CN111783848B - 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 - Google Patents

基于概率密度分布字典和马尔可夫转移特征的图像分类方法 Download PDF

Info

Publication number
CN111783848B
CN111783848B CN202010542010.3A CN202010542010A CN111783848B CN 111783848 B CN111783848 B CN 111783848B CN 202010542010 A CN202010542010 A CN 202010542010A CN 111783848 B CN111783848 B CN 111783848B
Authority
CN
China
Prior art keywords
distribution
scale
parameters
sub
subbands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010542010.3A
Other languages
English (en)
Other versions
CN111783848A (zh
Inventor
宋传鸣
葛明博
刘丹
王相海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Houren Technology Co ltd
Original Assignee
Liaoning Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Normal University filed Critical Liaoning Normal University
Priority to CN202010542010.3A priority Critical patent/CN111783848B/zh
Publication of CN111783848A publication Critical patent/CN111783848A/zh
Application granted granted Critical
Publication of CN111783848B publication Critical patent/CN111783848B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于概率分布参数特征和马尔可夫转移特征的图像分类方法,首先,采用柯西分布、拉普拉斯分布、广义高斯分布和α‑稳态分布为原子,建立一个分布字典,对输入图像的不同尺度、不同子带下的高频小波变换系数分布进行拟合;利用1阶差分算子分别计算离散余弦变换系数沿水平方向、竖直方向的马尔可夫转移概率;将概率密度分布参数特征和马尔可夫转移概率参数特征作为分类特征,以支持向量机LIBSVM作为分类器,以径向基函数作为核函数,训练得到一种基于支持向量机LIBSVM的、用于屏幕内容图像和自然图像的分类器,进而实现屏幕内容图像块和自然图像块的自动分类。

Description

基于概率密度分布字典和马尔可夫转移特征的图像分类方法
技术领域
本发明涉及屏幕内容的图像和视频处理领域,尤其是一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
背景技术
复杂度适中、面向屏幕内容视频的高效率编码是视频编码领域具有挑战性的最新研究课题之一,学者们将其称为“屏幕内容视频编码”。目前,H.264/AVC、HEVC对屏幕内容中的线条、文字、图形等非连续色调内容的压缩效率尚未满足应用需求,且计算复杂度高。究其原因在于,屏幕内容由不连续色调区域和连续色调区域两部分共同组成,而二者的成像机制和获取手段却完全不同,使得其通道特性也大相径庭。在空间域中,不连续色调区域拥有背景简单、对比度高、色调数量有限的锐化边缘和线条,而连续色调区域的纹理特点却恰恰相反;在频率域中,与连续色调区域相比,不连续色调区域的离散余弦变换(DiscreteCosine Transform,DCT)系数分布呈现更加显著的非高斯特性。所以,无论在空间域,还是在频率域,不连续色调区域的统计分布规律都明显有别于连续色调区域,目前还不存在任何一种编码方法,能在这两类区域上均取得令人满意的编码效率。在这种情况下,面向屏幕内容视频的国际编码标准HEVC-SCC采用了一种混合编码框架对屏幕内容进行压缩,其主要思路是首先将待编码帧划分为不连续色调块和连续色调块,再为不同类型的块选择恰当的编码算法,从而形成复合码流。然而,由于研究人员目前尚缺乏对屏幕内容视频的统计分布特征,尤其是DCT系数统计分布特征的深入认识,HEVC-SCC编码器仅能依靠对不同编码模式的枚举和多次率失真选择,才能为每个待编码块确定恰当的图像块类型及其编码方法,其决策过程的计算负担非常繁重。因此,对自然图像块和屏幕内容图像块进行准确地自动分类,已经成为一个现实且重要的问题,它是指导SCC视频编码器实现快速块分类决策的关键环节,有利于加快编码器的编码模式决策和率失真优化的速度,进而提高编码器的时间效率。
目前,还鲜见对包含大量文字、电脑桌面内容的屏幕内容图像与自然图像进行分类的方法。现有方法主要集中于对自然图像和计算机生成图像的分类,这些方法大致可以分为三类:基于统计特征的分类方法、基于几何特征的分类方法和基于物理特征的分类方法。
在基于统计特征的分类方法方面,Fard等人对图像的RGB颜色通道采取4阶小波变换,然后提取每阶小波高频子带的216维统计特征,并采用SVM及LDA进行分类,其对自然图像的识别准确率为98.8%,但计算机生成图像的识别准确率仅66.8%,并且其特征维数较高,准确率也不足,尤其是计算机生成图像的分类识别精度不够。Chen等人提出采用图像特征函数的统计矩以及小波子带作为分类特征,应用小波系数直方图的特征函数来构造一个234维的区分特征,并采用LIBSVM在RBF核的基础上实现图像种类判别,其识别精度达到了82.1%。虽然精度有所提升,但特征向量的维度和计算复杂度均更高。Li等人在YCbCr颜色空间中提取均匀的59维灰度不变LBP特征,再使用SVM和多项式核函数完成图像分类,其平均精确度可以达到98.33%,但复杂度较高,鲁棒性也不尽人意。Wang等人利用同态滤波突出图像细节,用共生矩阵构建分类特征,再通过计算各灰度共生矩阵的能量、对比度、同质性、列平均最大值以及纹理相似性等特征,使平均分类精度达到了98%。
在基于几何特征的图像分类方面,Peng等人提出了一种基于多重分形谱和回归分析的自然图像和计算机生成图像分类算法,利用多元线性回归得到残差图像,同时研究纹理差异和回归模型的拟合度,从而得到9维直方图特征、9维多重分形谱特征和6维回归模型拟合特征,再应用LIBSVM的RBF核函数和5倍交叉验证训练模型。通过分析局部边缘斑块的统计特性,Zhang等人对图像边缘块进行预处理,将其投影到一个7维的球面空间,再依据Voronoi单元确定关键采样点,形成可视化词汇表,进而采用SVM实现图像分类。不过,该方法对特征维数非常敏感,当特征维数降为14时,其识别精度仅为88%,尚需提高小维度特征的精确度。Pan等人提出应用分形几何来实现图像分类的目的,从HSV颜色空间的H、S通道获取10个分类特征,再从H通道中提取一个用于表征图像粗糙度的10维特征向量,从而借助SVM和网格搜索优化完成分类,其平均分类精度为91.2%,但是对计算机生成图像的识别精度仍然不足。
在基于物理特征的图像分类方面,考虑到自然图像是由采集设备(如数码相机、手机等)所获取的,设备的物理特性必然能够在图像中得以反映。自然图像在采集过程中必定经过彩色滤波阵列(Color Filter Array,CFA)的插值操作,而计算机生成图像却无需该过程。故此,CFA插值系自然图像所特有的运算,亦被称为“马赛克”。为此,张晓琳等人在分析了插值图像与原图像的频谱差异后,提出了一种基于通道间相关性的CFA图像盲取证算法,能够实现对篡改图像的自动识别。Gallagher等人发现,CFA插值会降低像素方差,于是提出了一种基于CFA插值的去噪周期方差特征存在性检测的检测方案,平均可达到98.4%的判别精度。然而,如果仅使用处于图像中心的、大小为64×64像素的块来完成判别,则其精度会急剧下降到66%。此外,PRNU也是一种由传感器产生的、自然图像所特有的模式噪声,在图像源识别中具有广泛应用。由于CFA插值与其邻域的像素有较强的相关性,且具有周期性,Peng等人认为PRNU在像素的某个邻域内将同样表现出周期性特点,于是提出了一种借助PRNU来度量CFA插值影响的方法,其主要思路是通过分析PRNU方差直方图,从而获得峰值、均值和方差的9维特征,再使用LIBSVM的RBF核函数和5倍交叉验证进行训练,将图像分类的平均精度提高到了99.43%。但是,该方法的计算复杂度较高,且依赖于图像所特有的PRNU模式噪声,其鲁棒性尚不尽如人意。
总体来看,上述方案仍存在分类特征维度大、计算复杂度高、鲁棒性差、自适应性弱的缺点。并且,由于屏幕视频的统计特性不同于计算机生成图像,这些方案尚无法很好地适用于屏幕内容图像块与自然图像块的自动分类。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
本发明的技术解决方案是:一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,其特征在于按如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000041
所述/>
Figure BDA0002539226490000042
和/>
Figure BDA0002539226490000043
分别表示水平方向子带cHj的尺度参数和形状参数,/>
Figure BDA0002539226490000044
和/>
Figure BDA0002539226490000045
分别表示垂直方向子带cVj的尺度参数和形状参数,/>
Figure BDA0002539226490000046
和/>
Figure BDA0002539226490000047
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000048
Figure BDA0002539226490000049
Figure BDA00025392264900000410
所述
Figure BDA00025392264900000411
和/>
Figure BDA00025392264900000412
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤4.3根据公式(4)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900000413
Figure BDA00025392264900000414
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA00025392264900000415
和/>
Figure BDA00025392264900000416
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA00025392264900000417
Figure BDA00025392264900000418
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA00025392264900000419
和/>
Figure BDA00025392264900000420
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,/>
Figure BDA00025392264900000421
Figure BDA00025392264900000422
和/>
Figure BDA00025392264900000423
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900000424
所述/>
Figure BDA00025392264900000425
和/>
Figure BDA00025392264900000426
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900000427
和/>
Figure BDA00025392264900000428
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900000429
和/>
Figure BDA00025392264900000430
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤5.2根据公式(5)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA0002539226490000051
Figure BDA0002539226490000052
所述
Figure BDA0002539226490000053
和/>
Figure BDA0002539226490000054
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,/>
Figure BDA0002539226490000055
和/>
Figure BDA0002539226490000056
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA0002539226490000057
所述/>
Figure BDA0002539226490000058
和/>
Figure BDA0002539226490000059
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900000510
和/>
Figure BDA00025392264900000511
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900000512
和/>
Figure BDA00025392264900000513
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.2根据公式(6)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900000514
Figure BDA00025392264900000515
所述
Figure BDA00025392264900000516
和/>
Figure BDA00025392264900000517
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA00025392264900000518
和/>
Figure BDA00025392264900000519
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA00025392264900000520
和/>
Figure BDA00025392264900000521
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA00025392264900000522
和/>
Figure BDA00025392264900000523
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900000524
所述/>
Figure BDA00025392264900000525
和/>
Figure BDA00025392264900000526
分别表示水平方向子带cHj的形状参数和尺度参数,/>
Figure BDA00025392264900000527
和/>
Figure BDA00025392264900000528
分别表示垂直方向子带cVj的形状参数和尺度参数,/>
Figure BDA00025392264900000529
和/>
Figure BDA0002539226490000061
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤7.2根据公式(7)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA0002539226490000062
Figure BDA0002539226490000063
所述
Figure BDA0002539226490000064
和/>
Figure BDA0002539226490000065
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA0002539226490000066
和/>
Figure BDA0002539226490000067
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA0002539226490000068
和/>
Figure BDA0002539226490000069
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900000610
和/>
Figure BDA00025392264900000611
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤8.令图像I的概率密度分布参数特征
Figure BDA00025392264900000612
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤9.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA00025392264900000613
Figure BDA00025392264900000614
步骤10.利用图像I中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000071
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=|nF(u,v)=m):
Figure BDA0002539226490000072
步骤10.3令图像I的马尔可夫转移概率参数特征
Figure BDA0002539226490000073
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征
Figure BDA0002539226490000074
和马尔可夫转移概率参数特征/>
Figure BDA0002539226490000075
进行降维,得到/>
Figure BDA0002539226490000076
和/>
Figure BDA0002539226490000077
步骤12.以径向基函数作为核函数,将
Figure BDA0002539226490000078
和/>
Figure BDA0002539226490000079
输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型,是按照如下步骤训练而成:
步骤13.1输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1;
步骤13.2从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3分别统计9个高频子带的归一化系数直方图;
步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000081
所述/>
Figure BDA0002539226490000082
和/>
Figure BDA0002539226490000083
分别表示水平方向子带cHj的尺度参数和形状参数,/>
Figure BDA0002539226490000084
和/>
Figure BDA0002539226490000085
分别表示垂直方向子带cVj的尺度参数和形状参数,/>
Figure BDA0002539226490000086
和/>
Figure BDA0002539226490000087
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000088
Figure BDA0002539226490000089
/>
Figure BDA00025392264900000810
所述
Figure BDA00025392264900000811
和/>
Figure BDA00025392264900000812
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤13.5.3根据公式(15)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900000813
Figure BDA00025392264900000814
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA00025392264900000815
和/>
Figure BDA00025392264900000816
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA00025392264900000817
Figure BDA00025392264900000818
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA00025392264900000819
和/>
Figure BDA00025392264900000820
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,/>
Figure BDA00025392264900000821
Figure BDA00025392264900000822
和/>
Figure BDA00025392264900000823
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900000824
所述/>
Figure BDA00025392264900000825
和/>
Figure BDA00025392264900000826
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900000827
Figure BDA00025392264900000828
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900000829
和/>
Figure BDA00025392264900000830
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.6.2根据公式(16)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA00025392264900000928
Figure BDA0002539226490000091
所述
Figure BDA0002539226490000092
和/>
Figure BDA0002539226490000093
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,/>
Figure BDA0002539226490000094
和/>
Figure BDA0002539226490000095
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA0002539226490000096
所述/>
Figure BDA0002539226490000097
和/>
Figure BDA0002539226490000098
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA0002539226490000099
和/>
Figure BDA00025392264900000910
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900000911
和/>
Figure BDA00025392264900000912
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.2根据公式(17)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900000913
Figure BDA00025392264900000914
所述
Figure BDA00025392264900000915
和/>
Figure BDA00025392264900000916
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA00025392264900000917
和/>
Figure BDA00025392264900000918
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA00025392264900000919
和/>
Figure BDA00025392264900000920
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA00025392264900000921
和/>
Figure BDA00025392264900000922
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900000923
所述/>
Figure BDA00025392264900000924
和/>
Figure BDA00025392264900000925
分别表示水平方向子带cHj的形状参数和尺度参数,/>
Figure BDA00025392264900000926
和/>
Figure BDA00025392264900000927
分别表示垂直方向子带cVj的形状参数和尺度参数,/>
Figure BDA0002539226490000101
和/>
Figure BDA0002539226490000102
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤13.8.2根据公式(18)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA0002539226490000103
Figure BDA0002539226490000104
所述
Figure BDA0002539226490000105
和/>
Figure BDA0002539226490000106
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA0002539226490000107
和/>
Figure BDA0002539226490000108
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA0002539226490000109
和/>
Figure BDA00025392264900001010
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900001011
和/>
Figure BDA00025392264900001012
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.9.令图像Ti的概率密度分布参数特征
Figure BDA00025392264900001013
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤13.10.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA00025392264900001014
Figure BDA00025392264900001015
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000111
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure BDA0002539226490000112
步骤13.11.3令图像Ti的马尔可夫转移概率参数特征
Figure BDA0002539226490000113
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.12.利用95%的主成分分析方法将图像Ti的概率密度分布参数特征
Figure BDA0002539226490000114
和马尔可夫转移概率参数特征/>
Figure BDA0002539226490000115
进行降维,得到/>
Figure BDA0002539226490000116
和/>
Figure BDA0002539226490000117
步骤13.13.将
Figure BDA0002539226490000118
作为第i条训练数据,输入支持向量机LIBSVM,令i←i+1,若i≤N,则转入步骤13.2,否则转入步骤13.14;
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
本发明首先,利用4种“厚尾”分布构建了一个概率密度分布字典,组成自适应的混合“厚尾”分布,在理论上能够得到更加丰富的“厚尾”分布及其概率密度函数形式,有利于突破传统方法采用单一分布或某两个固定分布对小波变换系数分布进行统计建模时所存在的局限性,从而突破现有“厚尾”分布的种类限制,可为变换系数拟合提供更大的灵活性和更多的自由度,提高分布拟合的精度;其次,由于成像内容和成像机理的不同,自然图像和屏幕内容图像在空间域呈现出明显的纹理特征差异,在频率域也表现出明显的统计特征差异。本发明采用概率密度分布字典将两类图像的频率域统计特征差异建模为概率密度分布参数特征的差异,而采用马尔可夫随机过程将两类图像的空间域纹理特征差异建模为马尔可夫转移概率参数特征的差异,进而形成了空间域—频率域联合的可判别性特征,有利于提高图像分类的精度。因此,本发明具有稳定高效、自适应性强、分类精度高的优点。
具体实施方式
本发明的一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,按照如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3},本实施例中,令B=256;
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000121
所述/>
Figure BDA0002539226490000122
和/>
Figure BDA0002539226490000123
分别表示水平方向子带cHj的尺度参数和形状参数,/>
Figure BDA0002539226490000124
和/>
Figure BDA0002539226490000125
分别表示垂直方向子带cVj的尺度参数和形状参数,/>
Figure BDA0002539226490000126
和/>
Figure BDA0002539226490000127
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000128
Figure BDA0002539226490000129
Figure BDA00025392264900001210
所述
Figure BDA00025392264900001211
和/>
Figure BDA00025392264900001212
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤4.3根据公式(4)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900001213
/>
Figure BDA00025392264900001214
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA0002539226490000131
和/>
Figure BDA0002539226490000132
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA0002539226490000133
Figure BDA0002539226490000134
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA0002539226490000135
和/>
Figure BDA0002539226490000136
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,/>
Figure BDA0002539226490000137
Figure BDA0002539226490000138
和/>
Figure BDA0002539226490000139
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001310
所述/>
Figure BDA00025392264900001311
和/>
Figure BDA00025392264900001312
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900001313
和/>
Figure BDA00025392264900001314
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900001315
和/>
Figure BDA00025392264900001316
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤5.2根据公式(5)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA00025392264900001317
Figure BDA00025392264900001318
所述
Figure BDA00025392264900001319
和/>
Figure BDA00025392264900001320
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,/>
Figure BDA00025392264900001321
和/>
Figure BDA00025392264900001322
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001323
所述/>
Figure BDA00025392264900001324
和/>
Figure BDA00025392264900001325
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900001326
和/>
Figure BDA00025392264900001327
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900001328
和/>
Figure BDA00025392264900001329
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.2根据公式(6)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900001330
Figure BDA0002539226490000141
所述
Figure BDA0002539226490000142
和/>
Figure BDA0002539226490000143
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA0002539226490000144
和/>
Figure BDA0002539226490000145
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA0002539226490000146
和/>
Figure BDA0002539226490000147
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA0002539226490000148
和/>
Figure BDA0002539226490000149
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900001410
所述/>
Figure BDA00025392264900001411
和/>
Figure BDA00025392264900001412
分别表示水平方向子带cHj的形状参数和尺度参数,/>
Figure BDA00025392264900001413
和/>
Figure BDA00025392264900001414
分别表示垂直方向子带cVj的形状参数和尺度参数,/>
Figure BDA00025392264900001415
和/>
Figure BDA00025392264900001416
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤7.2根据公式(7)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA00025392264900001417
Figure BDA00025392264900001418
所述
Figure BDA00025392264900001419
和/>
Figure BDA00025392264900001420
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA00025392264900001421
和/>
Figure BDA00025392264900001422
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA00025392264900001423
和/>
Figure BDA00025392264900001424
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900001425
和/>
Figure BDA00025392264900001426
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤8.令图像I的概率密度分布参数特征
Figure BDA00025392264900001427
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤9.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA0002539226490000151
/>
Figure BDA0002539226490000152
在本实施例中,令T=3;
步骤10.利用图像I中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000153
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure BDA0002539226490000154
步骤10.3令图像I的马尔可夫转移概率参数特征
Figure BDA0002539226490000155
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征
Figure BDA0002539226490000156
和马尔可夫转移概率参数特征/>
Figure BDA0002539226490000157
进行降维,得到/>
Figure BDA0002539226490000158
和/>
Figure BDA0002539226490000159
步骤12.以径向基函数作为核函数,将
Figure BDA00025392264900001510
和/>
Figure BDA00025392264900001511
输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成:
步骤13.1.输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1,本实施例中,令B=256;
步骤13.2.从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3.分别统计9个高频子带的归一化系数直方图;
步骤13.4.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000161
所述/>
Figure BDA0002539226490000162
和/>
Figure BDA0002539226490000163
分别表示水平方向子带cHj的尺度参数和形状参数,/>
Figure BDA0002539226490000164
和/>
Figure BDA0002539226490000165
分别表示垂直方向子带cVj的尺度参数和形状参数,/>
Figure BDA0002539226490000166
和/>
Figure BDA0002539226490000167
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000168
Figure BDA0002539226490000169
Figure BDA00025392264900001610
所述
Figure BDA00025392264900001611
和/>
Figure BDA00025392264900001612
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤13.5.3根据公式(15)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900001613
Figure BDA00025392264900001614
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA0002539226490000171
和/>
Figure BDA0002539226490000172
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA0002539226490000173
Figure BDA0002539226490000174
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure BDA0002539226490000175
和/>
Figure BDA0002539226490000176
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,/>
Figure BDA0002539226490000177
Figure BDA0002539226490000178
和/>
Figure BDA0002539226490000179
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001710
所述/>
Figure BDA00025392264900001711
和/>
Figure BDA00025392264900001712
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900001713
Figure BDA00025392264900001714
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900001715
和/>
Figure BDA00025392264900001716
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.6.2根据公式(16)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA00025392264900001717
/>
Figure BDA00025392264900001718
所述
Figure BDA00025392264900001719
和/>
Figure BDA00025392264900001720
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,/>
Figure BDA00025392264900001721
和/>
Figure BDA00025392264900001722
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001723
所述/>
Figure BDA00025392264900001724
和/>
Figure BDA00025392264900001725
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure BDA00025392264900001726
和/>
Figure BDA00025392264900001727
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure BDA00025392264900001728
和/>
Figure BDA00025392264900001729
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.2根据公式(17)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900001730
Figure BDA0002539226490000181
所述
Figure BDA0002539226490000182
和/>
Figure BDA0002539226490000183
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA0002539226490000184
和/>
Figure BDA0002539226490000185
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure BDA0002539226490000186
和/>
Figure BDA0002539226490000187
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA0002539226490000188
和/>
Figure BDA0002539226490000189
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900001810
所述/>
Figure BDA00025392264900001811
和/>
Figure BDA00025392264900001812
分别表示水平方向子带cHj的形状参数和尺度参数,/>
Figure BDA00025392264900001813
和/>
Figure BDA00025392264900001814
分别表示垂直方向子带cVj的形状参数和尺度参数,/>
Figure BDA00025392264900001815
和/>
Figure BDA00025392264900001816
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤13.8.2根据公式(18)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA00025392264900001817
Figure BDA00025392264900001818
所述
Figure BDA00025392264900001819
和/>
Figure BDA00025392264900001820
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA00025392264900001821
和/>
Figure BDA00025392264900001822
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure BDA00025392264900001823
和/>
Figure BDA00025392264900001824
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900001825
和/>
Figure BDA00025392264900001826
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.9.令图像Ti的概率密度分布参数特征
Figure BDA00025392264900001827
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤13.10.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA0002539226490000191
Figure BDA0002539226490000192
在本实施例中,令T=3;
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000193
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure BDA0002539226490000194
步骤13.11.3令图像Ti的马尔可夫转移概率参数特征
Figure BDA0002539226490000195
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.12.利用95%的主成分分析方法将图像Ti的概率密度分布参数特征
Figure BDA0002539226490000196
和马尔可夫转移概率参数特征/>
Figure BDA0002539226490000197
进行降维,得到/>
Figure BDA0002539226490000198
和/>
Figure BDA0002539226490000199
步骤13.13.将
Figure BDA00025392264900001910
作为第i条训练数据,输入支持向量机LIBSVM,令i←i+1,若i≤N,则转入步骤13.2,否则转入步骤13.14;
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
为验证本发明的有效性,以1000幅自然图像和1000幅屏幕内容图像组成图像数据集进行实验。其中,自然图像和屏幕内容图像的来源为JCT-VC公布的标准屏幕内容视频以及自然视频序列,每个图像被裁剪为256×256像素;训练集包括1000幅图像(由500幅自然图像和500幅屏幕内容图像组成),测试集包括1000张图像(由500幅自然图像和500幅屏幕内容图像组成)。分类准确度定义为正确分类的自然图像数量与全部测试自然图像之比,以及正确分类的屏幕内容图像数量与全部屏幕内容图像之比之间的平均值,并将5次实验的平均值作为最终的分类准确度。
采用本发明和基于广义高斯分布的分类方法、基于镶嵌处理的分类方法、基于残差模式噪声的分类方法和基于隐马尔可夫树的分类方法进行图像分类的分类准确度对比如表1所示。
表1
Figure BDA0002539226490000201
从表1可见,通过充分发掘分布字典的概率分布参数的判别性特征,并将其与马尔可夫转移特征进行有机整合,本发明得到了适用屏幕内容图像和自然图像的、更加有效的判别性特征,获得了最高的图像分类准确度,比基于镶嵌处理的分类方法、基于残差模式噪声的分类方法、基于隐马尔可夫树的分类方法和基于广义高斯分布的分类方法分别提高了65.74%、19.45%、12.17%、7.04%。

Claims (1)

1.一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,其特征在于按如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure FDA0002539226480000011
所述/>
Figure FDA0002539226480000012
和/>
Figure FDA0002539226480000013
分别表示水平方向子带cHj的尺度参数和形状参数,/>
Figure FDA0002539226480000014
和/>
Figure FDA0002539226480000015
分别表示垂直方向子带cVj的尺度参数和形状参数,/>
Figure FDA0002539226480000016
和/>
Figure FDA0002539226480000017
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure FDA0002539226480000018
Figure FDA0002539226480000019
Figure FDA00025392264800000110
所述
Figure FDA00025392264800000111
和/>
Figure FDA00025392264800000112
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤4.3根据公式(4)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure FDA00025392264800000113
Figure FDA0002539226480000021
所述J表示高频子带所在的尺度且J∈{1,2},
Figure FDA0002539226480000022
和/>
Figure FDA0002539226480000023
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure FDA0002539226480000024
和/>
Figure FDA0002539226480000025
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure FDA0002539226480000026
和/>
Figure FDA0002539226480000027
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,/>
Figure FDA0002539226480000028
Figure FDA0002539226480000029
和/>
Figure FDA00025392264800000210
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;/>
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000211
所述
Figure FDA00025392264800000212
和/>
Figure FDA00025392264800000213
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure FDA00025392264800000214
和/>
Figure FDA00025392264800000215
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure FDA00025392264800000216
和/>
Figure FDA00025392264800000217
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤5.2根据公式(5)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure FDA00025392264800000218
Figure FDA00025392264800000219
所述
Figure FDA00025392264800000220
和/>
Figure FDA00025392264800000221
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,/>
Figure FDA00025392264800000222
和/>
Figure FDA00025392264800000223
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000224
所述/>
Figure FDA00025392264800000225
和/>
Figure FDA00025392264800000226
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure FDA00025392264800000227
和/>
Figure FDA00025392264800000228
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure FDA00025392264800000229
和/>
Figure FDA00025392264800000230
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.2根据公式(6)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure FDA0002539226480000031
Figure FDA0002539226480000032
所述
Figure FDA0002539226480000033
和/>
Figure FDA0002539226480000034
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure FDA0002539226480000035
和/>
Figure FDA0002539226480000036
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure FDA0002539226480000037
和/>
Figure FDA0002539226480000038
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure FDA0002539226480000039
和/>
Figure FDA00025392264800000310
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure FDA00025392264800000311
所述/>
Figure FDA00025392264800000312
和/>
Figure FDA00025392264800000313
分别表示水平方向子带cHj的形状参数和尺度参数,/>
Figure FDA00025392264800000314
和/>
Figure FDA00025392264800000315
分别表示垂直方向子带cVj的形状参数和尺度参数,/>
Figure FDA00025392264800000316
和/>
Figure FDA00025392264800000317
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤7.2根据公式(7)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure FDA00025392264800000318
Figure FDA00025392264800000319
所述
Figure FDA00025392264800000320
和/>
Figure FDA00025392264800000321
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure FDA00025392264800000322
和/>
Figure FDA00025392264800000323
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure FDA00025392264800000324
和/>
Figure FDA00025392264800000325
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,/>
Figure FDA00025392264800000326
和/>
Figure FDA00025392264800000327
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤8.令图像I的概率密度分布参数特征
Figure FDA00025392264800000328
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤9.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure FDA0002539226480000041
Figure FDA0002539226480000042
步骤10.利用图像I中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure FDA0002539226480000043
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure FDA0002539226480000044
步骤10.3令图像I的马尔可夫转移概率参数特征Θ2←{Ph(F(u+1,v)=n|F(u,v)=m)}∪{Pv(F(u,v+1)=n|F(u,v)=m)},共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征Θ1和马尔可夫转移概率参数特征Θ2进行降维,得到Θ′1和Θ′2
步骤12.以径向基函数作为核函数,将Θ′1和Θ′2输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成:
步骤13.1输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1;
步骤13.2从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3分别统计9个高频子带的归一化系数直方图;
步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure FDA0002539226480000051
所述/>
Figure FDA0002539226480000052
和/>
Figure FDA0002539226480000053
分别表示水平方向子带cHj的尺度参数和形状参数,/>
Figure FDA0002539226480000054
和/>
Figure FDA0002539226480000055
分别表示垂直方向子带cVj的尺度参数和形状参数,/>
Figure FDA0002539226480000056
和/>
Figure FDA0002539226480000057
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure FDA0002539226480000058
Figure FDA0002539226480000059
Figure FDA00025392264800000510
所述
Figure FDA00025392264800000511
和/>
Figure FDA00025392264800000512
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤13.5.3根据公式(15)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure FDA00025392264800000513
Figure FDA00025392264800000514
所述J表示高频子带所在的尺度且J∈{1,2},
Figure FDA0002539226480000061
和/>
Figure FDA0002539226480000062
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure FDA0002539226480000063
和/>
Figure FDA0002539226480000064
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,/>
Figure FDA0002539226480000065
和/>
Figure FDA0002539226480000066
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,/>
Figure FDA0002539226480000067
Figure FDA0002539226480000068
和/>
Figure FDA0002539226480000069
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000610
所述/>
Figure FDA00025392264800000611
和/>
Figure FDA00025392264800000612
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure FDA00025392264800000613
和/>
Figure FDA00025392264800000614
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure FDA00025392264800000615
和/>
Figure FDA00025392264800000616
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.6.2根据公式(16)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure FDA00025392264800000617
Figure FDA00025392264800000618
所述
Figure FDA00025392264800000619
和/>
Figure FDA00025392264800000620
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,/>
Figure FDA00025392264800000621
和/>
Figure FDA00025392264800000622
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000623
所述/>
Figure FDA00025392264800000624
和/>
Figure FDA00025392264800000625
分别表示水平方向子带cHj的位置参数和尺度参数,/>
Figure FDA00025392264800000626
和/>
Figure FDA00025392264800000627
分别表示垂直方向子带cVj的位置参数和尺度参数,/>
Figure FDA00025392264800000628
和/>
Figure FDA00025392264800000629
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.2根据公式(17)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure FDA00025392264800000630
Figure FDA0002539226480000071
所述
Figure FDA0002539226480000072
和/>
Figure FDA0002539226480000073
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure FDA0002539226480000074
和/>
Figure FDA0002539226480000075
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,/>
Figure FDA0002539226480000076
和/>
Figure FDA0002539226480000077
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure FDA0002539226480000078
和/>
Figure FDA0002539226480000079
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure FDA00025392264800000710
所述/>
Figure FDA00025392264800000711
和/>
Figure FDA00025392264800000712
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure FDA00025392264800000713
和/>
Figure FDA00025392264800000714
分别表示垂直方向子带cVj的形状参数和尺度参数,/>
Figure FDA00025392264800000715
和/>
Figure FDA00025392264800000716
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤13.8.2根据公式(18)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure FDA00025392264800000717
Figure FDA00025392264800000718
所述
Figure FDA00025392264800000719
和/>
Figure FDA00025392264800000720
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure FDA00025392264800000721
和/>
Figure FDA00025392264800000722
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,/>
Figure FDA00025392264800000723
和/>
Figure FDA00025392264800000724
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,/>
Figure FDA00025392264800000725
Figure FDA00025392264800000726
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.9.令图像Ti的概率密度分布参数特征
Figure FDA00025392264800000727
/>
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤13.10.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure FDA0002539226480000081
Figure FDA0002539226480000082
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure FDA0002539226480000083
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure FDA0002539226480000084
步骤13.11.3令图像Ti的马尔可夫转移概率参数特征
Figure FDA0002539226480000085
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.12.利用95%的主成分分析方法将图像Ti的概率密度分布参数特征
Figure FDA0002539226480000086
和马尔可夫转移概率参数特征/>
Figure FDA0002539226480000087
进行降维,得到/>
Figure FDA0002539226480000088
和/>
Figure FDA0002539226480000089
步骤13.13.将
Figure FDA00025392264800000810
作为第i条训练数据,输入支持向量机LIBSVM,令i←i+1,若i≤N,则转入步骤13.2,否则转入步骤13.14;
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
CN202010542010.3A 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 Active CN111783848B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010542010.3A CN111783848B (zh) 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010542010.3A CN111783848B (zh) 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Publications (2)

Publication Number Publication Date
CN111783848A CN111783848A (zh) 2020-10-16
CN111783848B true CN111783848B (zh) 2023-05-23

Family

ID=72756530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010542010.3A Active CN111783848B (zh) 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Country Status (1)

Country Link
CN (1) CN111783848B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075133A1 (en) * 2005-01-13 2006-07-20 Isis Innovation Limited Physiological data classification
CN101604376A (zh) * 2008-10-11 2009-12-16 大连大学 基于hmm-svm混合模型的人脸识别方法
CN103034847A (zh) * 2012-12-13 2013-04-10 河海大学 一种基于隐马尔可夫模型的人脸识别方法
CN110880192A (zh) * 2019-07-29 2020-03-13 辽宁师范大学 基于概率密度函数字典的图像dct系数分布拟合方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101300247B1 (ko) * 2011-11-11 2013-08-26 경희대학교 산학협력단 마르코프 연쇄 은닉 조건부 랜덤 필드 모델 기반의 패턴 인식 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075133A1 (en) * 2005-01-13 2006-07-20 Isis Innovation Limited Physiological data classification
CN101604376A (zh) * 2008-10-11 2009-12-16 大连大学 基于hmm-svm混合模型的人脸识别方法
CN103034847A (zh) * 2012-12-13 2013-04-10 河海大学 一种基于隐马尔可夫模型的人脸识别方法
CN110880192A (zh) * 2019-07-29 2020-03-13 辽宁师范大学 基于概率密度函数字典的图像dct系数分布拟合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Contourlet域HMT模型的图像融合;刘战文;焦李成;金海燕;沙宇恒;杨淑媛;;西安电子科技大学学报(第03期);全文 *

Also Published As

Publication number Publication date
CN111783848A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN115861135B (zh) 一种应用于箱体全景探测的图像增强及识别方法
Gllavata et al. Text detection in images based on unsupervised classification of high-frequency wavelet coefficients
WO2018145470A1 (zh) 一种图像检测方法和装置
CN111340824B (zh) 一种基于数据挖掘的图像特征分割方法
CN106778517A (zh) 一种监控视频序列图像车辆再识别的方法
CN110766689A (zh) 基于卷积神经网络进行物品图像缺陷检测的方法及装置
CN106022303B (zh) 基于无透镜全息成像的淡水藻类粗分类与计数方法
CN110728185A (zh) 一种判别驾驶人存在手持手机通话行为的检测方法
CN108932492A (zh) 一种基于非采样剪切波变换的图像指纹提取方法
CN112070714B (zh) 一种基于局部三元计数特征的翻拍图像检测方法
CN111783848B (zh) 基于概率密度分布字典和马尔可夫转移特征的图像分类方法
CN111241979B (zh) 一种基于图像特征标定的实时障碍物检测方法
CN113052234A (zh) 一种基于图像特征和深度学习技术的玉石分类方法
CN109460768B (zh) 一种用于组织病理学显微图像的文本检测与去除方法
Wu et al. Research on crack detection algorithm of asphalt pavement
KR101151739B1 (ko) 텐서 보팅에 기반을 둔 컬러 클러스터링 시스템 및 그 방법
CN110866470A (zh) 一种基于随机图像特征的人脸防伪检测方法
CN112818779B (zh) 一种基于特征优选与多种特征融合的人体行为识别方法
Gao et al. Salient object detection using octonion with Bayesian inference
Shahab et al. Bayesian approach to photo time-stamp recognition
Livens et al. Classification of corrosion images by wavelet signatures and LVQ networks
CN108171750A (zh) 基于视觉的箱子装卸定位识别系统
CN113298891A (zh) 基于四元数小波变换的全参考3d合成图像质量评价方法
Saini et al. Comparative study of text detection in natural scene images
TWI759818B (zh) 基於熵的叢集演算處理指紋影像之指紋奇異點偵測方法及其系統

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231120

Address after: Room 2401, 2402, 2403, 2407, 24/F, Building B, No. 6, Yiyang Road, Qixianling, High-tech Industrial Park, Dalian, Liaoning, 116000

Patentee after: Dalian Houren Technology Co.,Ltd.

Address before: No. 116500, Shahekou Road, Dalian City, Liaoning Province

Patentee before: LIAONING NORMAL University