CN111783848A - 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 - Google Patents

基于概率密度分布字典和马尔可夫转移特征的图像分类方法 Download PDF

Info

Publication number
CN111783848A
CN111783848A CN202010542010.3A CN202010542010A CN111783848A CN 111783848 A CN111783848 A CN 111783848A CN 202010542010 A CN202010542010 A CN 202010542010A CN 111783848 A CN111783848 A CN 111783848A
Authority
CN
China
Prior art keywords
sub
bands
scale
parameter
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010542010.3A
Other languages
English (en)
Other versions
CN111783848B (zh
Inventor
宋传鸣
葛明博
刘丹
王相海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Houren Technology Co ltd
Original Assignee
Liaoning Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Normal University filed Critical Liaoning Normal University
Priority to CN202010542010.3A priority Critical patent/CN111783848B/zh
Publication of CN111783848A publication Critical patent/CN111783848A/zh
Application granted granted Critical
Publication of CN111783848B publication Critical patent/CN111783848B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于概率分布参数特征和马尔可夫转移特征的图像分类方法,首先,采用柯西分布、拉普拉斯分布、广义高斯分布和α‑稳态分布为原子,建立一个分布字典,对输入图像的不同尺度、不同子带下的高频小波变换系数分布进行拟合;利用1阶差分算子分别计算离散余弦变换系数沿水平方向、竖直方向的马尔可夫转移概率;将概率密度分布参数特征和马尔可夫转移概率参数特征作为分类特征,以支持向量机LIBSVM作为分类器,以径向基函数作为核函数,训练得到一种基于支持向量机LIBSVM的、用于屏幕内容图像和自然图像的分类器,进而实现屏幕内容图像块和自然图像块的自动分类。

Description

基于概率密度分布字典和马尔可夫转移特征的图像分类方法
技术领域
本发明涉及屏幕内容的图像和视频处理领域,尤其是一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
背景技术
复杂度适中、面向屏幕内容视频的高效率编码是视频编码领域具有挑战性的最新研究课题之一,学者们将其称为“屏幕内容视频编码”。目前,H.264/AVC、HEVC对屏幕内容中的线条、文字、图形等非连续色调内容的压缩效率尚未满足应用需求,且计算复杂度高。究其原因在于,屏幕内容由不连续色调区域和连续色调区域两部分共同组成,而二者的成像机制和获取手段却完全不同,使得其通道特性也大相径庭。在空间域中,不连续色调区域拥有背景简单、对比度高、色调数量有限的锐化边缘和线条,而连续色调区域的纹理特点却恰恰相反;在频率域中,与连续色调区域相比,不连续色调区域的离散余弦变换(DiscreteCosine Transform,DCT)系数分布呈现更加显著的非高斯特性。所以,无论在空间域,还是在频率域,不连续色调区域的统计分布规律都明显有别于连续色调区域,目前还不存在任何一种编码方法,能在这两类区域上均取得令人满意的编码效率。在这种情况下,面向屏幕内容视频的国际编码标准HEVC-SCC采用了一种混合编码框架对屏幕内容进行压缩,其主要思路是首先将待编码帧划分为不连续色调块和连续色调块,再为不同类型的块选择恰当的编码算法,从而形成复合码流。然而,由于研究人员目前尚缺乏对屏幕内容视频的统计分布特征,尤其是DCT系数统计分布特征的深入认识,HEVC-SCC编码器仅能依靠对不同编码模式的枚举和多次率失真选择,才能为每个待编码块确定恰当的图像块类型及其编码方法,其决策过程的计算负担非常繁重。因此,对自然图像块和屏幕内容图像块进行准确地自动分类,已经成为一个现实且重要的问题,它是指导SCC视频编码器实现快速块分类决策的关键环节,有利于加快编码器的编码模式决策和率失真优化的速度,进而提高编码器的时间效率。
目前,还鲜见对包含大量文字、电脑桌面内容的屏幕内容图像与自然图像进行分类的方法。现有方法主要集中于对自然图像和计算机生成图像的分类,这些方法大致可以分为三类:基于统计特征的分类方法、基于几何特征的分类方法和基于物理特征的分类方法。
在基于统计特征的分类方法方面,Fard等人对图像的RGB颜色通道采取4阶小波变换,然后提取每阶小波高频子带的216维统计特征,并采用SVM及LDA进行分类,其对自然图像的识别准确率为98.8%,但计算机生成图像的识别准确率仅66.8%,并且其特征维数较高,准确率也不足,尤其是计算机生成图像的分类识别精度不够。Chen等人提出采用图像特征函数的统计矩以及小波子带作为分类特征,应用小波系数直方图的特征函数来构造一个234维的区分特征,并采用LIBSVM在RBF核的基础上实现图像种类判别,其识别精度达到了82.1%。虽然精度有所提升,但特征向量的维度和计算复杂度均更高。Li等人在YCbCr颜色空间中提取均匀的59维灰度不变LBP特征,再使用SVM和多项式核函数完成图像分类,其平均精确度可以达到98.33%,但复杂度较高,鲁棒性也不尽人意。Wang等人利用同态滤波突出图像细节,用共生矩阵构建分类特征,再通过计算各灰度共生矩阵的能量、对比度、同质性、列平均最大值以及纹理相似性等特征,使平均分类精度达到了98%。
在基于几何特征的图像分类方面,Peng等人提出了一种基于多重分形谱和回归分析的自然图像和计算机生成图像分类算法,利用多元线性回归得到残差图像,同时研究纹理差异和回归模型的拟合度,从而得到9维直方图特征、9维多重分形谱特征和6维回归模型拟合特征,再应用LIBSVM的RBF核函数和5倍交叉验证训练模型。通过分析局部边缘斑块的统计特性,Zhang等人对图像边缘块进行预处理,将其投影到一个7维的球面空间,再依据Voronoi单元确定关键采样点,形成可视化词汇表,进而采用SVM实现图像分类。不过,该方法对特征维数非常敏感,当特征维数降为14时,其识别精度仅为88%,尚需提高小维度特征的精确度。Pan等人提出应用分形几何来实现图像分类的目的,从HSV颜色空间的H、S通道获取10个分类特征,再从H通道中提取一个用于表征图像粗糙度的10维特征向量,从而借助SVM和网格搜索优化完成分类,其平均分类精度为91.2%,但是对计算机生成图像的识别精度仍然不足。
在基于物理特征的图像分类方面,考虑到自然图像是由采集设备(如数码相机、手机等)所获取的,设备的物理特性必然能够在图像中得以反映。自然图像在采集过程中必定经过彩色滤波阵列(Color Filter Array,CFA)的插值操作,而计算机生成图像却无需该过程。故此,CFA插值系自然图像所特有的运算,亦被称为“马赛克”。为此,张晓琳等人在分析了插值图像与原图像的频谱差异后,提出了一种基于通道间相关性的CFA图像盲取证算法,能够实现对篡改图像的自动识别。Gallagher等人发现,CFA插值会降低像素方差,于是提出了一种基于CFA插值的去噪周期方差特征存在性检测的检测方案,平均可达到98.4%的判别精度。然而,如果仅使用处于图像中心的、大小为64×64像素的块来完成判别,则其精度会急剧下降到66%。此外,PRNU也是一种由传感器产生的、自然图像所特有的模式噪声,在图像源识别中具有广泛应用。由于CFA插值与其邻域的像素有较强的相关性,且具有周期性,Peng等人认为PRNU在像素的某个邻域内将同样表现出周期性特点,于是提出了一种借助PRNU来度量CFA插值影响的方法,其主要思路是通过分析PRNU方差直方图,从而获得峰值、均值和方差的9维特征,再使用LIBSVM的RBF核函数和5倍交叉验证进行训练,将图像分类的平均精度提高到了99.43%。但是,该方法的计算复杂度较高,且依赖于图像所特有的PRNU模式噪声,其鲁棒性尚不尽如人意。
总体来看,上述方案仍存在分类特征维度大、计算复杂度高、鲁棒性差、自适应性弱的缺点。并且,由于屏幕视频的统计特性不同于计算机生成图像,这些方案尚无法很好地适用于屏幕内容图像块与自然图像块的自动分类。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
本发明的技术解决方案是:一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,其特征在于按如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000041
所述
Figure BDA0002539226490000042
Figure BDA0002539226490000043
分别表示水平方向子带cHj的尺度参数和形状参数,
Figure BDA0002539226490000044
Figure BDA0002539226490000045
分别表示垂直方向子带cVj的尺度参数和形状参数,
Figure BDA0002539226490000046
Figure BDA0002539226490000047
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000048
Figure BDA0002539226490000049
Figure BDA00025392264900000410
所述
Figure BDA00025392264900000411
Figure BDA00025392264900000412
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤4.3根据公式(4)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900000413
Figure BDA00025392264900000414
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA00025392264900000415
Figure BDA00025392264900000416
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA00025392264900000417
Figure BDA00025392264900000418
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA00025392264900000419
Figure BDA00025392264900000420
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,
Figure BDA00025392264900000421
Figure BDA00025392264900000422
Figure BDA00025392264900000423
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900000424
所述
Figure BDA00025392264900000425
Figure BDA00025392264900000426
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900000427
Figure BDA00025392264900000428
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900000429
Figure BDA00025392264900000430
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤5.2根据公式(5)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA0002539226490000051
Figure BDA0002539226490000052
所述
Figure BDA0002539226490000053
Figure BDA0002539226490000054
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,
Figure BDA0002539226490000055
Figure BDA0002539226490000056
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA0002539226490000057
所述
Figure BDA0002539226490000058
Figure BDA0002539226490000059
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900000510
Figure BDA00025392264900000511
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900000512
Figure BDA00025392264900000513
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.2根据公式(6)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900000514
Figure BDA00025392264900000515
所述
Figure BDA00025392264900000516
Figure BDA00025392264900000517
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA00025392264900000518
Figure BDA00025392264900000519
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA00025392264900000520
Figure BDA00025392264900000521
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA00025392264900000522
Figure BDA00025392264900000523
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900000524
所述
Figure BDA00025392264900000525
Figure BDA00025392264900000526
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure BDA00025392264900000527
Figure BDA00025392264900000528
分别表示垂直方向子带cVj的形状参数和尺度参数,
Figure BDA00025392264900000529
Figure BDA0002539226490000061
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤7.2根据公式(7)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA0002539226490000062
Figure BDA0002539226490000063
所述
Figure BDA0002539226490000064
Figure BDA0002539226490000065
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA0002539226490000066
Figure BDA0002539226490000067
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA0002539226490000068
Figure BDA0002539226490000069
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900000610
Figure BDA00025392264900000611
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤8.令图像I的概率密度分布参数特征
Figure BDA00025392264900000612
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤9.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA00025392264900000613
Figure BDA00025392264900000614
步骤10.利用图像I中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000071
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=|nF(u,v)=m):
Figure BDA0002539226490000072
步骤10.3令图像I的马尔可夫转移概率参数特征
Figure BDA0002539226490000073
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征
Figure BDA0002539226490000074
和马尔可夫转移概率参数特征
Figure BDA0002539226490000075
进行降维,得到
Figure BDA0002539226490000076
Figure BDA0002539226490000077
步骤12.以径向基函数作为核函数,将
Figure BDA0002539226490000078
Figure BDA0002539226490000079
输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型,是按照如下步骤训练而成:
步骤13.1输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1;
步骤13.2从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3分别统计9个高频子带的归一化系数直方图;
步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000081
所述
Figure BDA0002539226490000082
Figure BDA0002539226490000083
分别表示水平方向子带cHj的尺度参数和形状参数,
Figure BDA0002539226490000084
Figure BDA0002539226490000085
分别表示垂直方向子带cVj的尺度参数和形状参数,
Figure BDA0002539226490000086
Figure BDA0002539226490000087
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000088
Figure BDA0002539226490000089
Figure BDA00025392264900000810
所述
Figure BDA00025392264900000811
Figure BDA00025392264900000812
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤13.5.3根据公式(15)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900000813
Figure BDA00025392264900000814
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA00025392264900000815
Figure BDA00025392264900000816
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA00025392264900000817
Figure BDA00025392264900000818
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA00025392264900000819
Figure BDA00025392264900000820
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,
Figure BDA00025392264900000821
Figure BDA00025392264900000822
Figure BDA00025392264900000823
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900000824
所述
Figure BDA00025392264900000825
Figure BDA00025392264900000826
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900000827
Figure BDA00025392264900000828
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900000829
Figure BDA00025392264900000830
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.6.2根据公式(16)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA00025392264900000928
Figure BDA0002539226490000091
所述
Figure BDA0002539226490000092
Figure BDA0002539226490000093
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,
Figure BDA0002539226490000094
Figure BDA0002539226490000095
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA0002539226490000096
所述
Figure BDA0002539226490000097
Figure BDA0002539226490000098
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA0002539226490000099
Figure BDA00025392264900000910
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900000911
Figure BDA00025392264900000912
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.2根据公式(17)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900000913
Figure BDA00025392264900000914
所述
Figure BDA00025392264900000915
Figure BDA00025392264900000916
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA00025392264900000917
Figure BDA00025392264900000918
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA00025392264900000919
Figure BDA00025392264900000920
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA00025392264900000921
Figure BDA00025392264900000922
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900000923
所述
Figure BDA00025392264900000924
Figure BDA00025392264900000925
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure BDA00025392264900000926
Figure BDA00025392264900000927
分别表示垂直方向子带cVj的形状参数和尺度参数,
Figure BDA0002539226490000101
Figure BDA0002539226490000102
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤13.8.2根据公式(18)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA0002539226490000103
Figure BDA0002539226490000104
所述
Figure BDA0002539226490000105
Figure BDA0002539226490000106
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA0002539226490000107
Figure BDA0002539226490000108
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA0002539226490000109
Figure BDA00025392264900001010
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900001011
Figure BDA00025392264900001012
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.9.令图像Ti的概率密度分布参数特征
Figure BDA00025392264900001013
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤13.10.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA00025392264900001014
Figure BDA00025392264900001015
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000111
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure BDA0002539226490000112
步骤13.11.3令图像Ti的马尔可夫转移概率参数特征
Figure BDA0002539226490000113
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.12.利用95%的主成分分析方法将图像Ti的概率密度分布参数特征
Figure BDA0002539226490000114
和马尔可夫转移概率参数特征
Figure BDA0002539226490000115
进行降维,得到
Figure BDA0002539226490000116
Figure BDA0002539226490000117
步骤13.13.将
Figure BDA0002539226490000118
作为第i条训练数据,输入支持向量机LIBSVM,令i←i+1,若i≤N,则转入步骤13.2,否则转入步骤13.14;
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
本发明首先,利用4种“厚尾”分布构建了一个概率密度分布字典,组成自适应的混合“厚尾”分布,在理论上能够得到更加丰富的“厚尾”分布及其概率密度函数形式,有利于突破传统方法采用单一分布或某两个固定分布对小波变换系数分布进行统计建模时所存在的局限性,从而突破现有“厚尾”分布的种类限制,可为变换系数拟合提供更大的灵活性和更多的自由度,提高分布拟合的精度;其次,由于成像内容和成像机理的不同,自然图像和屏幕内容图像在空间域呈现出明显的纹理特征差异,在频率域也表现出明显的统计特征差异。本发明采用概率密度分布字典将两类图像的频率域统计特征差异建模为概率密度分布参数特征的差异,而采用马尔可夫随机过程将两类图像的空间域纹理特征差异建模为马尔可夫转移概率参数特征的差异,进而形成了空间域—频率域联合的可判别性特征,有利于提高图像分类的精度。因此,本发明具有稳定高效、自适应性强、分类精度高的优点。
具体实施方式
本发明的一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,按照如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3},本实施例中,令B=256;
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000121
所述
Figure BDA0002539226490000122
Figure BDA0002539226490000123
分别表示水平方向子带cHj的尺度参数和形状参数,
Figure BDA0002539226490000124
Figure BDA0002539226490000125
分别表示垂直方向子带cVj的尺度参数和形状参数,
Figure BDA0002539226490000126
Figure BDA0002539226490000127
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000128
Figure BDA0002539226490000129
Figure BDA00025392264900001210
所述
Figure BDA00025392264900001211
Figure BDA00025392264900001212
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤4.3根据公式(4)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900001213
Figure BDA00025392264900001214
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA0002539226490000131
Figure BDA0002539226490000132
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA0002539226490000133
Figure BDA0002539226490000134
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA0002539226490000135
Figure BDA0002539226490000136
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,
Figure BDA0002539226490000137
Figure BDA0002539226490000138
Figure BDA0002539226490000139
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001310
所述
Figure BDA00025392264900001311
Figure BDA00025392264900001312
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900001313
Figure BDA00025392264900001314
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900001315
Figure BDA00025392264900001316
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤5.2根据公式(5)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA00025392264900001317
Figure BDA00025392264900001318
所述
Figure BDA00025392264900001319
Figure BDA00025392264900001320
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,
Figure BDA00025392264900001321
Figure BDA00025392264900001322
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001323
所述
Figure BDA00025392264900001324
Figure BDA00025392264900001325
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900001326
Figure BDA00025392264900001327
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900001328
Figure BDA00025392264900001329
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.2根据公式(6)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900001330
Figure BDA0002539226490000141
所述
Figure BDA0002539226490000142
Figure BDA0002539226490000143
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA0002539226490000144
Figure BDA0002539226490000145
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA0002539226490000146
Figure BDA0002539226490000147
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA0002539226490000148
Figure BDA0002539226490000149
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900001410
所述
Figure BDA00025392264900001411
Figure BDA00025392264900001412
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure BDA00025392264900001413
Figure BDA00025392264900001414
分别表示垂直方向子带cVj的形状参数和尺度参数,
Figure BDA00025392264900001415
Figure BDA00025392264900001416
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤7.2根据公式(7)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA00025392264900001417
Figure BDA00025392264900001418
所述
Figure BDA00025392264900001419
Figure BDA00025392264900001420
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA00025392264900001421
Figure BDA00025392264900001422
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA00025392264900001423
Figure BDA00025392264900001424
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900001425
Figure BDA00025392264900001426
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤8.令图像I的概率密度分布参数特征
Figure BDA00025392264900001427
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤9.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA0002539226490000151
Figure BDA0002539226490000152
在本实施例中,令T=3;
步骤10.利用图像I中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000153
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure BDA0002539226490000154
步骤10.3令图像I的马尔可夫转移概率参数特征
Figure BDA0002539226490000155
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征
Figure BDA0002539226490000156
和马尔可夫转移概率参数特征
Figure BDA0002539226490000157
进行降维,得到
Figure BDA0002539226490000158
Figure BDA0002539226490000159
步骤12.以径向基函数作为核函数,将
Figure BDA00025392264900001510
Figure BDA00025392264900001511
输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成:
步骤13.1.输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1,本实施例中,令B=256;
步骤13.2.从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3.分别统计9个高频子带的归一化系数直方图;
步骤13.4.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure BDA0002539226490000161
所述
Figure BDA0002539226490000162
Figure BDA0002539226490000163
分别表示水平方向子带cHj的尺度参数和形状参数,
Figure BDA0002539226490000164
Figure BDA0002539226490000165
分别表示垂直方向子带cVj的尺度参数和形状参数,
Figure BDA0002539226490000166
Figure BDA0002539226490000167
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure BDA0002539226490000168
Figure BDA0002539226490000169
Figure BDA00025392264900001610
所述
Figure BDA00025392264900001611
Figure BDA00025392264900001612
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤13.5.3根据公式(15)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure BDA00025392264900001613
Figure BDA00025392264900001614
所述J表示高频子带所在的尺度且J∈{1,2},
Figure BDA0002539226490000171
Figure BDA0002539226490000172
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA0002539226490000173
Figure BDA0002539226490000174
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure BDA0002539226490000175
Figure BDA0002539226490000176
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,
Figure BDA0002539226490000177
Figure BDA0002539226490000178
Figure BDA0002539226490000179
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001710
所述
Figure BDA00025392264900001711
Figure BDA00025392264900001712
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900001713
Figure BDA00025392264900001714
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900001715
Figure BDA00025392264900001716
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.6.2根据公式(16)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure BDA00025392264900001717
Figure BDA00025392264900001718
所述
Figure BDA00025392264900001719
Figure BDA00025392264900001720
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,
Figure BDA00025392264900001721
Figure BDA00025392264900001722
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure BDA00025392264900001723
所述
Figure BDA00025392264900001724
Figure BDA00025392264900001725
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure BDA00025392264900001726
Figure BDA00025392264900001727
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure BDA00025392264900001728
Figure BDA00025392264900001729
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.2根据公式(17)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure BDA00025392264900001730
Figure BDA0002539226490000181
所述
Figure BDA0002539226490000182
Figure BDA0002539226490000183
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA0002539226490000184
Figure BDA0002539226490000185
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure BDA0002539226490000186
Figure BDA0002539226490000187
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure BDA0002539226490000188
Figure BDA0002539226490000189
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure BDA00025392264900001810
所述
Figure BDA00025392264900001811
Figure BDA00025392264900001812
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure BDA00025392264900001813
Figure BDA00025392264900001814
分别表示垂直方向子带cVj的形状参数和尺度参数,
Figure BDA00025392264900001815
Figure BDA00025392264900001816
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤13.8.2根据公式(18)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure BDA00025392264900001817
Figure BDA00025392264900001818
所述
Figure BDA00025392264900001819
Figure BDA00025392264900001820
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA00025392264900001821
Figure BDA00025392264900001822
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure BDA00025392264900001823
Figure BDA00025392264900001824
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure BDA00025392264900001825
Figure BDA00025392264900001826
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.9.令图像Ti的概率密度分布参数特征
Figure BDA00025392264900001827
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤13.10.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure BDA0002539226490000191
Figure BDA0002539226490000192
在本实施例中,令T=3;
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure BDA0002539226490000193
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure BDA0002539226490000194
步骤13.11.3令图像Ti的马尔可夫转移概率参数特征
Figure BDA0002539226490000195
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.12.利用95%的主成分分析方法将图像Ti的概率密度分布参数特征
Figure BDA0002539226490000196
和马尔可夫转移概率参数特征
Figure BDA0002539226490000197
进行降维,得到
Figure BDA0002539226490000198
Figure BDA0002539226490000199
步骤13.13.将
Figure BDA00025392264900001910
作为第i条训练数据,输入支持向量机LIBSVM,令i←i+1,若i≤N,则转入步骤13.2,否则转入步骤13.14;
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
为验证本发明的有效性,以1000幅自然图像和1000幅屏幕内容图像组成图像数据集进行实验。其中,自然图像和屏幕内容图像的来源为JCT-VC公布的标准屏幕内容视频以及自然视频序列,每个图像被裁剪为256×256像素;训练集包括1000幅图像(由500幅自然图像和500幅屏幕内容图像组成),测试集包括1000张图像(由500幅自然图像和500幅屏幕内容图像组成)。分类准确度定义为正确分类的自然图像数量与全部测试自然图像之比,以及正确分类的屏幕内容图像数量与全部屏幕内容图像之比之间的平均值,并将5次实验的平均值作为最终的分类准确度。
采用本发明和基于广义高斯分布的分类方法、基于镶嵌处理的分类方法、基于残差模式噪声的分类方法和基于隐马尔可夫树的分类方法进行图像分类的分类准确度对比如表1所示。
表1
Figure BDA0002539226490000201
从表1可见,通过充分发掘分布字典的概率分布参数的判别性特征,并将其与马尔可夫转移特征进行有机整合,本发明得到了适用屏幕内容图像和自然图像的、更加有效的判别性特征,获得了最高的图像分类准确度,比基于镶嵌处理的分类方法、基于残差模式噪声的分类方法、基于隐马尔可夫树的分类方法和基于广义高斯分布的分类方法分别提高了65.74%、19.45%、12.17%、7.04%。

Claims (1)

1.一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,其特征在于按如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure FDA0002539226480000011
所述
Figure FDA0002539226480000012
Figure FDA0002539226480000013
分别表示水平方向子带cHj的尺度参数和形状参数,
Figure FDA0002539226480000014
Figure FDA0002539226480000015
分别表示垂直方向子带cVj的尺度参数和形状参数,
Figure FDA0002539226480000016
Figure FDA0002539226480000017
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure FDA0002539226480000018
Figure FDA0002539226480000019
Figure FDA00025392264800000110
所述
Figure FDA00025392264800000111
Figure FDA00025392264800000112
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤4.3根据公式(4)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure FDA00025392264800000113
Figure FDA0002539226480000021
所述J表示高频子带所在的尺度且J∈{1,2},
Figure FDA0002539226480000022
Figure FDA0002539226480000023
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure FDA0002539226480000024
Figure FDA0002539226480000025
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure FDA0002539226480000026
Figure FDA0002539226480000027
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,
Figure FDA0002539226480000028
Figure FDA0002539226480000029
Figure FDA00025392264800000210
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000211
所述
Figure FDA00025392264800000212
Figure FDA00025392264800000213
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure FDA00025392264800000214
Figure FDA00025392264800000215
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure FDA00025392264800000216
Figure FDA00025392264800000217
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤5.2根据公式(5)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure FDA00025392264800000218
Figure FDA00025392264800000219
所述
Figure FDA00025392264800000220
Figure FDA00025392264800000221
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,
Figure FDA00025392264800000222
Figure FDA00025392264800000223
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000224
所述
Figure FDA00025392264800000225
Figure FDA00025392264800000226
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure FDA00025392264800000227
Figure FDA00025392264800000228
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure FDA00025392264800000229
Figure FDA00025392264800000230
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.2根据公式(6)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure FDA0002539226480000031
Figure FDA0002539226480000032
所述
Figure FDA0002539226480000033
Figure FDA0002539226480000034
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure FDA0002539226480000035
Figure FDA0002539226480000036
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure FDA0002539226480000037
Figure FDA0002539226480000038
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure FDA0002539226480000039
Figure FDA00025392264800000310
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure FDA00025392264800000311
所述
Figure FDA00025392264800000312
Figure FDA00025392264800000313
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure FDA00025392264800000314
Figure FDA00025392264800000315
分别表示垂直方向子带cVj的形状参数和尺度参数,
Figure FDA00025392264800000316
Figure FDA00025392264800000317
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤7.2根据公式(7)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure FDA00025392264800000318
Figure FDA00025392264800000319
所述
Figure FDA00025392264800000320
Figure FDA00025392264800000321
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure FDA00025392264800000322
Figure FDA00025392264800000323
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure FDA00025392264800000324
Figure FDA00025392264800000325
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure FDA00025392264800000326
Figure FDA00025392264800000327
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤8.令图像I的概率密度分布参数特征
Figure FDA00025392264800000328
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤9.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure FDA0002539226480000041
Figure FDA0002539226480000042
步骤10.利用图像I中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure FDA0002539226480000043
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure FDA0002539226480000044
步骤10.3令图像I的马尔可夫转移概率参数特征Θ2←{Ph(F(u+1,v)=n|F(u,v)=m)}∪{Pv(F(u,v+1)=n|F(u,v)=m)},共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征Θ1和马尔可夫转移概率参数特征Θ2进行降维,得到Θ′1和Θ′2
步骤12.以径向基函数作为核函数,将Θ′1和Θ′2输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成:
步骤13.1输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1;
步骤13.2从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3分别统计9个高频子带的归一化系数直方图;
步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合
Figure FDA0002539226480000051
所述
Figure FDA0002539226480000052
Figure FDA0002539226480000053
分别表示水平方向子带cHj的尺度参数和形状参数,
Figure FDA0002539226480000054
Figure FDA0002539226480000055
分别表示垂直方向子带cVj的尺度参数和形状参数,
Figure FDA0002539226480000056
Figure FDA0002539226480000057
分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
Figure FDA0002539226480000058
Figure FDA0002539226480000059
Figure FDA00025392264800000510
所述
Figure FDA00025392264800000511
Figure FDA00025392264800000512
分别表示水平方向子带cHj、垂直方向子带cVj和对角线方向子带cDj的标准差,Γ(·)表示Gamma函数;
步骤13.5.3根据公式(15)的定义,将相邻尺度下的标准差之比和形状参数之比作为区分自然图像和屏幕内容图像的广义高斯分布参数特征
Figure FDA00025392264800000513
Figure FDA00025392264800000514
所述J表示高频子带所在的尺度且J∈{1,2},
Figure FDA0002539226480000061
Figure FDA0002539226480000062
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure FDA0002539226480000063
Figure FDA0002539226480000064
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,
Figure FDA0002539226480000065
Figure FDA0002539226480000066
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数,
Figure FDA0002539226480000067
Figure FDA0002539226480000068
Figure FDA0002539226480000069
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000610
所述
Figure FDA00025392264800000611
Figure FDA00025392264800000612
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure FDA00025392264800000613
Figure FDA00025392264800000614
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure FDA00025392264800000615
Figure FDA00025392264800000616
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.6.2根据公式(16)的定义,将相邻尺度下的尺度参数之比作为区分自然图像和屏幕内容图像的柯西分布特征
Figure FDA00025392264800000617
Figure FDA00025392264800000618
所述
Figure FDA00025392264800000619
Figure FDA00025392264800000620
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数,
Figure FDA00025392264800000621
Figure FDA00025392264800000622
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的柯西分布的尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合
Figure FDA00025392264800000623
所述
Figure FDA00025392264800000624
Figure FDA00025392264800000625
分别表示水平方向子带cHj的位置参数和尺度参数,
Figure FDA00025392264800000626
Figure FDA00025392264800000627
分别表示垂直方向子带cVj的位置参数和尺度参数,
Figure FDA00025392264800000628
Figure FDA00025392264800000629
分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.2根据公式(17)的定义,将相邻尺度下的尺度参数之比和位置参数之比作为区分自然图像和屏幕内容图像的拉普拉斯分布特征
Figure FDA00025392264800000630
Figure FDA0002539226480000071
所述
Figure FDA0002539226480000072
Figure FDA0002539226480000073
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure FDA0002539226480000074
Figure FDA0002539226480000075
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,
Figure FDA0002539226480000076
Figure FDA0002539226480000077
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,
Figure FDA0002539226480000078
Figure FDA0002539226480000079
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合
Figure FDA00025392264800000710
所述
Figure FDA00025392264800000711
Figure FDA00025392264800000712
分别表示水平方向子带cHj的形状参数和尺度参数,
Figure FDA00025392264800000713
Figure FDA00025392264800000714
分别表示垂直方向子带cVj的形状参数和尺度参数,
Figure FDA00025392264800000715
Figure FDA00025392264800000716
分别表示对角线方向子带cDj的形状参数和尺度参数;
步骤13.8.2根据公式(18)的定义,将相邻尺度下的形状参数之比和尺度参数之比作为区分自然图像和屏幕内容图像的α-稳态分布特征
Figure FDA00025392264800000717
Figure FDA00025392264800000718
所述
Figure FDA00025392264800000719
Figure FDA00025392264800000720
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure FDA00025392264800000721
Figure FDA00025392264800000722
分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,
Figure FDA00025392264800000723
Figure FDA00025392264800000724
分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,
Figure FDA00025392264800000725
Figure FDA00025392264800000726
则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.9.令图像Ti的概率密度分布参数特征
Figure FDA00025392264800000727
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F(u,v)和沿着竖直方向计算1阶差分矩阵F(u,v);
步骤13.10.2对差分矩阵F(u,v)和F(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F(u,v)和F(u,v)中的每个元素进行截断运算:
Figure FDA0002539226480000081
Figure FDA0002539226480000082
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F(u,v)和F(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F(u,v)沿着水平方向的马尔可夫转移概率Ph(F(u+1,v)=n|F(u,v)=m):
Figure FDA0002539226480000083
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F(u,v)沿着竖直方向的马尔可夫转移概率Pv(F(u,v+1)=n|F(u,v)=m):
Figure FDA0002539226480000084
步骤13.11.3令图像Ti的马尔可夫转移概率参数特征
Figure FDA0002539226480000085
共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.12.利用95%的主成分分析方法将图像Ti的概率密度分布参数特征
Figure FDA0002539226480000086
和马尔可夫转移概率参数特征
Figure FDA0002539226480000087
进行降维,得到
Figure FDA0002539226480000088
Figure FDA0002539226480000089
步骤13.13.将
Figure FDA00025392264800000810
作为第i条训练数据,输入支持向量机LIBSVM,令i←i+1,若i≤N,则转入步骤13.2,否则转入步骤13.14;
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
CN202010542010.3A 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 Active CN111783848B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010542010.3A CN111783848B (zh) 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010542010.3A CN111783848B (zh) 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Publications (2)

Publication Number Publication Date
CN111783848A true CN111783848A (zh) 2020-10-16
CN111783848B CN111783848B (zh) 2023-05-23

Family

ID=72756530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010542010.3A Active CN111783848B (zh) 2020-06-15 2020-06-15 基于概率密度分布字典和马尔可夫转移特征的图像分类方法

Country Status (1)

Country Link
CN (1) CN111783848B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075133A1 (en) * 2005-01-13 2006-07-20 Isis Innovation Limited Physiological data classification
CN101604376A (zh) * 2008-10-11 2009-12-16 大连大学 基于hmm-svm混合模型的人脸识别方法
CN103034847A (zh) * 2012-12-13 2013-04-10 河海大学 一种基于隐马尔可夫模型的人脸识别方法
US20130124438A1 (en) * 2011-11-11 2013-05-16 Sung-young Lee Method of recognizing patterns based on markov chain hidden conditional random field model
CN110880192A (zh) * 2019-07-29 2020-03-13 辽宁师范大学 基于概率密度函数字典的图像dct系数分布拟合方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075133A1 (en) * 2005-01-13 2006-07-20 Isis Innovation Limited Physiological data classification
CN101604376A (zh) * 2008-10-11 2009-12-16 大连大学 基于hmm-svm混合模型的人脸识别方法
US20130124438A1 (en) * 2011-11-11 2013-05-16 Sung-young Lee Method of recognizing patterns based on markov chain hidden conditional random field model
CN103034847A (zh) * 2012-12-13 2013-04-10 河海大学 一种基于隐马尔可夫模型的人脸识别方法
CN110880192A (zh) * 2019-07-29 2020-03-13 辽宁师范大学 基于概率密度函数字典的图像dct系数分布拟合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘战文;焦李成;金海燕;沙宇恒;杨淑媛;: "基于Contourlet域HMT模型的图像融合", 西安电子科技大学学报 *

Also Published As

Publication number Publication date
CN111783848B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
US7174044B2 (en) Method for character recognition based on gabor filters
CN104050471B (zh) 一种自然场景文字检测方法及系统
CN102081731B (zh) 一种从图像中提取文本的方法和装置
WO2018145470A1 (zh) 一种图像检测方法和装置
CN103854016B (zh) 基于方向性共同发生特征的人体行为分类识别方法及系统
Lu et al. A novel approach for video text detection and recognition based on a corner response feature map and transferred deep convolutional neural network
CN108829711B (zh) 一种基于多特征融合的图像检索方法
CN106022303B (zh) 基于无透镜全息成像的淡水藻类粗分类与计数方法
CN104268590A (zh) 基于互补性组合特征与多相回归的盲图像质量评价方法
CN102819733A (zh) 一种快速的街景图像中人脸的检测模糊方法
Retornaz et al. Scene text localization based on the ultimate opening.
CN108133211B (zh) 一种基于移动终端视觉图像的检测配电柜的方法
CN104504161B (zh) 一种基于机器人视觉平台的图像检索方法
CN102004902A (zh) 一种基于小波和稀疏表示理论的近红外人脸图像识别方法
CN103885978A (zh) 一种多层分级图像检索方法
CN106203291B (zh) 一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法
CN106295478A (zh) 一种图像特征提取方法和装置
CN111783848A (zh) 基于概率密度分布字典和马尔可夫转移特征的图像分类方法
CN110866470A (zh) 一种基于随机图像特征的人脸防伪检测方法
CN103871084B (zh) 蓝印花布图案识别方法
Malviya et al. Copy move forgery detection using low complexity feature extraction
CN110489587B (zh) 局部梯度方向三值模式的轮胎痕迹图像特征提取方法
Singh et al. An efficient hybrid scheme for key frame extraction and text localization in video
Shahab et al. Bayesian approach to photo time-stamp recognition
CN102279925A (zh) 链式处理人脸识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231120

Address after: Room 2401, 2402, 2403, 2407, 24/F, Building B, No. 6, Yiyang Road, Qixianling, High-tech Industrial Park, Dalian, Liaoning, 116000

Patentee after: Dalian Houren Technology Co.,Ltd.

Address before: No. 116500, Shahekou Road, Dalian City, Liaoning Province

Patentee before: LIAONING NORMAL University