CN111783848A - 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 - Google Patents
基于概率密度分布字典和马尔可夫转移特征的图像分类方法 Download PDFInfo
- Publication number
- CN111783848A CN111783848A CN202010542010.3A CN202010542010A CN111783848A CN 111783848 A CN111783848 A CN 111783848A CN 202010542010 A CN202010542010 A CN 202010542010A CN 111783848 A CN111783848 A CN 111783848A
- Authority
- CN
- China
- Prior art keywords
- sub
- bands
- scale
- parameter
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 291
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012546 transfer Methods 0.000 title claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 33
- 230000007704 transition Effects 0.000 claims abstract description 33
- 239000011159 matrix material Substances 0.000 claims description 46
- 238000007476 Maximum Likelihood Methods 0.000 claims description 12
- 238000013145 classification model Methods 0.000 claims description 9
- 238000012512 characterization method Methods 0.000 claims description 6
- 238000012847 principal component analysis method Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 239000011782 vitamin Substances 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 229940088594 vitamin Drugs 0.000 claims description 5
- 229930003231 vitamin Natural products 0.000 claims description 5
- 235000013343 vitamin Nutrition 0.000 claims description 5
- 150000003722 vitamin derivatives Chemical class 0.000 claims description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 230000008569 process Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 3
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于概率分布参数特征和马尔可夫转移特征的图像分类方法,首先,采用柯西分布、拉普拉斯分布、广义高斯分布和α‑稳态分布为原子,建立一个分布字典,对输入图像的不同尺度、不同子带下的高频小波变换系数分布进行拟合;利用1阶差分算子分别计算离散余弦变换系数沿水平方向、竖直方向的马尔可夫转移概率;将概率密度分布参数特征和马尔可夫转移概率参数特征作为分类特征,以支持向量机LIBSVM作为分类器,以径向基函数作为核函数,训练得到一种基于支持向量机LIBSVM的、用于屏幕内容图像和自然图像的分类器,进而实现屏幕内容图像块和自然图像块的自动分类。
Description
技术领域
本发明涉及屏幕内容的图像和视频处理领域,尤其是一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
背景技术
复杂度适中、面向屏幕内容视频的高效率编码是视频编码领域具有挑战性的最新研究课题之一,学者们将其称为“屏幕内容视频编码”。目前,H.264/AVC、HEVC对屏幕内容中的线条、文字、图形等非连续色调内容的压缩效率尚未满足应用需求,且计算复杂度高。究其原因在于,屏幕内容由不连续色调区域和连续色调区域两部分共同组成,而二者的成像机制和获取手段却完全不同,使得其通道特性也大相径庭。在空间域中,不连续色调区域拥有背景简单、对比度高、色调数量有限的锐化边缘和线条,而连续色调区域的纹理特点却恰恰相反;在频率域中,与连续色调区域相比,不连续色调区域的离散余弦变换(DiscreteCosine Transform,DCT)系数分布呈现更加显著的非高斯特性。所以,无论在空间域,还是在频率域,不连续色调区域的统计分布规律都明显有别于连续色调区域,目前还不存在任何一种编码方法,能在这两类区域上均取得令人满意的编码效率。在这种情况下,面向屏幕内容视频的国际编码标准HEVC-SCC采用了一种混合编码框架对屏幕内容进行压缩,其主要思路是首先将待编码帧划分为不连续色调块和连续色调块,再为不同类型的块选择恰当的编码算法,从而形成复合码流。然而,由于研究人员目前尚缺乏对屏幕内容视频的统计分布特征,尤其是DCT系数统计分布特征的深入认识,HEVC-SCC编码器仅能依靠对不同编码模式的枚举和多次率失真选择,才能为每个待编码块确定恰当的图像块类型及其编码方法,其决策过程的计算负担非常繁重。因此,对自然图像块和屏幕内容图像块进行准确地自动分类,已经成为一个现实且重要的问题,它是指导SCC视频编码器实现快速块分类决策的关键环节,有利于加快编码器的编码模式决策和率失真优化的速度,进而提高编码器的时间效率。
目前,还鲜见对包含大量文字、电脑桌面内容的屏幕内容图像与自然图像进行分类的方法。现有方法主要集中于对自然图像和计算机生成图像的分类,这些方法大致可以分为三类:基于统计特征的分类方法、基于几何特征的分类方法和基于物理特征的分类方法。
在基于统计特征的分类方法方面,Fard等人对图像的RGB颜色通道采取4阶小波变换,然后提取每阶小波高频子带的216维统计特征,并采用SVM及LDA进行分类,其对自然图像的识别准确率为98.8%,但计算机生成图像的识别准确率仅66.8%,并且其特征维数较高,准确率也不足,尤其是计算机生成图像的分类识别精度不够。Chen等人提出采用图像特征函数的统计矩以及小波子带作为分类特征,应用小波系数直方图的特征函数来构造一个234维的区分特征,并采用LIBSVM在RBF核的基础上实现图像种类判别,其识别精度达到了82.1%。虽然精度有所提升,但特征向量的维度和计算复杂度均更高。Li等人在YCbCr颜色空间中提取均匀的59维灰度不变LBP特征,再使用SVM和多项式核函数完成图像分类,其平均精确度可以达到98.33%,但复杂度较高,鲁棒性也不尽人意。Wang等人利用同态滤波突出图像细节,用共生矩阵构建分类特征,再通过计算各灰度共生矩阵的能量、对比度、同质性、列平均最大值以及纹理相似性等特征,使平均分类精度达到了98%。
在基于几何特征的图像分类方面,Peng等人提出了一种基于多重分形谱和回归分析的自然图像和计算机生成图像分类算法,利用多元线性回归得到残差图像,同时研究纹理差异和回归模型的拟合度,从而得到9维直方图特征、9维多重分形谱特征和6维回归模型拟合特征,再应用LIBSVM的RBF核函数和5倍交叉验证训练模型。通过分析局部边缘斑块的统计特性,Zhang等人对图像边缘块进行预处理,将其投影到一个7维的球面空间,再依据Voronoi单元确定关键采样点,形成可视化词汇表,进而采用SVM实现图像分类。不过,该方法对特征维数非常敏感,当特征维数降为14时,其识别精度仅为88%,尚需提高小维度特征的精确度。Pan等人提出应用分形几何来实现图像分类的目的,从HSV颜色空间的H、S通道获取10个分类特征,再从H通道中提取一个用于表征图像粗糙度的10维特征向量,从而借助SVM和网格搜索优化完成分类,其平均分类精度为91.2%,但是对计算机生成图像的识别精度仍然不足。
在基于物理特征的图像分类方面,考虑到自然图像是由采集设备(如数码相机、手机等)所获取的,设备的物理特性必然能够在图像中得以反映。自然图像在采集过程中必定经过彩色滤波阵列(Color Filter Array,CFA)的插值操作,而计算机生成图像却无需该过程。故此,CFA插值系自然图像所特有的运算,亦被称为“马赛克”。为此,张晓琳等人在分析了插值图像与原图像的频谱差异后,提出了一种基于通道间相关性的CFA图像盲取证算法,能够实现对篡改图像的自动识别。Gallagher等人发现,CFA插值会降低像素方差,于是提出了一种基于CFA插值的去噪周期方差特征存在性检测的检测方案,平均可达到98.4%的判别精度。然而,如果仅使用处于图像中心的、大小为64×64像素的块来完成判别,则其精度会急剧下降到66%。此外,PRNU也是一种由传感器产生的、自然图像所特有的模式噪声,在图像源识别中具有广泛应用。由于CFA插值与其邻域的像素有较强的相关性,且具有周期性,Peng等人认为PRNU在像素的某个邻域内将同样表现出周期性特点,于是提出了一种借助PRNU来度量CFA插值影响的方法,其主要思路是通过分析PRNU方差直方图,从而获得峰值、均值和方差的9维特征,再使用LIBSVM的RBF核函数和5倍交叉验证进行训练,将图像分类的平均精度提高到了99.43%。但是,该方法的计算复杂度较高,且依赖于图像所特有的PRNU模式噪声,其鲁棒性尚不尽如人意。
总体来看,上述方案仍存在分类特征维度大、计算复杂度高、鲁棒性差、自适应性弱的缺点。并且,由于屏幕视频的统计特性不同于计算机生成图像,这些方案尚无法很好地适用于屏幕内容图像块与自然图像块的自动分类。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种稳定高效、自适应性强、分类精度高、基于概率密度分布字典和马尔可夫转移特征的图像分类方法。
本发明的技术解决方案是:一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,其特征在于按如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合所述和分别表示水平方向子带cHj的尺度参数和形状参数,和分别表示垂直方向子带cVj的尺度参数和形状参数,和分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
所述J表示高频子带所在的尺度且J∈{1,2},和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数, 和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合所述和分别表示水平方向子带cHj的形状参数和尺度参数,和分别表示垂直方向子带cVj的形状参数和尺度参数,和分别表示对角线方向子带cDj的形状参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,和则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F→(u,v)和沿着竖直方向计算1阶差分矩阵F↓(u,v);
步骤9.2对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行截断运算:
步骤10.利用图像I中全部图像块的1阶差分矩阵F→(u,v)和F↓(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F→(u,v)沿着水平方向的马尔可夫转移概率Ph(F→(u+1,v)=n|F→(u,v)=m):
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F↓(u,v)沿着竖直方向的马尔可夫转移概率Pv(F↓(u,v+1)=|nF↓(u,v)=m):
所述基于支持向量机LIBSVM的图像分类模型,是按照如下步骤训练而成:
步骤13.1输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1;
步骤13.2从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3分别统计9个高频子带的归一化系数直方图;
步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合所述和分别表示水平方向子带cHj的尺度参数和形状参数,和分别表示垂直方向子带cVj的尺度参数和形状参数,和分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
所述J表示高频子带所在的尺度且J∈{1,2},和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数, 和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合所述和分别表示水平方向子带cHj的形状参数和尺度参数,和分别表示垂直方向子带cVj的形状参数和尺度参数,和分别表示对角线方向子带cDj的形状参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,和则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F→(u,v)和沿着竖直方向计算1阶差分矩阵F↓(u,v);
步骤13.10.2对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行截断运算:
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F→(u,v)和F↓(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F→(u,v)沿着水平方向的马尔可夫转移概率Ph(F→(u+1,v)=n|F→(u,v)=m):
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F↓(u,v)沿着竖直方向的马尔可夫转移概率Pv(F↓(u,v+1)=n|F↓(u,v)=m):
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
本发明首先,利用4种“厚尾”分布构建了一个概率密度分布字典,组成自适应的混合“厚尾”分布,在理论上能够得到更加丰富的“厚尾”分布及其概率密度函数形式,有利于突破传统方法采用单一分布或某两个固定分布对小波变换系数分布进行统计建模时所存在的局限性,从而突破现有“厚尾”分布的种类限制,可为变换系数拟合提供更大的灵活性和更多的自由度,提高分布拟合的精度;其次,由于成像内容和成像机理的不同,自然图像和屏幕内容图像在空间域呈现出明显的纹理特征差异,在频率域也表现出明显的统计特征差异。本发明采用概率密度分布字典将两类图像的频率域统计特征差异建模为概率密度分布参数特征的差异,而采用马尔可夫随机过程将两类图像的空间域纹理特征差异建模为马尔可夫转移概率参数特征的差异,进而形成了空间域—频率域联合的可判别性特征,有利于提高图像分类的精度。因此,本发明具有稳定高效、自适应性强、分类精度高的优点。
具体实施方式
本发明的一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,按照如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3},本实施例中,令B=256;
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合所述和分别表示水平方向子带cHj的尺度参数和形状参数,和分别表示垂直方向子带cVj的尺度参数和形状参数,和分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
所述J表示高频子带所在的尺度且J∈{1,2},和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数, 和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合所述和分别表示水平方向子带cHj的形状参数和尺度参数,和分别表示垂直方向子带cVj的形状参数和尺度参数,和分别表示对角线方向子带cDj的形状参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,和则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F→(u,v)和沿着竖直方向计算1阶差分矩阵F↓(u,v);
步骤9.2对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行截断运算:
在本实施例中,令T=3;
步骤10.利用图像I中全部图像块的1阶差分矩阵F→(u,v)和F↓(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F→(u,v)沿着水平方向的马尔可夫转移概率Ph(F→(u+1,v)=n|F→(u,v)=m):
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F↓(u,v)沿着竖直方向的马尔可夫转移概率Pv(F↓(u,v+1)=n|F↓(u,v)=m):
所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成:
步骤13.1.输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1,本实施例中,令B=256;
步骤13.2.从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3.分别统计9个高频子带的归一化系数直方图;
步骤13.4.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合所述和分别表示水平方向子带cHj的尺度参数和形状参数,和分别表示垂直方向子带cVj的尺度参数和形状参数,和分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
所述J表示高频子带所在的尺度且J∈{1,2},和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数, 和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合所述和分别表示水平方向子带cHj的形状参数和尺度参数,和分别表示垂直方向子带cVj的形状参数和尺度参数,和分别表示对角线方向子带cDj的形状参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,和则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F→(u,v)和沿着竖直方向计算1阶差分矩阵F↓(u,v);
步骤13.10.2对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行截断运算:
在本实施例中,令T=3;
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F→(u,v)和F↓(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F→(u,v)沿着水平方向的马尔可夫转移概率Ph(F→(u+1,v)=n|F→(u,v)=m):
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F↓(u,v)沿着竖直方向的马尔可夫转移概率Pv(F↓(u,v+1)=n|F↓(u,v)=m):
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
为验证本发明的有效性,以1000幅自然图像和1000幅屏幕内容图像组成图像数据集进行实验。其中,自然图像和屏幕内容图像的来源为JCT-VC公布的标准屏幕内容视频以及自然视频序列,每个图像被裁剪为256×256像素;训练集包括1000幅图像(由500幅自然图像和500幅屏幕内容图像组成),测试集包括1000张图像(由500幅自然图像和500幅屏幕内容图像组成)。分类准确度定义为正确分类的自然图像数量与全部测试自然图像之比,以及正确分类的屏幕内容图像数量与全部屏幕内容图像之比之间的平均值,并将5次实验的平均值作为最终的分类准确度。
采用本发明和基于广义高斯分布的分类方法、基于镶嵌处理的分类方法、基于残差模式噪声的分类方法和基于隐马尔可夫树的分类方法进行图像分类的分类准确度对比如表1所示。
表1
从表1可见,通过充分发掘分布字典的概率分布参数的判别性特征,并将其与马尔可夫转移特征进行有机整合,本发明得到了适用屏幕内容图像和自然图像的、更加有效的判别性特征,获得了最高的图像分类准确度,比基于镶嵌处理的分类方法、基于残差模式噪声的分类方法、基于隐马尔可夫树的分类方法和基于广义高斯分布的分类方法分别提高了65.74%、19.45%、12.17%、7.04%。
Claims (1)
1.一种基于概率密度分布字典和马尔可夫转移特征的图像分类方法,其特征在于按如下步骤进行:
步骤1.输入一幅大小为B×B的图像I,将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤2.分别统计9个高频子带的归一化系数直方图;
步骤3.以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布作为分布原子,建立一个概率密度分布字典D;
步骤4.采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤4.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合所述和分别表示水平方向子带cHj的尺度参数和形状参数,和分别表示垂直方向子带cVj的尺度参数和形状参数,和分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤4.2根据公式(1)-公式(3)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
所述J表示高频子带所在的尺度且J∈{1,2},和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数, 和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤5.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤5.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤6.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤6.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤7.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤7.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合所述和分别表示水平方向子带cHj的形状参数和尺度参数,和分别表示垂直方向子带cVj的形状参数和尺度参数,和分别表示对角线方向子带cDj的形状参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,和则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤9.对图像I划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤9.1~步骤9.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤9.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F→(u,v)和沿着竖直方向计算1阶差分矩阵F↓(u,v);
步骤9.2对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤9.3根据公式(8)和公式(9)的定义,利用预设阈值T对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行截断运算:
步骤10.利用图像I中全部图像块的1阶差分矩阵F→(u,v)和F↓(u,v),执行步骤10.1~步骤10.3来提取图像I的马尔可夫转移概率参数特征;
步骤10.1根据公式(10)的定义,计算1阶差分矩阵F→(u,v)沿着水平方向的马尔可夫转移概率Ph(F→(u+1,v)=n|F→(u,v)=m):
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤10.2根据公式(11)的定义,计算1阶差分矩阵F↓(u,v)沿着竖直方向的马尔可夫转移概率Pv(F↓(u,v+1)=n|F↓(u,v)=m):
步骤10.3令图像I的马尔可夫转移概率参数特征Θ2←{Ph(F→(u+1,v)=n|F→(u,v)=m)}∪{Pv(F↓(u,v+1)=n|F↓(u,v)=m)},共(2T+1)×(2T+1)×2个维度,所述m和n是整数,且m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤11.利用95%的主成分分析方法将图像I的概率密度分布参数特征Θ1和马尔可夫转移概率参数特征Θ2进行降维,得到Θ′1和Θ′2;
步骤12.以径向基函数作为核函数,将Θ′1和Θ′2输入基于支持向量机LIBSVM的图像分类模型,进而计算得出图像I的分类结果;
所述基于支持向量机LIBSVM的图像分类模型按照如下步骤训练而成:
步骤13.1输入一组包含N幅图像的训练集{Ti,Ci},训练集中每幅图像的大小为B×B像素,所述1≤i≤N,Ti表示第i幅训练图像,Ci表示第i幅训练图像的分类标签且Ci∈{-1,+1},标签“-1”表示Ti为屏幕内容图像样本,标签“+1”表示Ti为自然图像样本,令i←1;
步骤13.2从训练集中取出第i幅训练图像Ti,并将其进行3层离散小波变换,得到9个高频子带:3个水平方向子带cHj∈{cH1,cH2,cH3}、3个垂直方向子带cVj∈{cV1,cV2,cV3}和3个对角线方向子带cDj∈{cD1,cD2,cD3},所述j表示高频子带所在的尺度且j∈{1,2,3};
步骤13.3分别统计9个高频子带的归一化系数直方图;
步骤13.4以广义高斯分布、柯西分布、拉普拉斯分布和α-稳态分布为分布原子,建立一个概率密度分布字典D;
步骤13.5采用广义高斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取广义高斯分布在9个高频子带上的参数特征;
步骤13.5.1采用广义高斯分布和基于估计方程的方法对9个高频子带的归一化系数直方图进行拟合,得到广义高斯分布在9个高频子带上的尺度参数和形状参数集合所述和分别表示水平方向子带cHj的尺度参数和形状参数,和分别表示垂直方向子带cVj的尺度参数和形状参数,和分别表示对角线方向子带cDj的尺度参数和形状参数;
步骤13.5.2根据公式(12)-公式(14)的定义,利用9个高频子带的广义高斯分布的尺度参数计算其相应的标准差:
所述J表示高频子带所在的尺度且J∈{1,2},和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的标准差,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数, 和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的广义高斯分布的形状参数;
步骤13.6.采用柯西分布对9个高频子带的归一化系数直方图进行拟合,进而提取柯西分布在9个高频子带上的参数特征;
步骤13.6.1采用柯西分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到柯西分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
步骤13.7.采用拉普拉斯分布对9个高频子带的归一化系数直方图进行拟合,进而提取拉普拉斯分布在9个高频子带上的参数特征;
步骤13.7.1采用拉普拉斯分布和极大似然估计法对9个高频子带的归一化系数直方图进行拟合,得到拉普拉斯分布在9个高频子带上的位置参数和尺度参数集合所述和分别表示水平方向子带cHj的位置参数和尺度参数,和分别表示垂直方向子带cVj的位置参数和尺度参数,和分别表示对角线方向子带cDj的位置参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的位置参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的拉普拉斯分布的尺度参数;
步骤13.8.采用α-稳态分布对9个高频子带的归一化系数直方图进行拟合,进而提取α-稳态分布在9个高频子带上的参数特征;
步骤13.8.1采用α-稳态分布和基于经验特征函数的方法对9个高频子带的归一化系数直方图进行拟合,得到α-稳态分布在9个高频子带上的形状参数和尺度参数集合所述和分别表示水平方向子带cHj的形状参数和尺度参数,和分别表示垂直方向子带cVj的形状参数和尺度参数,和分别表示对角线方向子带cDj的形状参数和尺度参数;
所述和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的形状参数,和分别表示在尺度J下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数,和则分别表示在尺度J+1下,水平方向子带、垂直方向子带和对角线方向子带的α-稳态分布的尺度参数;
步骤13.10.对图像Ti划分为不重叠的、大小为8×8像素的图像块,并将每个图像块进行离散余弦变换,进而,对于每个图像块的离散余弦变换系数矩阵F(u,v),执行步骤13.10.1~步骤13.10.3来计算F(u,v)的1阶差分,所述1≤u,v≤8;
步骤13.10.1利用前向差分算子,分别沿着水平方向计算1阶差分矩阵F→(u,v)和沿着竖直方向计算1阶差分矩阵F↓(u,v);
步骤13.10.2对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行取整运算,取整原则为四舍五入;
步骤13.10.3根据公式(19)和公式(20)的定义,利用预设阈值T对差分矩阵F→(u,v)和F↓(u,v)中的每个元素进行截断运算:
步骤13.11.利用图像Ti中全部图像块的1阶差分矩阵F→(u,v)和F↓(u,v),执行步骤13.11.1~步骤13.11.3来提取图像Ti的马尔可夫转移概率参数特征;
步骤13.11.1根据公式(21)的定义,计算1阶差分矩阵F→(u,v)沿着水平方向的马尔可夫转移概率Ph(F→(u+1,v)=n|F→(u,v)=m):
所述δ(·)表示Delta函数,m,n∈{-T,-T+1,-T+2,…,T-1,T};
步骤13.11.2根据公式(22)的定义,计算1阶差分矩阵F↓(u,v)沿着竖直方向的马尔可夫转移概率Pv(F↓(u,v+1)=n|F↓(u,v)=m):
步骤13.14.以全部的N条训练数据组成训练集,以径向基函数作为核函数,以网格搜索作为自动寻优方式,通过五倍交叉验证,对支持向量机LIBSVM进行训练,进而得到基于支持向量机LIBSVM的图像分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010542010.3A CN111783848B (zh) | 2020-06-15 | 2020-06-15 | 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010542010.3A CN111783848B (zh) | 2020-06-15 | 2020-06-15 | 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783848A true CN111783848A (zh) | 2020-10-16 |
CN111783848B CN111783848B (zh) | 2023-05-23 |
Family
ID=72756530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010542010.3A Active CN111783848B (zh) | 2020-06-15 | 2020-06-15 | 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783848B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006075133A1 (en) * | 2005-01-13 | 2006-07-20 | Isis Innovation Limited | Physiological data classification |
CN101604376A (zh) * | 2008-10-11 | 2009-12-16 | 大连大学 | 基于hmm-svm混合模型的人脸识别方法 |
CN103034847A (zh) * | 2012-12-13 | 2013-04-10 | 河海大学 | 一种基于隐马尔可夫模型的人脸识别方法 |
US20130124438A1 (en) * | 2011-11-11 | 2013-05-16 | Sung-young Lee | Method of recognizing patterns based on markov chain hidden conditional random field model |
CN110880192A (zh) * | 2019-07-29 | 2020-03-13 | 辽宁师范大学 | 基于概率密度函数字典的图像dct系数分布拟合方法 |
-
2020
- 2020-06-15 CN CN202010542010.3A patent/CN111783848B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006075133A1 (en) * | 2005-01-13 | 2006-07-20 | Isis Innovation Limited | Physiological data classification |
CN101604376A (zh) * | 2008-10-11 | 2009-12-16 | 大连大学 | 基于hmm-svm混合模型的人脸识别方法 |
US20130124438A1 (en) * | 2011-11-11 | 2013-05-16 | Sung-young Lee | Method of recognizing patterns based on markov chain hidden conditional random field model |
CN103034847A (zh) * | 2012-12-13 | 2013-04-10 | 河海大学 | 一种基于隐马尔可夫模型的人脸识别方法 |
CN110880192A (zh) * | 2019-07-29 | 2020-03-13 | 辽宁师范大学 | 基于概率密度函数字典的图像dct系数分布拟合方法 |
Non-Patent Citations (1)
Title |
---|
刘战文;焦李成;金海燕;沙宇恒;杨淑媛;: "基于Contourlet域HMT模型的图像融合", 西安电子科技大学学报 * |
Also Published As
Publication number | Publication date |
---|---|
CN111783848B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7174044B2 (en) | Method for character recognition based on gabor filters | |
CN104050471B (zh) | 一种自然场景文字检测方法及系统 | |
CN102081731B (zh) | 一种从图像中提取文本的方法和装置 | |
WO2018145470A1 (zh) | 一种图像检测方法和装置 | |
CN103854016B (zh) | 基于方向性共同发生特征的人体行为分类识别方法及系统 | |
Lu et al. | A novel approach for video text detection and recognition based on a corner response feature map and transferred deep convolutional neural network | |
CN108829711B (zh) | 一种基于多特征融合的图像检索方法 | |
CN106022303B (zh) | 基于无透镜全息成像的淡水藻类粗分类与计数方法 | |
CN104268590A (zh) | 基于互补性组合特征与多相回归的盲图像质量评价方法 | |
CN102819733A (zh) | 一种快速的街景图像中人脸的检测模糊方法 | |
Retornaz et al. | Scene text localization based on the ultimate opening. | |
CN108133211B (zh) | 一种基于移动终端视觉图像的检测配电柜的方法 | |
CN104504161B (zh) | 一种基于机器人视觉平台的图像检索方法 | |
CN102004902A (zh) | 一种基于小波和稀疏表示理论的近红外人脸图像识别方法 | |
CN103885978A (zh) | 一种多层分级图像检索方法 | |
CN106203291B (zh) | 一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法 | |
CN106295478A (zh) | 一种图像特征提取方法和装置 | |
CN111783848A (zh) | 基于概率密度分布字典和马尔可夫转移特征的图像分类方法 | |
CN110866470A (zh) | 一种基于随机图像特征的人脸防伪检测方法 | |
CN103871084B (zh) | 蓝印花布图案识别方法 | |
Malviya et al. | Copy move forgery detection using low complexity feature extraction | |
CN110489587B (zh) | 局部梯度方向三值模式的轮胎痕迹图像特征提取方法 | |
Singh et al. | An efficient hybrid scheme for key frame extraction and text localization in video | |
Shahab et al. | Bayesian approach to photo time-stamp recognition | |
CN102279925A (zh) | 链式处理人脸识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231120 Address after: Room 2401, 2402, 2403, 2407, 24/F, Building B, No. 6, Yiyang Road, Qixianling, High-tech Industrial Park, Dalian, Liaoning, 116000 Patentee after: Dalian Houren Technology Co.,Ltd. Address before: No. 116500, Shahekou Road, Dalian City, Liaoning Province Patentee before: LIAONING NORMAL University |