CN104200225A - 一种基于局部空间约束图模型的图像分类方法 - Google Patents
一种基于局部空间约束图模型的图像分类方法 Download PDFInfo
- Publication number
- CN104200225A CN104200225A CN201410439295.2A CN201410439295A CN104200225A CN 104200225 A CN104200225 A CN 104200225A CN 201410439295 A CN201410439295 A CN 201410439295A CN 104200225 A CN104200225 A CN 104200225A
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- msubsup
- image
- sigma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000000007 visual effect Effects 0.000 claims description 47
- 238000012360 testing method Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 12
- 238000009795 derivation Methods 0.000 claims description 4
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明提供一种在传统的图模型中加入图像的空域信息的图像分类方法。一种基于局部空间约束图模型的图像分类方法,在现有基于概率图模型的图像分类的基础上,在传统的图模型中加入描述图像子区域位置的空域信息,提高了图像的分类精度。
Description
技术领域
本发明提出图像分类技术,是一种基于图模型的分类技术。
背景技术
由于图像光照、尺度和姿态的变化,精确的图像分类非常具有挑战性。目前的图像分类方法大致可以分为三步:首先,从图像的稠密块(均匀划分大小的块)中提取底层特征(如颜色特征、梯度特征、纹理特征),然后,用图像编码的技术根据底层特征得到图像的特征,最后,再用分类器根据这些特征进行学习。因为这些方法都是直接从底层特征出发,而底层特征和图像类别(如图像场景类别)有着语义鸿沟,所以往往不能取得很好的分类结果。中层语义(中层特征)是根据图像的底层特征和监督信息提取而得,它能很好地改善这个问题。
作为目前常用的提取中层语义的方法,图模型已经获得广泛的应用。所谓图模型,是一种将变量之间的关系用图的结构来表示的工具。其中,每个节点代表一个变量,而变量间的关系可以用点与点间的关系来表示。最经典的图模型是LDA(Latent Dirichlet Allocation)模型,其主要思想是引入了潜在主题。通过推断每个单词对应的潜在主题,可以得到中层语义。
LDA最开始是用于文本处理,因为其优越的性能,图像处理也开始使用LDA模型。但是图像和文本不同,并没有单词的概念。于是,聚类量化的方法便引入了进来。即将每一幅图像分为稠密的图像块,提取每个图像块的底层特征,预先设置聚类中心的个数N后,对这些底层特征通过聚类的方法就能选取到N个聚类中心,聚类中心实为选取的某个图像块底层特征。图像中每个图像块的底层特征通过聚类都对应属于一个聚类中心。图像块的视觉单词即是该图像块对应的聚类中心。
因为在训练分类模型时,需要使用图像的标签信息(图像类别),而传统的LDA中并没有监督的类别节点,所以目前有很多模型在LDA的基础上做了改进,构建了监督的图模型。目前主要有三种添加监督信息的方法,一种是为每一个类别都训练一个控制主题分布的超参数。第二种是将类别作为主题的父节点,根据图像的主题分布,用拟合的方法来预测图像的类别。第三种是针对每一种类别,训练特有的主题集。前两种学习到的主题包含数据集的结构信息,但是与图像的类别并没有太大的联系,而第三种方法提取的是特定类别对应的主题,因此更具类别判别性。但是,目前的基于概率图模型的方法都是基于直方图BOW表示的,忽略了图像中视觉单词在空域上的相互关系。
发明内容
本发明所要解决的技术问题是,提供一种在传统的图模型中加入图像的空域信息的图像分类方法。
本发明为解决上述技术问题所采用的技术方案是,一种基于局部空间约束图模型的图像分类方法,包括以下步骤:
1)参数学习步骤:
1-1)将训练集里的每一幅图像图像分解为N1个子区域;
1-2)将每个子区域子划分出N2个均与的图像块;
1-3)提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集;
1-4)预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心;用聚类中心对底层特征集中的底层特征进行量化得到图像块的视觉单词;
1-5)将训练集中所有子区域图像块对应的视觉单词代入局部空间约束的图模型中,进行参数的学习:
1-5-1)先更新简单图模型的dirichlet分布超参数γ和多项式分布参数χ,参数γ、χ中各元素的迭代更新过程为:
其中,表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维,初值为1/KZ,d的取值范围为1~D,D为训练集中图像的总数,n1的取值范围为1~N1,i的取值范围为1~KZ,KZ为中层语义的总数,αi是局部空间约束图模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别,为类别为局部空间约束图模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数,的初值为1/V,V表示视觉单词的总数,是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(i)求导,Γ(i)为Γ分布函数,KT表示位置的总数,表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,为简单模型中第d幅图像第n1子区域的位置为第l个位置;
将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,判断当前参数γ和χ是否满足迭代结束条件,如是,进入步骤1-5-2),如否,继续迭代过程;
1-5-2)将参数γ和χ作为输入,用牛顿-拉夫逊Newton-Raphson迭代方法更新局部空间约束图模型中主题下的狄利克雷dirichlet分布超参数α;
局部空间约束图模型中主题下视觉单词的多项式分布参数β中各元素的更新方法如下:
其中,表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,函数δ(cd,c)表示当cd=c时,c表示图像的类别,函数输出为1,否则函数输出为0;
判断当前得到的参数α、β是否满足迭代结束的条件,如是,则进入步骤2,否则返回步骤1-5-1)继续迭代更新参数γ和χ;
2)图像测试:
2-1)将测试图像分成分解为N1个子区域,将每个子区域子划分出N2个均与的图像块,对于每个图像块提取底层特征进行量化得到对应的视觉单词;
2-2)将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ,参数γ、χ中各元素的迭代更新过程为:
当γ和χ两个参数迭代至收敛后,得到测试图像对应的简单图模型的dirichlet分布超参数γ和多项式分布参数χ;
2-3)将测试图像对应的简单图模型的多项式分布参数χ以及学习得到局部空间约束图模型中主题下视觉单词的多项式分布参数β用来计算测试图像的类别c*为:
其中,为取目标函数最大时c的值,是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。
本发明的有益效果是,在现有基于概率图模型的图像分类的基础上,本发明在传统的图模型中加入描述图像子区域位置的空域信息,能提高图像的分类精度。
具体实施方式
本发明主要分为模型的参数学习部分和图像测试部分。
1、参数学习:
1-1、首先,将训练集里的每一幅图像进行了预处理,统一将图像的最大边设定为300,而图像的比例不变。再将图像分解为N1个子区域,每个子域的大小相同。常规的N1=4,即,将图像分解为左上、左下、右上、右下4个子区域。当然,本领域技术人员可以根据需要调整子区域的个数。
1-2、将每个子区域子划分出N2个稠密的块。对于图像分块,这里是先将每幅图像在提取图像块时,考虑到尺度不变性,选取了多尺度的图像块,分别为4×4,8×8,16×16和24×24。
1-3、提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集。本实施采用一种图像纹理特征SIFT特征作为底层特征,本领域技术人员可以根据需要采用其它的一种底层特征或多种底层特征的组合作为提取的特征。底层特征集中包括有所有尺寸下图像块的底层特征。
1-4、预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心。用聚类中心对底层特征集中的底层特征进行量化。量化的过程为:分别计算底层特征和各个聚类中心的欧式距离,用欧式距离最小对应的聚类中心的底层特征来表示当前图像块的底层特征。这样,可以将从图像中提取的所有底层特征量化,将量化后的图像块的底层特征为该图像块的视觉单词,这样就得到了图像的KC个视觉单词。
1-5、将训练集中所有子区域对应的视觉单词代入局部空间约束的图模型中,进行参数的学习。局部空间约束的图模型中,图像集有D幅图像,每幅图像分解为N1个子区域,而每个子区域有N2个图像块,c表示图像的类别,W是图像块对应的视觉单词,t是每个子区域对应位置,Z是视觉单词对应的中层语义(潜在主题),KZ为中层语义的总数,α是主题下的狄利克雷dirichlet分布超参数,α可以为一个先验的参数也可以后期学习得到,实施在此将α作为一个需要后期学习的参数,β主题下视觉单词的多项式分布参数。参数学习就是根据已知的c,W和t,学习模型参数α和β。
本文中,图像块的视觉单词用量化后的图像块的底层特征表示,也是某一聚类中心。主题用中层语义表示。
模型参数α和β的学习过程如下:
采用变分推断的方法来计算图模型的参数,因为直接对原有的图模型进行推断非常复杂,因此简单图模型来近似局部空间约束的图模型(下面简称为原有模型),简单图模型的参数包括dirichlet分布超参数γ和多项式分布参数χ,参数γ与参数χ为向量参数,参数γ、χ中各元素的迭代更新过程为:
其中,表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维,初值为1/KZ,d的取值范围为1~D,n1的取值范围为1~N1,i的取值范围为1~KZ,αi是原有模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别,为类别为原有模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数,的初值为1/V,V表示视觉单词的总数,是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(i)求导,Γ(i)为Γ分布函数,KT表示位置的总数,KT=N1,表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,为简单模型中第d幅图像第n1子区域的位置为第l个位置。
将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,当γ和χ两个参数迭代至收敛后,更新原有模型的参数β以及参数α:
1-6、将参数γ和χ作为输入,用Newton-Raphson迭代方法得到参数α;
通过最大似然概率的方法,我们可以求得模型的最优参数β:
其中,函数δ(cd,c)表示当cd=c时,函数输出为1,否则函数输出为0,表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,将所所有主题下视觉单词的多项式分布参数组成参数β。判断当前得到的参数α、β是否满足迭代结束的条件,如是,则学习得到模型参数α、β,否则返回参数γ、χ的更新步骤1-5。
2、图像测试:
在学习得到模型参数α、β后,可进行测试图像的分类:
2-1、给定一幅测试图像,我们首先将图像分成KT个子区域,然后提取每个子区域进行图像块划分,提取底层特征进行量化得到对应的视觉单词。
2-2、将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ。
参数γ、χ中各元素的迭代更新过程为:
其中,αi与为已知,当γ和χ两个参数迭代至收敛后,得到最终的参数γ和χ。
2-3、最后用变分推导的方法来近似似然概率分布,然后根据近似模型下的概率分布,用最大后验的方法求得测试图像的类别。测试图像的类别c*为:
其中,为取目标函数最大时c的值,是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。
Claims (1)
1.一种基于局部空间约束图模型的图像分类方法,其特征在于,包括以下步骤:
1)参数学习步骤:
1-1)将训练集里的每一幅图像图像分解为N1个子区域;
1-2)将每个子区域子划分出N2个均与的图像块;
1-3)提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集;
1-4)预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心;用聚类中心对底层特征集中的底层特征进行量化得到图像块的视觉单词;
1-5)将训练集中所有子区域图像块对应的视觉单词代入局部空间约束的图模型中,进行参数的学习:
1-5-1)先更新简单图模型的dirichlet分布超参数γ和多项式分布参数χ,参数γ、χ中各元素的迭代更新过程为:
其中,表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维,初值为1/KZ,d的取值范围为1~D,D为训练集中图像的总数,n1的取值范围为1~N1,i的取值范围为1~KZ,KZ为中层语义的总数,αi是局部空间约束图模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别,为类别为局部空间约束图模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数,的初值为1/V,V表示视觉单词的总数,是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(i)求导,Γ(i)为Γ分布函数,KT表示位置的总数,表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,为简单模型中第d幅图像第n1子区域的位置为第l个位置;
将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,判断当前参数γ和χ是否满足迭代结束条件,如是,进入步骤1-5-2),如否,继续迭代过程;
1-5-2)将参数γ和χ作为输入,用牛顿-拉夫逊Newton-Raphson迭代方法更新局部空间约束图模型中主题下的狄利克雷dirichlet分布超参数α;
局部空间约束图模型中主题下视觉单词的多项式分布参数β中各元素的更新方法如下:
其中,表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,函数δ(cd,c)表示当cd=c时,c表示图像的类别,函数输出为1,否则函数输出为0;
判断当前得到的参数α、β是否满足迭代结束的条件,如是,则进入步骤2,否则返回步骤1-5-1)继续迭代更新参数γ和χ;
2)图像测试:
2-1)将测试图像分成分解为N1个子区域,将每个子区域子划分出N2个均与的图像块,对于每个图像块提取底层特征进行量化得到对应的视觉单词;
2-2)将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ,参数γ、χ中各元素的迭代更新过程为:
当γ和χ两个参数迭代至收敛后,得到测试图像对应的简单图模型的dirichlet分布超参数γ和多项式分布参数χ;
2-3)将测试图像对应的简单图模型的多项式分布参数χ以及学习得到局部空间约束图模型中主题下视觉单词的多项式分布参数β用来计算测试图像的类别c*为:
其中,为取目标函数最大时c的值,是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410439295.2A CN104200225B (zh) | 2014-08-29 | 2014-08-29 | 一种基于局部空间约束图模型的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410439295.2A CN104200225B (zh) | 2014-08-29 | 2014-08-29 | 一种基于局部空间约束图模型的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104200225A true CN104200225A (zh) | 2014-12-10 |
CN104200225B CN104200225B (zh) | 2017-07-11 |
Family
ID=52085515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410439295.2A Active CN104200225B (zh) | 2014-08-29 | 2014-08-29 | 一种基于局部空间约束图模型的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104200225B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335499A (zh) * | 2015-10-27 | 2016-02-17 | 盐城工学院 | 一种基于分布-收敛模型的文献聚类方法 |
CN111339803A (zh) * | 2018-12-19 | 2020-06-26 | 北大方正集团有限公司 | 字体识别方法、装置、设备及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159019A (zh) * | 2007-11-08 | 2008-04-09 | 复旦大学 | 一种用于k近邻分类的线性特征提取方法 |
CN101894275A (zh) * | 2010-06-29 | 2010-11-24 | 武汉大学 | 一种弱监督的sar图像分类方法 |
CN103366175A (zh) * | 2013-07-14 | 2013-10-23 | 西安电子科技大学 | 基于潜在狄利克雷分配的自然图像分类方法 |
-
2014
- 2014-08-29 CN CN201410439295.2A patent/CN104200225B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159019A (zh) * | 2007-11-08 | 2008-04-09 | 复旦大学 | 一种用于k近邻分类的线性特征提取方法 |
CN101894275A (zh) * | 2010-06-29 | 2010-11-24 | 武汉大学 | 一种弱监督的sar图像分类方法 |
CN103366175A (zh) * | 2013-07-14 | 2013-10-23 | 西安电子科技大学 | 基于潜在狄利克雷分配的自然图像分类方法 |
Non-Patent Citations (2)
Title |
---|
JINJUN WANG: ""Locality-constrained Linear Coding for image classification"", 《2013 IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION IEEE COMPUTER SOCIETY CONFERENCE ON CVPR2010》 * |
NIKHIL RASIWASIA ETC,: ""Latent Dirichlet Allocation Models for image Classification"", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS& MACHINE INTELLIGENCE》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335499A (zh) * | 2015-10-27 | 2016-02-17 | 盐城工学院 | 一种基于分布-收敛模型的文献聚类方法 |
CN105335499B (zh) * | 2015-10-27 | 2019-04-05 | 盐城工学院 | 一种基于分布-收敛模型的文献聚类方法 |
CN111339803A (zh) * | 2018-12-19 | 2020-06-26 | 北大方正集团有限公司 | 字体识别方法、装置、设备及计算机可读存储介质 |
CN111339803B (zh) * | 2018-12-19 | 2023-10-24 | 新方正控股发展有限责任公司 | 字体识别方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104200225B (zh) | 2017-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109934293B (zh) | 图像识别方法、装置、介质及混淆感知卷积神经网络 | |
US10719780B2 (en) | Efficient machine learning method | |
CN109376242B (zh) | 基于循环神经网络变体和卷积神经网络的文本分类方法 | |
CN111160037B (zh) | 一种支持跨语言迁移的细粒度情感分析方法 | |
CN110197286B (zh) | 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法 | |
CN109034264B (zh) | 交通事故严重性预测csp-cnn模型及其建模方法 | |
CN110110323B (zh) | 一种文本情感分类方法和装置、计算机可读存储介质 | |
CN106897746B (zh) | 数据分类模型训练方法和装置 | |
CN107832458B (zh) | 一种字符级的基于嵌套深度网络的文本分类方法 | |
CN110188192B (zh) | 一种多任务网络构建与多尺度的罪名法条联合预测方法 | |
Wager et al. | Altitude training: Strong bounds for single-layer dropout | |
CN109101584B (zh) | 一种将深度学习与数学分析相结合的句子分类改进方法 | |
CN104239554A (zh) | 跨领域跨类别的新闻评论情绪预测方法 | |
CN109492750B (zh) | 基于卷积神经网络和因素空间的零样本图像分类方法 | |
EP3620982B1 (en) | Sample processing method and device | |
CN109063743B (zh) | 基于半监督多任务学习的医疗数据分类模型的构建方法 | |
CN110097096B (zh) | 一种基于tf-idf矩阵和胶囊网络的文本分类方法 | |
CN111639186B (zh) | 动态嵌入投影门控的多类别多标签文本分类模型及装置 | |
CN110555459A (zh) | 基于模糊聚类和支持向量回归的成绩预测方法 | |
CN108109612A (zh) | 一种基于自适应降维的语音识别分类方法 | |
CN114925205B (zh) | 基于对比学习的gcn-gru文本分类方法 | |
CN111753995A (zh) | 一种基于梯度提升树的局部可解释方法 | |
CN104794499A (zh) | 一种基于自适应熵权的区间灰色关联分类器设计方法 | |
Blot et al. | Shade: Information-based regularization for deep learning | |
CN104200225B (zh) | 一种基于局部空间约束图模型的图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |