CN104200225B - 一种基于局部空间约束图模型的图像分类方法 - Google Patents

一种基于局部空间约束图模型的图像分类方法 Download PDF

Info

Publication number
CN104200225B
CN104200225B CN201410439295.2A CN201410439295A CN104200225B CN 104200225 B CN104200225 B CN 104200225B CN 201410439295 A CN201410439295 A CN 201410439295A CN 104200225 B CN104200225 B CN 104200225B
Authority
CN
China
Prior art keywords
image
sigma
chi
sub
gamma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410439295.2A
Other languages
English (en)
Other versions
CN104200225A (zh
Inventor
李宏亮
黄超
罗冰
罗雯怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201410439295.2A priority Critical patent/CN104200225B/zh
Publication of CN104200225A publication Critical patent/CN104200225A/zh
Application granted granted Critical
Publication of CN104200225B publication Critical patent/CN104200225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供一种在传统的图模型中加入图像的空域信息的图像分类方法。一种基于局部空间约束图模型的图像分类方法,在现有基于概率图模型的图像分类的基础上,在传统的图模型中加入描述图像子区域位置的空域信息,提高了图像的分类精度。

Description

一种基于局部空间约束图模型的图像分类方法
技术领域
本发明提出图像分类技术,是一种基于图模型的分类技术。
背景技术
由于图像光照、尺度和姿态的变化,精确的图像分类非常具有挑战性。目前的图像分类方法大致可以分为三步:首先,从图像的稠密块(均匀划分大小的块)中提取底层特征(如颜色特征、梯度特征、纹理特征),然后,用图像编码的技术根据底层特征得到图像的特征,最后,再用分类器根据这些特征进行学习。因为这些方法都是直接从底层特征出发,而底层特征和图像类别(如图像场景类别)有着语义鸿沟,所以往往不能取得很好的分类结果。中层语义(中层特征)是根据图像的底层特征和监督信息提取而得,它能很好地改善这个问题。
作为目前常用的提取中层语义的方法,图模型已经获得广泛的应用。所谓图模型,是一种将变量之间的关系用图的结构来表示的工具。其中,每个节点代表一个变量,而变量间的关系可以用点与点间的关系来表示。最经典的图模型是LDA(Latent DirichletAllocation)模型,其主要思想是引入了潜在主题。通过推断每个单词对应的潜在主题,可以得到中层语义。
LDA最开始是用于文本处理,因为其优越的性能,图像处理也开始使用LDA模型。但是图像和文本不同,并没有单词的概念。于是,聚类量化的方法便引入了进来。即将每一幅图像分为稠密的图像块,提取每个图像块的底层特征,预先设置聚类中心的个数N后,对这些底层特征通过聚类的方法就能选取到N个聚类中心,聚类中心实为选取的某个图像块底层特征。图像中每个图像块的底层特征通过聚类都对应属于一个聚类中心。图像块的视觉单词即是该图像块对应的聚类中心。
因为在训练分类模型时,需要使用图像的标签信息(图像类别),而传统的LDA中并没有监督的类别节点,所以目前有很多模型在LDA的基础上做了改进,构建了监督的图模型。目前主要有三种添加监督信息的方法,一种是为每一个类别都训练一个控制主题分布的超参数。第二种是将类别作为主题的父节点,根据图像的主题分布,用拟合的方法来预测图像的类别。第三种是针对每一种类别,训练特有的主题集。前两种学习到的主题包含数据集的结构信息,但是与图像的类别并没有太大的联系,而第三种方法提取的是特定类别对应的主题,因此更具类别判别性。但是,目前的基于概率图模型的方法都是基于直方图BOW表示的,忽略了图像中视觉单词在空域上的相互关系。
发明内容
本发明所要解决的技术问题是,提供一种在传统的图模型中加入图像的空域信息的图像分类方法。
本发明为解决上述技术问题所采用的技术方案是,一种基于局部空间约束图模型的图像分类方法,包括以下步骤:
1)参数学习步骤:
1-1)将训练集里的每一幅图像分解为N1个子区域;
1-2)将每个子区域子划分出N2个均匀的图像块;
1-3)提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集;
1-4)预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心;用聚类中心对底层特征集中的底层特征进行量化得到图像块的视觉单词;
1-5)将训练集中所有子区域图像块对应的视觉单词代入局部空间约束的图模型中,进行参数的学习:
1-5-1)先更新简单图模型的dirichlet分布超参数γ和多项式分布参数χ,参数γ、χ中各元素的迭代更新过程为:
其中,表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维,初值为1/KZ,d的取值范围为1~D,D为训练集中图像的总数,n1的取值范围为1~N1,i的取值范围为1~KZ,KZ为中层语义的总数,αi是局部空间约束图模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别,为类别为局部空间约束图模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数,的初值为1/V,V表示视觉单词的总数,是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(·)求导,Γ(·)为Γ分布函数,KT表示位置的总数,表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,为简单模型中第d幅图像第n1子区域的位置为第l个位置;
将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,判断当前参数γ和χ是否满足迭代结束条件,如是,进入步骤1-5-2),如否,继续迭代过程;
1-5-2)将参数γ和χ作为输入,用牛顿-拉夫逊Newton-Raphson迭代方法更新局部空间约束图模型中主题下的狄利克雷dirichlet分布超参数α;
局部空间约束图模型中主题下视觉单词的多项式分布参数β中各元素的更新方法如下:
其中,表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,函数δ(cd,c)表示当cd=c时,c表示图像的类别,函数输出为1,否则函数输出为0;
判断当前得到的参数α、β是否满足迭代结束的条件,如是,则进入步骤2,否则返回步骤1-5-1)继续迭代更新参数γ和χ;
2)图像测试:
2-1)将测试图像分成分解为N1个子区域,将每个子区域子划分出N2个均与的图像块,对于每个图像块提取底层特征进行量化得到对应的视觉单词;
2-2)将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ,参数γ、χ中各元素的迭代更新过程为:
当γ和χ两个参数迭代至收敛后,得到测试图像对应的简单图模型的dirichlet分布超参数γ和多项式分布参数χ;
2-3)将测试图像对应的简单图模型的多项式分布参数χ以及学习得到局部空间约束图模型中主题下视觉单词的多项式分布参数β用来计算测试图像的类别c*为:
其中,为取目标函数最大时c的值,是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。
本发明的有益效果是,在现有基于概率图模型的图像分类的基础上,本发明在传统的图模型中加入描述图像子区域位置的空域信息,能提高图像的分类精度。
具体实施方式
本发明主要分为模型的参数学习部分和图像测试部分。
1、参数学习:
1-1、首先,将训练集里的每一幅图像进行了预处理,统一将图像的最大边设定为300,而图像的比例不变。再将图像分解为N1个子区域,每个子域的大小相同。常规的N1=4,即,将图像分解为左上、左下、右上、右下4个子区域。当然,本领域技术人员可以根据需要调整子区域的个数。
1-2、将每个子区域子划分出N2个稠密的块。对于图像分块,这里是先将每幅图像在提取图像块时,考虑到尺度不变性,选取了多尺度的图像块,分别为4×4,8×8,16×16和24×24。
1-3、提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集。本实施采用一种图像纹理特征SIFT特征作为底层特征,本领域技术人员可以根据需要采用其它的一种底层特征或多种底层特征的组合作为提取的特征。底层特征集中包括有所有尺寸下图像块的底层特征。
1-4、预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心。用聚类中心对底层特征集中的底层特征进行量化。量化的过程为:分别计算底层特征和各个聚类中心的欧式距离,用欧式距离最小对应的聚类中心的底层特征来表示当前图像块的底层特征。这样,可以将从图像中提取的所有底层特征量化,将量化后的图像块的底层特征为该图像块的视觉单词,这样就得到了图像的KC个视觉单词。
1-5、将训练集中所有子区域对应的视觉单词代入局部空间约束的图模型中,进行参数的学习。局部空间约束的图模型中,图像集有D幅图像,每幅图像分解为N1个子区域,而每个子区域有N2个图像块,c表示图像的类别,W是图像块对应的视觉单词,t是每个子区域对应位置,Z是视觉单词对应的中层语义(潜在主题),KZ为中层语义的总数,α是主题下的狄利克雷dirichlet分布超参数,α可以为一个先验的参数也可以后期学习得到,实施在此将α作为一个需要后期学习的参数,β主题下视觉单词的多项式分布参数。参数学习就是根据已知的c,W和t,学习模型参数α和β。
本文中,图像块的视觉单词用量化后的图像块的底层特征表示,也是某一聚类中心。主题用中层语义表示。
模型参数α和β的学习过程如下:
采用变分推断的方法来计算图模型的参数,因为直接对原有的图模型进行推断非常复杂,因此简单图模型来近似局部空间约束的图模型(下面简称为原有模型),简单图模型的参数包括dirichlet分布超参数γ和多项式分布参数χ,参数γ与参数χ为向量参数,参数γ、χ中各元素的迭代更新过程为:
其中,表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维,初值为1/KZ,d的取值范围为1~D,n1的取值范围为1~N1,i的取值范围为1~KZ,αi是原有模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别,为类别为原有模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数,的初值为1/V,V表示视觉单词的总数,是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(·)求导,Γ(·)为Γ分布函数,KT表示位置的总数,KT=N1表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,为简单模型中第d幅图像第n1子区域的位置为第l个位置。
将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,当γ和χ两个参数迭代至收敛后,更新原有模型的参数β以及参数α:
1-6、将参数γ和χ作为输入,用Newton-Raphson迭代方法得到参数α;
通过最大似然概率的方法,我们可以求得模型的最优参数β:
其中,函数δ(cd,c)表示当cd=c时,函数输出为1,否则函数输出为0,表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,将所所有主题下视觉单词的多项式分布参数组成参数β。判断当前得到的参数α、β是否满足迭代结束的条件,如是,则学习得到模型参数α、β,否则返回参数γ、χ的更新步骤1-5。
2、图像测试:
在学习得到模型参数α、β后,可进行测试图像的分类:
2-1、给定一幅测试图像,我们首先将图像分成KT个子区域,然后提取每个子区域进行图像块划分,提取底层特征进行量化得到对应的视觉单词。
2-2、将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ。
参数γ、χ中各元素的迭代更新过程为:
其中,αi为已知,当γ和χ两个参数迭代至收敛后,得到最终的参数γ和χ。
2-3、最后用变分推导的方法来近似似然概率分布,然后根据近似模型下的概率分布,用最大后验的方法求得测试图像的类别。测试图像的类别c*为:
其中,为取目标函数最大时c的值,是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。

Claims (1)

1.一种基于局部空间约束图模型的图像分类方法,其特征在于,包括以下步骤:
1)参数学习步骤:
1-1)将训练集里的每一幅图像分解为N1个子区域;
1-2)将每个子区域子划分出N2个均匀的图像块;
1-3)提取每个图像块的底层特征,将所有图像块的底层特征放入底层特征集;
1-4)预设KC个图像类别,用聚类的方法得到底层特征的KC个聚类中心;用聚类中心对底层特征集中的底层特征进行量化得到图像块的视觉单词;
1-5)将训练集中所有子区域图像块对应的视觉单词代入局部空间约束的图模型中,进行参数的学习:
1-5-1)先更新简单图模型的dirichlet分布超参数γ和多项式分布参数χ,参数γ、χ中各元素的迭代更新过程为:
γ dn 1 i = α i + Σ n 2 = 1 N 2 χ dn 1 n 2 i
logχ dn 1 n 2 i = ψ ( γ dn 1 i ) + Σ l = 1 K T Σ j = 1 V W dn 1 n 2 j t dn 1 l logβ l i j c d Σ i = 1 K Z ( ψ ( γ dn 1 i ) + Σ l = 1 K T Σ j = 1 V W dn 1 n 2 j t dn 1 l logβ l i j c d )
其中,表示简单模型中第d幅图像第n1子区域dirichle分布超参数的第i维,初值为1/KZ,d的取值范围为1~D,D为训练集中图像的总数,n1的取值范围为1~N1,i的取值范围为1~KZ,KZ为中层语义的总数,αi是局部空间约束图模型中dirichlet分布超参数的第i维,αi的初值为1/KZ,cd表示第d幅图像的类别,为类别为局部空间约束图模型中cd的第d幅图像中的子区域l在主题i下视觉单词j的多项式分布参数,的初值为1/V,V表示视觉单词的总数,是简单模型中第d幅图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,的初值为1/KZ,n2的取值范围为1~N2,ψ表示对logΓ(·)求导,Γ(·)为Γ分布函数,KT表示位置的总数,表示简单模型中第d幅图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,为简单模型中第d幅图像第n1子区域的位置为第l个位置;
将简单模型中所有的主题下dirichle分布超参数组成参数γ,将简单模型中所有的主题下视觉单词的多项式分布参数组成参数χ,判断当前参数γ和χ是否满足迭代结束条件,如是,进入步骤1-5-2),如否,继续迭代过程;
1-5-2)将参数γ和χ作为输入,用牛顿-拉夫逊Newton-Raphson迭代方法更新局部空间约束图模型中主题下的狄利克雷dirichlet分布超参数α;
局部空间约束图模型中主题下视觉单词的多项式分布参数β中各元素的更新方法如下:
β l i j c = Σ d = 1 D Σ n 1 = 1 N 1 Σ n 2 = 1 N 2 δ ( c d , c ) t dn 1 l χ dn 1 n 2 i W dn 1 n 2 j Σ j = 1 V Σ d = 1 D Σ n 1 = 1 N 1 Σ n 2 = 1 N 2 δ ( c d , c ) t dn 1 l χ dn 1 n 2 i W dn 1 n 2 j
其中,表示类别为c的图像的子区域l在主题i下视觉单词j的多项式分布参数,函数δ(cd,c)表示当cd=c时,c表示图像的类别,函数输出为1,否则函数输出为0;
判断当前得到的参数α、β是否满足迭代结束的条件,如是,则进入步骤2,否则返回步骤1-5-1)继续迭代更新参数γ和χ;
2)图像测试:
2-1)将测试图像分成分解为N1个子区域,将每个子区域子划分出N2个均与的图像块,对于每个图像块提取底层特征进行量化得到对应的视觉单词;
2-2)将通过学习得到模型参数α、β代入迭代更新运算,求得参数γ、χ,参数γ、χ中各元素的迭代更新过程为:
γ dn 1 i = α i + Σ n 2 = 1 N 2 χ dn 1 n 2 i
logχ dn 1 n 2 i = ψ ( γ dn 1 i ) + Σ l = 1 K T Σ j = 1 V W dn 1 n 2 j t dn 1 l logβ l i j c d Σ i = 1 K Z ( ψ ( γ dn 1 i ) + Σ l = 1 K T Σ j = 1 V W dn 1 n 2 j t dn 1 l logβ l i j c d )
当γ和χ两个参数迭代至收敛后,得到测试图像对应的简单图模型的dirichlet分布超参数γ和多项式分布参数χ;
2-3)将测试图像对应的简单图模型的多项式分布参数χ以及学习得到局部空间约束图模型中主题下视觉单词的多项式分布参数β用来计算测试图像的类别c*为:
c * = arg m a x c Σ n 1 = 1 N 1 Σ n 2 = 1 N 2 Σ i = 1 K z χ n 1 n 2 i W n 1 n 2 j logβ l i j
其中,为取目标函数最大时c的值,是简单模型中测试图像第n1个子区域中第n2个图像块对应的多项式分布参数的第i维,表示简单模型中测试图像第n1子区域第n2个图像块对应视觉单词为第j个视觉单词,βlij为测试图像中的子区域l在主题i下视觉单词j的多项式分布参数。
CN201410439295.2A 2014-08-29 2014-08-29 一种基于局部空间约束图模型的图像分类方法 Active CN104200225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410439295.2A CN104200225B (zh) 2014-08-29 2014-08-29 一种基于局部空间约束图模型的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410439295.2A CN104200225B (zh) 2014-08-29 2014-08-29 一种基于局部空间约束图模型的图像分类方法

Publications (2)

Publication Number Publication Date
CN104200225A CN104200225A (zh) 2014-12-10
CN104200225B true CN104200225B (zh) 2017-07-11

Family

ID=52085515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410439295.2A Active CN104200225B (zh) 2014-08-29 2014-08-29 一种基于局部空间约束图模型的图像分类方法

Country Status (1)

Country Link
CN (1) CN104200225B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335499B (zh) * 2015-10-27 2019-04-05 盐城工学院 一种基于分布-收敛模型的文献聚类方法
CN111339803B (zh) * 2018-12-19 2023-10-24 新方正控股发展有限责任公司 字体识别方法、装置、设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159019A (zh) * 2007-11-08 2008-04-09 复旦大学 一种用于k近邻分类的线性特征提取方法
CN101894275A (zh) * 2010-06-29 2010-11-24 武汉大学 一种弱监督的sar图像分类方法
CN103366175A (zh) * 2013-07-14 2013-10-23 西安电子科技大学 基于潜在狄利克雷分配的自然图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159019A (zh) * 2007-11-08 2008-04-09 复旦大学 一种用于k近邻分类的线性特征提取方法
CN101894275A (zh) * 2010-06-29 2010-11-24 武汉大学 一种弱监督的sar图像分类方法
CN103366175A (zh) * 2013-07-14 2013-10-23 西安电子科技大学 基于潜在狄利克雷分配的自然图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Latent Dirichlet Allocation Models for image Classification";Nikhil Rasiwasia etc,;《IEEE Transactions on Pattern analysis& Machine Intelligence》;20131130;第35卷(第11期);第2665-2679页 *
"Locality-constrained Linear Coding for image classification";jinjun Wang;《2013 IEEE Computer Society Conference on Computer Vision and Pattern Recognition IEEE Computer Society Conference on Cvpr2010》;20100618;第119卷(第5期);第3360-3367页 *

Also Published As

Publication number Publication date
CN104200225A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
CN111079639B (zh) 垃圾图像分类模型构建的方法、装置、设备及存储介质
CN110197286B (zh) 一种基于混合高斯模型和稀疏贝叶斯的主动学习分类方法
CN107220506A (zh) 基于深度卷积神经网络的乳腺癌风险评估分析系统
CN110110323B (zh) 一种文本情感分类方法和装置、计算机可读存储介质
CN107832458B (zh) 一种字符级的基于嵌套深度网络的文本分类方法
CN109101584B (zh) 一种将深度学习与数学分析相结合的句子分类改进方法
CN110188192B (zh) 一种多任务网络构建与多尺度的罪名法条联合预测方法
WO2023125654A1 (zh) 人脸识别模型的训练方法、装置、电子设备及存储介质
CN105224984A (zh) 一种基于深度神经网络的数据类别识别方法及装置
CN106203534A (zh) 一种基于Boosting的代价敏感软件缺陷预测方法
CN109492750B (zh) 基于卷积神经网络和因素空间的零样本图像分类方法
CN104834940A (zh) 一种基于支持向量机的医疗影像检查疾病分类方法
EP3620982B1 (en) Sample processing method and device
CN110097096B (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
JP2018026122A5 (zh)
DE102019211651A1 (de) Vorrichtung und Verfahren zum Maschinenlernen und Ansteuern einer Maschine
CN111127360A (zh) 一种基于自动编码器的灰度图像迁移学习方法
CN103870840A (zh) 基于改进的潜在狄利克雷分配的自然图像分类方法
Blot et al. Shade: Information-based regularization for deep learning
CN104200225B (zh) 一种基于局部空间约束图模型的图像分类方法
CN105678340B (zh) 一种基于增强型栈式自动编码器的自动图像标注方法
CN114428860A (zh) 院前急救病例文本的识别方法、装置、终端及存储介质
CN113159419A (zh) 一种群体特征画像分析方法、装置、设备及可读存储介质
Zhao The water potability prediction based on active support vector machine and artificial neural network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant