CN102122358A - 基于提升稀疏约束双线性模型的图像分类方法 - Google Patents

基于提升稀疏约束双线性模型的图像分类方法 Download PDF

Info

Publication number
CN102122358A
CN102122358A CN 201110081240 CN201110081240A CN102122358A CN 102122358 A CN102122358 A CN 102122358A CN 201110081240 CN201110081240 CN 201110081240 CN 201110081240 A CN201110081240 A CN 201110081240A CN 102122358 A CN102122358 A CN 102122358A
Authority
CN
China
Prior art keywords
parts
image
model
sparse constraint
bilinear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201110081240
Other languages
English (en)
Other versions
CN102122358B (zh
Inventor
卢汉清
刘静
张淳杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201110081240.5A priority Critical patent/CN102122358B/zh
Publication of CN102122358A publication Critical patent/CN102122358A/zh
Application granted granted Critical
Publication of CN102122358B publication Critical patent/CN102122358B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于提升稀疏约束双线性模型的图像进行分类方法,该方法的图像分类步骤如下:步骤S1:在图像上提取图像的局部特征;步骤S2:从图像上密集的提取多个部件;步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。为了提高方法的判别力,我们加入了稀疏性的约束,并采用提升的策略来提高方法的鲁棒性。在三个数据库上的实验结果,证实了我们的方法的有效性。

Description

基于提升稀疏约束双线性模型的图像分类方法
技术领域
本发明属于图像处理领域,涉及一种基于提升稀疏约束双线性模型的图像分类方法。
背景技术
随着多媒体数据的爆炸性增涨,人工对图像进行分类越来越困难,基于图像内容的自动分类越来越受到重视。自动的图像分类技术能够通过对图像本身内容进行处理分析,从而预测图像的类别,避免了大量人工处理。然而由于图像中各种物体形态各异,出现位置也不固定,而且还有可能存在遮挡的现象,自动的学习一个鲁棒的图像特征表示和预测模型仍然是一个很有挑战的问题。
传统的图像分类方法大都是基于词袋模型。这种方法首先在图像上提取局部特征,对局部特征进行量化,生成码本,然后通过寻找最近邻的方法将局部特征量化到每个视觉词,并将图像表示成一个视觉词的直方图分布,最后通过训练分类器的方式来预测图像的类别。这种方法在一定程度上克服了全局特征的缺陷,但是,这种方法忽略了图像局部特征的空间位置信息和相互联系。为了在一定程度上考虑空间信息,一般采用空间金字塔的方式对图像进行划分。但是,这种方法划分金字塔的方式是一种经验性的,事先无法取得最有效地划分。另一方面,每个视觉词对于分类性能的影响是不同的,给予每个视觉词同样的权重也不利于最终的分类。
发明内容
为了解决吸纳有技术的问题,本发明的目的是对快速有效的图像分类,提出一个更有效的图像特征表示和分类模型,为此本发明提供一种基于提升稀疏约束双线性模型的图像分类方法。
为达成所述目的,本发明提供一种基于提升稀疏约束双线性模型的图像分类方法,该方法的图像分类步骤如下:
步骤S1:在图像上提取图像的局部特征;
步骤S2:从图像上密集的提取多个部件;
步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;
步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。
优选实施例,基于部件的图像表示,综合考虑局部特征的空间信息;考虑部件本身的空间信息,用于增强部件表示方式的判别力。
优选实施例,设每个部件都对图像的类别预测有贡献,采用线性模型去拟合每个部件都对图像的类别预测的这种联系;同时,设每个部件中的每个视觉词对所述部件的类别也有贡献,也采用线性模型来拟合每个部件中的每个视觉词对所述部件的类别的这种联系,从而将图像类别预测问题转化为学习一个双线性模型的问题。
优选实施例,为了选择最有判别力的视觉词和部件,从而更好的进行图像分类,对双线性模型的两个系数向量施加稀疏性的约束,并通过组合多个双线性模型来增强图像分类的鲁棒性。
优选实施例,在学习单个稀疏约束的双线性模型时,采用交替优化的策略,先固定视觉词到部件的模型系数,去学习部件到图像类别的模型的系数;然后固定部件到图像类别的模型的系数,去学习视觉词到部件的模型系数。
优选实施例,所述优化的策略采用加权的系数符号搜索算法实现。
本发明的有益效果:本发明提出一种基于提升稀疏约束双线性模型对图像进行分类。通过部件来融合图像的空间信息,并通过双线性模型来进行图像分类,利用稀疏约束进行最有判别力的部件和视觉词的选择,并利用提升的方法来提高算法的性能和鲁棒性。本发明在三个数据库上的实验,证明了本发明的方法有更高的分类性能。
附图说明
图1提升稀疏约束双线性模型进行图像分类框图;
图2基于部件的图像表示示意图;
图3基于提升稀疏约束双线性模型的混淆矩阵;
图4提升稀疏约束双线性模型在Caltech-101数据库上的分类准确率;
图5提升稀疏约束双线性模型在Caltech-256数据库上的分类准确率。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明利用图像分块和稀疏约束,提出了一个行之有效的图像分类方法。图1示出本发明的系统提升稀疏约束双线性模型进行图像分类框架,包括图像局部特征提取、基于部件的图像表示、提升稀疏约束双线性模型,以及图像分类。
本发明主要包括两个部分:基于部件的图像表示和提升稀疏约束双线性模型。
(一)、基于部件的图像表示:
图像表示部分采用基于部件的表示方式,图2示出描述了基于部件的图像表示方法,这种方法同时考虑了局部特征的空间信息和部件之间的空间信息,从而可以得到有判别力的图像特征表示,为下一步的分类器训练提供便利。
本发明中,采用视觉词直方图来表示每个部件。先用k均值聚类方法获得1000个聚类中心,每个聚类中心对应一个视觉词;采用寻找最近邻的方法对图像局部特征的空间信息进行视觉词的量化。我们密集地抽取部件,在每幅图上抽取20×15个部件,每个部件是一个64×64像素的正方形区域。用部件内的视觉词的直方图来表示部件,将每个部件直方图的定义为:
hj=[h1,j,h2,j,…,hN,j]T    (1)
其中,N代表视觉词的个数,hj是一个N×1的向量,其中每一维的元素hi,j,i=1,2,…,N正比于第i个视觉词在第j个部件里面出现的次数,j=1,2,…,M,M代表部件的个数。并满足
Figure BDA0000053209010000041
在把每个部件用直方图表示以后,将各个部件hj,j=1,2,…,M按顺序排列起来,将第k个图像表示成一个N×M的矩阵Hk
Hk=[h1,h2,…,hM]    (2)
这样,我们就得到了最终的基于部件的图像表示,k=1,2,…,K。K代表训练图像的个数。
(二)、提升稀疏约束双线性模型:
在将图像用部件表示后,我们用提升稀疏约束双线性模型来进行图像类别的预测。首先,我们认为图像的每个部件都对图像的类别预测有贡献,我们采用线性模型去模拟;同时,对于每个部件,其中的每个视觉词对这个部件的类别也有贡献,本发明也采用线性模型来模拟,从而将图像类别预测问题转化为学习一个双线性模型的问题,即学习α,β,使得:
f(Hk)=yk=αTHkβ        (3)
其中,yk代表对第k个图像的预测值。F(Hk)=αTHkβ代表要学习的双线性模型。α是一个N×1维的系数向量,β是一个M×1维的系数向量。
为了选择最有判别力的视觉词和部件,从而更好的进行图像分类,对于双线性模型的两个系数向量α,β施加稀疏性的约束。同时,通过组合多个双线性模型来增强本发明方法的鲁棒性。这是通过优化以下的目标函数实现:
F T ( H ) = arg min F T ( H ) Σ k = 1 K exp [ - y k × F T ( H k ) ] + c 1 Σ t = 1 T | | α t | | 1 + c 2 Σ t = 1 T | | β t | | n - - - ( 4 )
其中,
Figure BDA0000053209010000043
T代表双线性模型的个数,K代表训练图像的个数。c1,c2是两个控制稀疏程度的系数。H代表训练图像ft(H)代表要学习的第t个双线性模型,αt和βt是第t个双线性模型对应的参数,αt T代表αt的转置。
Figure BDA0000053209010000044
代表要学习的提升稀疏约束的双线性模型,它是由T个双线性模型组成。
我们采用提升的思想,通过T次循环,每次学习一个稀疏约束的双线性模型。本发明的算法如表1所示:
表(1)提升稀疏约束双线性模型算法
Figure BDA0000053209010000051
在算法的步骤2.(a),我们的目标函数(4)可以简化为:
( α t , β t ) = arg min ( α t , β t ) Σ k = 1 K w k , t × exp [ - y k × f t ( H k ) ] + c 1 | | α t | | 1 + c 2 | | β t | | 1 - - - ( 5 )
在本发明中采用交替优化的方法,通过先固定βt来求解αt,然后固定αt来求解βt。当固定βt来求解αt时,目标函数(5)可进一步简化为:
α t = arg min α t Σ k = 1 K w k , t × exp [ - y k × α t T H k β t ] + c 1 | | α t | | 1 - - - ( 6 )
在本发明中采用加权的系数符号搜索算法来优化目标函数αt。本发明的算法流程图如下表(2)所示。为了简化表示,在不引起误解的前提下,我们忽略掉下标t。
表(2)加权的系数符号搜索算法
Figure BDA0000053209010000054
Figure BDA0000053209010000061
Figure BDA0000053209010000071
当固定αt来求解βt时,我们可以采取类似表(2)的策略。将αt和c1替换成βt和c2,并令
∂ exp ( y k × α T H k β ) ∂ β = - y k × α T H k × exp ( - y k × α T H k β ) .
实施效果
在三个图像分类数据库上测试了本发明的提升稀疏约束双线性模型算法效果。在场景-15数据库上的图像分类效果如表(3),每类训练图像个数为100,用剩余的图像进行测试,并重复10遍求均值和方差。其中稀疏约束的双线性模型是本发明提出的基于提升稀疏约束双线性模型的一个简化版本,在稀疏约束的双线性模型中并未使用提升的策略。图3给出了本发明提出的基于提升稀疏约束双线性模型方法在场景-15数据库上的混淆矩阵。图4示出提升稀疏约束双线性模型在加州理工学院-101数据库上的分类准确率,图中横轴:每类训练样本的个数,纵轴:分类准确率;图5示出提升稀疏约束双线性模型在加州理工学院-256数据库上的分类准确率,图中横轴:每类训练样本的个数,纵轴:分类准确率。
表(3)场景-15数据库上的分类准确率
  方法   分类准确率(%)
  稀疏约束的双线性模型   85.6±1.5
  提升稀疏约束双线性模型   90.5±1.6
从在三个数据库上的实验结果可以看出我们提出的基于提升稀疏约束双线性模型在图像分类应用中的有效性。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的权利要求书的保护范围之内。

Claims (6)

1.一种基于提升稀疏约束双线性模型的图像分类方法,其特征在于,该方法图像分类的步骤如下:
步骤S1:在图像上提取图像的局部特征;
步骤S2:从图像上密集的提取多个部件;
步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;
步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。
2.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,基于部件的图像表示,综合考虑局部特征的空间信息;考虑部件本身的空间信息,用于增强部件表示方式的判别力。
3.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,设每个部件都对图像的类别预测有贡献,采用线性模型去拟合每个部件都对图像的类别预测的这种联系;同时,设每个部件中的每个视觉词对所述部件的类别也有贡献,也采用线性模型来拟合每个部件中的每个视觉词对所述部件的类别的这种联系,从而将图像类别预测问题转化为学习一个双线性模型的问题。
4.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,为了选择最有判别力的视觉词和部件,从而更好的进行图像分类,对双线性模型的两个系数向量施加稀疏性的约束,并通过组合多个双线性模型来增强图像分类的鲁棒性。
5.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,在学习单个稀疏约束的双线性模型时,采用交替优化的策略,先固定视觉词到部件的模型系数,去学习部件到图像类别的模型的系数;然后固定部件到图像类别的模型的系数,去学习视觉词到部件的模型系数。
6.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,所述优化的策略采用加权的系数符号搜索算法实现。
CN201110081240.5A 2011-03-31 2011-03-31 基于提升稀疏约束双线性模型的图像分类方法 Expired - Fee Related CN102122358B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110081240.5A CN102122358B (zh) 2011-03-31 2011-03-31 基于提升稀疏约束双线性模型的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110081240.5A CN102122358B (zh) 2011-03-31 2011-03-31 基于提升稀疏约束双线性模型的图像分类方法

Publications (2)

Publication Number Publication Date
CN102122358A true CN102122358A (zh) 2011-07-13
CN102122358B CN102122358B (zh) 2014-03-26

Family

ID=44250912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110081240.5A Expired - Fee Related CN102122358B (zh) 2011-03-31 2011-03-31 基于提升稀疏约束双线性模型的图像分类方法

Country Status (1)

Country Link
CN (1) CN102122358B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306298A (zh) * 2011-07-19 2012-01-04 北京航空航天大学 一种基于Wiki的图像分类体系动态演化方法
CN110378356A (zh) * 2019-07-16 2019-10-25 北京中科研究院 基于多目标拉格朗日正则的细粒度图像识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276419A (zh) * 2007-02-19 2008-10-01 精工爱普生株式会社 类别划分装置、类别划分方法和存储程序的存储介质
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
CN101923653A (zh) * 2010-08-17 2010-12-22 北京大学 一种基于多层次内容描述的图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276419A (zh) * 2007-02-19 2008-10-01 精工爱普生株式会社 类别划分装置、类别划分方法和存储程序的存储介质
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
CN101923653A (zh) * 2010-08-17 2010-12-22 北京大学 一种基于多层次内容描述的图像分类方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306298A (zh) * 2011-07-19 2012-01-04 北京航空航天大学 一种基于Wiki的图像分类体系动态演化方法
CN110378356A (zh) * 2019-07-16 2019-10-25 北京中科研究院 基于多目标拉格朗日正则的细粒度图像识别方法
CN110378356B (zh) * 2019-07-16 2021-07-02 北京中科研究院 基于多目标拉格朗日正则的细粒度图像识别方法

Also Published As

Publication number Publication date
CN102122358B (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN109977817B (zh) 基于深度学习的动车组车底板螺栓故障检测方法
CN113947590B (zh) 一种基于多尺度注意力引导和知识蒸馏的表面缺陷检测方法
CN110889449A (zh) 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法
CN107346436A (zh) 一种融合图像分类的视觉显著性检测方法
CN107392901A (zh) 一种用于输电线路部件智能自动识别的方法
CN107564025A (zh) 一种基于深度神经网络的电力设备红外图像语义分割方法
CN102024152B (zh) 一种基于稀疏表达和字典学习进行交通标志识别的方法
CN108629367A (zh) 一种基于深度网络增强服装属性识别精度的方法
CN107563439A (zh) 一种识别清洗食材图片的模型及识别食材类别的方法
CN107507162A (zh) 一种基于多模态脑影像的基因型分析方法
CN104392463A (zh) 一种基于联合稀疏多尺度融合的图像显著区域检测方法
CN103258214A (zh) 基于图像块主动学习的遥感图像分类方法
CN106991666A (zh) 一种适用于多尺寸图片信息的病害图像识别方法
CN109636846B (zh) 基于循环注意力卷积神经网络的目标定位方法
CN107729312A (zh) 基于序列标注建模的多粒度分词方法及系统
CN103186776B (zh) 基于多特征和深度信息的人体检测方法
CN109948696A (zh) 一种多语言场景字符识别方法及系统
CN106897669A (zh) 一种基于一致迭代多视角迁移学习的行人再辨识方法
CN104063713A (zh) 一种基于随机蕨分类器的半自主在线学习方法
CN104778482A (zh) 基于张量半监督标度切维数约减的高光谱图像分类方法
CN105160653A (zh) 一种用于雾天图像的质量评价方法
CN107247965A (zh) 一种基于自适应匹配和学习的失真图像处理方法及系统
CN110084812A (zh) 一种太赫兹图像缺陷检测方法、装置、系统及存储介质
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
CN115564194A (zh) 智能电网的计量异常诊断信息生成模型构建方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140326

CF01 Termination of patent right due to non-payment of annual fee