CN102122358A - 基于提升稀疏约束双线性模型的图像分类方法 - Google Patents
基于提升稀疏约束双线性模型的图像分类方法 Download PDFInfo
- Publication number
- CN102122358A CN102122358A CN 201110081240 CN201110081240A CN102122358A CN 102122358 A CN102122358 A CN 102122358A CN 201110081240 CN201110081240 CN 201110081240 CN 201110081240 A CN201110081240 A CN 201110081240A CN 102122358 A CN102122358 A CN 102122358A
- Authority
- CN
- China
- Prior art keywords
- parts
- image
- model
- sparse constraint
- bilinear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000000007 visual effect Effects 0.000 claims abstract description 26
- 239000011159 matrix material Substances 0.000 claims abstract description 6
- 230000004069 differentiation Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000003014 reinforcing effect Effects 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000001737 promoting effect Effects 0.000 description 4
- HUTDUHSNJYTCAR-UHFFFAOYSA-N ancymidol Chemical compound C1=CC(OC)=CC=C1C(O)(C=1C=NC=NC=1)C1CC1 HUTDUHSNJYTCAR-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种基于提升稀疏约束双线性模型的图像进行分类方法,该方法的图像分类步骤如下:步骤S1:在图像上提取图像的局部特征;步骤S2:从图像上密集的提取多个部件;步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。为了提高方法的判别力,我们加入了稀疏性的约束,并采用提升的策略来提高方法的鲁棒性。在三个数据库上的实验结果,证实了我们的方法的有效性。
Description
技术领域
本发明属于图像处理领域,涉及一种基于提升稀疏约束双线性模型的图像分类方法。
背景技术
随着多媒体数据的爆炸性增涨,人工对图像进行分类越来越困难,基于图像内容的自动分类越来越受到重视。自动的图像分类技术能够通过对图像本身内容进行处理分析,从而预测图像的类别,避免了大量人工处理。然而由于图像中各种物体形态各异,出现位置也不固定,而且还有可能存在遮挡的现象,自动的学习一个鲁棒的图像特征表示和预测模型仍然是一个很有挑战的问题。
传统的图像分类方法大都是基于词袋模型。这种方法首先在图像上提取局部特征,对局部特征进行量化,生成码本,然后通过寻找最近邻的方法将局部特征量化到每个视觉词,并将图像表示成一个视觉词的直方图分布,最后通过训练分类器的方式来预测图像的类别。这种方法在一定程度上克服了全局特征的缺陷,但是,这种方法忽略了图像局部特征的空间位置信息和相互联系。为了在一定程度上考虑空间信息,一般采用空间金字塔的方式对图像进行划分。但是,这种方法划分金字塔的方式是一种经验性的,事先无法取得最有效地划分。另一方面,每个视觉词对于分类性能的影响是不同的,给予每个视觉词同样的权重也不利于最终的分类。
发明内容
为了解决吸纳有技术的问题,本发明的目的是对快速有效的图像分类,提出一个更有效的图像特征表示和分类模型,为此本发明提供一种基于提升稀疏约束双线性模型的图像分类方法。
为达成所述目的,本发明提供一种基于提升稀疏约束双线性模型的图像分类方法,该方法的图像分类步骤如下:
步骤S1:在图像上提取图像的局部特征;
步骤S2:从图像上密集的提取多个部件;
步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;
步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。
优选实施例,基于部件的图像表示,综合考虑局部特征的空间信息;考虑部件本身的空间信息,用于增强部件表示方式的判别力。
优选实施例,设每个部件都对图像的类别预测有贡献,采用线性模型去拟合每个部件都对图像的类别预测的这种联系;同时,设每个部件中的每个视觉词对所述部件的类别也有贡献,也采用线性模型来拟合每个部件中的每个视觉词对所述部件的类别的这种联系,从而将图像类别预测问题转化为学习一个双线性模型的问题。
优选实施例,为了选择最有判别力的视觉词和部件,从而更好的进行图像分类,对双线性模型的两个系数向量施加稀疏性的约束,并通过组合多个双线性模型来增强图像分类的鲁棒性。
优选实施例,在学习单个稀疏约束的双线性模型时,采用交替优化的策略,先固定视觉词到部件的模型系数,去学习部件到图像类别的模型的系数;然后固定部件到图像类别的模型的系数,去学习视觉词到部件的模型系数。
优选实施例,所述优化的策略采用加权的系数符号搜索算法实现。
本发明的有益效果:本发明提出一种基于提升稀疏约束双线性模型对图像进行分类。通过部件来融合图像的空间信息,并通过双线性模型来进行图像分类,利用稀疏约束进行最有判别力的部件和视觉词的选择,并利用提升的方法来提高算法的性能和鲁棒性。本发明在三个数据库上的实验,证明了本发明的方法有更高的分类性能。
附图说明
图1提升稀疏约束双线性模型进行图像分类框图;
图2基于部件的图像表示示意图;
图3基于提升稀疏约束双线性模型的混淆矩阵;
图4提升稀疏约束双线性模型在Caltech-101数据库上的分类准确率;
图5提升稀疏约束双线性模型在Caltech-256数据库上的分类准确率。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明利用图像分块和稀疏约束,提出了一个行之有效的图像分类方法。图1示出本发明的系统提升稀疏约束双线性模型进行图像分类框架,包括图像局部特征提取、基于部件的图像表示、提升稀疏约束双线性模型,以及图像分类。
本发明主要包括两个部分:基于部件的图像表示和提升稀疏约束双线性模型。
(一)、基于部件的图像表示:
图像表示部分采用基于部件的表示方式,图2示出描述了基于部件的图像表示方法,这种方法同时考虑了局部特征的空间信息和部件之间的空间信息,从而可以得到有判别力的图像特征表示,为下一步的分类器训练提供便利。
本发明中,采用视觉词直方图来表示每个部件。先用k均值聚类方法获得1000个聚类中心,每个聚类中心对应一个视觉词;采用寻找最近邻的方法对图像局部特征的空间信息进行视觉词的量化。我们密集地抽取部件,在每幅图上抽取20×15个部件,每个部件是一个64×64像素的正方形区域。用部件内的视觉词的直方图来表示部件,将每个部件直方图的定义为:
hj=[h1,j,h2,j,…,hN,j]T (1)
在把每个部件用直方图表示以后,将各个部件hj,j=1,2,…,M按顺序排列起来,将第k个图像表示成一个N×M的矩阵Hk:
Hk=[h1,h2,…,hM] (2)
这样,我们就得到了最终的基于部件的图像表示,k=1,2,…,K。K代表训练图像的个数。
(二)、提升稀疏约束双线性模型:
在将图像用部件表示后,我们用提升稀疏约束双线性模型来进行图像类别的预测。首先,我们认为图像的每个部件都对图像的类别预测有贡献,我们采用线性模型去模拟;同时,对于每个部件,其中的每个视觉词对这个部件的类别也有贡献,本发明也采用线性模型来模拟,从而将图像类别预测问题转化为学习一个双线性模型的问题,即学习α,β,使得:
f(Hk)=yk=αTHkβ (3)
其中,yk代表对第k个图像的预测值。F(Hk)=αTHkβ代表要学习的双线性模型。α是一个N×1维的系数向量,β是一个M×1维的系数向量。
为了选择最有判别力的视觉词和部件,从而更好的进行图像分类,对于双线性模型的两个系数向量α,β施加稀疏性的约束。同时,通过组合多个双线性模型来增强本发明方法的鲁棒性。这是通过优化以下的目标函数实现:
其中,T代表双线性模型的个数,K代表训练图像的个数。c1,c2是两个控制稀疏程度的系数。H代表训练图像ft(H)代表要学习的第t个双线性模型,αt和βt是第t个双线性模型对应的参数,αt T代表αt的转置。代表要学习的提升稀疏约束的双线性模型,它是由T个双线性模型组成。
我们采用提升的思想,通过T次循环,每次学习一个稀疏约束的双线性模型。本发明的算法如表1所示:
表(1)提升稀疏约束双线性模型算法
在算法的步骤2.(a),我们的目标函数(4)可以简化为:
在本发明中采用交替优化的方法,通过先固定βt来求解αt,然后固定αt来求解βt。当固定βt来求解αt时,目标函数(5)可进一步简化为:
在本发明中采用加权的系数符号搜索算法来优化目标函数αt。本发明的算法流程图如下表(2)所示。为了简化表示,在不引起误解的前提下,我们忽略掉下标t。
表(2)加权的系数符号搜索算法
当固定αt来求解βt时,我们可以采取类似表(2)的策略。将αt和c1替换成βt和c2,并令
实施效果
在三个图像分类数据库上测试了本发明的提升稀疏约束双线性模型算法效果。在场景-15数据库上的图像分类效果如表(3),每类训练图像个数为100,用剩余的图像进行测试,并重复10遍求均值和方差。其中稀疏约束的双线性模型是本发明提出的基于提升稀疏约束双线性模型的一个简化版本,在稀疏约束的双线性模型中并未使用提升的策略。图3给出了本发明提出的基于提升稀疏约束双线性模型方法在场景-15数据库上的混淆矩阵。图4示出提升稀疏约束双线性模型在加州理工学院-101数据库上的分类准确率,图中横轴:每类训练样本的个数,纵轴:分类准确率;图5示出提升稀疏约束双线性模型在加州理工学院-256数据库上的分类准确率,图中横轴:每类训练样本的个数,纵轴:分类准确率。
表(3)场景-15数据库上的分类准确率
方法 | 分类准确率(%) |
稀疏约束的双线性模型 | 85.6±1.5 |
提升稀疏约束双线性模型 | 90.5±1.6 |
从在三个数据库上的实验结果可以看出我们提出的基于提升稀疏约束双线性模型在图像分类应用中的有效性。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的权利要求书的保护范围之内。
Claims (6)
1.一种基于提升稀疏约束双线性模型的图像分类方法,其特征在于,该方法图像分类的步骤如下:
步骤S1:在图像上提取图像的局部特征;
步骤S2:从图像上密集的提取多个部件;
步骤S3:将各个部件用视觉词的直方图作为部件的特征表示,并将每个部件的特征表示按顺序排列起来,用一个矩阵的形式来表示图像;
步骤S4:使用提升稀疏约束双线性模型模拟视觉词到部件、部件到图像类别之间的关系,从而达到对图像分类的目的。
2.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,基于部件的图像表示,综合考虑局部特征的空间信息;考虑部件本身的空间信息,用于增强部件表示方式的判别力。
3.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,设每个部件都对图像的类别预测有贡献,采用线性模型去拟合每个部件都对图像的类别预测的这种联系;同时,设每个部件中的每个视觉词对所述部件的类别也有贡献,也采用线性模型来拟合每个部件中的每个视觉词对所述部件的类别的这种联系,从而将图像类别预测问题转化为学习一个双线性模型的问题。
4.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,为了选择最有判别力的视觉词和部件,从而更好的进行图像分类,对双线性模型的两个系数向量施加稀疏性的约束,并通过组合多个双线性模型来增强图像分类的鲁棒性。
5.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,在学习单个稀疏约束的双线性模型时,采用交替优化的策略,先固定视觉词到部件的模型系数,去学习部件到图像类别的模型的系数;然后固定部件到图像类别的模型的系数,去学习视觉词到部件的模型系数。
6.根据权利要求1所述的基于提升稀疏约束双线性模型的图像分类方法,其特征在于,所述优化的策略采用加权的系数符号搜索算法实现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110081240.5A CN102122358B (zh) | 2011-03-31 | 2011-03-31 | 基于提升稀疏约束双线性模型的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110081240.5A CN102122358B (zh) | 2011-03-31 | 2011-03-31 | 基于提升稀疏约束双线性模型的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102122358A true CN102122358A (zh) | 2011-07-13 |
CN102122358B CN102122358B (zh) | 2014-03-26 |
Family
ID=44250912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110081240.5A Expired - Fee Related CN102122358B (zh) | 2011-03-31 | 2011-03-31 | 基于提升稀疏约束双线性模型的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102122358B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306298A (zh) * | 2011-07-19 | 2012-01-04 | 北京航空航天大学 | 一种基于Wiki的图像分类体系动态演化方法 |
CN110378356A (zh) * | 2019-07-16 | 2019-10-25 | 北京中科研究院 | 基于多目标拉格朗日正则的细粒度图像识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276419A (zh) * | 2007-02-19 | 2008-10-01 | 精工爱普生株式会社 | 类别划分装置、类别划分方法和存储程序的存储介质 |
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
CN101923653A (zh) * | 2010-08-17 | 2010-12-22 | 北京大学 | 一种基于多层次内容描述的图像分类方法 |
-
2011
- 2011-03-31 CN CN201110081240.5A patent/CN102122358B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276419A (zh) * | 2007-02-19 | 2008-10-01 | 精工爱普生株式会社 | 类别划分装置、类别划分方法和存储程序的存储介质 |
CN101315663A (zh) * | 2008-06-25 | 2008-12-03 | 中国人民解放军国防科学技术大学 | 一种基于区域潜在语义特征的自然场景图像分类方法 |
CN101923653A (zh) * | 2010-08-17 | 2010-12-22 | 北京大学 | 一种基于多层次内容描述的图像分类方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102306298A (zh) * | 2011-07-19 | 2012-01-04 | 北京航空航天大学 | 一种基于Wiki的图像分类体系动态演化方法 |
CN110378356A (zh) * | 2019-07-16 | 2019-10-25 | 北京中科研究院 | 基于多目标拉格朗日正则的细粒度图像识别方法 |
CN110378356B (zh) * | 2019-07-16 | 2021-07-02 | 北京中科研究院 | 基于多目标拉格朗日正则的细粒度图像识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102122358B (zh) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977817B (zh) | 基于深度学习的动车组车底板螺栓故障检测方法 | |
CN113947590B (zh) | 一种基于多尺度注意力引导和知识蒸馏的表面缺陷检测方法 | |
CN110889449A (zh) | 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法 | |
CN107346436A (zh) | 一种融合图像分类的视觉显著性检测方法 | |
CN107392901A (zh) | 一种用于输电线路部件智能自动识别的方法 | |
CN107564025A (zh) | 一种基于深度神经网络的电力设备红外图像语义分割方法 | |
CN102024152B (zh) | 一种基于稀疏表达和字典学习进行交通标志识别的方法 | |
CN108629367A (zh) | 一种基于深度网络增强服装属性识别精度的方法 | |
CN107563439A (zh) | 一种识别清洗食材图片的模型及识别食材类别的方法 | |
CN107507162A (zh) | 一种基于多模态脑影像的基因型分析方法 | |
CN104392463A (zh) | 一种基于联合稀疏多尺度融合的图像显著区域检测方法 | |
CN103258214A (zh) | 基于图像块主动学习的遥感图像分类方法 | |
CN106991666A (zh) | 一种适用于多尺寸图片信息的病害图像识别方法 | |
CN109636846B (zh) | 基于循环注意力卷积神经网络的目标定位方法 | |
CN107729312A (zh) | 基于序列标注建模的多粒度分词方法及系统 | |
CN103186776B (zh) | 基于多特征和深度信息的人体检测方法 | |
CN109948696A (zh) | 一种多语言场景字符识别方法及系统 | |
CN106897669A (zh) | 一种基于一致迭代多视角迁移学习的行人再辨识方法 | |
CN104063713A (zh) | 一种基于随机蕨分类器的半自主在线学习方法 | |
CN104778482A (zh) | 基于张量半监督标度切维数约减的高光谱图像分类方法 | |
CN105160653A (zh) | 一种用于雾天图像的质量评价方法 | |
CN107247965A (zh) | 一种基于自适应匹配和学习的失真图像处理方法及系统 | |
CN110084812A (zh) | 一种太赫兹图像缺陷检测方法、装置、系统及存储介质 | |
CN114283285A (zh) | 交叉一致性自训练遥感图像语义分割网络训练方法及装置 | |
CN115564194A (zh) | 智能电网的计量异常诊断信息生成模型构建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140326 |
|
CF01 | Termination of patent right due to non-payment of annual fee |