CN102509110A - 基于成对约束的在线词典再加权对图像进行分类的方法 - Google Patents

基于成对约束的在线词典再加权对图像进行分类的方法 Download PDF

Info

Publication number
CN102509110A
CN102509110A CN2011103259387A CN201110325938A CN102509110A CN 102509110 A CN102509110 A CN 102509110A CN 2011103259387 A CN2011103259387 A CN 2011103259387A CN 201110325938 A CN201110325938 A CN 201110325938A CN 102509110 A CN102509110 A CN 102509110A
Authority
CN
China
Prior art keywords
tau
constraint
image
characteristic
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103259387A
Other languages
English (en)
Other versions
CN102509110B (zh
Inventor
谭铁牛
黄凯奇
任伟强
赵鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201110325938.7A priority Critical patent/CN102509110B/zh
Publication of CN102509110A publication Critical patent/CN102509110A/zh
Application granted granted Critical
Publication of CN102509110B publication Critical patent/CN102509110B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于成对约束的在线词典再加权对图像进行分类的方法,包括:对所有训练集图像进行底层特征提取,构建初始视觉词典;采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,以利用分类器进行分类;以及利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。本发明利用成对约束,可以有效地编码成对图像之间的关系,基于保守-激进训练策略提出的在线学习算法,大大减少了训练时间,并可以实现增量更新,尤其适用于海量数据集。

Description

基于成对约束的在线词典再加权对图像进行分类的方法
技术领域
本发明涉及计算机视觉中图像分类技术领域,特别涉及一种基于词包模型和在线学习的目标分类的方法。
背景技术
随着计算机运算能力的飞速提升,计算机视觉、人工智能、机器感知等领域也迅猛发展。图像分类作为计算机视觉中一个基本问题之一,也得到了长足的发展。图像分类就是利用计算机对图像进行智能分析,进而判断图像所属的类别。
随着互联网技术、计算机技术的发展,图像分类已经在众多领域中得到了广泛的应用。基于内容的图像检索可以对图像进行基于图像内容的检索,快速获得与检索图像在表观上相似的图像,这是基于文本的图像检索技术无法比拟的。智能视频监控技术在很多机场、博览会、居民小区等公共场所以及国防军事领域发挥了重要的作用,一般的视频监控算法在使用背景建模方法获取到前景目标后,都会使用目标分类方法对目标进行粗分类,然后根据不同目标类别,接下来进行进一步的跟踪、行为分析、行为报警。遥感图像处理中也大量使用图像分类技术,判断地面物体类别,可以有效地帮助专业人员进行快速的分析与处理。目前在计算机、手持设备上大量应用的手写识别,也是图像分类与图像识别技术的典型成功应用。
尽管图像分类技术在很多领域得到了广泛应用,目前还是有很多困难有待解决。当前已有的应用,绝大多数是工作在受限场景下的,对背景、天气、光照、姿态等有较强限制。而在真实场景下,目标的背景、光照、姿态、尺度、视角等,都有可能发生变化,如何在如此大变化下,依然能够对目标做出准确的分类,仍旧是图像分类的一个最重要的难题。科学工作者在这个问题上进行了大量的研究,致力于寻找具有不变性的特征描述子,最著名的有尺度不变特征转换(Scale-invariant feature transform,SIFT)、SURF、HOG(Histogram of Oriented Gradients)等。SIFT特征就是一种对尺度变化不敏感的特征,对旋转也有一定的不变性;也有科研工作者致力于分类器的设计,提出更加鲁棒的分类器,最常见的如支持向量机(supportvector machine,SVM)、Boosting等;还有人从生理学、心理学等领域的理论出发,尝试通过认识人的识别机理,进而应用计算机技术模拟这一过程,实现真正的人工智能。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的是提供一种基于成对约束的在线词典再加权对图像进行分类的方法,以准确、快速地在大尺度数据上对图像进行在线分类。
(二)技术方案
为了达到上述目的,本发明提供了一种基于成对约束的在线词典再加权对图像进行分类的方法,包括:
对所有训练集图像进行底层特征提取,构建初始视觉词典;
采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;
对编码后的特征进行最大值汇聚,得到一个用向量表达的特征;以及
利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。
(三)有益效果
本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,与目前国内外发表的最新的方法相比具有几个明显优点:
1)、本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,基于成对约束实现词典再加权,可以有效编码图像之间的关系,减少类内差别和背景变化的影响。
2)、本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,再加权向量通过一种在线学习算法迭代学习得到,可以实现增量更新。
3)、本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,在线学习算法有解析解,在计算时间复杂度和内存消耗上都大大低于一般批量训练算法,非常适合大规模数据上的应用。
附图说明
图1是依照本发明实施例基于成对约束的在线词典再加权对图像进行分类的方法流程图;
图2是依照本发明实施例成对约束的示意图;
图3是依照本发明实施例将最大值汇聚看作一种弱加权过程的示意图;
图4是依照本发明实施例对两张图片之间相似度进行计算的示意图;
图5是依照本发明实施例显示再加权对图片之间相似度影响的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的思想要点是:1)图像分类中常用的汇聚操作可以看作是一种弱加权,本发明通过机器学习得到更强的加权;2)本发明利用成对约束实现词典再加权,可以有效编码图像之间的关系,减少类内差别和背景变化的影响;3)批量训练在计算时间和内存消耗上都代价很高,本发明提出了一种在线学习算法,可以用非常小的代价得到同样甚至更好的结果;4)本发明通过拉格朗日乘子法得到了解析解,使得计算复杂度进一步减少。
如图1所示,图1左边是依照本发明实施例基于成对约束的在线词典再加权对图像进行分类的方法流程图。图1右边部分阐述了该方法的出发点和目的,其中方块形状和三角形状分别代表不同类别的样本点,实线和虚线分别代表了cannot-link和must-link关系。在原始样本空间中,不同类数据点分布有重叠,经过再加权后,同类别的数据点倾向于集中到一起。该方法包括以下步骤:
S1、对所有训练集图像进行底层特征提取,构建初始视觉词典。
特征提取是模式识别和计算机视觉算法中的重要部分。图像描述子一般分为全局描述子和局部描述子,常见的包括SIFT、SURF、HOG、PHOG、颜色描述子、形状上下文等。本实施例中采用密集提取的SIFT特征作为底层特征。对每张图像,X={x1,x2,...,xN}∈RD×N表示从图像中密集提取的N个D维SIFT特征。从所有训练集图像密集提取SIFT特征,并从提取到的所有SIFT特征中随机选择部分SIFT特征,使用K-means聚类算法得到M个聚类中心,作为初始的视觉词典,记为C={c1,c2,...,cM}∈RD×M,其中ci代表第i个视觉单词,维度为D。
S2、采用稀疏编码对步骤S1中提取到的底层特征进行特征变换,得到编码后的特征。
对底层进行特征变换,先编码到特征空间再进行后续处理已经成为图像分类框架中的标准过程。最常用的是硬投票编码,即对图像的每个局部特征xi,寻找与其最近的单词,等价为求解下面问题:
arg min Σ i = 1 N | | x i - Cb i | | - - - ( 1 )
s . t . | | b i | | 0 = 1 , Σ j = 1 M b ij = 1
其中bi是局部特征xi再视觉词典C上面的响应。
为了使变换后的特征具有更强的空间局部性、方向性和鲁棒性,本实施例采用了稀疏编码进行特征变换,归结为求解下面最优化问题:
arg min Σ i = 1 N | | x i - Cb i | | + λ | | b i | | - - - ( 2 )
s . t . Σ j = 1 M b ij = 1
稀疏编码已经在信号处理、图像处理、计算机视觉、机器学习等领域得到了广泛的研究和发展,大量的生理学、心理学实验结果也证实了稀疏性对于人类视觉处理的重要作用。
S3、对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,以利用分类器进行分类。
在对底层特征进行编码之后,需要对编码后的特征进行汇聚得到一个用向量表达的特征,以利用分类器进行分类。对于硬投票而言,最直观的是用统计直方图,统计每个单词出现的频率。最大值汇聚则是一个更有效的算法,并且在生理学实验上找到了一定的依据。基本思想就是,对于每个单词,每个局部特征都在该单词上有一个响应,取最大的响应作为该单词的响应,忽略其他响应。最大值汇聚可以有效地对图像进行表达,压制噪声的影响,更重要的是可以获得一定的不变性。
S4、利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。
为进一步改善基于词包模型的图像分类系统的性能,本实施例提出一种词典再加权算法,以克服其他现有算法的一些缺点。下面将详细介绍再加权的思想、实现以及优化求解过程。
定义I={I1,I2,...,In}代表n张图片,y={y1,y2,...,yn}为对应的标记。每张图片Ii分别经过稀疏编码和最大值汇聚,得到一个表达向量pi
本实施例利用成对约束来进行词典再加权,成对约束是编码图像之间关系的一种很自然的表达方式。如图2中所示,同类别图像之间使用must-link,不同类别图像之间使用cannot-link。pi的每个元素可以看作是对应单词的权重。我们使用两幅图对应的特征向量的相交核作为两幅图之间的相似度,用下面公式计算:
di,j=min(pi,pj)       (3)
d i , j = Σ m = 1 M d i , j ( m ) - - - ( 4 )
其中di,j(m)是向量di,j的第m维元素。
图4给出了依照本发明实施例对两张图片之间相似度进行计算的示意图,从图中可以直观的看出相似度的计算。
图3中给出了依照本发明实施例将最大值汇聚看作一种弱加权过程的示意图,从图中可以看出,最大值汇聚实际上可以看作是一种弱加权操作,从更一般的角度来说,再加权后图片间相似度定义为:
d i , j w = w T d i , j - - - ( 5 )
其中w是权值向量。
进一步,成对约束可以这样构造:
d i , j w > d i , k w , y i = y j , y i ≠ y k , ∀ i , j , k - - - ( 6 )
从上面公式可以看出,再加权后同类图片之间的相似度倾向大于异类图片之间的相似度,这无疑将减少类内差异和背景变换的影响。图5给出了依照本发明实施例显示再加权对图片之间相似度影响的示意图,可以看出,再加权后,同类图片之间的相似度倾向于增大,而异类之间的相似度则倾向于减小。尽管使用成对约束有上列优点,计算成对约束有非常高的计算复杂度和存储需求。本实施例提出了一种在线学习算法来解决这个问题。
定义三元组 { I i , I j , I k | ∀ i , j , k , y i = y j , y i ≠ y k } , 成对约束可扩展成
d i , j , k w > 1 , y i = y j , y i ≠ y k , ∀ i , j , k - - - ( 7 )
其中 d i , j , k w = d i , j k - d i , k w
上面公式意味着我们期望达到边界至少为1,损失函数使用下面形式:
l ( d i , j , k w ) = max ( 0,1 - d i , j , k w ) - - - ( 8 )
对于批量学习过程,即使是非常小的数据库,在所有三元组上面最小化上述损失函数都有非常高的复杂度。本实施例采用一种保守-激进训练策略迭代更新权值向量。
具体说来,在每次迭代过程中,新的权值向量通过求解下列优化问题得到:
w t = arg min w ∈ R M 1 2 | | w - w t - 1 | | 2 2 + Cξ - - - ( 9 )
s . t . l ( d i , j , k w ) ≤ ξ , ξ ≥ 0 , ∀ i , j , k
该迭代过程在损失函数大时“激进”更新权值向量,再损失函数小时“保守”更新权值向量,因而称为保守-激进过程。保守和激进之间的权衡是由参数C来控制的。
利用拉格朗日乘子法,本实施例给出了权值向量更新问题的解析解。
拉格朗日目标函数为
L ( w , τ 1 , τ 2 , ξ ) = 1 2 | | w - w t - 1 | | 2 2 + Cξ + τ 1 ( 1 - w T d i , j , k - ξ ) - τ 2 ξ - - - ( 10 )
其中τ1≥0,τ2≥0是拉格朗日乘数。关于w对拉格朗日目标函数(10)求偏导数
∂ L ( w , τ 1 , τ 2 , ξ ) ∂ w = w - w t - 1 - τ 1 d i , j , k = 0 - - - ( 11 )
对上面公式整理可以得到下面的权值向量更新公式
w=wt-11di,j,k      (12)
关于ξ对拉格朗日目标函数求偏导数
∂ L ( w , τ 1 , τ 2 , ξ ) ∂ ξ = C - τ 1 - τ 2 = 0 - - - ( 13 )
将公式(11)和(12)分别代入拉格朗日目标函数(10),得到下面关于τ1的拉格朗日函数
L ( τ 1 ) = - 1 2 τ 1 2 | | d i , j , k | | 2 + τ 1 ( 1 - ( w t - 1 ) T d i , j , k ) - - - ( 14 )
对(14)式关于τ1求导数,并令其为零,得到
τ 1 = 1 - ( w t - 1 ) T d i , j , k | | d i , j , k | | 2 - - - ( 15 )
由于τ1≤C,τ2≥0,综合(15)式,得到下式
τ 1 = min ( C , 1 - ( w t - 1 ) T d i , j , k | | d i , j , k | | 2 ) - - - ( 16 )
使用(12)、(16)式给出的解析解迭代更新权值向量,理论和实验表明在计算时间复杂度和内存需求上,均大大小于常规批量学习算法。
为了更好地说明本实施例的具体实施方式,下面按以下步骤对本发明进一步详细阐述:
步骤S1:特征提取。对图像在一个密集的网格上提取SIFT特征。
步骤S2:稀疏编码。对局部SIFT描述子进行k-means聚类,得到一个视觉字典,并用该视觉字典对局部SIFT描述子进行稀疏编码。
步骤S3:最大值汇聚。对一个区域内稀疏编码后的特征进行最大值汇聚。
步骤S4:词典再加权。对训练集中任意一个三元组
Figure BDA0000101440270000077
Figure BDA0000101440270000078
使用(12)和(16)迭代求解权值向量。利用权值向量对步骤S3得到的特征进行再加权,送入分类器进行训练和分类。
总之,本发明提出了一种新的基于成对约束的视觉词典再加权算法,并使用在线学习方法进行求解,实验表明该发明与主流图像分类算法相比具有计算复杂度低、内存消耗少、快速、准确等优点,适合大尺度数据下的图像分类应用。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,包括:
对所有训练集图像进行底层特征提取,构建初始视觉词典;
采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;
对编码后的特征进行最大值汇聚,得到一个用向量表达的特征;以及
利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。
2.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述对所有训练集图像进行底层特征提取,构建初始视觉词典,包括:
采用密集提取的尺度不变特征转换(SIFT)特征作为底层特征,对于每张图像X={x1,x2,...,xN}∈RD×N表示N个从图像中密集提取的D维SIFT特征;从所有训练集图像中密集提取SIFT特征,并从提取到的所有SIFT特征中随机选择部分SIFT特征,使用K-means聚类算法得到M个聚类中心,作为初始的视觉词典,记为C={c1,c2,...,cM}∈RD×M,其中ci代表第i个视觉单词,维度为D。
3.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述采用稀疏编码对提取的底层特征进行特征变换,是通过求解以下公式的最优化问题实现的:
arg min Σ i = 1 N | | x i - Cb i | | + λ | | b i | | 1
s . t . Σ j = 1 M b ij = 1
其中,xi是一个D维SIFT特征,C是由M个聚类中心构成的视觉字典,bi是局部特征xi再视觉词典C上面的响应,bij是bi的第j维元素,λ是惩罚系数。
4.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,包括:
对于编码后的特征中的每个单词,每个局部特征都在该单词上有一个响应,取最大的响应作为该单词的响应,忽略其他响应,并将该单词的响应作为一个用向量表达的特征。
5.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述利用成对约束对所述用向量表达的特征进行在线词典再加权,包括:
定义I={I1,I2,...,In}代表n张图片,y={y1,y2,...,yn}为对应的标记,每张图片Ii分别经过稀疏编码和最大值汇聚,得到一个表达向量pi
利用成对约束来进行在线词典再加权,成对约束是编码图像之间关系的一种很自然的表达方式,同类别图像之间使用must-link,不同类别图像之间使用cannot-link;pi的每个元素可以看作是对应单词的权重;使用两幅图对应的特征向量的相交核作为两幅图之间的相似度,用下面公式计算:
di,j=min(pi,pj)
d i , j = Σ m = 1 M d i , j ( m )
其中di,j(m)是向量di,j的第m维元素,pi,pj分别是由图片Ii,Ij在最大值汇聚后得到特征向量;
再加权后图片间相似度定义为:
d i , j w = w T d i , j
其中w是权值向量;
进一步,成对约束能够这样构造:
d i , j w > d i , k w , y i = y j , y i ≠ y k , ∀ i , j , k
其中 d i , j w = w T d i , j , 这里 d i , j = Σ m = 1 M d i , j ( m ) , di,j(m)是di,j的第m维元素,w是权值向量。
6.根据权利5所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述利用成对约束对所述用向量表达的特征进行在线词典再加权的步骤中,所述成对约束的计算采用在线学习方法求解基于成对约束的再加权向量,该方法包括:
采用3张图片组成一个三元组 { I i , I j , I k | ∀ i , j , k , y i = y j , y i ≠ y k } , 成对约束可扩展成
d i , j , k w > 1 , y i = y j , y i ≠ y k , ∀ i , j , k
其中, d i , j , k w = d i , j k - d i , k w
上面公式意味着期望达到边界至少为1,损失函数使用下面形式:
l ( d i , j , k w ) = max ( 0,1 - d i , j , k w )
对于批量学习过程,即使是非常小的数据库,在所有三元组上面最小化上述损失函数都有非常高的复杂度,所以采用保守-激进训练策略迭代更新权值向量。
7.根据权利6所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述采用保守-激进训练策略迭代更新权值向量,是在每次迭代过程中使用三元组按下面公式更新权值向量:
w t = arg min w ∈ R M 1 2 | | w - w t - 1 | | 2 2 + Cξ
s . t . l ( d i , j , k w ) ≤ ξ , ξ ≥ 0 , ∀ i , j , k
该迭代过程在损失函数大时“激进”更新权值向量,再损失函数小时“保守”更新权值向量,因而称为保守-激进过程,其中保守和激进之间的权衡是由参数C来控制的。
8.根据权利6所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述权值向量更新采用利用拉格朗日乘子法实现,具体包括:
拉格朗日目标函数为
L ( w , τ 1 , τ 2 , ξ ) = 1 2 | | w - w t - 1 | | 2 2 + Cξ + τ 1 ( 1 - w T d i , j , k - ξ ) - τ 2 ξ - - - ( 10 )
其中τ1≥0,τ2≥0是拉格朗日乘数;关于w对拉格朗日目标函数(10)求偏导数
∂ L ( w , τ 1 , τ 2 , ξ ) ∂ w = w - w t - 1 - τ 1 d i , j , k = 0 - - - ( 11 )
对上面公式整理可以得到下面的权值向量更新公式
w=wt-11di,j,k          (12)
关于ξ对拉格朗日目标函数求偏导数
∂ L ( w , τ 1 , τ 2 , ξ ) ∂ ξ = C - τ 1 - τ 2 = 0 - - - ( 13 )
将公式(11)和(12)分别代入拉格朗日目标函数(10),得到下面关于τ1的拉格朗日函数
L ( τ 1 ) = - 1 2 τ 1 2 | | d i , j , k | | 2 + τ 1 ( 1 - ( w t - 1 ) T d i , j , k ) - - - ( 14 )
对(14)式关于τ1求导数,并令其为零,得到
τ 1 = 1 - ( w t - 1 ) T d i , j , k | | d i , j , k | | 2 - - - ( 15 )
由于τ1≤C,τ2≥0,综合(15)式,得到下式
τ 1 = min ( C , 1 - ( w t - 1 ) T d i , j , k | | d i , j , k | | 2 ) - - - ( 16 )
使用公式(12)、(16)给出的解析解迭代更新权值向量。
CN201110325938.7A 2011-10-24 2011-10-24 基于成对约束的在线词典再加权对图像进行分类的方法 Expired - Fee Related CN102509110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110325938.7A CN102509110B (zh) 2011-10-24 2011-10-24 基于成对约束的在线词典再加权对图像进行分类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110325938.7A CN102509110B (zh) 2011-10-24 2011-10-24 基于成对约束的在线词典再加权对图像进行分类的方法

Publications (2)

Publication Number Publication Date
CN102509110A true CN102509110A (zh) 2012-06-20
CN102509110B CN102509110B (zh) 2014-04-23

Family

ID=46221191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110325938.7A Expired - Fee Related CN102509110B (zh) 2011-10-24 2011-10-24 基于成对约束的在线词典再加权对图像进行分类的方法

Country Status (1)

Country Link
CN (1) CN102509110B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932605A (zh) * 2012-11-26 2013-02-13 南京大学 一种视觉感知网络中摄像机的组合选择方法
CN103020265A (zh) * 2012-12-25 2013-04-03 深圳先进技术研究院 图像检索的方法和系统
CN103116762A (zh) * 2013-03-20 2013-05-22 南京大学 一种基于自调制字典学习的图像分类方法
CN103177264A (zh) * 2013-03-14 2013-06-26 中国科学院自动化研究所 基于视觉词典全局拓扑表达的图像分类方法
CN104134068A (zh) * 2014-08-12 2014-11-05 江苏理工学院 基于稀疏编码的监控车辆特征表示及分类方法
CN105139036A (zh) * 2015-06-19 2015-12-09 四川大学 一种基于稀疏编码的手写体数字识别方法
CN106033546A (zh) * 2015-03-10 2016-10-19 中国科学院西安光学精密机械研究所 基于自上而下学习的行为分类方法
CN106157240A (zh) * 2015-04-22 2016-11-23 南京理工大学 基于字典学习的遥感图像超分辨率方法
CN106228181A (zh) * 2016-07-12 2016-12-14 广东智嵌物联网技术有限公司 一种基于视觉词典的图像分类方法及系统
CN108764275A (zh) * 2018-04-10 2018-11-06 甘肃农业大学 叶片病害的识别方法和系统
CN109344898A (zh) * 2018-09-30 2019-02-15 北京工业大学 基于稀疏编码预训练的卷积神经网络图像分类方法
CN109858570A (zh) * 2019-03-08 2019-06-07 京东方科技集团股份有限公司 图像分类方法及系统、计算机设备及介质
CN111881954A (zh) * 2020-07-15 2020-11-03 中国科学院自动化研究所 基于渐进式簇净化网络的转导推理小样本分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1691065A (zh) * 2004-04-23 2005-11-02 中国科学院计算技术研究所 一种视频运动对象分割方法
CN102043784A (zh) * 2009-10-17 2011-05-04 青岛理工大学 一种融合成对约束和属性排序信息的半监督聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1691065A (zh) * 2004-04-23 2005-11-02 中国科学院计算技术研究所 一种视频运动对象分割方法
CN102043784A (zh) * 2009-10-17 2011-05-04 青岛理工大学 一种融合成对约束和属性排序信息的半监督聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴军等: "正负模糊规则系统_极限学习机与图像分类", 《中国图象图形学报》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932605A (zh) * 2012-11-26 2013-02-13 南京大学 一种视觉感知网络中摄像机的组合选择方法
CN102932605B (zh) * 2012-11-26 2014-12-24 南京大学 一种视觉感知网络中摄像机的组合选择方法
CN103020265A (zh) * 2012-12-25 2013-04-03 深圳先进技术研究院 图像检索的方法和系统
CN103020265B (zh) * 2012-12-25 2015-08-26 深圳先进技术研究院 图像检索的方法和系统
CN103177264A (zh) * 2013-03-14 2013-06-26 中国科学院自动化研究所 基于视觉词典全局拓扑表达的图像分类方法
CN103177264B (zh) * 2013-03-14 2016-09-14 中国科学院自动化研究所 基于视觉词典全局拓扑表达的图像分类方法
CN103116762A (zh) * 2013-03-20 2013-05-22 南京大学 一种基于自调制字典学习的图像分类方法
CN103116762B (zh) * 2013-03-20 2015-10-14 南京大学 一种基于自调制字典学习的图像分类方法
CN104134068A (zh) * 2014-08-12 2014-11-05 江苏理工学院 基于稀疏编码的监控车辆特征表示及分类方法
CN104134068B (zh) * 2014-08-12 2017-11-14 江苏理工学院 基于稀疏编码的监控车辆特征表示及分类方法
CN106033546A (zh) * 2015-03-10 2016-10-19 中国科学院西安光学精密机械研究所 基于自上而下学习的行为分类方法
CN106157240A (zh) * 2015-04-22 2016-11-23 南京理工大学 基于字典学习的遥感图像超分辨率方法
CN105139036A (zh) * 2015-06-19 2015-12-09 四川大学 一种基于稀疏编码的手写体数字识别方法
CN105139036B (zh) * 2015-06-19 2018-10-19 四川大学 一种基于稀疏编码的手写体数字识别方法
CN106228181A (zh) * 2016-07-12 2016-12-14 广东智嵌物联网技术有限公司 一种基于视觉词典的图像分类方法及系统
CN106228181B (zh) * 2016-07-12 2019-05-31 广东智嵌物联网技术有限公司 一种基于视觉词典的图像分类方法及系统
CN108764275A (zh) * 2018-04-10 2018-11-06 甘肃农业大学 叶片病害的识别方法和系统
CN109344898A (zh) * 2018-09-30 2019-02-15 北京工业大学 基于稀疏编码预训练的卷积神经网络图像分类方法
CN109858570A (zh) * 2019-03-08 2019-06-07 京东方科技集团股份有限公司 图像分类方法及系统、计算机设备及介质
US11144799B2 (en) 2019-03-08 2021-10-12 Beijing Boe Optoelectronics Technology Co., Ltd. Image classification method, computer device and medium
CN111881954A (zh) * 2020-07-15 2020-11-03 中国科学院自动化研究所 基于渐进式簇净化网络的转导推理小样本分类方法

Also Published As

Publication number Publication date
CN102509110B (zh) 2014-04-23

Similar Documents

Publication Publication Date Title
CN102509110B (zh) 基于成对约束的在线词典再加权对图像进行分类的方法
Zou et al. Scene classification using local and global features with collaborative representation fusion
Gao et al. Infar dataset: Infrared action recognition at different times
Wang et al. Semi-supervised classification using linear neighborhood propagation
CN102034096B (zh) 基于自顶向下运动注意机制的视频事件识别方法
CN103116762A (zh) 一种基于自调制字典学习的图像分类方法
CN102622607A (zh) 一种基于多特征融合的遥感图像分类方法
CN105719285A (zh) 一种基于方向倒角距离特征的行人检测方法
CN102263790A (zh) 一种基于集成学习的入侵检测方法
CN103065158A (zh) 基于相对梯度的isa模型的行为识别方法
Liu et al. Eagle-eyed multitask CNNs for aerial image retrieval and scene classification
CN104463248A (zh) 基于深度玻尔兹曼机提取高层特征的高分辨率遥感图像飞机检测方法
Xin et al. Real-time visual place recognition based on analyzing distribution of multi-scale CNN landmarks
Bai et al. Achieving better category separability for hyperspectral image classification: A spatial–spectral approach
CN114842507A (zh) 一种基于组优化奖励的强化行人属性识别方法
Sun et al. Remote sensing image recognition based on LOG-T-SSA-LSSVM and AE-ELM network
Wang et al. Action recognition using linear dynamic systems
CN103336830A (zh) 基于结构语义直方图的图像检索方法
Li et al. Deeply feature learning by CMAC network for manipulating rehabilitation robots
Weng et al. Traffic scene perception based on joint object detection and semantic segmentation
Zhang et al. Joint image representation and classification in random semantic spaces
Xu et al. Human detection in images via L1-norm minimization learning
CN105718858A (zh) 一种基于正负广义最大池化的行人识别方法
Wang et al. A lightweight and stochastic depth residual attention network for remote sensing scene classification
Zou et al. Research on human movement target recognition algorithm in complex traffic environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140423

Termination date: 20211024