CN102509110B - 基于成对约束的在线词典再加权对图像进行分类的方法 - Google Patents
基于成对约束的在线词典再加权对图像进行分类的方法 Download PDFInfo
- Publication number
- CN102509110B CN102509110B CN201110325938.7A CN201110325938A CN102509110B CN 102509110 B CN102509110 B CN 102509110B CN 201110325938 A CN201110325938 A CN 201110325938A CN 102509110 B CN102509110 B CN 102509110B
- Authority
- CN
- China
- Prior art keywords
- feature
- tau
- constraint
- weighting
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 230000000007 visual effect Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 238000012804 iterative process Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000003064 k means clustering Methods 0.000 claims description 2
- 238000006467 substitution reaction Methods 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 238000004220 aggregation Methods 0.000 abstract 1
- 230000002776 aggregation Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000035479 physiological effects, processes and functions Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 101100477520 Homo sapiens SHOX gene Proteins 0.000 description 1
- 102000048489 Short Stature Homeobox Human genes 0.000 description 1
- 108700025071 Short Stature Homeobox Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Abstract
本发明公开了一种基于成对约束的在线词典再加权对图像进行分类的方法,包括:对所有训练集图像进行底层特征提取,构建初始视觉词典;采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,以利用分类器进行分类;以及利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。本发明利用成对约束,可以有效地编码成对图像之间的关系,基于保守-激进训练策略提出的在线学习算法,大大减少了训练时间,并可以实现增量更新,尤其适用于海量数据集。
Description
技术领域
本发明涉及计算机视觉中图像分类技术领域,特别涉及一种基于词包模型和在线学习的目标分类的方法。
背景技术
随着计算机运算能力的飞速提升,计算机视觉、人工智能、机器感知等领域也迅猛发展。图像分类作为计算机视觉中一个基本问题之一,也得到了长足的发展。图像分类就是利用计算机对图像进行智能分析,进而判断图像所属的类别。
随着互联网技术、计算机技术的发展,图像分类已经在众多领域中得到了广泛的应用。基于内容的图像检索可以对图像进行基于图像内容的检索,快速获得与检索图像在表观上相似的图像,这是基于文本的图像检索技术无法比拟的。智能视频监控技术在很多机场、博览会、居民小区等公共场所以及国防军事领域发挥了重要的作用,一般的视频监控算法在使用背景建模方法获取到前景目标后,都会使用目标分类方法对目标进行粗分类,然后根据不同目标类别,接下来进行进一步的跟踪、行为分析、行为报警。遥感图像处理中也大量使用图像分类技术,判断地面物体类别,可以有效地帮助专业人员进行快速的分析与处理。目前在计算机、手持设备上大量应用的手写识别,也是图像分类与图像识别技术的典型成功应用。
尽管图像分类技术在很多领域得到了广泛应用,目前还是有很多困难有待解决。当前已有的应用,绝大多数是工作在受限场景下的,对背景、天气、光照、姿态等有较强限制。而在真实场景下,目标的背景、光照、姿态、尺度、视角等,都有可能发生变化,如何在如此大变化下,依然能够对目标做出准确的分类,仍旧是图像分类的一个最重要的难题。科学工作者在这个问题上进行了大量的研究,致力于寻找具有不变性的特征描述子,最著名的有尺度不变特征转换(Scale-invariant feature transform,SIFT)、SURF、HOG(Histogram of Oriented Gradients)等。SIFT特征就是一种对尺度变化不敏感的特征,对旋转也有一定的不变性;也有科研工作者致力于分类器的设计,提出更加鲁棒的分类器,最常见的如支持向量机(supportvector machine,SVM)、Boosting等;还有人从生理学、心理学等领域的理论出发,尝试通过认识人的识别机理,进而应用计算机技术模拟这一过程,实现真正的人工智能。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的是提供一种基于成对约束的在线词典再加权对图像进行分类的方法,以准确、快速地在大尺度数据上对图像进行在线分类。
(二)技术方案
为了达到上述目的,本发明提供了一种基于成对约束的在线词典再加权对图像进行分类的方法,包括:
对所有训练集图像进行底层特征提取,构建初始视觉词典;
采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;
对编码后的特征进行最大值汇聚,得到一个用向量表达的特征;以及
利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。
(三)有益效果
本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,与目前国内外发表的最新的方法相比具有几个明显优点:
1)、本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,基于成对约束实现词典再加权,可以有效编码图像之间的关系,减少类内差别和背景变化的影响。
2)、本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,再加权向量通过一种在线学习算法迭代学习得到,可以实现增量更新。
3)、本发明提供的基于成对约束的在线词典再加权对图像进行分类的方法,在线学习算法有解析解,在计算时间复杂度和内存消耗上都大大低于一般批量训练算法,非常适合大规模数据上的应用。
附图说明
图1是依照本发明实施例基于成对约束的在线词典再加权对图像进行分类的方法流程图;
图2是依照本发明实施例成对约束的示意图;
图3是依照本发明实施例将最大值汇聚看作一种弱加权过程的示意图;
图4是依照本发明实施例对两张图片之间相似度进行计算的示意图;
图5是依照本发明实施例显示再加权对图片之间相似度影响的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的思想要点是:1)图像分类中常用的汇聚操作可以看作是一种弱加权,本发明通过机器学习得到更强的加权;2)本发明利用成对约束实现词典再加权,可以有效编码图像之间的关系,减少类内差别和背景变化的影响;3)批量训练在计算时间和内存消耗上都代价很高,本发明提出了一种在线学习算法,可以用非常小的代价得到同样甚至更好的结果;4)本发明通过拉格朗日乘子法得到了解析解,使得计算复杂度进一步减少。
如图1所示,图1左边是依照本发明实施例基于成对约束的在线词典再加权对图像进行分类的方法流程图。图1右边部分阐述了该方法的出发点和目的,其中方块形状和三角形状分别代表不同类别的样本点,实线和虚线分别代表了cannot-link和must-link关系。在原始样本空间中,不同类数据点分布有重叠,经过再加权后,同类别的数据点倾向于集中到一起。该方法包括以下步骤:
S1、对所有训练集图像进行底层特征提取,构建初始视觉词典。
特征提取是模式识别和计算机视觉算法中的重要部分。图像描述子一般分为全局描述子和局部描述子,常见的包括SIFT、SURF、HOG、PHOG、颜色描述子、形状上下文等。本实施例中采用密集提取的SIFT特征作为底层特征。对每张图像,X={x1,x2,...,xN}∈RD×N表示从图像中密集提取的N个D维SIFT特征。从所有训练集图像密集提取SIFT特征,并从提取到的所有SIFT特征中随机选择部分SIFT特征,使用K-means聚类算法得到M个聚类中心,作为初始的视觉词典,记为C={c1,c2,...,cM}∈RD×M,其中ci代表第i个视觉单词,维度为D。
S2、采用稀疏编码对步骤S1中提取到的底层特征进行特征变换,得到编码后的特征。
对底层进行特征变换,先编码到特征空间再进行后续处理已经成为图像分类框架中的标准过程。最常用的是硬投票编码,即对图像的每个局部特征xi,寻找与其最近的单词,等价为求解下面问题:
其中bi是局部特征xi再视觉词典C上面的响应。
为了使变换后的特征具有更强的空间局部性、方向性和鲁棒性,本实施例采用了稀疏编码进行特征变换,归结为求解下面最优化问题:
稀疏编码已经在信号处理、图像处理、计算机视觉、机器学习等领域得到了广泛的研究和发展,大量的生理学、心理学实验结果也证实了稀疏性对于人类视觉处理的重要作用。
S3、对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,以利用分类器进行分类。
在对底层特征进行编码之后,需要对编码后的特征进行汇聚得到一个用向量表达的特征,以利用分类器进行分类。对于硬投票而言,最直观的是用统计直方图,统计每个单词出现的频率。最大值汇聚则是一个更有效的算法,并且在生理学实验上找到了一定的依据。基本思想就是,对于每个单词,每个局部特征都在该单词上有一个响应,取最大的响应作为该单词的响应,忽略其他响应。最大值汇聚可以有效地对图像进行表达,压制噪声的影响,更重要的是可以获得一定的不变性。
S4、利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类。
为进一步改善基于词包模型的图像分类系统的性能,本实施例提出一种词典再加权算法,以克服其他现有算法的一些缺点。下面将详细介绍再加权的思想、实现以及优化求解过程。
定义I={I1,I2,...,In}代表n张图片,y={y1,y2,...,yn}为对应的标记。每张图片Ii分别经过稀疏编码和最大值汇聚,得到一个表达向量pi。
本实施例利用成对约束来进行词典再加权,成对约束是编码图像之间关系的一种很自然的表达方式。如图2中所示,同类别图像之间使用must-link,不同类别图像之间使用cannot-link。pi的每个元素可以看作是对应单词的权重。我们使用两幅图对应的特征向量的相交核作为两幅图之间的相似度,用下面公式计算:
di,j=min(pi,pj) (3)
其中di,j(m)是向量di,j的第m维元素。
图4给出了依照本发明实施例对两张图片之间相似度进行计算的示意图,从图中可以直观的看出相似度的计算。
图3中给出了依照本发明实施例将最大值汇聚看作一种弱加权过程的示意图,从图中可以看出,最大值汇聚实际上可以看作是一种弱加权操作,从更一般的角度来说,再加权后图片间相似度定义为:
其中w是权值向量。
进一步,成对约束可以这样构造:
从上面公式可以看出,再加权后同类图片之间的相似度倾向大于异类图片之间的相似度,这无疑将减少类内差异和背景变换的影响。图5给出了依照本发明实施例显示再加权对图片之间相似度影响的示意图,可以看出,再加权后,同类图片之间的相似度倾向于增大,而异类之间的相似度则倾向于减小。尽管使用成对约束有上列优点,计算成对约束有非常高的计算复杂度和存储需求。本实施例提出了一种在线学习算法来解决这个问题。
定义三元组 成对约束可扩展成
其中
上面公式意味着我们期望达到边界至少为1,损失函数使用下面形式:
对于批量学习过程,即使是非常小的数据库,在所有三元组上面最小化上述损失函数都有非常高的复杂度。本实施例采用一种保守-激进训练策略迭代更新权值向量。
具体说来,在每次迭代过程中,新的权值向量通过求解下列优化问题得到:
该迭代过程在损失函数大时“激进”更新权值向量,再损失函数小时“保守”更新权值向量,因而称为保守-激进过程。保守和激进之间的权衡是由参数C来控制的。
利用拉格朗日乘子法,本实施例给出了权值向量更新问题的解析解。
拉格朗日目标函数为
其中τ1≥0,τ2≥0是拉格朗日乘数。关于w对拉格朗日目标函数(10)求偏导数
对上面公式整理可以得到下面的权值向量更新公式
w=wt-1+τ1di,j,k (12)
关于ξ对拉格朗日目标函数求偏导数
将公式(11)和(12)分别代入拉格朗日目标函数(10),得到下面关于τ1的拉格朗日函数
对(14)式关于τ1求导数,并令其为零,得到
由于τ1≤C,τ2≥0,综合(15)式,得到下式
使用(12)、(16)式给出的解析解迭代更新权值向量,理论和实验表明在计算时间复杂度和内存需求上,均大大小于常规批量学习算法。
为了更好地说明本实施例的具体实施方式,下面按以下步骤对本发明进一步详细阐述:
步骤S1:特征提取。对图像在一个密集的网格上提取SIFT特征。
步骤S2:稀疏编码。对局部SIFT描述子进行k-means聚类,得到一个视觉字典,并用该视觉字典对局部SIFT描述子进行稀疏编码。
步骤S3:最大值汇聚。对一个区域内稀疏编码后的特征进行最大值汇聚。
总之,本发明提出了一种新的基于成对约束的视觉词典再加权算法,并使用在线学习方法进行求解,实验表明该发明与主流图像分类算法相比具有计算复杂度低、内存消耗少、快速、准确等优点,适合大尺度数据下的图像分类应用。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,包括:
对所有训练集图像进行底层特征提取,构建初始视觉词典;
采用稀疏编码对提取的底层特征进行特征变换,得到编码后的特征;
对编码后的特征进行最大值汇聚,得到一个用向量表达的特征;以及
利用成对约束对所述用向量表达的特征进行在线词典再加权,并送入分类器进行训练和分类;
其中,所述利用成对约束对所述用向量表达的特征进行在线词典再加权,包括:
定义I={I1,I2,...,In}代表n张图片,y={y1,y2,...,yn}为对应的标记,每张图片Ii分别经过稀疏编码和最大值汇聚,得到一个表达向量pi;
利用成对约束来进行在线词典再加权,成对约束是编码图像之间关系的一种很自然的表达方式,同类别图像之间使用must-link,不同类别图像之间使用cannot-link;pi的每个元素是对应单词的权重;使用两幅图对应的特征向量的相交核作为两幅图之间的相似度,用下面公式计算:
di,j=min(pi,pj)
其中di,j(m)是向量di,j的第m维元素,pi,pj分别是由图片Ii,Ij在最大值汇聚后得到特征向量;
再加权后图片间相似度定义为:
其中w是权值向量;
进一步,成对约束能够这样构造:
其中 这里 di,j(m)是di,j的第m维元素,w是权值向量。
2.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述对所有训练集图像进行底层特征提取,构建初始视觉词典,包括:
采用密集提取的尺度不变特征转换SIFT特征作为底层特征,对于每张图像X={x1,x2,…,xN}∈RD×N表示N个从图像中密集提取的D维SIFT特征;从所有训练集图像中密集提取SIFT特征,并从提取到的所有SIFT特征中随机选择部分SIFT特征,使用K-means聚类算法得到M个聚类中心,作为初始的视觉词典,记为C={c1,c2,…,cM}∈RD×M,其中cj代表第i个视觉单词,维度为D。
3.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述采用稀疏编码对提取的底层特征进行特征变换,是通过求解以下公式的最优化问题实现的:
其中,Xj是一个D维SIFT特征,C是由M个聚类中心构成的视觉字典,bi是局部特征xi在视觉词典C上面的响应,bij是bi的第j维元素,λ是惩罚系数。
4.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述对编码后的特征进行最大值汇聚,得到一个用向量表达的特征,包括:
对于编码后的特征中的每个单词,每个局部特征都在该单词上有一个响应,取最大的响应作为该单词的响应,忽略其他响应,并将该单词的响应作为一个用向量表达的特征。
5.根据权利1所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述利用成对约束对所述用向量表达的特征进行在线词典再加权的步骤中,所述成对约束的计算采用在线学习方法求解基于成对约束的再加权向量,该方法包括:
采用3张图片组成一个三元组 成对约束可扩展成
其中,
上面公式意味着期望达到边界至少为1,损失函数使用下面形式:
对于批量学习过程,即使是非常小的数据库,在所有三元组上面最小化上述损失函数都有非常高的复杂度,所以采用保守-激进训练策略迭代更新权值向量。
6.根据权利5所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述采用保守-激进训练策略迭代更新权值向量,是在每次迭代过程中使用三元组按下面公式更新权值向量:
其中t是迭代次数,ξ是松弛变量,用来控制模型复杂度,防止更新过拟合;该迭代过程在损失函数大时“激进”更新权值向量,在损失函数小时“保守”更新权值向量,因而称为保守-激进过程,其中保守和激进之间的权衡是由参数C来控制的;并且,在该迭代过程中权值向量w更新采用拉格朗日乘子法实现。
7.根据权利6所述的基于成对约束的在线词典再加权对图像进行分类的方法,其特征在于,所述在该迭代过程中权值向量w更新采用拉格朗日乘子法实现,具体包括:
拉格朗日目标函数为
其中τ1≥0,τ2≥0是拉格朗日乘数,t是迭代次数,τ是拉格朗日乘子,ξ是松弛变量,用来控制模型复杂度,用来防止更新过拟合;关于w对拉格朗日目标函数(10)求偏导数
对上面公式整理可以得到下面的权值向量更新公式
w=Wt-1+τ1di,j,k (12)
关于ξ对拉格朗日目标函数求偏导数
将公式(11)和(12)分别代入拉格朗日目标函数(10),得到下面关于τ1的拉格朗日函数
对(14)式关于τ1求导数,并令其为零,得到
由于τ1≤C,τ2≥0,综合(15)式,得到下式
使用公式(12)、(16)给出的解析解迭代更新权值向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110325938.7A CN102509110B (zh) | 2011-10-24 | 2011-10-24 | 基于成对约束的在线词典再加权对图像进行分类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110325938.7A CN102509110B (zh) | 2011-10-24 | 2011-10-24 | 基于成对约束的在线词典再加权对图像进行分类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102509110A CN102509110A (zh) | 2012-06-20 |
CN102509110B true CN102509110B (zh) | 2014-04-23 |
Family
ID=46221191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110325938.7A Expired - Fee Related CN102509110B (zh) | 2011-10-24 | 2011-10-24 | 基于成对约束的在线词典再加权对图像进行分类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102509110B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102932605B (zh) * | 2012-11-26 | 2014-12-24 | 南京大学 | 一种视觉感知网络中摄像机的组合选择方法 |
CN103020265B (zh) * | 2012-12-25 | 2015-08-26 | 深圳先进技术研究院 | 图像检索的方法和系统 |
CN103177264B (zh) * | 2013-03-14 | 2016-09-14 | 中国科学院自动化研究所 | 基于视觉词典全局拓扑表达的图像分类方法 |
CN103116762B (zh) * | 2013-03-20 | 2015-10-14 | 南京大学 | 一种基于自调制字典学习的图像分类方法 |
CN104134068B (zh) * | 2014-08-12 | 2017-11-14 | 江苏理工学院 | 基于稀疏编码的监控车辆特征表示及分类方法 |
CN106033546B (zh) * | 2015-03-10 | 2021-03-19 | 中国科学院西安光学精密机械研究所 | 基于自上而下学习的行为分类方法 |
CN106157240B (zh) * | 2015-04-22 | 2020-06-26 | 南京理工大学 | 基于字典学习的遥感图像超分辨率方法 |
CN105139036B (zh) * | 2015-06-19 | 2018-10-19 | 四川大学 | 一种基于稀疏编码的手写体数字识别方法 |
CN106228181B (zh) * | 2016-07-12 | 2019-05-31 | 广东智嵌物联网技术有限公司 | 一种基于视觉词典的图像分类方法及系统 |
CN108764275B (zh) * | 2018-04-10 | 2020-08-04 | 甘肃农业大学 | 叶片病害的识别方法和系统 |
CN109344898A (zh) * | 2018-09-30 | 2019-02-15 | 北京工业大学 | 基于稀疏编码预训练的卷积神经网络图像分类方法 |
CN109858570A (zh) * | 2019-03-08 | 2019-06-07 | 京东方科技集团股份有限公司 | 图像分类方法及系统、计算机设备及介质 |
CN111881954A (zh) * | 2020-07-15 | 2020-11-03 | 中国科学院自动化研究所 | 基于渐进式簇净化网络的转导推理小样本分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100337249C (zh) * | 2004-04-23 | 2007-09-12 | 中国科学院计算技术研究所 | 一种视频运动对象分割方法 |
CN102043784A (zh) * | 2009-10-17 | 2011-05-04 | 青岛理工大学 | 一种融合成对约束和属性排序信息的半监督聚类方法 |
-
2011
- 2011-10-24 CN CN201110325938.7A patent/CN102509110B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102509110A (zh) | 2012-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102509110B (zh) | 基于成对约束的在线词典再加权对图像进行分类的方法 | |
Dizaji et al. | Unsupervised deep generative adversarial hashing network | |
Huttunen et al. | Car type recognition with deep neural networks | |
Gao et al. | Infar dataset: Infrared action recognition at different times | |
US9679226B1 (en) | Hierarchical conditional random field model for labeling and segmenting images | |
Yang et al. | Video scene understanding using multi-scale analysis | |
Wang et al. | Semi-supervised classification using linear neighborhood propagation | |
CN102034096B (zh) | 基于自顶向下运动注意机制的视频事件识别方法 | |
CN103116762A (zh) | 一种基于自调制字典学习的图像分类方法 | |
CN102034212A (zh) | 一种基于视频分析的城市管理系统 | |
CN102263790A (zh) | 一种基于集成学习的入侵检测方法 | |
CN105719285A (zh) | 一种基于方向倒角距离特征的行人检测方法 | |
CN103065158A (zh) | 基于相对梯度的isa模型的行为识别方法 | |
Liu et al. | Eagle-eyed multitask CNNs for aerial image retrieval and scene classification | |
CN105678261A (zh) | 基于有监督图的直推式数据降维方法 | |
Li et al. | Robust geometric ℓp-norm feature pooling for image classification and action recognition | |
Yuan et al. | Few-shot scene classification with multi-attention deepemd network in remote sensing | |
Zhang et al. | Class relatedness oriented-discriminative dictionary learning for multiclass image classification | |
CN114842507A (zh) | 一种基于组优化奖励的强化行人属性识别方法 | |
Sun et al. | Remote sensing image recognition based on LOG-T-SSA-LSSVM and AE-ELM network | |
Wang et al. | Action recognition using linear dynamic systems | |
CN103336830A (zh) | 基于结构语义直方图的图像检索方法 | |
Xia et al. | Anomaly detection in traffic surveillance with sparse topic model | |
Weng et al. | Traffic scene perception based on joint object detection and semantic segmentation | |
Zhang et al. | Joint image representation and classification in random semantic spaces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140423 Termination date: 20211024 |