CN103942570A - 图像分类方法及系统 - Google Patents

图像分类方法及系统 Download PDF

Info

Publication number
CN103942570A
CN103942570A CN201410177159.0A CN201410177159A CN103942570A CN 103942570 A CN103942570 A CN 103942570A CN 201410177159 A CN201410177159 A CN 201410177159A CN 103942570 A CN103942570 A CN 103942570A
Authority
CN
China
Prior art keywords
image
normalization
histogram
class
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410177159.0A
Other languages
English (en)
Inventor
雷柏英
陈思平
汪天富
倪东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201410177159.0A priority Critical patent/CN103942570A/zh
Publication of CN103942570A publication Critical patent/CN103942570A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种图像分类方法,包括如下步骤:对要分类的图像进行多尺度分割;对多尺度分割后的图像进行显著图提取;对显著图提取后的图像进行直方图挖掘;对直方图挖掘后的图像进行归一化;采用支持向量机对上述归一化的图像进行分类。本发明还涉及一种图像分类系统。本发明能够提高图像的分类性能,减少计算时间,增加图像的区分能力。

Description

图像分类方法及系统
技术领域
本发明涉及一种图像分类方法及系统。
背景技术
图像分类即是,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。
在最近的十年中,图像分类是计算机视觉领域的一个研究热点。BOW(字典袋)技术已被证明是最有效的图像分类的方法之一。
然而,在BOW方法中,空间的上下文信息,如字共生和成对的信息被忽略,产生的视觉单词仍然不够说明问题,限制了图像的整体分类性能。此外,基于局部特征是相互独立的假设,如朴素贝叶斯,并不是总能成立。
发明内容
有鉴于此,有必要提供一种图像分类方法及系统。
本发明提供一种图像分类方法,该方法包括如下步骤:a.对要分类的图像进行多尺度分割;b.对多尺度分割后的图像进行显著图提取;c.对显著图提取后的图像进行直方图挖掘;d.对直方图挖掘后的图像进行归一化;e.采用支持向量机对上述归一化的图像进行分类。
其中,所述的多尺度分割包括将所述图像划分成多块,修改所述划分后图像的结构信息表示。
所述的步骤b采用基于图形的视觉显著性的自下而上的显著性模型提取图像的显著图。
所述的步骤c中直方图挖掘基于:R(m)=d(m)×v(m),其中,d(m)(0≤d(m≤)和1)v(m)分别是差异性分数和代表性分数。
所述步骤d中的归一化包括:平方根归一化、L1归一化、类内和类间l1归一化、l2归一化、类内和类间l2归一化。
本发明还提供一种图像分类系统,包括相互电性连接的分割模块、提取模块、挖掘模块、归一化模块及分类模块。其中,所述分割模块用于对要分类的图像进行多尺度分割;所述提取模块用于对多尺度分割后的图像进行显著图提取;所述挖掘模块用于对显著图提取后的图像进行直方图挖掘;所述归一化模块用于对直方图挖掘后的图像进行归一化;所述分类模块用于采用支持向量机对上述归一化的图像进行分类。
其中,所述的多尺度分割包括将所述图像划分成多块,修改所述划分后图像的结构信息表示。
所述的提取模块采用基于图形的视觉显著性的自下而上的显著性模型提取图像的显著图。
所述的直方图挖掘基于:R(m)=d(m)×v(m),其中,d(m)(0≤d(m)≤1)和v(m)分别是差异性分数和代表性分数。
所述的归一化包括:平方根归一化、L1归一化、类内和类间l1归一化、l2归一化、类内和类间l2归一化。
本发明图像分类方法及系统,利用显著区域定位、直方图挖掘、图像评分、差异性学习等进行图像分类。主要贡献如下:首先,结合直方图挖掘的多尺度空间进行金字塔的图像表示,基于边缘的密集描述符提高分类性能和减少计算时间;其次,显著图提取构建BoP模型,增加区分判断能力;第三,从视觉显著性获得的图像得分被集成到SVM分类器的分离超平面,所述图像得分被视为潜在的信息,以提高区分能力;最后,提出了考虑类间和类内变化,也考虑直方图的统计信息的直方图归一化方法。
附图说明
图1为本发明图像分类方法的流程图;
图2为本发明较佳实施例图像多尺度分割示意图;
图3为本发明较佳实施例图像、显著图、显著图的灰度形式示意图;
图4为本发明较佳实施例事件数据集的直方图PDF示意图;
图5为本发明较佳实施例足球数据集的直方图PDF示意图;
图6为本发明图像分类系统的硬件架构图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细的说明。
参阅图1所示,是本发明图像分类方法较佳实施例的作业流程图。
步骤S401,对要分类的图像进行多尺度分割。具体而言,将每个所述图像划分成多块,修改所述划分后图像的结构信息表示。图2示出了多尺度分割后的图像空间金字塔。图2中1×1(原始图像)、2×2、4×4的区域(总共21个区域)均由SPM技术生成。本实施例中,所述图像的纵横比保持SPM的多尺度技术。从多尺度分割和密集采样中得到特征矢量,一般是高维数,通过主成分分析(PCA)和线性判别分析(LDA)进行降维运算,从而产生良好的结果,且不显著损失。
步骤S402,对多尺度分割后的图像进行显著图提取。视觉显著性或点分布通常用于获得通用的显著性和强调不同的局部区域,如轮廓、边缘和颜色。本实施例中,采用基于图形的视觉显著性(GBVS)的自下而上的显著性模型来提取图像的显著图。图3显示了图像、显著图、显著图的灰度形式,由此看出有意义鉴别的区域,可以可靠地从显著图中获得。
每个视觉词之间码字的共同出现结合在特征向量也融合进BoP(bagof phrase)直方图中,n个局部描述符s={st},t=1,...,n的每个码字v由原始的BoW方法生成,显著性驱动的方法由下式获得:
s = Σ t = 1 n β t | | v - s t | | 2
其中,加权系数βt在位置(x,y)定义为:σ是加权参数。
假设sic代表i-th图像在c-th类的显著性,hic代表i-th图像在c-th类的近似归一化的BoP直方图。该图像由连接在一起的特征直方图和显著特征图可以表示为:
X=[..s1ch1c...sichic...shNM],
对于图像评分的权重,图像中心的计算通过选择其中各个细胞的最小化各个距离:
S i = arg min s j Σ j = 1 M d ( S i , S j )
其中,d是距离衡量。距离衡量是基于图像局部细胞的直方图。χ2距离衡量差别如下:
d ( S i , S j ) = Σ r = 1 | ζ | 2 s jr × s ir s jr + s ir .
此类距离度量是衡量图像是否属于这个类。如果这个细胞远离细胞中心,很可能这个细胞不在这个类中,那么这幅图像的权重就比较低。假设d表示为t-th图像分数和每类的图像分数中,图像的评分可以定义为:
d≥0,其中,τ是强度测量系数,st是显著性图,φ是边界因子,Γ(·)是伽玛函数。
空间上下文信息最终被归一化图像的得分在支持向量机学习中训练。归一化的图像的得分计算如下:
λ i = μ i | ζ | Σ i = 1 | ζ | μ i . .
步骤S403,对显著图提取后的图像进行直方图挖掘。具体而言:
直方图挖掘得分是基于两个discriminitivity和代表性分数如下组合M表示:
R(m)=d(m)×v(m),
其中,d(m)(0≤d(m)≤1)和v(m)分别是差异性和代表性分数。高的R(m)意味着模式m在整个图像具有很高区分性有利于分类。
假设p(i|m)是图像类c在具体的模式m下的条件概率,在熵方法下的差异性定义为:
d ( m ) = 1 - Σ c p ( c | m ) log p ( c | m ) log O ,
其中,logO是保证0≤d(m)≤1,的正则化参数,假设Aj代表j-th图像,N是此类中总的图像数,F(m|Aj)是常出现的模式,p(c|m)定义为:
p ( c | m ) = Σ j = 1 N F ( m | A j ) p ( c | A j ) Σ j = 1 N F ( m | A j ) ,
其中,F(m|Aj)等于1意味着模式m在图像Aj中,而0则代表图像在此类中,同样,p(c|Aj)等于1意味着类标同Aj相同,为0则类标不同。
假设p(A|m'c)是类c的最佳分配,概率p(A|m)从频率F(m|A)中获得,本质就是模式m的分配,代表性的分数可以定义为整个图像的最佳匹配:
v ( m ) = max c ( exp - [ D KL ( P ( A | m c ′ ) | | p ( A | m ) ) ] ) ,
其中,DKL(·||·)是两种分配中的Kullabak-Leibler(KL)散度。
步骤S404,对直方图挖掘后的图像进行归一化。具体步骤如下:
在大多数的数据集中,测试和训练图像有不同的宽度和高度,这导致图像的变化以及直方图的多样化。多尺度方法把图像分割成不同的尺寸,因此导致图像的变化。由于直方图是SVM分类器的输入,归一化直方图的输入可能导致由一致性改进的分类结果。因此,关键是要进行归一化,以实现分类一致性。归一化是解决变化问题的有效方法。lp范数为实数时,p≥1时定义为:
| | x | | p = ( Σ i = 1 n | x i | p ) 1 / p ,
其中,p=1是l1范数,p=2是l2范数或者欧几里德范数。归一化的直方图往往有利于在较大区域分类可以获得相对较大的分数。当上述直方图被归一化后,在SVM分类区域相似度的最大值可以在两个区域共享相同的外观被发现。为归一化常常执行与小区域的更好,并且因此相比正常化相对较不可靠的性能得到。同时,当直方图h是归一化,特征映射h利用核方法是一个常数。分类和直方图归一化的效率之间的关系进行详细的观察和解释。直方图归一化是特别为基于核SVM分类器非常有用。分类基于直方图,统计技术,如直方图(即直方图分布)的概率密度函数(PDF)的框架支持向量机的图像能够提供大量的区分性的信息进行分类。但是,直方图分布的统计信息往往被忽略。从BOF-PDF算法可以看出,如果图像很好地表示了标准化后的有限分布直方图,分类就可以得到很好的结果。
事实上,在直方图分布已在归一化之后被改变。此外,不同的范数方法在改变直方图PDF格式中起不同的作用。本实施例采用新颖的直方图正态化技术,以便更好地表示图像,进行图像的分类。为了说明直方图PDF格式的变化。图4和5分别显示在事件数据集、足球数据集上采用不同归一化方法后的直方图分布变化(横坐标代表直方图的值;纵坐标为小数点时代表出现的概率,为非小数点时代表出现的次数),如图4及图5中(a)-(f)中所示:(a)表示无归一化;(b)表示平方根(SQRT)归一化,即SQRT范数;(c)表示L1归一化,即l1范数(L1);(d)表示类内和类间l1归一化,即类内和类间l1范数(L1N);(e)表示l2归一化,即l2范数(L2)(f)表示类内和类间l2归一化,即类内和类间l2范数(L2N)。所述L1N和L2N方法利用类的差异进行相应的归一化。L1和L2的方法,仅有l1或者l2范数方法仅在这个类中利用直方图,而L1N和L2N方法意味着l1或者l2范数的方法应用于类内,然后l1或者l2范数方法应用于类间。从图4、图5中可以看出,在事件数据集、足球数据集上,逆高斯和广义极值分布比正态和log正态分布更好地表示数据集的分布。
值得一提的是,类内和类间的归一化方法可以减少类内和类间的变化,并且使分布更广义的和一致。也观察到L1N范数的直方图特征能更好地方法比L1范数的直方图方法更好表示,类似的结果也适用于L2N和L2的方法。此外,L2N方法获得比L1N方法稍微好一点的结果。事实上也已经验证明适当的归一化方法可以提升分类性能。归一化的直方图分布在有限的维数,从而表现出类似于高斯混合模型的特性。在图像表示上,归一化的直方图也大大优于非归一化的直方图。
步骤S405,采用支持向量机(support vector machines,SVM)对上述归一化的图像进行分类。
参阅图6所示,是本发明图像分类系统的硬件架构图。该系统包括相互电性连接的分割模块、提取模块、挖掘模块、归一化模块及分类模块。
所述分割模块用于对要分类的图像进行多尺度分割。具体而言,所述分割模块将每个所述图像划分成多块,修改所述划分后图像的结构信息表示。图2示出了多尺度分割后的图像空间金字塔。图2中1×1(原始图像)、2×2、4×4的区域(总共21个区域)均由SPM技术生成。本实施例中,所述图像的纵横比保持SPM的多尺度技术。从多尺度分割和密集采样中得到特征矢量,一般是高维数,通过主成分分析(PCA)和线性判别分析(LDA)进行降维运算,从而产生良好的结果,且不显著损失。
所述提取模块用于对多尺度分割后的图像进行显著图提取。视觉显著性或点分布通常用于获得通用的显著性和强调不同的局部区域,如轮廓、边缘和颜色。本实施例中,所述提取模块采用基于图形的视觉显著性(GBVS)的自下而上的显著性模型来提取图像的显著图。图3显示了图像、显著图、显著图的灰度形式,由此看出有意义鉴别的区域,可以可靠地从显著图中获得。
每个视觉词之间码字的共同出现结合在特征向量也融合进BoP(bagof phrase)直方图中,n个局部描述符s={st},t=1,...,n的每个码字v由原始的BoW方法生成,显著性驱动的方法由下式获得:
s = Σ t = 1 n β t | | v - s t | | 2
其中,加权系数βt在位置(x,y)定义为:σ是加权参数。
假设sic代表i-th图像在c-th类的显著性,hic代表i-th图像在c-th类的近似归一化的BoP直方图。该图像由连接在一起的特征直方图和显著特征图可以表示为:
X=[..s1ch1c...sichic...shNM],
对于图像评分的权重,图像中心的计算通过选择其中各个细胞的最小化各个距离:
S i = arg min s j Σ j = 1 M d ( S i , S j )
其中,d是距离衡量。距离衡量是基于图像局部细胞的直方图。χ2距离衡量差别如下:
d ( S i , S j ) = Σ r = 1 | ζ | 2 s jr × s ir s jr + s ir .
此类距离度量是衡量图像是否属于这个类。如果这个细胞远离细胞中心,很可能这个细胞不在这个类中,那么这幅图像的权重就比较低。假设d表示为t-th图像分数和每类的图像分数中,图像的评分可以定义为:
d≥0,其中,τ是强度测量系数,st是显著性图,φ是边界因子,Γ(·)是伽玛函数。
空间上下文信息最终被归一化图像的得分在支持向量机学习中训练。归一化的图像的得分计算如下:
λ i = μ i | ζ | Σ i = 1 | ζ | μ i . .
所述挖掘模块用于对显著图提取后的图像进行直方图挖掘。具体而言:
直方图挖掘得分是基于两个discriminitivity和代表性分数如下组合M表示:
R(m)=d(m)×v(m),
其中,d(m)(0≤d(m)≤1)和v(m)分别是差异性和代表性分数。高的R(m)意味着模式m在整个图像具有很高区分性有利于分类。
假设p(i|m)是图像类c在具体的模式m下的条件概率,在熵方法下的差异性定义为:
d ( m ) = 1 - Σ c p ( c | m ) log p ( c | m ) log O ,
其中,logO是保证0≤d(m)≤1,的正则化参数,假设Aj代表j-th图像,N是此类中总的图像数,F(m|Aj)是常出现的模式,p(c|m)定义为:
p ( c | m ) = Σ j = 1 N F ( m | A j ) p ( c | A j ) Σ j = 1 N F ( m | A j ) ,
其中,F(m|Aj)等于1意味着模式m在图像Aj中,而0则代表图像在此类中,同样,p(c|Aj)等于1意味着类标同Aj相同,为0则类标不同。
假设p(A|m'c)是类c的最佳分配,概率p(A|m)从频率F(m|A)中获得,本质就是模式m的分配,代表性的分数可以定义为整个图像的最佳匹配:
v ( m ) = max c ( exp - [ D KL ( P ( A | m c ′ ) | | p ( A | m ) ) ] ) ,
其中,DKL(·||·)是两种分配中的Kullabak-Leibler(KL)散度。
所述归一化模块用于对直方图挖掘后的图像进行归一化。具体如下:
在大多数的数据集中,测试和训练图像有不同的宽度和高度,这导致图像的变化以及直方图的多样化。多尺度分割把图像分割成不同的尺寸,因此导致图像的变化。由于直方图是SVM分类器的输入,归一化直方图的输入可能导致由一致性改进的分类结果。因此,关键是要进行归一化,以实现分类一致性。归一化是解决变化问题的有效方法。lp范数为实数时,p≥1时定义为:
| | x | | p = ( Σ i = 1 n | x i | p ) 1 / p ,
其中,p=1是l1范数,p=2是l2范数或者欧几里德范数。归一化的直方图往往有利于在较大区域分类可以获得相对较大的分数。当上述直方图被归一化后,在SVM分类区域相似度的最大值可以在两个区域共享相同的外观被发现。为归一化常常执行与小区域的更好,并且因此相比正常化相对较不可靠的性能得到。同时,当直方图h是归一化,特征映射h利用核方法是一个常数。分类和直方图归一化的效率之间的关系进行详细的观察和解释。直方图归一化是特别为基于核SVM分类器非常有用。分类基于直方图,统计技术,如直方图(即直方图分布)的概率密度函数(PDF)的框架支持向量机的图像能够提供大量的区分性的信息进行分类。但是,直方图分布的统计信息往往被忽略。从BOF-PDF算法可以看出,如果图像很好地表示了标准化后的有限分布直方图,分类就可以得到很好的结果。
事实上,在直方图分布已在归一化之后被改变。此外,不同的范数方法在改变直方图PDF格式中起不同的作用。本实施例采用新颖的直方图正态化技术,以便更好地表示图像,进行图像的分类。为了说明直方图PDF格式的变化。图4和5分别显示在事件数据集、足球数据集上采用不同归一化方法后的直方图分布变化(横坐标代表直方图的值;纵坐标为小数点时代表出现的概率,为非小数点时代表出现的次数),如图4及图5中(a)-(f)中所示:(a)表示无归一化;(b)表示平方根(SQRT)归一化,即SQRT范数;(c)表示L1归一化,即l1范数(L1);(d)表示类内和类间l1归一化,即类内和类间l1范数(L1N);(e)表示l2归一化,即l2范数(L2)(f)表示类内和类间l2归一化,即类内和类间l2范数(L2N)。所述L1N和L2N方法利用类的差异进行相应的归一化。L1和L2的方法,仅有l1或者l2范数方法仅在这个类中利用直方图,而L1N和L2N方法意味着l1或者l2范数的方法应用于类内,然后l1或者l2范数方法应用于类间。从图4、图5中可以看出,在事件数据集、足球数据集上,逆高斯和广义极值分布比正态和log正态分布更好地表示数据集的分布。
值得一提的是,类内和类间的归一化方法可以减少类内和类间的变化,并且使分布更广义的和一致。也观察到L1N范数的直方图特征能更好地方法比L1范数的直方图方法更好表示,类似的结果也适用于L2N和L2的方法。此外,L2N方法获得比L1N方法稍微好一点的结果。事实上也已经验证明适当的归一化方法可以提升分类性能。归一化的直方图分布在有限的维数,从而表现出类似于高斯混合模型的特性。在图像表示上,归一化的直方图也大大优于非归一化的直方图。。
所述分类模块用于采用支持向量机(support vector machines,SVM)对上述归一化的图像进行分类。
虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。

Claims (10)

1.一种图像分类方法,其特征在于,该方法包括如下步骤:
a.对要分类的图像进行多尺度分割;
b.对多尺度分割后的图像进行显著图提取;
c.对显著图提取后的图像进行直方图挖掘;
d.对直方图挖掘后的图像进行归一化;
e.采用支持向量机对上述归一化的图像进行分类。
2.如权利要求1所述的方法,其特征在于,所述的多尺度分割包括将所述图像划分成多块,修改所述划分后图像的结构信息表示。
3.如权利要求1或2所述的方法,其特征在于,所述的步骤b采用基于图形的视觉显著性的自下而上的显著性模型提取图像的显著图。
4.如权利要求3所述的方法,其特征在于,所述的步骤c中直方图挖掘基于:
R(m)=d(m)×v(m),
其中,l1d(m)(0≤d(m)≤1)和v(m)分别是差异性分数和代表性分数。
5.如权利要求1所述的方法,其特征在于,所述步骤d中的归一化包括:平方根归一化、L1归一化、类内和类间归一化、l2归一化、类内和类间l2归一化。
6.一种图像分类系统,其特征在于,该系统包括相互电性连接的分割模块、提取模块、挖掘模块、归一化模块及分类模块,其中:
所述分割模块用于对要分类的图像进行多尺度分割;
所述提取模块用于对多尺度分割后的图像进行显著图提取;
所述挖掘模块用于对显著图提取后的图像进行直方图挖掘;
所述归一化模块用于对直方图挖掘后的图像进行归一化;
所述分类模块用于采用支持向量机对上述归一化的图像进行分类。
7.如权利要求6所述的系统,其特征在于,所述的多尺度分割包括将所述图像划分成多块,修改所述划分后图像的结构信息表示。
8.如权利要求6或7所述的系统,其特征在于,所述的提取模块采用基于图形的视觉显著性的自下而上的显著性模型提取图像的显著图。
9.如权利要求8所述的系统,其特征在于,所述的直方图挖掘基于:
R(m)=d(m)×v(m),
其中,d(m)(0≤d(m)≤1)和v(m)分别是差异性分数和代表性分数。
10.如权利要求6所述的系统,其特征在于,所述的归一化包括:平方根归一化、L1归一化、类内和类间l1归一化、l2归一化、类内和类间l2归一化。
CN201410177159.0A 2014-04-29 2014-04-29 图像分类方法及系统 Pending CN103942570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410177159.0A CN103942570A (zh) 2014-04-29 2014-04-29 图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410177159.0A CN103942570A (zh) 2014-04-29 2014-04-29 图像分类方法及系统

Publications (1)

Publication Number Publication Date
CN103942570A true CN103942570A (zh) 2014-07-23

Family

ID=51190233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410177159.0A Pending CN103942570A (zh) 2014-04-29 2014-04-29 图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN103942570A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104198497A (zh) * 2014-09-12 2014-12-10 苏州大学 一种基于视觉显著图和支持向量机的表面缺陷检测方法
CN107247966A (zh) * 2017-06-02 2017-10-13 太仓韬信信息科技有限公司 一种高光谱图像分类方法
CN108805181A (zh) * 2018-05-25 2018-11-13 深圳大学 一种基于多分类模型的图像分类装置及分类方法
CN112204613A (zh) * 2019-02-01 2021-01-08 株式会社计数技研 计数装置、学习器制造装置、计数方法和学习器制造方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745200A (zh) * 2014-01-02 2014-04-23 哈尔滨工程大学 一种基于词带模型的人脸图像识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745200A (zh) * 2014-01-02 2014-04-23 哈尔滨工程大学 一种基于词带模型的人脸图像识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BAIYING LEI ET AL.: "Object recognition based on adapative bag of feature and discriminative learning", 《2013 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
BASURA FERNANDO ET AL.: "Effective Use of Frequent Itemset Mining for Image Classification", 《EUROPEAN CONFERENCE ON COMPUTER VISION》 *
刘帅师等: "基于Gabor多方向特征融合与分块直方图的人脸表情识别方法", 《自动化学报》 *
宋雁斓 等: "一种基于视觉注意模型的图像分类方法", 《中国图象图形学报》 *
张鑫 等: "空间金字塔颜色直方图在图像分类中的应用", 《计算机工程与应用》 *
贾玉红: "视觉注意机制及其在场景分类中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104198497A (zh) * 2014-09-12 2014-12-10 苏州大学 一种基于视觉显著图和支持向量机的表面缺陷检测方法
CN104198497B (zh) * 2014-09-12 2017-01-25 苏州大学 一种基于视觉显著图和支持向量机的表面缺陷检测方法
CN107247966A (zh) * 2017-06-02 2017-10-13 太仓韬信信息科技有限公司 一种高光谱图像分类方法
CN108805181A (zh) * 2018-05-25 2018-11-13 深圳大学 一种基于多分类模型的图像分类装置及分类方法
CN108805181B (zh) * 2018-05-25 2021-11-23 深圳大学 一种基于多分类模型的图像分类装置及分类方法
CN112204613A (zh) * 2019-02-01 2021-01-08 株式会社计数技研 计数装置、学习器制造装置、计数方法和学习器制造方法

Similar Documents

Publication Publication Date Title
EP2808827B1 (en) System and method for OCR output verification
US10102443B1 (en) Hierarchical conditional random field model for labeling and segmenting images
US9626594B2 (en) Method and system to perform text-to-image queries with wildcards
Ommer et al. Learning the compositional nature of visual object categories for recognition
Lucchi et al. Are spatial and global constraints really necessary for segmentation?
US20140219563A1 (en) Label-embedding for text recognition
Tarawneh et al. Invoice classification using deep features and machine learning techniques
CN103020971A (zh) 从图像中自动分割目标对象的方法
CN102254326A (zh) 利用核传递进行图像分割的方法
CN105069478A (zh) 基于超像素张量稀疏编码的高光谱遥感地物分类方法
He et al. Object-oriented mangrove species classification using hyperspectral data and 3-D Siamese residual network
CN103942570A (zh) 图像分类方法及系统
Huo et al. Learning relationship for very high resolution image change detection
CN109933619A (zh) 一种半监督分类预测方法
CN102542050A (zh) 基于支持向量机的图像反馈方法及系统
Ghosh et al. R-phoc: segmentation-free word spotting using cnn
Duan et al. Superpixel-based composite kernel for hyperspectral image classification
Shi et al. An active relearning framework for remote sensing image classification
CN107679467A (zh) 一种基于hsv和sdalf的行人重识别算法实现方法
CN111275125A (zh) 一种面向低秩图像特征分析的类别标签恢复方法
Turtinen et al. Contextual analysis of textured scene images.
Yang et al. Can partial strong labels boost multi-label object recognition
Jubair et al. A simplified method for handwritten character recognition from document image
Yin et al. Combining pyramid representation and AdaBoost for urban scene classification using high-resolution synthetic aperture radar images
Zanwar et al. A comprehensive survey on soft computing based optical character recognition techniques

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140723

RJ01 Rejection of invention patent application after publication