CN103390046A - 潜在狄利克雷模型的多尺度字典自然场景图像分类方法 - Google Patents

潜在狄利克雷模型的多尺度字典自然场景图像分类方法 Download PDF

Info

Publication number
CN103390046A
CN103390046A CN2013103069752A CN201310306975A CN103390046A CN 103390046 A CN103390046 A CN 103390046A CN 2013103069752 A CN2013103069752 A CN 2013103069752A CN 201310306975 A CN201310306975 A CN 201310306975A CN 103390046 A CN103390046 A CN 103390046A
Authority
CN
China
Prior art keywords
image
dictionary
width image
potential
semantic topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013103069752A
Other languages
English (en)
Inventor
王爽
焦李成
张雪
牛振兴
马文萍
马晶晶
陈阳平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN2013103069752A priority Critical patent/CN103390046A/zh
Publication of CN103390046A publication Critical patent/CN103390046A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明方法公开了一种基于潜在狄利克雷分析的多尺度字典场景图像分类方法,主要解决现有分类方法人工标记工作量较大和分类正确率较低的问题。其实现步骤是:分别建立自然场景图像分类的训练集和测试集;对训练集提取尺度不变特征,生成多尺度字典;用多尺度字典对图像进行字典映射,并用词袋模型BOW生成多尺度稀疏表示向量;用Gibbs采样方法生成多尺度稀疏表示向量的潜在语义主题模型,得到图像的潜在语义主题分布,进而构建自然场景图像分类模型;利用分类模型对自然场景图像进行分类。本发明采用了多尺度特征和潜在语义主题模型,丰富了图像的特征信息,避免了大量的人工标记工作,提高了分类正确率,可用于目标识别及车辆、机器人导航。

Description

潜在狄利克雷模型的多尺度字典自然场景图像分类方法
技术领域
本发明属于图像处理技术领域,特别涉及自然场景图像分类的方法,可用于目标识别、检测、智能车辆及机器人导航。
背景技术
在过去的十年里,自然场景图像分类已经成为图像处理技术领域里一个很重要的研究主体。自然场景图像分类有很广泛的应用,如目标识别与检测和智能车辆或机器人导航等领域。由于自然场景图像类内差异性、照明条件差异性和图像本身尺度差异性较大,使其仍然是具有挑战性的问题。
自然场景图像分类的分类方法大致可以分为两类:一类是基于低层语义模型的自然场景图像分类方法;一类是基于中层语义模型的自然场景图像分类方法。早期的一些自然场景图像分类方法大多数是应用低层信息建立模型的,这些方法采用全局统计信息,如运用全局的颜色或者纹理特征直方图表示图像。尽管这些方法的时间复杂性较低,但是它们通常应用于人为场景图像和室内场景图像分类,并且分类结果较差。近期关于自然场景图像分类的方法都是基于中层语义模型的,它们弥补了高层语义信息和低层语义信息之间的鸿沟,并解决层次分类定义重叠问题,因此得到了广泛应用。
Oliva和Torralba使用一组视觉感知属性来描述场景的主要空间结构,他们定义了自然度、宽阔度、粗糙度、伸展度和险峻度等视觉感知属性,通过底层特征来得到这些视觉感知属性。Vogel等人则首先将局部图像区域分类到一定的语义概念中,然后根据这些语义概念在图像中出现的频率描述图像。但这些方法中为了得到预定义的语义概念模型,往往需要大量的人工标记样本。为了减少生成中间语义所需的人工标记工作,一些采用文本主题模型的方法被用于自然场景图像分类,这些方法主要以Lifeifei和Quelhas等人提出的自然场景图像分类方法为代表。这些方法通常先提取图像中的尺度不变特征,然后将图像的尺度不变特征通过聚类生成一个字典来表示聚类中心,然后通过字典映射得到一个表示图像的稀疏表示向量,最后应用文本分类中的概率潜在语义分析方法和潜在狄利克雷模型等主题分析方法来找出图像的潜在语义主题分布,从而完成图像的场景分类。这类方法虽然很大地减少对人工标记的需求,但是它们通常是根据图像中视觉词汇出现的总体情况来进行场景分类的,由于没有考虑词汇之间的尺度关系和语义关系,因此往往不能得到好的分类结果。
发明内容
本发明的目的在于针对上述已有方法的不足,提出一种潜在狄利克雷模型的多尺度字典自然场景图像分类方法,以减少人工标记的需求,丰富图像特征的尺度信息,提高分类正确率。
为实现上述目的,本发明的技术方案包括如下步骤:
(1)分别建立自然场景图像分类训练集和图像分类测试集;
(2)提取训练集中每幅图像采样点尺度不变特征集合F,生成多尺度字典D:
(2a)用网格采样方法对训练集中的每幅图像进行网格采样,得到每幅图像的网格采样点SP;
(2b)用尺度不变特征提取方法对训练集中每幅图像的网格采样点SP提取尺度不变特征,得到训练集中每幅图像的尺度不变特征集合F;
(2c)用K均值聚类算法分别对训练集上每幅图像网格采样点的尺度不变特征F进行聚类,生成字典D;
(3)用多尺度字典D对训练集中每幅图像进行字典映射词袋模型BOW描述,得到每幅图像对应的多尺度稀疏表示向量W;
(4)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数,得到训练集中每幅图像的潜在语义主题模型Z和潜在语义主题分布θ;
(5)用图像潜在语义主题模型Z生成测试集中每幅图像潜在语义主题分布θ1
(6)将训练集中每幅图像的潜在语义主题分布θ和其对应的类别l作为训练数据,用支撑向量机SVM算法获得自然场景分类模型E;
(7)根据自然场景分类模型E对测试图像进行分类。
本发明与现有的技术相比具有以下优点:
1、本发明通过步骤(2)提取训练集中每幅图像采样点尺度不变特征集合F,生成多尺度字典D,丰富了每幅图像特征的尺度信息,因此与Lifeifei和Quelhas等人的方法相比,正确率有着很大的提高。
2、本发明由于只需要将整幅图像进行标记,就可以完成自然图像场景分类的过程,与Vogel等人需要将局部图像区域和整幅图像均进行标记的方法相比,大大减少了人工标记的工作量,自动化程度更高。
附图说明
图1是本发明的实现流程图;
图2是本发明仿真采用的国际标准场景图像类别库中的样例图像;
图3是本发明对图2进行仿真得到的各类别平均正确率示意图。
具体实施方式
参照图1,本发明的实施步骤如下:
步骤1,分别建立自然场景图像分类训练集和图像分类测试集。
首先,根据使用需要定义图2中的13个自然场景图像类别,类别编号为1~13;
其次,在每个自然场景图像类别中随机选取100幅图像,组成自然场景图像分类的训练集,用其余的图像组成自然场景图像分类的测试集。
步骤2,提取训练集中每幅图像采样点尺度不变特征集合F,生成多尺度字典D。
(2a)用网格采样方法对训练集中的每幅图像进行网格采样,得到每幅图像的网格采样点SP:
(2a1)将训练集中每幅图像先按像素大小M1×M1的网格进行采样,得到网格采样点SP1;再按像素大小M2×M2的网格进行采样,得到网格采样点SP2;再按像素大小M3×M3的网格进行采样,得到网格采样点SP3
本实例取M1=16,M2=12,M3=8,但M1、M2、M3的取值不局限于16、12、8,M1、M2、M3可以取2-20之间任意偶数,且M1≠M2≠M3
(2a2)用网格采样点SP1、SP2、SP3构成集合SP=(SP1,SP2,SP3),即得到每幅图像的网格采样点SP;
(2b)用尺度不变特征提取方法对训练集中每幅图像的网格采样点SP提取尺度不变特征,得到训练集中每幅图像的尺度不变特征集合F:
(2b1)计算每幅图像的尺度不变特征子集合F1、F2、F3,即在采样点SP1周围的P1×P1像素大小区域上计算梯度方向直方图,得到尺度不变特征子集合F1;在采样点SP2周围的P2×P2像素大小区域上计算梯度方向直方图,得到尺度不变特征子集合F2;在采样点SP3周围的P3×P3像素大小区域上计算梯度方向直方图,得到尺度不变特征子集合F3;其中 P 1 = M 1 2 , P 2 = M 2 2 , P 3 = M 3 2 ;
(2b2)用每幅图像的尺度不变特征子集合F1、F2、F3构成集合F=(F1,F2,F3),即得到每幅图像所有采样点的尺度不变特征集合F;
(2c)用K均值聚类算法分别对训练集上每幅图像网格采样点的尺度不变特征F进行聚类,生成字典D。
步骤3,用多尺度字典D对训练集中每幅图像进行字典映射词袋模型BOW描述,得到每幅图像对应的多尺度稀疏表示向量W。
(3a)分别计算每幅图像的尺度不变特征子集合F1、F2、F3中的每个尺度不变特征与对应字典D1、D2、D3的每个词汇所对应特征值之间的欧式距离,找出欧氏距离最小的词汇表示该尺度不变特征,得到每幅图像对应于尺度不变特征子集合F1、F2、F3的词汇子集合R1、R2、R3
(3b)用词汇子集合R1、R2、R3构成集合R=(R1,R2,R3),即得到每幅图像的词汇集合R;
(3c)根据每幅图像的词汇集合R中的词汇,统计字典D1、D2、D3中每个词汇在R中出现的次数,得到每幅图像对应于字典D1、D2、D3的稀疏表示子向量W1、W2、W3
(3d)用稀疏表示子向量W1、W2、W3构成向量W=(W1,W2,W3),即得到每幅图像对应的多尺度稀疏表示向量W。
步骤4,用Gibbs采样方法估计潜在狄利克雷模型中的隐参数,得到训练集中每幅图像的潜在语义主题模型Z和潜在语义主题分布θ。
(4a)将wi对应词汇被分配的潜在语义主题zi赋值为1~T任意值,作为马尔可夫链的初始状态,本发明中T取值为80,但T的取值不局限于80,可以取任意正整数;
(4b)利用迭代公式1),分别计算图像中第i个词汇wi被分配给主题1~T的概率P(zi=j|z-i,w):
P ( z i = j | z - i , w ) = n - i , j ( w i ) + β n - i , j ( · ) + Wβ · n - i , j ( d i ) + α n - i , · ( d i ) + Tα Σ j = 1 T n - i , j ( w i ) + β n - i , j ( · ) + Wβ · n - i , j ( d i ) + α n - i , · ( d i ) + Tα , - - - 1 )
其中,j表示潜在语义主题,取值范围为1~T,T为潜在语义主题总数,z-i表示除wi对应词汇以外的词汇被分配的潜在语义主题;
Figure BDA00003541683700052
表示wi对应词汇被分配给潜在语义主题j的个数,
Figure BDA00003541683700053
表示被分配给潜在语义主题j的词汇总数,
Figure BDA00003541683700054
表示训练集中第i幅图像di中分配给潜在语义主题j的词汇总数,
Figure BDA00003541683700055
表示训练集中第i幅图像di中的词汇总数,W表示图像对应的多尺度稀疏表示向量,α为超参数,β为超参数;
(4c)将wi分配的主题状态更新为主题分配概率最大的主题,得到马尔可夫链的下一个状态,当迭代次数C=100时,终止迭代;
(4d)迭代结束后,得到需要求解的图像潜在语义主题模型Z和潜在语义主题分布θ:
Z = n j ( w ) + β n j ( · ) + Wβ ,    2)
θ = n j ( d ) + α n . ( d ) + Tα
其中,
Figure BDA00003541683700058
表示图像d中词汇w被分配给潜在语义主题模型j的个数,表示图像d中被分配给潜在语义主题模型j的词汇总数,
Figure BDA000035416837000510
表示图像d被分配的潜在语义主题j的总数,表示图像d被分配的所有潜在语义主题总数。
步骤5,用图像潜在语义主题模型Z生成测试集中每幅图像潜在语义主题分布θ1,具体实现方式同步骤4。
步骤6,将训练集中每幅图像的潜在语义主题分布θ和其对应的类别l作为训练数据,用支撑向量机SVM算法获得自然场景分类模型E。
步骤7,根据自然场景分类模型E对测试图像进行分类,得到分类结果。
本发明的效果可以通过以下仿真实验进一步说明:
1.仿真条件:
仿真实验采用国际标准场景图像类别库,该图像类别库包含13个类别的自然场景图像,这13类自然场景图像的总数目为3860,每幅自然场景图像的大小为256×256,其样例图像如图2所示,其中图2(a)是卧室场景,图2(b)是郊区别墅场景,图2(c)是厨房场景,图2(d)是客厅场景,图2(e)是海岸场景,图2(f)是森林场景,图2(g)是高速公路场景,图2(h)是城市场景,图2(i)是山脉场景,图2(j)是乡村场景,图2(k)是街道场景,图2(l)是高楼场景,图2(m)是办公室场景,其每个类别的类别编号、类别名称以及包含的图像数目如表1所示,类别1~4以及13表示5类室内场景图像,5~12表示8类室外场景图像。
仿真实验在CPU为Intel Core(TM)2Duo、主频2.33GHz,内存为2G的WINDOWSXP系统上用MATLAB7.0.1软件进行。
表1国际标准场景图像类别库图像类别
类别编号 类别名称 图像数目
1 卧室 217
2 郊区别墅 241
3 厨房 210
4 客厅 289
5 海岸 360
6 森林 328
7 高速公路 260
8 城市 308
9 山脉 374
10 乡村 410
11 街道 292
12 高楼 356
13 办公室 215
2.仿真内容及分析:
使用本发明与Lifeifei和Quelhas的方法进行对比,均对国际标准场景图像类别库中的每个自然场景图像中随机选取100幅共1300幅图像组成自然场景图像分类的训练集,用国际标准场景图像类别库中其余的2560幅图像组成自然场景图像分类的测试集,潜在狄利克雷模型的参数取值均为T=80,α=0.125,β=0.01。
仿真1,用本发明方法对国际标准场景图像类别库中的13类自然场景图像进行10次分类实验,计算10次实验的平均分类正确率,作为国际标准场景图像类别库的最终分类正确率,结果如图3,图3的横坐标是国际标准场景图像类别库的类别编号,纵坐标是各类别的平均分类正确率。
从图3可见,国际标准场景图像类别库的各类别平均分类正确率均在70%以上。
仿真2,用本发明方法及现有Lifeifei的贝叶斯分层模型方法和Quelhas的概率潜在语义分析模型方法的方法进行对比实验,对国际标准场景图像类别库中的13类自然场景图像进行10次分类实验,计算10次实验的平均分类正确率,作为国际标准场景图像类别库的最终分类正确率,对比结果如表2所示。
表2实验结果对比
Lifeifei 65.2
Quelhas 66.5
本发明方法 90.9
从表2可见,本发明方法对国际标准场景图像类别库的最终分类正确率远远高于其他方法。
综上,本发明通过对自然场景图像训练集中的图像进行多尺度字典提取,进而丰富了尺度信息,与Lifeifei和Quelhas的方法相比,正确率有着很大的提高。

Claims (6)

1.一种潜在狄利克雷模型的多尺度字典自然场景图像分类方法,包括如下步骤:
(1)分别建立自然场景图像分类训练集和图像分类测试集;
(2)提取训练集中每幅图像采样点尺度不变特征集合F,生成多尺度字典D:
(2a)用网格采样方法对训练集中的每幅图像进行网格采样,得到每幅图像的网格采样点SP;
(2b)用尺度不变特征提取方法对训练集中每幅图像的网格采样点SP提取尺度不变特征,得到训练集中每幅图像的尺度不变特征集合F;
(2c)用K均值聚类算法分别对训练集上每幅图像网格采样点的尺度不变特征F进行聚类,生成字典D;
(3)用多尺度字典D对训练集中每幅图像进行字典映射词袋模型BOW描述,得到每幅图像对应的多尺度稀疏表示向量W;
(4)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数,得到训练集中每幅图像的潜在语义主题模型Z和潜在语义主题分布θ;
(5)用图像潜在语义主题模型Z生成测试集中每幅图像潜在语义主题分布θ1
(6)将训练集中每幅图像的潜在语义主题分布θ和其对应的类别l作为训练数据,用支撑向量机SVM算法获得自然场景分类模型E;
(7)根据自然场景分类模型E对测试图像进行分类。
2.根据权利要求1所述的潜在狄利克雷模型的多尺度字典自然场景图像分类方法,其中步骤(1)所述的分别建立自然场景图像分类训练集和图像分类测试集,是先根据使用需要定义N个自然场景图像类别,类别编号为1~N;再在每个自然场景图像类别中随机选取50~100幅图像组成自然场景图像分类训练集,其余图像组成自然场景图像分类测试集。
3.根据权利要求1所述的潜在狄利克雷模型的多尺度字典自然场景图像分类方法,其中步骤(2a)所述的用网格采样方法对训练集中的每幅图像进行网格采样,得到每幅图像的网格采样点SP,步骤如下:
(2a1)对训练集中每幅图像按M1×M1、M2×M2和M3×M3像素大小的网格进行采样,得到对应网格大小的网格采样点SP1、SP2、SP3,其中M1、M2、M3均为偶数,取值范围是2-20,且M1≠M2≠M3
(2a2)用网格采样点SP1、SP2、SP3构成集合SP=(SP1,SP2,SP3),即得到每幅图像的网格采样点SP。
4.根据权利要求1所述的潜在狄利克雷模型的多尺度字典自然场景图像分类方法,其中步骤(2b)所述的用尺度不变特征提取方法对训练集中每幅图像的网格采样点SP提取尺度不变特征,得到训练集中每幅图像的尺度不变特征集合F,步骤如下:
(2b1)分别在采样点SP1、SP2、SP3周围的P1×P1、P2×P2和P3×P3像素大小区域上计算梯度方向直方图,得到其对应的尺度不变特征子集合F1、F2、F3,其中
Figure FDA00003541683600021
Figure FDA00003541683600022
Figure FDA00003541683600023
M1、M2、M3是采样网格的大小,M1、M2、M3均为偶数,取值范围是2-20,且M1≠M2≠M3
(2b2)用每幅图像的尺度不变特征子集合F1、F2、F3构成集合F=(F1,F2,F3),即得到每幅图像所有采样点的尺度不变特征集合F。
5.根据权利要求1所述的潜在狄利克雷模型的多尺度字典自然场景图像分类方法,其中步骤(3)所述的用多尺度字典D对训练集中每幅图像进行字典映射词袋模型BOW描述,得到每幅图像对应的多尺度稀疏表示向量W,步骤如下:
(3a)分别计算每幅图像的尺度不变特征子集合F1、F2、F3中的每个尺度不变特征与对应字典D1、D2、D3的每个词汇所对应特征值之间的欧式距离,找出欧氏距离最小的词汇表示该尺度不变特征,得到每幅图像对应于尺度不变特征子集合F1、F2、F3的词汇子集合R1、R2、R3
(3b)用词汇子集合R1、R2、R3构成集合R=(R1,R2,R3),即得到每幅图像的词汇集合R;
(3c)根据每幅图像的词汇集合R中的词汇,统计字典D1、D2、D3中每个词汇在R中出现的次数,得到每幅图像对应于字典D1、D2、D3的稀疏表示子向量W1、W2、W3
(3d)用稀疏表示子向量W1、W2、W3构成向量W=(W1,W2,W3),即得到每幅图像对应的多尺度稀疏表示向量W。
6.根据权利要求1所述的潜在狄利克雷模型的多尺度字典自然场景图像分类方法,其中步骤(4)所述的用Gibbs采样方法估计潜在狄利克雷模型中的隐参数,得到训练集中每幅图像的潜在语义主题模型Z和潜在语义主题分布θ,按如下步骤进行:
(4a)将wi对应词汇被分配的潜在语义主题zi赋值为1~T任意值,作为马尔可夫链的初始状态,其中T为正整数;
(4b)利用迭代公式1),分别计算图像中第i个词汇wi被分配给主题1~T的概率P(zi=j|z-i,w):
P ( z i = j | z - i , w ) = n - i , j ( w i ) + β n - i , j ( · ) + Wβ · n - i , j ( d i ) + α n - i , · ( d i ) + Tα Σ j = 1 T n - i , j ( w i ) + β n - i , j ( · ) + Wβ · n - i , j ( d i ) + α n - i , · ( d i ) + Tα - - - 1 )
其中,j表示潜在语义主题,取值范围为1~T,z-i表示除wi对应词汇以外的词汇被分配的潜在语义主题情况;
Figure FDA00003541683600032
表示wi对应词汇被分配给潜在语义主题j的个数,
Figure FDA00003541683600033
表示被分配给潜在语义主题j的词汇总数,
Figure FDA00003541683600034
表示训练集中第i幅图像di中分配给潜在语义主题j的词汇总数,表示训练集中第i幅图像di中的词汇总数,T为潜在语义主题总数,W表示图像对应的多尺度稀疏表示向量,α为超参数,β为超参数;
(4c)取分配概率最大的主题更新该wi的主题分配状态,得到马尔可夫链的下一个状态,当迭代次数C=100时,迭代结束;
(4d)迭代结束后,得到需要求解的图像潜在语义主题模型Z和潜在语义主题分布θ:
Z = n j ( w ) + β n j ( · ) + Wβ     2)
θ = n j ( d ) + α n . ( d ) + Tα
其中,
Figure FDA00003541683600038
表示图像d中词汇w被分配给潜在语义主题模型j的个数,
Figure FDA00003541683600039
表示图像d中被分配给潜在语义主题模型j的词汇总数,
Figure FDA00003541683600041
表示图像d被分配的潜在语义主题j的总数,
Figure FDA00003541683600042
表示图像d被分配的所有潜在语义主题总数,T为潜在语义主题总数,W表示图像对应的多尺度稀疏表示向量,α为超参数,β为超参数。
CN2013103069752A 2013-07-20 2013-07-20 潜在狄利克雷模型的多尺度字典自然场景图像分类方法 Pending CN103390046A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013103069752A CN103390046A (zh) 2013-07-20 2013-07-20 潜在狄利克雷模型的多尺度字典自然场景图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013103069752A CN103390046A (zh) 2013-07-20 2013-07-20 潜在狄利克雷模型的多尺度字典自然场景图像分类方法

Publications (1)

Publication Number Publication Date
CN103390046A true CN103390046A (zh) 2013-11-13

Family

ID=49534318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013103069752A Pending CN103390046A (zh) 2013-07-20 2013-07-20 潜在狄利克雷模型的多尺度字典自然场景图像分类方法

Country Status (1)

Country Link
CN (1) CN103390046A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870840A (zh) * 2014-03-11 2014-06-18 西安电子科技大学 基于改进的潜在狄利克雷分配的自然图像分类方法
CN103942573A (zh) * 2014-02-18 2014-07-23 西安电子科技大学 一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法
CN106326938A (zh) * 2016-09-12 2017-01-11 西安电子科技大学 基于弱监督学习的sar图像目标鉴别方法
CN103778443B (zh) * 2014-02-20 2017-05-03 公安部第三研究所 基于主题模型方法和领域规则库实现场景分析描述的方法
CN107122801A (zh) * 2017-05-02 2017-09-01 北京小米移动软件有限公司 图像分类的方法和装置
CN107220657A (zh) * 2017-05-10 2017-09-29 中国地质大学(武汉) 一种面向小数据集的高分辨率遥感影像场景分类的方法
CN107481327A (zh) * 2017-09-08 2017-12-15 腾讯科技(深圳)有限公司 关于增强现实场景的处理方法、装置、终端设备及系统
CN108805012A (zh) * 2018-04-24 2018-11-13 西安理工大学 基于无穷Dirichlet过程混合模型的指节识别方法
CN108898587A (zh) * 2018-06-19 2018-11-27 Oppo广东移动通信有限公司 图片处理方法、图片处理装置及终端设备
CN109670547A (zh) * 2018-12-19 2019-04-23 中国人民解放军国防科技大学 一种多尺度序列图像匹配的位置识别定位方法
CN110414561A (zh) * 2019-06-26 2019-11-05 武汉大学 一种适用于机器视觉的自然场景数据集的构建方法
CN111989915A (zh) * 2018-04-02 2020-11-24 幻影人工智能公司 用于视觉推断的动态图像区域选择
CN114418036A (zh) * 2022-03-28 2022-04-29 浙江所托瑞安科技集团有限公司 神经网络的性能测试和训练方法、设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
CN102509121A (zh) * 2011-11-11 2012-06-20 东南大学 一种基于类别分布的自然场景分类排序方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
CN102509121A (zh) * 2011-11-11 2012-06-20 东南大学 一种基于类别分布的自然场景分类排序方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘泽奇: ""基于BoW模型与稀疏表示的乳腺肿块良恶性分类算法研究"", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942573A (zh) * 2014-02-18 2014-07-23 西安电子科技大学 一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法
CN103778443B (zh) * 2014-02-20 2017-05-03 公安部第三研究所 基于主题模型方法和领域规则库实现场景分析描述的方法
CN103870840A (zh) * 2014-03-11 2014-06-18 西安电子科技大学 基于改进的潜在狄利克雷分配的自然图像分类方法
CN106326938B (zh) * 2016-09-12 2019-03-08 西安电子科技大学 基于弱监督学习的sar图像目标鉴别方法
CN106326938A (zh) * 2016-09-12 2017-01-11 西安电子科技大学 基于弱监督学习的sar图像目标鉴别方法
CN107122801B (zh) * 2017-05-02 2020-03-03 北京小米移动软件有限公司 图像分类的方法和装置
CN107122801A (zh) * 2017-05-02 2017-09-01 北京小米移动软件有限公司 图像分类的方法和装置
CN107220657A (zh) * 2017-05-10 2017-09-29 中国地质大学(武汉) 一种面向小数据集的高分辨率遥感影像场景分类的方法
CN107481327A (zh) * 2017-09-08 2017-12-15 腾讯科技(深圳)有限公司 关于增强现实场景的处理方法、装置、终端设备及系统
CN111989915A (zh) * 2018-04-02 2020-11-24 幻影人工智能公司 用于视觉推断的动态图像区域选择
CN111989915B (zh) * 2018-04-02 2022-06-24 幻影人工智能公司 用于图像中的环境的自动视觉推断的方法、介质、及系统
CN108805012A (zh) * 2018-04-24 2018-11-13 西安理工大学 基于无穷Dirichlet过程混合模型的指节识别方法
CN108898587A (zh) * 2018-06-19 2018-11-27 Oppo广东移动通信有限公司 图片处理方法、图片处理装置及终端设备
CN109670547A (zh) * 2018-12-19 2019-04-23 中国人民解放军国防科技大学 一种多尺度序列图像匹配的位置识别定位方法
CN109670547B (zh) * 2018-12-19 2021-04-02 中国人民解放军国防科技大学 一种多尺度序列图像匹配的位置识别定位方法
CN110414561A (zh) * 2019-06-26 2019-11-05 武汉大学 一种适用于机器视觉的自然场景数据集的构建方法
CN114418036A (zh) * 2022-03-28 2022-04-29 浙江所托瑞安科技集团有限公司 神经网络的性能测试和训练方法、设备和存储介质
CN114418036B (zh) * 2022-03-28 2022-06-21 浙江所托瑞安科技集团有限公司 神经网络的性能测试和训练方法、设备和存储介质

Similar Documents

Publication Publication Date Title
CN103390046A (zh) 潜在狄利克雷模型的多尺度字典自然场景图像分类方法
Zhang et al. Integrating bottom-up classification and top-down feedback for improving urban land-cover and functional-zone mapping
CN105069481B (zh) 基于空间金字塔稀疏编码的自然场景多标记分类方法
CN109002834B (zh) 基于多模态表征的细粒度图像分类方法
CN101315663B (zh) 一种基于区域潜在语义特征的自然场景图像分类方法
Gosselin et al. Revisiting the fisher vector for fine-grained classification
Zhu et al. Knowledge-guided land pattern depiction for urban land use mapping: A case study of Chinese cities
CN109034210A (zh) 基于超特征融合与多尺度金字塔网络的目标检测方法
CN102289522B (zh) 一种对于文本智能分类的方法
CN105528575B (zh) 基于上下文推理的天空检测方法
Rubinstein et al. Annotation propagation in large image databases via dense image correspondence
CN108038498B (zh) 一种基于子图匹配的室内场景对象语义标注方法
CN103425996B (zh) 一种并行分布式的大规模图像识别方法
CN105205475A (zh) 一种动态手势识别方法
CN103530633A (zh) 一种图像局部不变特征的语义映射方法及语义映射系统
WO2022062419A1 (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
Yao et al. Sensing urban land-use patterns by integrating Google Tensorflow and scene-classification models
CN105930873A (zh) 一种基于子空间的自步跨模态匹配方法
CN104036296A (zh) 一种图像的表示和处理方法及装置
CN104850822A (zh) 基于多特征融合的简单背景下的叶片识别方法
CN115393666A (zh) 图像分类中基于原型补全的小样本扩充方法及系统
Vora et al. Iterative spectral clustering for unsupervised object localization
CN103942573A (zh) 一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法
CN103810287A (zh) 基于有监督共享组件主题模型的图像分类方法
Liu et al. Object cosegmentation by nonrigid mapping

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20131113