CN103605765A - 一种基于聚类紧凑特征的海量图像检索系统 - Google Patents

一种基于聚类紧凑特征的海量图像检索系统 Download PDF

Info

Publication number
CN103605765A
CN103605765A CN201310611155.4A CN201310611155A CN103605765A CN 103605765 A CN103605765 A CN 103605765A CN 201310611155 A CN201310611155 A CN 201310611155A CN 103605765 A CN103605765 A CN 103605765A
Authority
CN
China
Prior art keywords
cluster
image
feature
compact
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310611155.4A
Other languages
English (en)
Other versions
CN103605765B (zh
Inventor
董乐
梁燕
封宁
谢山山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201310611155.4A priority Critical patent/CN103605765B/zh
Publication of CN103605765A publication Critical patent/CN103605765A/zh
Application granted granted Critical
Publication of CN103605765B publication Critical patent/CN103605765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于模式识别与信息处理技术领域,提供了基于聚类紧凑特征的海量图像检索系统,包括如下步骤:一、计算样本图像库和测试图像库中图像的局部特征;二、计算每幅图像的聚类紧凑特征:对局部特征采用聚类方法获取每类的聚类中心,再统计在每个聚类中的局部特征分布直方图和空间统计信息,生成聚类紧凑特征;三、随机采样样本图像库中的聚类紧凑特征,对采样所得聚类紧凑特征中聚类中心的分量应用聚类方法生成词汇树,将测试图像库中图像的聚类紧凑特征都量化到词汇树上,生成相应的倒排文件;四、采用改进的基于词汇树的检索算法进行检索:通过查询词汇树的倒排文件,计算查询图像与图像库图像聚类紧凑特征间的相似度权重进行检索。

Description

一种基于聚类紧凑特征的海量图像检索系统
技术领域
本发明属于模式识别与信息处理技术领域,涉及计算机视觉方面的海量图像处理,尤其涉及一种基于聚类紧凑特征的海量图像检索的研究和实现方案。本方案通过对视觉特征进行基于聚类的紧凑描述并通过改进的基于词汇树的检索算法快速高效的在海量图像中检索出相似图片。
背景技术
目前,随着互联网图像数据的爆炸性增长,如何从图像大数据中检索出最相似的图片变为一项非常有挑战的主题并吸引了大量的研究工作。图像检索具有广泛的应用场景,在电子商务,社交网络,商品或风景推荐等方面应用价值越来越高。考虑一个最广泛也最通用的场景,用户在大规模的图像库中发现一张感兴趣的图片,可以是商品图片也可以风景,艺术等类型图片,想要快速准确的检索到这个图像库中与之最相似的图片。传统的图像检索通过提取图像的视觉特征包括像颜色、轮廓、纹理这样的底层特征和高维特征,在根据视觉特征计算相似度距离进行检索。海量图像检索的关键是在保持检索性能的情况下快速高效根据特征检索相似图像。
但由于包含相同的物品或场景的图片存在极大的差异,特别是由于光照,旋转,聚焦的影响,更别说相同类别不同物品之间的多样性,使海量图像检索存在特定的挑战。传统的基于内容的图像检索在检索精度和检索效率上都不能满足海量图像检索的需求。与此同时,图像多样性和海量数据增加了紧凑并具有高辨识度的视觉特征,更加鲁棒的索引结构和检索算法的需求。为了获取高辨识度的视觉特征,研究者提出了多种有效的算法,包括绑定多种特征生成词汇包[1]-[6],探索局部特征间的几何结构[7]-[10]和空间分布信息[4],[11]-[13]。然而当图像库中图像的数量增加到百万级别,这些算法会产生巨大的计算和存储开销,不利于系统实现。为了改善海量图像检索存在的计算和存储开销大的问题,[7,14,15]采用词汇树的索引结构成功地提高检索速度。词汇树索引结构是通过对样本图像的特征进行分层聚类。每个聚类中心都是词汇树的一个节点,第一次聚类产生的结果就是词汇树的第一层节点,以此类推。基于词汇树的检索通过查找树的相同节点的倒排文件进行检索,避免了需要和图像库中所有特征进行相似度计算,大大加快了检索速度。然而基于词汇树的方法需要把图像中数以千计的特征根据视觉词汇编码生成词汇包,这仍然导致大量的计算开销和存储开销。
参考文献:
[1]X.Wang,X.Bai,W.Liu,L.J.Latecki.Feature Context for Image Classification and ObjectDetection.In CVPR,June20-25,2011.
[2]Z.Wu,Q.Ke,M.Isard,J.Sun.Bundling Features for Large Scale Partial-Duplicate Web ImageSearch.In CVPR,June20-25,2009.
[3]Z.Lin and J.Brandt.A Local Bag-of-Features Model for Large-scale Object Retrieval.In ECCV,Vol.6316,Sept.5-11,2010.
[4]Y.Cao,C.Wang,Z.Li,et al.Spatial-Bag-of-Features[C],In CVPR,Sept.5-11,2010.
[5]H.J’egou,M.Douze,and C.Schmid.Improving Bag-of-Feature for Large Scale Image Search.In International Journal of Computer Vision,2010.
[6]G.Csurka,C.Dance,L.Fan,J.Willamowski,and C.Bray.Visual Categorization with Bags ofKeypoints.In Workshop on Statistical Learning in Computer Vision,ECCV,May11-14,2004.
[7]S.Zhang,Q.Huang,G.Hua,S.Ji ang,W.Gao,and Q.Tian.Building Contextual VisualVocabulary for Large-scale Image Applications.In ACM Multimedia,Oct.25-29,2010.
[8]H.Jegou,M.Douze,and C.Schmid.Hamming Embedding and Weak Geometric Consistencyfor Large Scale Image Search.In ECCV,October12-18,2008.
[9]Y.Jiang,J.Meng,J.Yuan.Randomized Visual Phrases for Object Search,In CVPR,June16-21,2012.
[10]Y.Zhang,Z.Jia,T.Chen.Image Retrieval with Geometry-Preserving Visual Phrases.In CVPR,June20-25,2011.
[11]J.Philbin,O.Chum,M.Isard,J.Sivic,and A.Zisserman.Object Retrieval with LargeVocabularies and Fast Spatial Matching.In CVPR,June17-22,2007.
[12]W.Zhou,Y.Lu,H.Li,Y.Song,and Q.Tian.Spatial Coding for Large-scale Partial-DuplicateWeb Image Search.In ACM Multimedia,Oct.25-29,2010.
[13]G.Tolias,Y.Avrithis.Speeded-up,Relaxed Spatial Matching[C],In ICCV,Nov.6-13,2011.
[14]D.Nister and H.Stewenius.Scalable Recognition with a Vocabulary Tree.In CVPR,vol.2,June17-22,2006.
[15]X.Wang,M.Yang,T.Cour,S.Zhu,K.Yu,and T.X.Han.Contextual Weighting forVocabulary Tree Based Image Retrieval.In ICCV,Nov.6-13,2011。
发明内容
本发明的目的在于为了克服海量图像检索中计算和存储开销大的不足等问题,提供了一种能够在保持视觉特征高辨识度的情况下紧凑地描述局部特征以及通过更多的信息例如空间信息来更有效的检索的一种基于聚类紧凑特征的快速高效的海量图像检索方法,该方法能够解决图像的快速检索问题,特别是包含百万或百万以上图像的图像库,由此用户可以在面临海量图像,快速检索与所感兴趣的图像最相似的图像。其是一种在不影响检索效率的情况下,快速有效的大规模图像检索方法。
为了实现上述目的本发明采用以下技术方案:
基于聚类紧凑特征的快速高效的海量图像检索方法,其特征在于包括如下步骤:
步骤一:计算样本图像库和测试图像库中图像的局部特征;
步骤二:计算每幅图像的聚类紧凑特征:
对局部特征采用聚类方法获取每类的聚类中心,再统计在每个聚类中的局部特征分布直方图和空间统计信息,生成聚类紧凑特征;
步骤三:随机采样样本图像库中的聚类紧凑特征,对采样所得聚类紧凑特征中聚类中心的分量应用聚类方法生成词汇树,将测试图像库中图像的聚类紧凑特征都量化到词汇树上,生成相应的倒排文件;
步骤四:采用改进的基于词汇树的检索算法进行检索:通过查询词汇树的倒排文件,计算查询图像与图像库图像聚类紧凑特征间的相似度权重进行检索。
上述技术方案中,所述聚类采用K-means聚类或Affinity Propagation(AP)聚类等聚类算法。
上述技术方案中,所述步骤1中的局部特征为SIFT特征,根据所提取出的局部特征每幅图像表示为I={d1,d2,…,dM}∈RD×M,其中d表示局部特征,D表示局部特征维度,M表示每幅图像局部特征的数目,R表示实数空间。
上述技术方案中,步骤二中,聚类紧凑特征表示为:
I={CFC1,CFC2,…,CFCN}
CFCi={μi,hi,vi},
①N表示每幅图像聚类的数目;μi表示第i个聚类xi的聚类中心;
②上式中成空间统计向量ρi
Figure BDA0000423025390000032
分别表示第i聚类的特征密度,平均尺度,尺度方差,平均方向和方向方差,在下面的公式中sjj分别表示在第i个聚类中第j个局部特征的尺度和方向,ρ表示聚类紧凑特征密度,n(i)表示在聚类区域内,局部特征的数目,dj为在第i个聚类中第j个局部特征,xi表示第i个聚类;
ρi=n(i),i=1,2,…,K
s i ‾ = 1 ρ Σ d j ∈ x i s j
σ i s = 1 ρ Σ d j ∈ x i ( s j - s i ‾ ) 2
θ i ‾ = 1 ρ Σ d j ∈ x i θ j
σ i θ = 1 ρ Σ d j ∈ x i ( θ j - θ i ‾ ) 2
Figure BDA0000423025390000045
每个聚类划分为R个小区域,第i聚类的特征分布直方图第r个分量 h i r = Σ j = 1 k 1 , if dis i , j ∈ dis i r , r = 1,2 , . . . , R 0 , otherwise , k表示第i聚类中局部特征的数目,根据第i聚类中第j个局部特征到聚类中心的距离统计获得,其中第i聚类中第j个局部特征到聚类中心的距离表示如下:
dis i , j = | | d j - μ i | | 2 , d j ∈ x i
dj表示在第i个聚类中第j个局部特征、μi表示第i个聚类xi的聚类中心;
为避免不能包含所有的局部特征或所有的局部特征都划分到直方图的一个分量中,对disi,j进行量化:
dis i , j = dis i , j Σ j = 1 k dis i , j .
上述技术方案中,图像库中查询图像和目标图像间的相似度定义为:
sim ( q , d ) = · 1 | I q | | I d | Σ i ∈ I q , j ∈ I d f ( CFC i q , CFC j d )
其中|Iq|表示查询图像的聚类紧凑特征数目,|Id|表示目标图像的聚类紧凑特征数目,为聚类紧凑特征间的相似度度量函数
( CFC i q , CFC j d ) Σ v i ∈ T ( CFC i q ) , v j ∈ T ( CFC j d ) f v ( v i , v j )
fv(vi,vj)=wi,j(vi)I(vi=vj)
w i , j ( v ) = w i , j c ( v ) × w i , j h ( v ) × w i , j s ( v ) ,
Figure BDA0000423025390000051
表示每个聚类紧凑特征从词汇树的根节点量化到叶子节点的视觉词汇路径集合,I(·)是一个判断函数,wi,j(v)表示量化到词汇树上同一个节点的两个聚类紧凑特征,即查询图像第i个聚类紧凑特征和目标图像第j个聚类紧凑特征的相似度权重,由三部分组成,包括聚类中心相似度权重函数
Figure BDA0000423025390000052
特征分布直方图相似度权重函数和空间统计信息相似度权重函数
Figure BDA0000423025390000054
为聚类中心相似度权重函数,
Figure BDA0000423025390000055
为查询图像第i个聚类紧凑特征量化到词汇树节点v的权重,
Figure BDA0000423025390000056
为目标图像第j个聚类紧凑特征量化到词汇树节点v的权重、idf(v)为词汇树节点v的IDF权重、、nq(v)表示查询图像量化到节点v的聚类紧凑特征数目,ω(v)是一个权重相关系数,可根据经验设置值;
w i q = Σ v ∈ T ( CFC i q ) ω ( v ) Σ v ∈ T ( CFC i q ) ω ( v ) × n q ( v )
Figure BDA0000423025390000058
为局部特征分布直方图相似度权重函数,通过计算特征分布直方图相应分量的最小值和最大值的比率之和表示,公式如下:
Figure BDA0000423025390000059
公式中
Figure BDA00004230253900000510
表示查询图像第i个聚类紧凑特征的局部特征直方图的第r个分量,
Figure BDA00004230253900000511
表示目标图像第j个聚类紧凑特征的局部特征直方图的第r个分量,R表示聚类所划分的区域数目,r=1,2,…,R,
为空间统计信息相似度权重函数,
Figure BDA00004230253900000513
聚类紧凑特征密度相似度权重:
Figure BDA00004230253900000514
平均尺度相似度权重:
Figure BDA00004230253900000515
尺度方差相似度权重:
Figure BDA00004230253900000516
平均方向相似度权重:
Figure BDA00004230253900000517
方向方差相似度权重:
本发明通过提取聚类,将图像特征很好的转化为了文本。解决了海量图像的快速有效检索问题,本发明具有以下优点:
一、从图像检索系统的易于实现的角度出发,通过对图像大量的局部特征做聚类,提取出聚类中心作为一个图像的初步描述,大大的减少了一副图像的特征数量,提高了检索的速度,降低了存储开销。
二、从信息处理技术的角度出发,通过计算每个聚类的局部特征分布直方图和空间统计信息,丰富了每个特征向量所包含的信息,使用很小的计算开销就提高了每个特征向量的辨识度。
三、从消费者对用户体验的要求出发,通过对词汇树检索算法的改进,能够快速高效地实现海量图像检索效果。
四、为了验证本发明的效果,我们选用了标准图像库UKbench和ImageNet上图片作为测试图像库,包括UKbench和ImageNet-T,同时从ImageNet图像库中抽取选用了100,000张和所有测试图像不重复的图像作为样本图像库。其中UKbench包括2550类,每类从不同的视角拍摄4张图像,共10200张图像;ImageNet-T是从ImageNet图像库中选取1000类共1,261,392张图像。本发明的部分实验结果如图3所示。与参考文献[14]方法对比,在UKbench和ImageNet-T图像库的检索准确度的对比如表2,3所示。通过对比可以发现在微弱的降低检索准确度的情况下,检索时间不高于100ms,仅仅是[14]的10.6%,达到了很好的实时效果。
附图说明:
图1是基于聚类紧凑特征的海量图像检索系统框架图;
图2特征量化过程图;
图3a-3d部分实验结果图;
图4ImageNet-T图像库上的性能对比图;
图5实验不同词汇树的参数;
图6UKbench图像库的检索性能;
图7ImageNet-T图像库的检索性能。
具体实施方式:
为了使得本发明的目的、技术方案和有益效果更加清楚明白,以下结合具体案例,并参照附图,对本发明进行进一步详细的说明。
本发明是用于海量图像库中,特别是包含百万或百万以上图像库,相似图像的快速检索方法。该方法能够将图像所提取的局部视觉特征通过聚类和相应局部特征分布直方图以及空间分布信息的计算获得聚类紧凑特征,同时应用基于改进词汇树的索引结构,使用聚类紧凑特征进行检索,能高效的完成对海量图像的检索工作。该检索方法能够很好的满足用户对快速有效检索方法需求,同时可在很大程度上增加图像检索的用户体验,并通过大量的实验验证了本发明仅使用很少的计算量就在大规模图像检索达到了让人满意的效果,同时展示了本发明方法在计算准确率和检索效率上都具有很好的可扩展性。
我们的测试实验软硬件环境为:
硬件环境:
电脑类型:IBM小型机
CPU:16核IBM CPU每核主频2.2GHz
内存:30.00GB
系统类型:64位SLES11操作系统
软件环境:
IDE:Visual Studio2010
图像处理SDK:OpenCV2.3.1
开发语言:C++
如图1本发明基于聚类紧凑特征的检索系统框架图,对海量图像库中相似图像的检索方法包括如下步骤:
步骤一:首先为了能够提取出图像的可用信息,根据现已有的经典算法提取出图像的视觉局部特征。本发明采用的是SIFT特征,提取出样本图像库和测试图像库中图像的SIFT特征,表示为dm∈RD。每幅图像根据所提取的M个局部特征表示为I=[d1,d2,…,dM]∈RD×M
步骤二:对步骤一所获得的图像局部特征进行聚类,获取到N个聚类X={x1,x2,…,xN}(N<M),并用μi表示聚类xi的聚类中心。计算每个聚类中局部特征到聚类中心的距离,如公式1。disi,j表示在第i聚类中第j个局部特征到聚类中心的距离。
dis i , j = | | d j - μ i | | 2 , d j ∈ x i           (公式1)
根据所计算的距离统计局部特征在该聚类的分布直方图:
h i r = Σ j = 1 k 1 , if dis i , j ∈ dis i r , r = 1,2 , . . . , R 0 , otherwise          (公式2)
其中
Figure BDA0000423025390000073
表示第i聚类的特征分布直方图的第r个分量,k表示第i聚类中局部特征的数目。该聚类被划分为R的小区域,
Figure BDA0000423025390000081
表示划分的第r个子区域,第i聚类的特征分布直方图为
Figure BDA0000423025390000082
然而如果某一聚类,局部特征都远离聚类中心或靠近聚类中心,依据距离划分将导致某些特征分布直方图不能包含所有的局部特征或所有的局部特征都划分到直方图的一个分量中。为了避免这种情况,按照公式3对disi,j进行量化:
dis i , j = dis i , j Σ j = 1 k dis i , j         (公式3)
为了能更好的补偿聚类所损失的信息,本发明按照公式4计算空间统计信息:
ρi=n(i),i=1,2,…,K
s i ‾ = 1 ρ Σ d j ∈ x i s j
σ i s = 1 ρ Σ d j ∈ x i ( s j - s i ‾ ) 2      (公式4)
θ i ‾ = 1 ρ Σ d j ∈ x i θ j
σ i θ = 1 ρ Σ d j ∈ x i ( θ j - θ i ‾ ) 2
sjj分别表示第i个聚类中第j个局部特征的尺度和方向,ρi
Figure BDA0000423025390000088
分别表示第i个聚类的特征密度,平均尺度,尺度方差,平均方向和方向方差,组成空间统计向量
Figure BDA0000423025390000089
结合聚类中心,特征分布直方图和空间统计信息,依据公式5生成聚类紧凑特征:
CFCi={μi,hi,vi}             (公式5)
因而一幅图像可用聚类紧凑特征表示为I={CFC1,CFC2,…,CFCN}
步骤三:将步骤二中所得的样本图像库中的聚类紧凑特征进行随机采样10,000,000个聚类紧凑特征,通过对采样所得聚类紧凑特征中聚类中心的分量应用聚类算法生成词汇树。为了全面的实验,设置不同的参数:词汇树的层数和每层的容量,获得不同容量的词汇树。将测试图像库中图像的聚类紧凑特征都量化到词汇树上,生成相应的倒排文件。量化过程如图2所。
步骤四:根据提出的改进的基于词汇树的检索算法采用聚类紧凑特征进行检索。让T表示为深度为L,度为K的词汇树,在词汇树中每个节点
Figure BDA00004230253900000810
表示一个视觉词汇,其中l该节点所在层数,hl表示在该层的索引。每个聚类紧凑特征从词汇树的根节点量化到叶子节点的视觉词汇路径集合表示为
Figure BDA0000423025390000091
图像库中查询图像和目标图像间的相似度定义为查询图像和目标图像的聚类紧凑特征对的平均相似度得分:
sim ( q , d ) = · 1 | I q | | I d | Σ i ∈ I q , j ∈ I d f ( CFC i q , CFC j d )        (公式6)
其中|Iq|表示查询图像的聚类紧凑特征数目,|Id|表示目标图像的聚类紧凑特征数目。聚类紧凑特征对的相似度可以进一步表示为在词汇树节点的匹配函数,,如公式7所示:
( CFC i q , CFC j d ) Σ v i ∈ T ( CFC i q ) , v j ∈ T ( CFC j d ) f v ( v i , v j )        (公式7)
fv定义为聚类紧凑特征量化到一个视觉词汇上的权重函数
fv(vi,vj)=wi,j(vi)I(vi=vj)             (公式8)
其中I(·)是一个判断函数。wi,j(v)由3部分组成,包括聚类中心权重函数
Figure BDA0000423025390000094
特征分布直方图权重函数和空间统计信息权重函数
Figure BDA0000423025390000096
如公式8所示:
w i , j ( v ) = w i , j c ( v ) × w i , j h ( v ) × w i , j s ( v )          (公式9)
为了更好的利用词汇树索引结构,采用文献[14]中的描述内容权重来表示
Figure BDA0000423025390000098
其中
Figure BDA0000423025390000099
表示查询图像第i个聚类紧凑特征在该节点的权重,
Figure BDA00004230253900000910
表示目标图像第j个聚类紧凑特征量化到词汇树节点v的权重,idf(v)表示词汇树节点v的IDF权重。在公式11中nq(v)表示查询图像量化到词汇树节点v的聚类紧凑特征数目,ω(v)是一个权重相关系数,可根据经验设置值
w i , j c ( v ) = w i q w j d idf ( v ) (公式10)
w i q = Σ v ∈ T ( CFC i q ) ω ( v ) Σ v ∈ T ( CFC i q ) ω ( v ) × n q ( v ) (公式11)
同时通过计算特征分布直方图相应分量的最小值和最大值的比率之和表示如公式8所示:
w i , j h = Σ r = 1 r = R min ( h i r , h j r ) max ( h i , r h j r )         (公式12)
五个统计信息相似度函数分别定义为:
w i , j ρ = min ( ρ i , ρ j ) max ( ρ i , ρ j )
w i , j s ‾ = min ( s i , ‾ s j ‾ ) man ( s i , ‾ s j ‾ )
w i , j σ s = min ( σ i s , σ j s ) max ( σ i s , σ j s )      (公式13)
w i , j θ ‾ = min ( θ i , ‾ θ j ‾ ) max ( θ i , ‾ θ j ‾ )
w i , j σ θ = min ( σ i θ , σ j θ ) max ( σ i θ , σ j θ )
空间统计信息相似度函数把5个统计信息相似度函数结合起来,定义为:
w i , j s = w i , j ρ × w i , j s ‾ × w i , j σ s × w i , j θ ‾ × w i , j σ θ      (公式14)
两幅图像的相似度由三部分构成,采用了相较于局部特征更为丰富的有效信息,使用很小的计算开销就获得了令人满意的检索结果。

Claims (5)

1.基于聚类紧凑特征的快速高效的海量图像检索方法,其特征在于包括如下步骤:
步骤一:计算样本图像库和测试图像库中图像的局部特征;
步骤二:计算每幅图像的聚类紧凑特征:
对局部特征采用聚类方法获取每类的聚类中心,再统计在每个聚类中的局部特征分布直方图和空间统计信息,生成聚类紧凑特征;
步骤三:随机采样样本图像库中的聚类紧凑特征,对采样所得聚类紧凑特征中聚类中心的分量应用聚类方法生成词汇树,将测试图像库中图像的聚类紧凑特征都量化到词汇树上,生成相应的倒排文件;
步骤四:采用改进的基于词汇树的检索算法进行检索:通过查询词汇树的倒排文件,计算查询图像与图像库图像聚类紧凑特征间的相似度权重进行检索。
2.根据权利要求1所述的基于聚类紧凑特征的快速高效的海量图像检索方法,其特征在于:所述聚类采用K-means聚类或Affinity Propagation(AP)聚类等聚类算法。
3.根据权利要求1所述的基于聚类紧凑特征的快速高效的海量图像检索方法,其特征在于:所述步骤1中的局部特征为SIFT特征,根据所提取出的局部特征每幅图像表示为I={d1,d2,…,dM}∈RD×M,其中d表示局部特征,D表示局部特征维度,M表示每幅图像局部特征的数目,R表示实数空间。
4.根据权利要求1所述的基于聚类紧凑特征的快速高效的海量图像检索方法,其特征在于:步骤二中,聚类紧凑特征表示为:
I={CFC1,CFC2,…,CFCN}
CFCi={μi,hi,vi},
①N表示每幅图像聚类的数目;μi表示第i个聚类xi的聚类中心;
②上式中成空间统计向量
Figure FDA0000423025380000011
ρi
Figure FDA0000423025380000012
分别表示第i聚类的特征密度,平均尺度,尺度方差,平均方向和方向方差,在下面的公式中sjj分别表示在第i个聚类中第j个局部特征的尺度和方向,ρ表示聚类紧凑特征密度,n(i)表示在聚类区域内,局部特征的数目,dj为在第i个聚类中第j个局部特征,xi表示第i个聚类;
ρi=n(i),i=1,2,…,K
s i ‾ = 1 ρ Σ d j ∈ x i s j
σ i s = 1 ρ Σ d j ∈ x i ( s j - s i ‾ ) 2
θ i ‾ = 1 ρ Σ d j ∈ x i θ j
σ i θ = 1 ρ Σ d j ∈ x i ( θ j - θ i ‾ ) 2
Figure FDA0000423025380000025
每个聚类划分为R个小区域,第i聚类的特征分布直方图第r个分量 h i r = Σ j = 1 k 1 , if dis i , j ∈ dis i r , r = 1,2 , . . . , R 0 , otherwise , k表示第i聚类中局部特征的数目,根据第i聚类中第j个局部特征到聚类中心的距离统计获得,其中第i聚类中第j个局部特征到聚类中心的距离表示如下:
dis i , j = | | d j - μ i | | 2 , d j ∈ x i
dj表示在第i个聚类中第j个局部特征、μi表示第i个聚类xi的聚类中心;
为避免不能包含所有的局部特征或所有的局部特征都划分到直方图的一个分量中,对disi,j进行量化:
dis i , j = dis i , j Σ j = 1 k dis i , j .
5.根据权利要求1所述的基于聚类紧凑特征的快速高效的海量图像检索方法,其特征在于:图像库中查询图像和目标图像间的相似度定义为:
sim ( q , d ) = · 1 | I q | | I d | Σ i ∈ I q , j ∈ I d f ( CFC i q , CFC j d )
其中|Iq|表示查询图像的聚类紧凑特征数目,|Id|表示目标图像的聚类紧凑特征数目,
Figure FDA00004230253800000210
为聚类紧凑特征间的相似度度量函数
( CFC i q , CFC j d ) Σ v i ∈ T ( CFC i q ) , v j ∈ T ( CFC j d ) f v ( v i , v j )
fv(vi,vj)=wi,j(vi)I(vi=vj)
w i , j ( v ) = w i , j c ( v ) × w i , j h ( v ) × w i , j s ( v ) ,
Figure FDA0000423025380000032
表示每个聚类紧凑特征从词汇树的根节点量化到叶子节点的视觉词汇路径集合,I(·)是一个判断函数,wi,j(v)表示量化到词汇树上同一个节点的两个聚类紧凑特征,即查询图像第i个聚类紧凑特征和目标图像第j个聚类紧凑特征的相似度权重,由三部分组成,包括聚类中心相似度权重函数特征分布直方图相似度权重函数
Figure FDA0000423025380000034
和空间统计信息相似度权重函数
Figure FDA0000423025380000035
为聚类中心相似度权重函数,
Figure FDA0000423025380000036
为查询图像第i个聚类紧凑特征量化到词汇树节点v的权重,
Figure FDA0000423025380000037
为目标图像第j个聚类紧凑特征量化到词汇树节点v的权重、idf(v)为词汇树节点v的IDF权重、、nq(v)表示查询图像量化到节点v的聚类紧凑特征数目,ω(v)是一个权重相关系数,可根据经验设置值;
w i q = Σ v ∈ T ( CFC i q ) ω ( v ) Σ v ∈ T ( CFC i q ) ω ( v ) × n q ( v )
Figure FDA0000423025380000039
为局部特征分布直方图相似度权重函数,通过计算特征分布直方图相应分量的最小值和最大值的比率之和表示,公式如下:
Figure FDA00004230253800000310
公式中
Figure FDA00004230253800000311
表示查询图像第i个聚类紧凑特征的局部特征直方图的第r个分量,
Figure FDA00004230253800000312
表示目标图像第j个聚类紧凑特征的局部特征直方图的第r个分量,R表示聚类所划分的区域数目,r=1,2,…,R,
Figure FDA00004230253800000313
为空间统计信息相似度权重函数,
聚类紧凑特征密度相似度权重:
Figure FDA00004230253800000315
平均尺度相似度权重:
尺度方差相似度权重:
Figure FDA00004230253800000317
平均方向相似度权重:
Figure FDA0000423025380000041
方向方差相似度权重:
Figure FDA0000423025380000042
CN201310611155.4A 2013-11-26 2013-11-26 一种基于聚类紧凑特征的海量图像检索系统 Active CN103605765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310611155.4A CN103605765B (zh) 2013-11-26 2013-11-26 一种基于聚类紧凑特征的海量图像检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310611155.4A CN103605765B (zh) 2013-11-26 2013-11-26 一种基于聚类紧凑特征的海量图像检索系统

Publications (2)

Publication Number Publication Date
CN103605765A true CN103605765A (zh) 2014-02-26
CN103605765B CN103605765B (zh) 2016-11-16

Family

ID=50123987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310611155.4A Active CN103605765B (zh) 2013-11-26 2013-11-26 一种基于聚类紧凑特征的海量图像检索系统

Country Status (1)

Country Link
CN (1) CN103605765B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914557A (zh) * 2014-04-15 2014-07-09 大连理工大学 一种基于关键特征描述符选取的移动视觉检索系统
CN104239566A (zh) * 2014-09-28 2014-12-24 小米科技有限责任公司 视频搜索的方法及装置
CN104408479A (zh) * 2014-11-28 2015-03-11 电子科技大学 一种基于深度局部特征描述符的海量图像分类方法
CN104462502A (zh) * 2014-12-19 2015-03-25 中国科学院深圳先进技术研究院 一种基于特征融合的图像检索方法
CN104462199A (zh) * 2014-10-31 2015-03-25 中国科学院自动化研究所 一种网络环境下的近似重复图像搜索方法
CN105117407A (zh) * 2015-07-27 2015-12-02 电子科技大学 一种基于聚类的距离方向直方图的图像检索方法
CN105844302A (zh) * 2016-04-07 2016-08-10 南京新与力文化传播有限公司 基于深度学习的自动计算商品潮流指数的方法
CN105912611A (zh) * 2016-04-05 2016-08-31 中国科学技术大学 一种基于cnn的快速图像检索方法
CN106503743A (zh) * 2016-10-31 2017-03-15 天津大学 一种数量多且维数高的图像局部特征点自适应聚类方法
CN108197649A (zh) * 2017-12-29 2018-06-22 厦门大学 一种太赫兹图像聚类分析方法及系统
CN104462502B (zh) * 2014-12-19 2018-08-31 中国科学院深圳先进技术研究院 一种基于特征融合的图像检索方法
CN109992690A (zh) * 2019-03-11 2019-07-09 中国华戎科技集团有限公司 一种图像检索方法和系统
CN110175546A (zh) * 2019-05-15 2019-08-27 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110297935A (zh) * 2019-06-28 2019-10-01 京东数字科技控股有限公司 图像检索方法、装置、介质及电子设备
CN110675319A (zh) * 2019-09-12 2020-01-10 创新奇智(成都)科技有限公司 一种基于最小生成树的手机拍照全景图像拼接方法
CN111368126A (zh) * 2017-02-13 2020-07-03 哈尔滨理工大学 一种面向图像检索的生成方法
CN112633051A (zh) * 2020-09-11 2021-04-09 博云视觉(北京)科技有限公司 一种基于图像搜索的在线人脸聚类方法
CN113449132A (zh) * 2021-08-26 2021-09-28 阿里云计算有限公司 一种向量检索方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004111931A2 (en) * 2003-06-10 2004-12-23 California Institute Of Technology A system and method for attentional selection
WO2005083592A1 (en) * 2004-02-24 2005-09-09 Koninklijke Philips Electronics N.V. Method and apparatus for locating content in a program
CN101021855A (zh) * 2006-10-11 2007-08-22 鲍东山 基于内容的视频检索系统
CN101140624A (zh) * 2007-10-18 2008-03-12 清华大学 图像匹配方法
CN101211355A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于聚类的图像查询方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004111931A2 (en) * 2003-06-10 2004-12-23 California Institute Of Technology A system and method for attentional selection
WO2004111931A3 (en) * 2003-06-10 2005-02-24 California Inst Of Techn A system and method for attentional selection
WO2005083592A1 (en) * 2004-02-24 2005-09-09 Koninklijke Philips Electronics N.V. Method and apparatus for locating content in a program
CN101021855A (zh) * 2006-10-11 2007-08-22 鲍东山 基于内容的视频检索系统
CN101211355A (zh) * 2006-12-30 2008-07-02 中国科学院计算技术研究所 一种基于聚类的图像查询方法
CN101140624A (zh) * 2007-10-18 2008-03-12 清华大学 图像匹配方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914557A (zh) * 2014-04-15 2014-07-09 大连理工大学 一种基于关键特征描述符选取的移动视觉检索系统
CN103914557B (zh) * 2014-04-15 2017-01-25 大连理工大学 一种基于关键特征描述符选取的移动视觉检索方法
CN104239566A (zh) * 2014-09-28 2014-12-24 小米科技有限责任公司 视频搜索的方法及装置
CN104462199B (zh) * 2014-10-31 2017-09-12 中国科学院自动化研究所 一种网络环境下的近似重复图像搜索方法
CN104462199A (zh) * 2014-10-31 2015-03-25 中国科学院自动化研究所 一种网络环境下的近似重复图像搜索方法
CN104408479A (zh) * 2014-11-28 2015-03-11 电子科技大学 一种基于深度局部特征描述符的海量图像分类方法
CN104408479B (zh) * 2014-11-28 2018-04-06 电子科技大学 一种基于深度局部特征描述符的海量图像分类方法
CN104462502B (zh) * 2014-12-19 2018-08-31 中国科学院深圳先进技术研究院 一种基于特征融合的图像检索方法
CN104462502A (zh) * 2014-12-19 2015-03-25 中国科学院深圳先进技术研究院 一种基于特征融合的图像检索方法
CN105117407A (zh) * 2015-07-27 2015-12-02 电子科技大学 一种基于聚类的距离方向直方图的图像检索方法
CN105117407B (zh) * 2015-07-27 2019-03-26 电子科技大学 一种基于聚类的距离方向直方图的图像检索方法
CN105912611A (zh) * 2016-04-05 2016-08-31 中国科学技术大学 一种基于cnn的快速图像检索方法
CN105912611B (zh) * 2016-04-05 2019-04-26 中国科学技术大学 一种基于cnn的快速图像检索方法
CN105844302A (zh) * 2016-04-07 2016-08-10 南京新与力文化传播有限公司 基于深度学习的自动计算商品潮流指数的方法
CN106503743B (zh) * 2016-10-31 2020-04-17 天津大学 一种数量多且维数高的图像局部特征点自适应聚类方法
CN106503743A (zh) * 2016-10-31 2017-03-15 天津大学 一种数量多且维数高的图像局部特征点自适应聚类方法
CN111368126A (zh) * 2017-02-13 2020-07-03 哈尔滨理工大学 一种面向图像检索的生成方法
CN111368126B (zh) * 2017-02-13 2022-06-07 哈尔滨理工大学 一种面向图像检索的生成方法
CN108197649A (zh) * 2017-12-29 2018-06-22 厦门大学 一种太赫兹图像聚类分析方法及系统
CN109992690A (zh) * 2019-03-11 2019-07-09 中国华戎科技集团有限公司 一种图像检索方法和系统
CN110175546A (zh) * 2019-05-15 2019-08-27 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110297935A (zh) * 2019-06-28 2019-10-01 京东数字科技控股有限公司 图像检索方法、装置、介质及电子设备
CN110675319A (zh) * 2019-09-12 2020-01-10 创新奇智(成都)科技有限公司 一种基于最小生成树的手机拍照全景图像拼接方法
CN110675319B (zh) * 2019-09-12 2020-11-03 创新奇智(成都)科技有限公司 一种基于最小生成树的手机拍照全景图像拼接方法
CN112633051A (zh) * 2020-09-11 2021-04-09 博云视觉(北京)科技有限公司 一种基于图像搜索的在线人脸聚类方法
CN113449132A (zh) * 2021-08-26 2021-09-28 阿里云计算有限公司 一种向量检索方法及装置

Also Published As

Publication number Publication date
CN103605765B (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN103605765A (zh) 一种基于聚类紧凑特征的海量图像检索系统
Kordopatis-Zilos et al. Near-duplicate video retrieval by aggregating intermediate cnn layers
Wang et al. Contextual weighting for vocabulary tree based image retrieval
Liu et al. Contextual hashing for large-scale image search
Chatfield et al. Visor: Towards on-the-fly large-scale object category retrieval
Hao et al. Unsupervised t-distributed video hashing and its deep hashing extension
CN106033426B (zh) 一种基于潜在语义最小哈希的图像检索方法
Zhang et al. Efficient indexing for large scale visual search
Liu et al. Embedding spatial context information into inverted filefor large-scale image retrieval
Gao et al. Democratic diffusion aggregation for image retrieval
Gao et al. 3D object retrieval with bag-of-region-words
Li et al. Exploiting hierarchical activations of neural network for image retrieval
CN111177435A (zh) 一种基于改进pq算法的cbir方法
Wang et al. Beauty product image retrieval based on multi-feature fusion and feature aggregation
Tu et al. Topic modeling and improvement of image representation for large-scale image retrieval
Zou et al. aware representation for sketch-based 3d model retrieval
Dong et al. Holons visual representation for image retrieval
Song et al. Hierarchical deep hashing for image retrieval
Zhou et al. Visual word expansion and BSIFT verification for large-scale image search
Sun et al. Search by detection: Object-level feature for image retrieval
Kulkarni et al. An effective content based video analysis and retrieval using pattern indexing techniques
Kim et al. Performance evaluation of large-scale object recognition system using bag-of-visual words model
Yeh et al. Fast visual retrieval using accelerated sequence matching
Cai et al. Constrained keypoint quantization: towards better bag-of-words model for large-scale multimedia retrieval
Sicre et al. Dense sampling of features for image retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant