CN103488664A - 一种图像检索方法 - Google Patents

一种图像检索方法 Download PDF

Info

Publication number
CN103488664A
CN103488664A CN201310159170.XA CN201310159170A CN103488664A CN 103488664 A CN103488664 A CN 103488664A CN 201310159170 A CN201310159170 A CN 201310159170A CN 103488664 A CN103488664 A CN 103488664A
Authority
CN
China
Prior art keywords
image
document vector
vision
retrieval
inquiry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310159170.XA
Other languages
English (en)
Other versions
CN103488664B (zh
Inventor
黄祥林
吕慧
曹学会
杨丽芳
张建生
张枫
韩笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XINHUA NEWS AGENCY
Communication University of China
Original Assignee
XINHUA NEWS AGENCY
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINHUA NEWS AGENCY, Communication University of China filed Critical XINHUA NEWS AGENCY
Priority to CN201310159170.XA priority Critical patent/CN103488664B/zh
Publication of CN103488664A publication Critical patent/CN103488664A/zh
Application granted granted Critical
Publication of CN103488664B publication Critical patent/CN103488664B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种图像检索方法,属于多媒体信息检索、模式识别等智能信息处理领域。本发明通过在初次检索后利用几何验证得到正确匹配的相关图像,将相关图像与查询图像的文档向量进行权重调整构成新的查询向量,进而得到扩展的查询,进行新的检索得到检索结果。该方法在查询向量中增加了相关图像中存在的隐性视觉单词的权重,提高了查询图像与相关匹配图像中相同视觉单词的权重从而大大提高了检索效率。

Description

一种图像检索方法
技术领域
本发明属于多媒体信息检索、模式识别等智能信息处理领域。具体涉及一种用于目标检索的扩展查询检索方法。
背景技术
基于视觉词袋模型的目标检索技术成为近年来的研究热点。视觉词袋模型预先利用训练图像的局部特征形成“视觉词表”,并利用该“视觉词表”对图像局部特征进行量化,将相似的图像局部特征近似的表示为它们的聚类中心-“视觉单词”。由此,图像被表示为一组“视觉单词”的集合。随后,人们利用倒排索引表存储图像的“视觉单词”,并利用文本检索中的TF-IDF模型对图像进行检索。
由于在提取查询图像局部特征过程中的漏检和局部特征到视觉单词量化过程中的误差累积造成的视觉单词的不精准性,造成的了检索效果的不理想。学者们对此进行了诸多改进。Chum等人提出对检索后的结果进行几何验证,通过仿射变换确定前N幅检索结果中正确的M幅检索结果图像,并将此M幅图像与查询图像相结合,调整查询向量进行扩展查询,重新进行检索以提高检索效率。Philbin等人提出软量化概念,通过将每个局部特征映射成为一个加权的视觉单词集合,允许将量化阶段丢失的特征包含进来,根据局部特征空间邻近型选择词汇来获得视觉单词的集合。Yang等人利用查询目标的视觉上下文信息来补偿基于视觉词袋模型查询目标表达的不确定性。
由此可见查询目标视觉单词的准确性极大的影响了检索效率。在扩展查询中利用了初次检索结果中正确匹配图像的视觉单词以扩展查询视觉单词的范围,增加了查询目标的隐性视觉单词,但是同时也增加了许多与查询目标不相关的视觉单词。
参考文献
1.J.Philbin,O.Chum,M.Isard,J.Sivic,and A.Zisserman.Object retrieval withlarge vocabularies and fast spatial matching.In Proc.CVPR,2007.
2.J.Sivic and A.Zisserman,Video Google:A Text Retrieval Approach to ObjectMatching in Videos,Proc.Ninth Int’l Conf.Computer Vision,2003,pp.1470-1478.
3.David G.Lowe.Object Recognition from Local Scale-Invariant Features.TheProceedings of the7th IEEE International Conference on Computer Vision.Corfu,Greece:IEEE Computer Society Press,1999:1150-1157.
发明内容
本发明的目的在于提出一种在查询过程中通过对盲反馈获取的初次检索相关图像集合进行分析,在新的查询向量中提高相关视觉单词权重并减小非相关视觉单词权重的图像检索方法来进行新的检索,以提高检索效率。
本发明的总体思想如下:首先通过视觉词袋模型训练图像的局部特征形成“视觉词表”,并利用该“视觉词表”将图像量化成视觉单词的集合。之后,利用文本检索中的TF-IDF模型将图像库中所有图像转化成为文档向量d。在进行检索时,根据用户划定的感兴趣区域,将查询图像的感兴趣区域组成的局部特征集合转化成查询文档向量dq,与图像库中所有图像对应的文档向量进行比较排序,得到初次检索结果图像集合R。然后利用查询图像和初次检索结果中的前m幅图像进行几何验证,得到正确匹配的相关图像n幅(N<=M)。随后,根据查询文档向量dq与n幅相关图像文档向量d1,d2...,dn构建新的查询文档向量dq’,利用dq’与图像库中所有图像对应的文档向量进行比较排序,得到新的检索结果集合R’。
具体创新点:本方法通过利用对初次检索结果进行几何验证后得到的正确匹配图像集合,结合查询图像感兴趣区域对查询向量进行调整,扩展了新查询向量中相关视觉单词的信息量,进而在新的检索中提高检索效率。
本发明的具体方法步骤为:
1提取图像库中所有图像的局部特征,每幅图像得到一个局部特征集合,所有图像的局部特征集合形成局部特征训练集合,利用视觉词袋模型从局部特征训练集合中得到视觉词表,利用视觉词表将图像转化成视觉单词集合;
2利用TF-IDF模型将图像对应的视觉单词集合量化成文档向量;
3结合视觉词表,利用TF-IDF模型将查询图像感兴趣区域的局部特征集合量化成查询文档向量dq
4将查询文档向量dq与图像库中所有图像对应的文档向量进行相似度匹配,得到初次检索结果图像集合R;
5将查询图像与检索结果R中相似度最高的前m幅图像进行几何验证,得到正确匹配的相关图像n幅,n<=m;
6根据查询文档向量dq与n幅相关图像的文档向量d1,d2...,dn构建新的查询文档向量dq’,公式表示如下:
d q ′ = 1 n + 1 [ α Σ j = 0 x ( w q sj + Σ i = 1 n w i sj ) + β Σ j = 0 y Σ i = 1 n w i uj ]
式中,α和β表示可调参数;
Figure BSA00000887542500032
表示查询文档向量dq中权重不为0的视觉单词在查询文档向量dq中的权重,
Figure BSA00000887542500033
表示查询文档向量dq中权重不为0的视觉单词在文档向量di中的权重,
Figure BSA00000887542500034
表示查询文档向量dq中权重为0的视觉单词在文档向量di中的权重;x和y分别表示
Figure BSA00000887542500035
Figure BSA00000887542500036
在文档向量中的数目。
7利用dq’与图像库中所有图像对应的文档向量进行相似度匹配,得到新的检索结果集合R’。
上述方法中,步骤4所述的相似度指两个向量间的余弦距离。
上述方法中,步骤5所述的几何验证是利用随机抽样一致性来计算两幅图像之间的仿射变换矩阵,如果能够得到仿射变换矩阵,说明两幅图像满足仿射变换,即两幅图像能够正确匹配;如果得不到仿射变换矩阵,则说明两幅图像之间不存在正确匹配。
附图说明
图1为图像到视觉单词的转化过程流程图。
图2为查询图像示例图。
图3为检索系统框图。
具体实施方式
本实施例的技术方案如下:
首先,利用视觉词袋模型将图像转化成视觉单词的集合,转化过程如图1所示。具体转化过程为:对图像进行特征检测,得到显著特征点或者显著区域,进行特征描述进而得到局部特征描述向量;对整个图像库中的图像进行特征提取并抽样即可得到局部特征集合作为特征训练集合。对特征训练集合进行k均值聚类,将每一个聚类中心作为一个“视觉单词”,所有聚类中心构成“视觉词表”。将单幅图像提取的局部特征集合进行特征量化,量化成为视觉单词的集合。量化时,将每个局部特征描述向量与视觉词表中所有视觉单词代表的特征向量进行比较,选取最相似或者距离最小的向量对应的视觉单词作为该向量的视觉单词。
然后,利用TF-IDF模型对图像对应的视觉单词进行统计计算,得到每个图像对应的文档向量。文档向量可以表示为d={w1,w2,...,wk},wt表示视觉单词t在量化的文档向量d中的权重,k为视觉词表的大小。具体的,每个视觉单词在其文档向量中的权重可以表示为
w t = tf ( t , d ) × log ( N / n l ) Σ t ∈ d [ tf ( t , d ) × log ( N / n l ) ] 2
tf(t,d)表示视觉单词在图像中出现的频率,tf(t,d)=nd/sd,nd表示视觉单词在图像中出现的次数,sd表示该图像中总的视觉单词个数;N表示整个图像集的大小;nl是包含视觉单词t的图像数目。这样,每个局部特征被量化为一个视觉单词,对应于一幅图像的由局部特征构成的集合就量化成为一个文档向量d={w1,w2,...,wk},图像库就被量化成为文档向量库D={d1,d2,...,dN}。
用户利用检索系统检索时,输入查询图像,并框选出检索区域,也就是感兴趣区域,如图2所示,框1框选部分为用户标定的检索区域。检索系统提取整个图像的局部特征,并将框选区域范围内的局部特征集合利用视觉词袋模型转化为视觉单词集合,之后利用TF-IDF模型转化为查询文档向量dq,那么现在查询图像框选区域与图像库中图像的相似度匹配过程就转化为查询文档向量dq与文档向量库D中的文档向量相似度匹配过程。检索系统框图如图3所示。计算查询文档向量dq与文档库D中的文档向量之间的相似度,在这里可以采用余弦距离。距离越小,说明两个文档向量越相似,其对应的图像就越相似,据此得到检索结果的图像集合R。
之后将检索结果图像集合R中的前m副图像作为验证集合,利用随机抽样一致性来计算查询图像框选区域是否与检索结果能够正确匹配。随机抽样一致性通过计算两幅图像之间的仿射变换矩阵来验证两幅图像是否能够正确匹配,如果能够得到仿射变换矩阵,说明两幅图像满足仿射变换,即两幅图像能够正确匹配;如果得不到仿射变换矩阵,则说明两幅图像之间不存在正确匹配。
之后将得到的n幅正确匹配图像作为相关图像集合,根据查询文档向量dq和相关图像的文档向量d1,d2,...,dn构建新的查询向量dq’。新的查询向量dq’可以通过如下公式得到:
d q ′ = 1 n + 1 [ α Σ j = 0 x ( w q sj + Σ i = 1 n w i sj ) + β Σ j = 0 y Σ i = 1 n w i uj ]
式中,α和β表示可调参数;
Figure BSA00000887542500061
表示查询文档向量dq中权重不为0的视觉单词在查询文档向量dq中的权重,
Figure BSA00000887542500062
表示查询文档向量dq中权重不为0的视觉单词在文档向量di中的权重,
Figure BSA00000887542500063
表示查询文档向量dq中权重为0的视觉单词在文档向量di中的权重;x和y分别表示
Figure BSA00000887542500064
Figure BSA00000887542500065
在文档向量中的数目。
之后利用新的查询文档向量dq’与文档库D的文档向量进行相似度匹配,得到新的查询结果图像集合R’返回给用户。
应当理解的是,上述针对实施实例的描述较为具体,并不能因此而认为是对本发明专利保护范围的限制,本发明的专利保护范围应以所附权利要求为准。

Claims (3)

1.一种图像检索方法,其特征在于,包括以下步骤:
1.1提取图像库中所有图像的局部特征,每幅图像得到一个局部特征集合,所有图像的局部特征集合形成局部特征训练集合,利用视觉词袋模型从局部特征训练集合中得到视觉词表,利用视觉词表将图像转化成视觉单词集合;
1.2利用TF-IDF模型将图像对应的视觉单词集合量化成文档向量;
1.3结合视觉词表,利用TF-IDF模型将查询图像感兴趣区域的局部特征集合量化成查询文档向量dq
1.4将查询文档向量dq与图像库中所有图像对应的文档向量进行相似度匹配,得到初次检索结果图像集合R;
1.5将查询图像与检索结果R中相似度最高的前m幅图像进行几何验证,得到正确匹配的相关图像n幅,n<=m;
1.6根据查询文档向量dq与n幅相关图像的文档向量d1,d2,...,dn构建新的查询文档向量dq’,公式表示如下:
d q ′ = 1 n + 1 [ α Σ j = 0 x ( w q sj + Σ i = 1 n w i sj ) + β Σ j = 0 y Σ i = 1 n w i uj ]
式中,α和β表示可调参数;
Figure FSA00000887542400012
表示查询文档向量dq中权重不为0的视觉单词在查询文档向量dq中的权重,
Figure FSA00000887542400013
表示查询文档向量dq中权重不为0的视觉单词在文档向量di中的权重,
Figure FSA00000887542400014
表示查询文档向量dq中权重为0的视觉单词在文档向量di中的权重;x和y分别表示
Figure FSA00000887542400016
在文档向量中的数目。
1.7利用dq与图像库中所有图像对应的文档向量进行相似度匹配,得到新的检索结果集合R’。
2.如权利要求1所述的方法,其特征在于:步骤1.4所述的相似度指两个向量间的余弦距离。
3.如权利要求1所述的方法,其特征在于:步骤1.5所述的几何验证是利用随机抽样一致性来计算两幅图像之间的仿射变换矩阵,如果能够得到仿射变换矩阵,说明两幅图像满足仿射变换,即两幅图像能够正确匹配;如果得不到仿射变换矩阵,则说明两幅图像之间不存在正确匹配。
CN201310159170.XA 2013-05-03 2013-05-03 一种图像检索方法 Expired - Fee Related CN103488664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310159170.XA CN103488664B (zh) 2013-05-03 2013-05-03 一种图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310159170.XA CN103488664B (zh) 2013-05-03 2013-05-03 一种图像检索方法

Publications (2)

Publication Number Publication Date
CN103488664A true CN103488664A (zh) 2014-01-01
CN103488664B CN103488664B (zh) 2016-12-28

Family

ID=49828901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310159170.XA Expired - Fee Related CN103488664B (zh) 2013-05-03 2013-05-03 一种图像检索方法

Country Status (1)

Country Link
CN (1) CN103488664B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886066A (zh) * 2014-03-20 2014-06-25 杭州禧颂科技有限公司 一种基于鲁棒非负矩阵分解的图像检索方法
CN104765764A (zh) * 2015-02-06 2015-07-08 南京理工大学 一种基于大规模图像检索方法
CN105320703A (zh) * 2014-08-05 2016-02-10 北京大学 相似车辆检索中的查询扩展方法及装置
CN105989001A (zh) * 2015-01-27 2016-10-05 北京大学 图像搜索方法及装置、图像搜索系统
CN106095983A (zh) * 2016-06-20 2016-11-09 北京百度网讯科技有限公司 一种基于个性化深度神经网络的相似度确定方法及装置
WO2017020741A1 (zh) * 2015-08-06 2017-02-09 阿里巴巴集团控股有限公司 图像检索、获取图像信息及图像识别方法、装置及系统
CN106933867A (zh) * 2015-12-30 2017-07-07 杭州华为企业通信技术有限公司 一种图像查询方法和装置
CN110472079A (zh) * 2019-07-08 2019-11-19 浙江省北大信息技术高等研究院 目标图像的检索方法、装置、设备及存储介质
CN112905798A (zh) * 2021-03-26 2021-06-04 深圳市阿丹能量信息技术有限公司 一种基于文字标识的室内视觉定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100088295A1 (en) * 2008-10-03 2010-04-08 Microsoft Corporation Co-location visual pattern mining for near-duplicate image retrieval
CN101894130A (zh) * 2010-06-08 2010-11-24 浙江大学 基于稀疏降维的谱哈希索引方法
WO2011094757A1 (en) * 2010-02-01 2011-08-04 Google Inc. Joint embedding for item association
CN102368237A (zh) * 2010-10-18 2012-03-07 中国科学技术大学 图像检索方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100088295A1 (en) * 2008-10-03 2010-04-08 Microsoft Corporation Co-location visual pattern mining for near-duplicate image retrieval
WO2011094757A1 (en) * 2010-02-01 2011-08-04 Google Inc. Joint embedding for item association
CN101894130A (zh) * 2010-06-08 2010-11-24 浙江大学 基于稀疏降维的谱哈希索引方法
CN102368237A (zh) * 2010-10-18 2012-03-07 中国科学技术大学 图像检索方法、装置及系统

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886066A (zh) * 2014-03-20 2014-06-25 杭州禧颂科技有限公司 一种基于鲁棒非负矩阵分解的图像检索方法
CN103886066B (zh) * 2014-03-20 2017-03-29 杭州禧颂科技有限公司 一种基于鲁棒非负矩阵分解的图像检索方法
CN105320703B (zh) * 2014-08-05 2018-07-24 北京大学 相似车辆检索中的查询扩展方法及装置
CN105320703A (zh) * 2014-08-05 2016-02-10 北京大学 相似车辆检索中的查询扩展方法及装置
CN105989001A (zh) * 2015-01-27 2016-10-05 北京大学 图像搜索方法及装置、图像搜索系统
CN105989001B (zh) * 2015-01-27 2019-09-06 北京大学 图像搜索方法及装置、图像搜索系统
CN104765764A (zh) * 2015-02-06 2015-07-08 南京理工大学 一种基于大规模图像检索方法
WO2017020741A1 (zh) * 2015-08-06 2017-02-09 阿里巴巴集团控股有限公司 图像检索、获取图像信息及图像识别方法、装置及系统
CN106933867B (zh) * 2015-12-30 2020-02-21 杭州华为企业通信技术有限公司 一种图像查询方法和装置
CN106933867A (zh) * 2015-12-30 2017-07-07 杭州华为企业通信技术有限公司 一种图像查询方法和装置
US11361019B2 (en) 2015-12-30 2022-06-14 Huawei Technologies Co., Ltd. Image query method and apparatus
CN106095983B (zh) * 2016-06-20 2019-11-26 北京百度网讯科技有限公司 一种基于个性化深度神经网络的相似度确定方法及装置
CN106095983A (zh) * 2016-06-20 2016-11-09 北京百度网讯科技有限公司 一种基于个性化深度神经网络的相似度确定方法及装置
CN110472079A (zh) * 2019-07-08 2019-11-19 浙江省北大信息技术高等研究院 目标图像的检索方法、装置、设备及存储介质
CN110472079B (zh) * 2019-07-08 2022-04-05 杭州未名信科科技有限公司 目标图像的检索方法、装置、设备及存储介质
CN112905798A (zh) * 2021-03-26 2021-06-04 深圳市阿丹能量信息技术有限公司 一种基于文字标识的室内视觉定位方法

Also Published As

Publication number Publication date
CN103488664B (zh) 2016-12-28

Similar Documents

Publication Publication Date Title
CN103488664A (zh) 一种图像检索方法
US8232996B2 (en) Image learning, automatic annotation, retrieval method, and device
CN107220611B (zh) 一种基于深度神经网络的空时特征提取方法
Chen et al. Residual enhanced visual vectors for on-device image matching
Duan et al. Compact descriptors for visual search
CN102461066A (zh) 组合的水印法和指纹法
JP2016502194A5 (zh)
Chandrasekhar et al. Low latency image retrieval with progressive transmission of chog descriptors
CN115841683B (zh) 一种联合多级特征的轻量行人重识别方法
CN102300095A (zh) 一种超谱信号的快速压缩编码方法及图像压缩方法
CN106777159A (zh) 一种基于内容的视频片段检索及定位方法
CN102547477B (zh) 一种基于轮廓波变换模型的视频指纹方法
CN109784295B (zh) 视频流特征识别方法、装置、设备及存储介质
JP6460926B2 (ja) 撮影画像に写る物体を検索するシステム及び方法
CN106203471A (zh) 一种基于融合Kendall Tau距离度量的谱聚类方法
CN104142978B (zh) 一种基于多特征和稀疏表示的图像检索系统及方法
JP5197492B2 (ja) 半教師画像認識検索装置、半教師画像認識検索方法、及びプログラム
Chen et al. Interframe coding of global image signatures for mobile augmented reality
Wang et al. Deep learning networks-based action videos classification and search
CN100507910C (zh) 集成颜色和运动特征进行镜头检索的方法
CN105224619A (zh) 一种适用于视频/图像局部特征的空间关系匹配方法及系统
CN104715057A (zh) 一种基于可变步长关键帧提取的网络视频拷贝检索方法
Xu et al. Indoor shop recognition via simple but efficient fingerprinting on smartphones
Dong et al. PeP: a Point enhanced Painting method for unified point cloud tasks
Sharm et al. Deformable and Structural Representative Network for Remote Sensing Image Captioning.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161228

Termination date: 20190503

CF01 Termination of patent right due to non-payment of annual fee