CN101271476A - 网络图像搜索中基于聚类的相关反馈检索方法 - Google Patents

网络图像搜索中基于聚类的相关反馈检索方法 Download PDF

Info

Publication number
CN101271476A
CN101271476A CNA2008101049429A CN200810104942A CN101271476A CN 101271476 A CN101271476 A CN 101271476A CN A2008101049429 A CNA2008101049429 A CN A2008101049429A CN 200810104942 A CN200810104942 A CN 200810104942A CN 101271476 A CN101271476 A CN 101271476A
Authority
CN
China
Prior art keywords
image
retrieval
user
cluster
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101049429A
Other languages
English (en)
Other versions
CN101271476B (zh
Inventor
尔桂花
路瑶
谢旭东
戴琼海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN2008101049429A priority Critical patent/CN101271476B/zh
Publication of CN101271476A publication Critical patent/CN101271476A/zh
Application granted granted Critical
Publication of CN101271476B publication Critical patent/CN101271476B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及网络图像搜索中基于聚类的相关反馈检索方法,属于计算机多媒体技术领域;该方法包括:用户首先输入一个或多个关键词,使用基于关键词的检索工具得到并返回第一轮图像的检索结果;将检索到的前n幅图像按底层特征聚类,将聚类后的图像包呈现给用户;用户对这些图像包进行标注;按照标注对第一轮检索结果的对图像进行排序,并将排序后的新的检索结果呈现给用户。该方法优化了现有的网络图像搜索引擎的图片检索功能,提高了检索准确率,同时也可以广泛的应用到网络以外的其他图像数据库的检索中。

Description

网络图像搜索中基于聚类的相关反馈检索方法
技术领域
本发明属于计算机多媒体技术领域,特别涉及网络图像搜索技术。
背景技术
近年来,随着图像获取设备和存储设备的发展,网络上数字图像的数量也在飞速增长。为了在互联网上浩瀚的图像资源中寻找需要的内容,需要有有效的搜索工具和机制。然而,现有的搜索引擎,如Google、Baidu等,只支持基于关键字的图片检索功能。这种基于文本的检索有很多弊端,例如同一个语义可以有多种不同的表达方法,而同一个词语表达的意思也会根据语境而有所不同。这种情况下,输入一个关键字,得到的检索结果通常是数目庞大而且内容混杂的,用户要在其中耐心翻找,才能锁定自己所要的图片。为克服关键字检索中出现的问题,基于内容的图像检索技术(content-based image retrieval,简称CBIR)应运而生,而且已成为近年来非常热门的研究领域。基于内容的图像检索系统自动提取图像的视觉内容(如颜色、纹理和形状等)作为其属性索引来检索图像,克服了基于关键字的检索中存在的问题。
相关反馈机制:这是一种监督学习的技术,核心思想是将用户加入到检索过程中。由用户对单词检索的结果进行标准,是“相关”,还是“不相关”。在当前的相关反馈机制中,通常的反馈方式和原理是:当针对某一个查询进行了一轮检索后,由系统提供一个标注集供用户反馈,即用户需要对标注集中的每幅图像做出反馈,说明其是否与查询图像或查询概念相关,其中与查询图像相关的被标为正例,不相关的被标为负例。再利用监督式或者半监督式的学习方法,学习到用户的查询语义,从而在下一轮中得到更好的检索结果。但是,这种依靠标注的方式存在着一定的缺欠,即检索的结果是与标注图像的数目直接相关的,所以要得到好的检索结果必须要标注很多图像;然而逐一翻看图像并进行标注,这一过程需要花费较长的时间和耐心,这是一项枯燥的、费时费力的工作。
和本发明相关的技术如下:
统计聚类的方法:使用图像的底层视觉特征,利用无监督或半监督的学习方法将图像划分成从属于不同语义的若干类别。
发明内容
本发明为克服已有技术的不足之处,提出一种网络图像搜索中基于聚类的相关反馈检索方法,针对应用Google、Baidu等基于文本的图片检索所得到的首次检索结果,将在线的相关反馈机制和离线的基于统计聚类的预处理结合在一起,来优化关键字搜索的结果,该方法优化了现有的网络图像搜索引擎的图片检索功能,提高了检索准确率,同时也可以广泛的应用到网络以外的其他图像数据库的检索中。
本发明提出的网络图像搜索中基于聚类的相关反馈检索方法,其特征在于,包括以下步骤:
1)用户首先输入一个或多个关键词,使用基于关键词的检索工具得到并返回第一轮图像的检索结果;
2)将检索到的前n幅图像按底层特征聚类,将聚类后的图像包呈现给用户(n的取值范围由用户需求而定一般,若n太小用户得不到满意的结果,n太大会影响计算速度,一般取500-1000即可);用户对这些图像包进行标注;
3)按照标注对第一轮检索结果的对图像进行排序,并将排序后的新的检索结果呈现给用户。
本发明特点和效果
本发明最主要的特点是用户的标注工作量被大大减小了。有研究表明,人类的视觉和感知系统在110ms之内即可获取一幅图的内容,移动视线大概只需要300ms,所以和逐个标注每幅图片相比,浏览经过组织的图像的集合,对图像的集合进行标注的方法显然更有效率,它避免了用户不停的点击图像,同时帮助用户更好的确定自己的查询概念,避免了关键字查询造成的语义模糊。
附图说明
图1为本发明的总体流程框图。
图2为本实施例中采用Google对“北京”的初始检索结果.
图3本实施例的聚类结果;其中(a)为北京古建筑(b)为北京地图(c)为北京人的生活。
图4为本实施例的重排序后的结果。
具体实施方式
本发明提出的网络图像搜索中基于聚类的相关反馈检索方法,应用于网络图像搜索。本发明方法的流程如图1所示,包括以下步骤:
1)用户首先输入一个或多个关键词,使用基于关键词的检索工具得到并返回第一轮图像的检索结果并显示给用户;
2)将检索到的前n幅图像按底层特征聚类,将聚类后的图像包显示给用户(n的取值范围由用户需求而定一般,若n太小用户得不到满意的结果,n太大会影响计算速度,一般取500-1000即可);用户对这些图像包进行标注;
3)按照标注对第一轮检索结果的对图像进行排序,并将排序后的新的检索结果显示给用户。
上述的聚类是使用图像的底层视觉特征,利用无监督或半监督的学习方法将图像划分成从属于不同语义的若干图像包,每个图像包里面包括一组视觉上相似的图像;
上述用户对图像包进行标注是,如果这个包里有超过一半的图像符合的用户查询概念(query concept)则标注为正包,如果包里的图像全都不符合查询概念要求则标注为负包,得到两种标签,其他图像包不标记。
在上述步骤3)中对图像进行排序可采用多示例半监督学习算法,该算法输入为:对聚类进行标注后得到的每个类别的标签;该算法输出为:每幅图像的排序结果,具体包括以下步骤:
31)定义某一点多样性密度(DD)为:用来度量有多少正包在这个点附近有样本,同时有多少负包的样本离这个点比较远;(在图像检索中,具有相同语义概念的正例图像往往在整个空间中的一个子区域内分布比较密集,而负例图像通常分散在整个空间中。因此,高密度区域中的图像通常具有相似的标签,而低密度区域的点则不一定有相似标签);
设标注的正包和负包分别记为L+和L-,L为所有包的集合,有L={L+,L-};则在点x处的多样性密度DD(x,L)定义为
DD ( x , L ) = Pr ( x | L ) = Pr ( L | x ) Pr ( x ) Pr ( L ) ,
进一步简化为
DD ( x , L ) = Pr ( L | x ) = Π i = 1 | L + | Pr ( C i + | x ) Π i = 1 | L - | Pr ( C i - | x ) ,
其中Ci +表示第i个正包,Ci -表示第i个负包;
Pr = max j [ 1 - | y i - p ( x ij , x ) | ] , 如果Ci是正包则yi=1,如果Ci是负包则yi=0。xij是包Ci里的第j个样本,p(xij,x)定义了xij和x表示同一概念;如果DD比较高则说明应该更多地将正包的标签传给这个点,反之亦然。
根据上述估算出的在每一包中的每个点的DD,可以得到xij对其类别Ci的标签所付出的信任度:
m ( C i , x ij ) = DD ( x ij , L ) max x ij ∈ C i DD ( x ij , L )
将一幅图像的标签定义为其对应包的标签的加权,既将包的标签转化为包内每幅图像的标签;
L(xij)=m(Ci,xij)×L(Ci);
32)以前n幅中每幅图像为一个节点,构建一个图;该图上的每条边对应着相应两幅图的底层视觉特征的相似度,所有的相似度构成一个相似度矩阵,矩阵中的每个元素Wij定义为:
Figure A20081010494200061
其中dij表示第i幅图像和第j幅图像的特征之间的欧氏距离;
利用该图将已得到标签的图像的标签扩展为所有检索到的图像的标签(即每一个点根据与其它点的相似度将其标签通过加权的图传给其相邻点,迭代后,这个传播过程可以收敛到一个全局稳定状态,使每一幅图都得到一个实值的标签);
33)将得到的所有图像的标签值从大到小排序,既得到改进后图像检索结果的重排序。本发明方法的一个实施例说明如下:
1)用户首先输入关键词“北京”,由Google Image Search的API返回第一轮图像的检索结果,如图2,是第一轮图像检索结果的前18幅,包括了与“北京”相关的各个方面的图像,例如北京地图、北京的建筑、现代北京的都市风景以及北京人的生活等等。所有的图像是混杂在一起的。
2)将检索到的前1000幅图像按底层特征聚类,将聚类后的图像呈现给用户,如图3,分别表示三种聚类结果的部分图像;包括北京古建筑,如图3(a),北京地图,如图3(b),北京人的生活,如图3(c);用户对这些图像类进行标注,北京古建筑一类为正包;
3)系统按照标注对第一轮检索结果的图像进行排序,并将排序后的新的检索结果呈现给用户,如图4所示,图中表示重排序后的前18幅图像;将“北京古建筑”的相关图像排在比较靠前的位置。

Claims (3)

1、一种网络图像搜索中基于聚类的相关反馈检索方法,其特征在于,包括以下步骤:
1)用户首先输入一个或多个关键词,使用基于关键词的检索工具得到并返回第一轮图像的检索结果;
2)将检索到的前n幅图像按底层特征聚类,将聚类后的图像包呈现给用户;用户对这些图像包进行标注;
3)按照标注对第一轮检索结果的对图像进行排序,并将排序后的新的检索结果呈现给用户。
2、如权利要求1所述方法,其特征在于,所述的聚类是使用图像的底层视觉特征,利用无监督或半监督的学习方法将图像划分成从属于不同语义的若干图像包,每个图像包里面包括一组视觉上相似的图像。
3、如权利要求1所述方法,其特征在于,所述用户对图像包进行标注是,如果这个包里有超过一半的图像符合的用户查询概念则标注为正包,如果包里的图像全都不符合查询概念要求则标注为负包,得到两种标签,其他图像包不标记。
CN2008101049429A 2008-04-25 2008-04-25 网络图像搜索中基于聚类的相关反馈检索方法 Expired - Fee Related CN101271476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101049429A CN101271476B (zh) 2008-04-25 2008-04-25 网络图像搜索中基于聚类的相关反馈检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101049429A CN101271476B (zh) 2008-04-25 2008-04-25 网络图像搜索中基于聚类的相关反馈检索方法

Publications (2)

Publication Number Publication Date
CN101271476A true CN101271476A (zh) 2008-09-24
CN101271476B CN101271476B (zh) 2010-07-21

Family

ID=40005446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101049429A Expired - Fee Related CN101271476B (zh) 2008-04-25 2008-04-25 网络图像搜索中基于聚类的相关反馈检索方法

Country Status (1)

Country Link
CN (1) CN101271476B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853299A (zh) * 2010-05-31 2010-10-06 杭州淘淘搜科技有限公司 一种基于感性认知的图像检索结果排序方法
CN101853272A (zh) * 2010-04-30 2010-10-06 华北电力大学(保定) 基于相关反馈和聚类的搜索引擎技术
CN101963971A (zh) * 2009-07-23 2011-02-02 浦项工科大学校产学协力团 使用相关性反馈进行数据库搜索的方法及相应的储存介质
CN102253996A (zh) * 2011-07-08 2011-11-23 北京航空航天大学 一种多视角阶段式的图像聚类方法
CN102375845A (zh) * 2010-08-19 2012-03-14 腾讯科技(深圳)有限公司 图片搜索方法和系统
WO2012058794A1 (en) * 2010-11-01 2012-05-10 Microsoft Corporation Image search
CN102457530A (zh) * 2010-10-20 2012-05-16 电子科技大学 一种基于聚类的迭代型p2p信誉管理方案
CN102693231A (zh) * 2011-03-23 2012-09-26 百度在线网络技术(北京)有限公司 用于根据来自网络的图像来确定图集的方法、装置和设备
CN102902821A (zh) * 2012-11-01 2013-01-30 北京邮电大学 基于网络热点话题的图像高级语义标注、检索方法及装置
CN103455550A (zh) * 2013-07-26 2013-12-18 百度在线网络技术(北京)有限公司 一种获取具有对比效果的图片搜索结果的方法及装置
CN103793444A (zh) * 2012-11-05 2014-05-14 江苏苏大大数据科技有限公司 用户需求获取方法
CN103870476A (zh) * 2012-12-12 2014-06-18 百度在线网络技术(北京)有限公司 检索方法及设备
CN104268227A (zh) * 2014-09-26 2015-01-07 天津大学 基于逆向k近邻的图像搜索中高质量相关样本自动选取法
CN104751168A (zh) * 2013-12-30 2015-07-01 宏达国际电子股份有限公司 经由主动学习搜索相关图像的方法及电子装置和用户界面
CN101753947B (zh) * 2008-12-08 2016-08-24 北京中星微电子有限公司 一种视频监控录像的点播回放的方法和装置
CN103180846B (zh) * 2010-11-01 2016-12-14 微软技术许可有限责任公司 图像搜索
CN106294394A (zh) * 2015-05-20 2017-01-04 北大方正集团有限公司 数据聚类方法和数据聚类系统
CN107358052A (zh) * 2017-07-18 2017-11-17 广州有宠网络科技股份有限公司 一种对宠物疾病进行人工智能问诊的系统及方法
CN107657269A (zh) * 2017-08-24 2018-02-02 百度在线网络技术(北京)有限公司 一种用于训练图片提纯模型的方法和装置

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101753947B (zh) * 2008-12-08 2016-08-24 北京中星微电子有限公司 一种视频监控录像的点播回放的方法和装置
CN101963971A (zh) * 2009-07-23 2011-02-02 浦项工科大学校产学协力团 使用相关性反馈进行数据库搜索的方法及相应的储存介质
CN101853272A (zh) * 2010-04-30 2010-10-06 华北电力大学(保定) 基于相关反馈和聚类的搜索引擎技术
CN101853272B (zh) * 2010-04-30 2012-07-04 华北电力大学(保定) 基于相关反馈和聚类的搜索引擎技术
CN101853299A (zh) * 2010-05-31 2010-10-06 杭州淘淘搜科技有限公司 一种基于感性认知的图像检索结果排序方法
CN102375845B (zh) * 2010-08-19 2016-01-13 深圳市世纪光速信息技术有限公司 图片搜索方法和系统
CN102375845A (zh) * 2010-08-19 2012-03-14 腾讯科技(深圳)有限公司 图片搜索方法和系统
CN102457530A (zh) * 2010-10-20 2012-05-16 电子科技大学 一种基于聚类的迭代型p2p信誉管理方案
US8750629B2 (en) 2010-11-01 2014-06-10 Microsoft Corporation Method for searching and ranking images clustered based upon similar content
WO2012058794A1 (en) * 2010-11-01 2012-05-10 Microsoft Corporation Image search
CN103180846B (zh) * 2010-11-01 2016-12-14 微软技术许可有限责任公司 图像搜索
CN103180846A (zh) * 2010-11-01 2013-06-26 微软公司 图像搜索
CN102693231A (zh) * 2011-03-23 2012-09-26 百度在线网络技术(北京)有限公司 用于根据来自网络的图像来确定图集的方法、装置和设备
CN102693231B (zh) * 2011-03-23 2019-07-26 百度在线网络技术(北京)有限公司 用于根据来自网络的图像来确定图集的方法、装置和设备
CN102253996A (zh) * 2011-07-08 2011-11-23 北京航空航天大学 一种多视角阶段式的图像聚类方法
CN102902821A (zh) * 2012-11-01 2013-01-30 北京邮电大学 基于网络热点话题的图像高级语义标注、检索方法及装置
CN102902821B (zh) * 2012-11-01 2015-08-12 北京邮电大学 基于网络热点话题的图像高级语义标注、检索方法及装置
CN103793444A (zh) * 2012-11-05 2014-05-14 江苏苏大大数据科技有限公司 用户需求获取方法
CN103793444B (zh) * 2012-11-05 2017-02-08 江苏苏大大数据科技有限公司 用户需求获取方法
CN103870476A (zh) * 2012-12-12 2014-06-18 百度在线网络技术(北京)有限公司 检索方法及设备
CN103455550B (zh) * 2013-07-26 2017-06-06 百度在线网络技术(北京)有限公司 一种获取具有对比效果的图片搜索结果的方法及装置
CN103455550A (zh) * 2013-07-26 2013-12-18 百度在线网络技术(北京)有限公司 一种获取具有对比效果的图片搜索结果的方法及装置
CN104751168A (zh) * 2013-12-30 2015-07-01 宏达国际电子股份有限公司 经由主动学习搜索相关图像的方法及电子装置和用户界面
US10169702B2 (en) 2013-12-30 2019-01-01 Htc Corporation Method for searching relevant images via active learning, electronic device using the same
CN104751168B (zh) * 2013-12-30 2019-09-03 宏达国际电子股份有限公司 经由主动学习搜索相关图像的方法及电子装置和用户界面
CN104268227A (zh) * 2014-09-26 2015-01-07 天津大学 基于逆向k近邻的图像搜索中高质量相关样本自动选取法
CN104268227B (zh) * 2014-09-26 2017-10-10 天津大学 基于逆向k近邻的图像搜索中高质量相关样本自动选取法
CN106294394A (zh) * 2015-05-20 2017-01-04 北大方正集团有限公司 数据聚类方法和数据聚类系统
CN106294394B (zh) * 2015-05-20 2019-10-15 北大方正集团有限公司 数据聚类方法和数据聚类系统
CN107358052A (zh) * 2017-07-18 2017-11-17 广州有宠网络科技股份有限公司 一种对宠物疾病进行人工智能问诊的系统及方法
CN107657269A (zh) * 2017-08-24 2018-02-02 百度在线网络技术(北京)有限公司 一种用于训练图片提纯模型的方法和装置

Also Published As

Publication number Publication date
CN101271476B (zh) 2010-07-21

Similar Documents

Publication Publication Date Title
CN101271476B (zh) 网络图像搜索中基于聚类的相关反馈检索方法
Pan et al. Gcap: Graph-based automatic image captioning
Chang Mining the World Wide Web: an information search approach
Wang et al. Annotating images by mining image search results
Lu et al. Tag-based image search by social re-ranking
Wang et al. Arista-image search to annotation on billions of web photos
Hsu et al. Reranking methods for visual search
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
Li et al. Mlrank: Multi-correlation learning to rank for image annotation
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
Qian et al. Image re-ranking based on topic diversity
Li et al. Statistical correlation analysis in image retrieval
Mei et al. Coherent image annotation by learning semantic distance
CN109657116A (zh) 一种舆情搜索方法、搜索装置、存储介质和终端设备
Song et al. A sparse gaussian processes classification framework for fast tag suggestions
CN103853797B (zh) 一种基于n元图片索引结构的图片检索方法与系统
Aslandogan et al. Evaluating strategies and systems for content based indexing of person images on the Web
Ke et al. Real web community based automatic image annotation
Budíková et al. DISA at ImageCLEF 2014: The Search-based Solution for Scalable Image Annotation.
Bouhlel et al. Hypergraph learning with collaborative representation for image search reranking
Xu et al. Multi-feature indexing for image retrieval based on hypergraph
Myoupo et al. Multimodal image retrieval over a large database
Bhosle et al. Random forest based long-term learning for content based image retrieval
Sun et al. Localized generalization error based active learning for image annotation
He et al. Pseudo relevance feedback based on iterative probabilistic one-class SVMs in web image retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100721

Termination date: 20150425

EXPY Termination of patent right or utility model