CN104268227B - 基于逆向k近邻的图像搜索中高质量相关样本自动选取法 - Google Patents

基于逆向k近邻的图像搜索中高质量相关样本自动选取法 Download PDF

Info

Publication number
CN104268227B
CN104268227B CN201410503500.7A CN201410503500A CN104268227B CN 104268227 B CN104268227 B CN 104268227B CN 201410503500 A CN201410503500 A CN 201410503500A CN 104268227 B CN104268227 B CN 104268227B
Authority
CN
China
Prior art keywords
correlated samples
sample
correlated
samples
reverse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410503500.7A
Other languages
English (en)
Other versions
CN104268227A (zh
Inventor
冀中
于云龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201410503500.7A priority Critical patent/CN104268227B/zh
Publication of CN104268227A publication Critical patent/CN104268227A/zh
Application granted granted Critical
Publication of CN104268227B publication Critical patent/CN104268227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于逆向k近邻的图像搜索中高质量相关样本自动选取方法:在搜索引擎中输入查询关键词,得到初始的基于文本的搜索结果;从初始的排序结果中标注相关样本,取出初始排序结果中排在前N幅图像样本作为待选样本集,其中N是大于1的整数;利用逆向k近邻方法从待选样本集中挑选出与所有已挑出的相关样本都相似的样本作为相关样本;利用所挑选的相关样本和学习得到的相关样本建立训练排序模型;利用所建立的训练排序模型对初始排序结果进行重排序。本发明对传统的重排序中相关反馈技术进行改进,提出了逆向k近邻方法,本发明只需要一次反馈,而且此反馈只需标注一个相关样本,就能自动找到足够多的高质量伪相关样本,不仅简单实用,还保证了重排序技术的性能。

Description

基于逆向k近邻的图像搜索中高质量相关样本自动选取法
技术领域
本发明涉及一种在多媒体信息检索中自动选取高质量相关数据的方法。特别是涉及一种基于逆向k近邻的图像搜索中高质量相关样本自动选取法。
背景技术
目前,借助于文本搜索中的成熟技术,常用的商业搜索引擎已经能较好地解决海量文本的搜索问题。目前的视频和图像搜索技术主要也是通过索引和搜索其相关的文本信息,但是,“一幅图像胜过千言万语”,有限的文本信息不足以全面充分地描述图像丰富的视觉内容,因此基于文本的搜索结果往往不尽如人意,在搜索引擎返回的结果中,一些不相关或者相关度低的图像经常被排在搜索结果的前几位,图像和其文本信息之间的误匹配会造成一些不相关的图像错误地被返回;由于仅依赖于文本信息无法区分图像的相关程度,所以一些相关性较低的图像被返回给用户。为了解决基于文本的视频和图像搜索存在的缺点,一个可能的解决办法是基于内容的图像检索,该方法完全不用文本描述信息,只依赖于图像视觉信息,比如颜色,纹理,边缘等。该方法的缺点是要求用户提供图像样本实例,在web图像搜索中,用户更趋向于用关键字来进行搜索,而且通常情况下图像样本实例很难获得。
综上所述,针对文本和基于内容的搜索排序技术各有优缺点,如何解决他们各自存在的问题并利用他们各自的优点是重排序技术面临的一个挑战,目前一个成功的解决方案是先用基于文本的搜索方法快速从大规模的数据库中返回一个初始的查询结果,然后在初始查询结果的数据集上(规模小很多)充分利用图像的内容信息来重新排序得到一个更好的结果,该方法称作视觉搜索重排序技术,即:利用视觉信息改进初始查询结果的过程。
搜索重排序技术的性能与提供的训练样本的个数及质量有关。在训练排序模型时,相关样本的数目越多、质量越高,系统能够得到的用户查询意图信息就越丰富,重排序的性能就越好。反之重排序的效果就不尽如人意。这就是所谓的搜索系统和用户之间存在的“意图鸿沟”(Intent Gap)。常用的解决方法是引入相关反馈(Relevance Feedback),以明确用户的特定搜索意图,返回用户需求的结果。
当前利用反馈技术进行重排序的方法大体分为三种:(1)显式的相关反馈技术:从初始的查询结果中手动地挑选出一些相关样本,这种方法通过与用户的交互来提高重排序的性能,具有一定局限性,例如Culetal等提出了IntentSearch模型,该模型允许用户从初始的搜索结果中挑选一幅图像作为正例,然后通过计算其它图像与这幅图像的相似性进行重排序,但是由于语义鸿沟的存在,很多情况下很难用一幅图像完整表达用户的搜索意图,尤其在搜索意图比较复杂的情况下。Tian等提出了主动重排序,该方法通过与用户交互不断地学习用户的真实搜索意图。(2)隐式的相关反馈技术:与显式的反馈相比,隐式的反馈技术不需要和用户进行交互,但容易受噪声的干扰。如Liu等提出了伪相关反馈模型,该模型基于初始的排序结果的前N幅图像是相关的这一假设,选取出前N幅图像样本建立模型,重新进行排序。这种方法简单,并且不需要和用户进行交互,但因为噪声的影响,效果并不是很理想。(3)点击数据:通过用户点击(Click-through)数据进行重排序的方法得到广泛关注,如Hua等利用用户的点击次数来缩小语义和意图之间的“意图鸿沟”,这种方法认为用户点击图像的次数为用户感兴趣的图像,也就是相关样本。如果一幅图像点击次数越多,就认为这幅图像与用户的查询意图越接近。但现实中,用户的点击次数的信息并不容易获得。
传统的伪相关反馈是基于初始的排序结果的前N幅图像都是相关的这一假设,选取出前N幅图像样本建立模型,重新进行排序。但初始排序结果的前N幅图像中有很多噪声,即有不相关样本的存在,受噪声的干扰,重排序的性能会受很大的影响。
发明内容
本发明所要解决的技术问题是,提供一种基于逆向k近邻的图像搜索中高质量相关样本自动选取法,只需要一次反馈,而且该次反馈只需标注一个相关样本,就可以自动找到足够多的高质量伪相关样本,不仅简单实用,还保证了重排序技术的性能。
本发明所采用的技术方案是:一种基于逆向k近邻的图像搜索中高质量相关样本自动选取方法,包括如下步骤:
1)在搜索引擎中输入查询关键词,得到初始的基于文本的搜索结果;
2)从初始的排序结果中标注相关样本,取出初始排序结果中排在前N幅图像样本作为待选样本集,其中N是大于1的整数;
3)利用逆向k近邻方法从待选样本集中挑选出与所有已挑出的相关样本都相似的样本作为相关样本;
4)利用所挑选的相关样本和学习得到的相关样本建立训练排序模型;
5)利用所建立的训练排序模型对初始排序结果进行重排序。
步骤3)所述的逆向k近邻方法包括如下步骤:
(1)样本初始化:从利用文本查询的方式排序得到的初始结果中标注一个相关样本放入相关样本集合V,将初始排序结果中排在前面的N幅图片样本构成的待选样本集合用U表示,计算前N幅图像的协方差矩阵S,计算所述标注相关样本的均值μ;
(2)进行迭代:从待选样本集合U中逐一计算与标注相关样本的相似度,将与标注相关样本相似度最高的样本x从待选样本集合U中取出并放入到相关样本集合V中,然后更新待选样本集合U及相关样本集合V;
(3)收敛:将相关样本集合V中的样本进行密度估计,估计出相关样本集合V总体的概率密度函数,计算相关样本集合V中每个样本的相对密度,设定使相关样本集合上的错误率最小的相对密度阈值θ,当相关样本集合V中的一个样本的相对密度低于阈值θ时停止迭代,最终确定相关样本集合中的样本个数,否则继续返回步骤(2)进行迭代。
步骤(2)是采用欧式距离或测地线距离或马氏距离从待选样本集合U中得到一个与标注相关样本相似度最高的样本x。
本发明的基于逆向k近邻的图像搜索中高质量相关样本自动选取方法,针对重排序问题中高质量的相关样本很难自动获得的问题,利用初始排序结果的图像中相关样本之间相似度高,相关样本和不相关样本之间相似度低的先验假设,对传统的重排序中相关反馈技术进行了重大改进,提出了逆向k近邻方法,该方法只需要一次反馈,而且该次反馈只需标注一个相关样本,就可以自动找到足够多的高质量伪相关样本,不仅简单实用,还保证了重排序技术的性能。本发明具有如下特点:
1、本发明充分利用初始排序结果的前N幅图像的相关性,并在此基础上通过学习挑选得到偏离总体样本最小的样本图像作为伪相关样本。
2、本发明比伪相关反馈的方式和不加相关反馈的重排序方法更加有效,能够在少量的监督相关样本下提高重排序的性能,因此与伪相关反馈方法相比,本发明更适合于重排序问题。
3、本发明只需要用户提供一次点击,非常实用。因为现在的搜索引擎中常采用的查询扩展等功能也会请用户提供一次点击。而且本发明简单可行,可以用于多媒体检索的视觉搜索重排序以及与分类问题相关的领域。
附图说明
图1是本发明基于逆向k近邻的图像搜索中高质量相关样本自动选取法的流程图;
图2是本发明自动选取高质量相关样本的流程图。
具体实施方式
下面结合实施例和附图对本发明的基于逆向k近邻的图像搜索中高质量相关样本自动选取法做出详细说明。
本发明的基于逆向k近邻的图像搜索中高质量相关样本自动选取法,基于利用文本排序的初始结果的前N幅图片是相关的以及相关样本之间的相似度比相关样本与不相关样本之间的相似度高的假设,提出了基于逆向k近邻的图像搜索中高质量相关样本自动选取方法。与k近邻方法相比,本发明不是从一个样本选取与离此样本最近的k个样本,而是从待选样本中挑选出一个离k个已知样本最近的样本,所以称作逆向k近邻方法。本发明只需要用户选择一个相关样本的显示反馈方式。从初始的排序结果的前N幅图像中选取m幅伪相关样本,在尽可能选取多个相关样本的基础上,减少噪声对重排序性能的影响,这种方法更加适合用于重排序学习,实现了在给与很少相关样本的情况下,从初始排序的结果中尽可能的学习到多个高质量的相关样本的设计,从而达到提升重排序性能的目的。与伪相关反馈的方式相比,本发明通过利用所有的相关样本挑选得到高质量的伪相关样本,减少了噪声对性能的影响。
如图1所示,本发明的基于逆向k近邻的图像搜索中高质量相关样本自动选取方法,包括如下步骤:
1)首先在搜索引擎中输入查询关键词,得到初始的基于文本的搜索结果;
2)从初始的排序结果中标注相关样本,取出初始排序结果中排在前N幅图像样本作为待选样本集,其中N是大于1的整数;
3)利用逆向k近邻方法从待选样本集中挑选出与所有已挑出的相关样本都相似的样本作为相关样本,所述的逆向k近邻方法如图2所示,包括如下步骤:
(1)样本初始化:从利用文本查询的方式排序得到的初始结果中标注一个相关样本放入相关样本集合V,将由排在前面的N幅图片样本构成的待选样本集合用U表示,计算前N幅图像的协方差矩阵S,计算所述标注相关样本的均值μ;
(2)进行迭代:从待选样本集合U中逐一计算与标注相关样本的相似度,将与标注相关样本相似度最高的样本x从待选样本集合U中取出并放入到相关样本集合V中,然后更新待选样本集合U及相关样本集合V;
该步骤可以采用欧式距离或测地线距离或马氏距离等从待选样本集合U中得到一个与标注相关样本相似度最高的样本x。
本发明采用马氏距离的公式:
取f(xk)=minf(x),将样本xk从待选样本集合U中选出作为相关样本放入相关样本集合V中,然后更新待选样本集合U、相关样本集合V。计算相关样本集合中图像样本的均值μ:
其中m为更新后相关样本集合中样本的数目,xi为相关样本集合中的样本,然后重复此迭代过程。
所选取的xk是待选样本集合U中离所有的相关样本最近的样本,传统的k近邻方法是选取离一个样本最近的k个样本,而本方法中是利用已知的m个样本,选取一个离这m个样本最近的某一样本,是k近邻方法的逆过程。
(3)收敛:将相关样本集合V中的样本进行密度估计,估计出相关样本集合V总体的概率密度函数,计算相关样本集合V中每个样本的相对密度,设定使相关样本集合上的错误率最小的相对密度阈值θ,当相关样本集合V中的一个样本的相对密度低于阈值θ时停止迭代,最终确定相关样本集合中的样本个数,否则继续返回步骤(2)进行迭代。
4)利用所挑选的相关样本和学习得到的相关样本建立训练排序模型;
5)利用所建立的训练排序模型对初始排序结果进行重排序。

Claims (2)

1.一种基于逆向k近邻的图像搜索中高质量相关样本自动选取方法,其特征在于,包括如下步骤:
1)在搜索引擎中输入查询关键词,得到初始的基于文本的搜索结果;
2)从初始的排序结果中标注相关样本,取出初始排序结果中排在前N幅图像样本作为待选样本集,其中N是大于1的整数;
3)利用逆向k近邻方法从待选样本集中挑选出与所有已挑出的相关样本都相似的样本作为相关样本;
所述的逆向k近邻方法包括如下步骤:
(1)样本初始化:从利用文本查询的方式排序得到的初始结果中标注一个相关样本放入相关样本集合V,将初始排序结果中排在前面的N幅图片样本构成的待选样本集合用U表示,计算前N幅图像的协方差矩阵S,计算所述标注相关样本的均值µ
(2)进行迭代:从待选样本集合U中逐一计算与标注相关样本的相似度,将与标注相关样本相似度最高的样本x从待选样本集合U中取出并放入到相关样本集合V中,然后更新待选样本集合U及相关样本集合V
(3)收敛:将相关样本集合V中的样本进行密度估计,估计出相关样本集合V总体的概率密度函数,计算相关样本集合V中每个样本的相对密度,设定使相关样本集合上的错误率最小的相对密度阈值θ,当相关样本集合V中的一个样本的相对密度低于阈值θ时停止迭代,最终确定相关样本集合中的样本个数,否则继续返回步骤(2)进行迭代;
4)利用所挑选的相关样本和学习得到的相关样本建立训练排序模型;
5)利用所建立的训练排序模型对初始排序结果进行重排序。
2.根据权利要求1所述的基于逆向k近邻的图像搜索中高质量相关样本自动选取方法,其特征在于,步骤(2)是采用欧式距离或测地线距离或马氏距离从待选样本集合U中得到一个与标注相关样本相似度最高的样本x。
CN201410503500.7A 2014-09-26 2014-09-26 基于逆向k近邻的图像搜索中高质量相关样本自动选取法 Active CN104268227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410503500.7A CN104268227B (zh) 2014-09-26 2014-09-26 基于逆向k近邻的图像搜索中高质量相关样本自动选取法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410503500.7A CN104268227B (zh) 2014-09-26 2014-09-26 基于逆向k近邻的图像搜索中高质量相关样本自动选取法

Publications (2)

Publication Number Publication Date
CN104268227A CN104268227A (zh) 2015-01-07
CN104268227B true CN104268227B (zh) 2017-10-10

Family

ID=52159749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410503500.7A Active CN104268227B (zh) 2014-09-26 2014-09-26 基于逆向k近邻的图像搜索中高质量相关样本自动选取法

Country Status (1)

Country Link
CN (1) CN104268227B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203511B (zh) * 2016-06-12 2019-09-10 湘潭大学 一种图像相似块评估方法
CN106951925B (zh) * 2017-03-27 2021-04-30 成都晓多科技有限公司 数据处理方法、装置、服务器及系统
CN112800259B (zh) * 2021-04-07 2021-06-29 武汉市真意境文化科技有限公司 一种基于边缘闭合与共性检测的图像生成方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271476A (zh) * 2008-04-25 2008-09-24 清华大学 网络图像搜索中基于聚类的相关反馈检索方法
CN102144231A (zh) * 2008-06-16 2011-08-03 微软公司 用于基于文本的图像搜索结果重新排序的自适应视觉相似性
CN102629279A (zh) * 2012-03-23 2012-08-08 天津大学 一种用于图像或视频搜索重排序的方法
CN102750347A (zh) * 2012-06-08 2012-10-24 天津大学 一种用于图像或视频搜索重排序的方法
CN102750385A (zh) * 2012-06-29 2012-10-24 南京邮电大学 基于标签检索的相关性—质量排序图像检索方法
CN103049570A (zh) * 2012-12-31 2013-04-17 天津大学 基于相关保持映射和一分类器的图像视频搜索排序方法
CN103198117A (zh) * 2013-03-29 2013-07-10 天津大学 基于内容的图像伪相关重排序方法
CN103678412A (zh) * 2012-09-21 2014-03-26 北京大学 一种文档检索的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610194B2 (en) * 2002-07-18 2009-10-27 Tegic Communications, Inc. Dynamic database reordering system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271476A (zh) * 2008-04-25 2008-09-24 清华大学 网络图像搜索中基于聚类的相关反馈检索方法
CN102144231A (zh) * 2008-06-16 2011-08-03 微软公司 用于基于文本的图像搜索结果重新排序的自适应视觉相似性
CN102629279A (zh) * 2012-03-23 2012-08-08 天津大学 一种用于图像或视频搜索重排序的方法
CN102750347A (zh) * 2012-06-08 2012-10-24 天津大学 一种用于图像或视频搜索重排序的方法
CN102750385A (zh) * 2012-06-29 2012-10-24 南京邮电大学 基于标签检索的相关性—质量排序图像检索方法
CN103678412A (zh) * 2012-09-21 2014-03-26 北京大学 一种文档检索的方法及装置
CN103049570A (zh) * 2012-12-31 2013-04-17 天津大学 基于相关保持映射和一分类器的图像视频搜索排序方法
CN103198117A (zh) * 2013-03-29 2013-07-10 天津大学 基于内容的图像伪相关重排序方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"图像搜索重排序关键技术研究";井佩光;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140815(第8期);摘要、正文第21-22页 *

Also Published As

Publication number Publication date
CN104268227A (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
US10153001B2 (en) Video skimming methods and systems
CN102334118B (zh) 基于用户兴趣学习的个性化广告推送方法与系统
AU2010322173B2 (en) Automatically mining person models of celebrities for visual search applications
CN106096066A (zh) 基于随机近邻嵌入的文本聚类方法
WO2014085776A2 (en) Web search ranking
CN110837578B (zh) 一种基于图卷积网络的视频片段推荐方法
JP2001155169A (ja) ビデオ画像の分割、分類、および要約のための方法およびシステム
CN105389590B (zh) 一种视频聚类推荐方法和装置
Weyand et al. Visual landmark recognition from internet photo collections: A large-scale evaluation
CN106294418B (zh) 检索方法和检索系统
JP2014503095A (ja) 映像を比較する方法および装置
CN103793721A (zh) 一种基于区域相关反馈的行人重识别方法及系统
CN107563406B (zh) 一种自主学习的图像精细分类方法
CN104079926B (zh) 一种远程桌面软件的视频性能测试方法
CN104268227B (zh) 基于逆向k近邻的图像搜索中高质量相关样本自动选取法
JP2018509664A (ja) モデル生成方法、単語重み付け方法、装置、デバイス及びコンピュータ記憶媒体
CN103430175A (zh) 用于对视频进行比较的方法和装置
CN101872415A (zh) 适用于iptv的视频拷贝检测方法
Wang et al. Aspect-ratio-preserving multi-patch image aesthetics score prediction
CN102708572A (zh) 更新场景模型的方法和系统、使用该方法的照相机系统
CN102855245A (zh) 一种用于确定图片相似度的方法与设备
CN112232134A (zh) 一种基于沙漏网络结合注意力机制的人体姿态估计方法
CN111126262A (zh) 基于图神经网络的视频精彩片段检测方法及装置
Lin et al. Hypergraph optimization for multi-structural geometric model fitting
CN103699612B (zh) 一种图像检索排序的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant