CN103049570A - 基于相关保持映射和一分类器的图像视频搜索排序方法 - Google Patents
基于相关保持映射和一分类器的图像视频搜索排序方法 Download PDFInfo
- Publication number
- CN103049570A CN103049570A CN2012105948571A CN201210594857A CN103049570A CN 103049570 A CN103049570 A CN 103049570A CN 2012105948571 A CN2012105948571 A CN 2012105948571A CN 201210594857 A CN201210594857 A CN 201210594857A CN 103049570 A CN103049570 A CN 103049570A
- Authority
- CN
- China
- Prior art keywords
- sample
- samples
- inquiry
- dimensionality reduction
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于相关保持映射和一分类器的图像视频搜索排序方法,通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本,组成训练样本集合;利用所述训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型;利用所述维数约简模型对所有样本及训练样本集合进行变换,得到维数约简后的所有样本新特征矩阵及训练样本新特征矩阵利用所述训练样本新特征矩阵中与查询最相关的样本作为基于一分类器的排序学习模型的输入,训练得到排序模型f(t);将所述所有样本新特征矩阵中的任意一个样本ti作为所述排序模型f(t)的输入,由大到小排列输出所有样本排序后的结果。提高了检索性能,减少了用户标注负担,提升了用户搜索体验。
Description
技术领域
本发明涉及面向多媒体信息检索领域,特别涉及基于相关保持映射和一分类器的图像视频搜索排序方法。
背景技术
随着网络上图像、视频等资源的日益丰富,从海量数据中快速准确地获取用户所需的信息已经越来越重要。基于内容的图像或视频检索是指通过对图像或视频内容进行分析提取图像或视频的视觉特征,从特定数据库或网络中查找到具有指定特征或含有特定内容的图像或视频。但由于基于内容的图像或视频检索方法存在着计算量大,计算复杂度高,占用更多的存储空间等不足,因此很难在网络检索中获得实质应用。图像或视频搜索排序技术是利用视觉信息改进初始查询结果的过程,可以很好的解决上述问题。
图像或视频搜索排序应用中存在着大量排序信息。排序信息包括数据的相关性等级信息、数据的优先级关系信息以及建立其之上的关系对、关系序列等信息。利用标注信息进行图像或视频排序是目前主要的方法之一,标注信息的获取可以通过相关反馈、伪相关反馈和隐相关反馈等途径。其中,相关性等级信息广泛应用于信息检索中的模型训练中。在大多数情况下,根据与查询的相关性的高低手动地或自动地对每个文档进行不同相关性等级的标注,例如“非常相关”、“一般相关”和“不相关”等。
样本的相关性等级信息不同于传统的类标号信息,前者是在信息检索中用来衡量文档与查询之间相关程度的度量,后者指的是机器学习与模式识别领域中一类事物所共同具有的属性。例如在传统的模式分类任务中,同一类的事物会具有共同的特征,不同类的事物具有不同的特征。然而,在排序应用中,由于样本按照与查询相关的程度分为不同的相关性等级,这样即使不同相关性等级的样本之间,也可能由于与查询相关而存在不同程度的相关性,此外具有相同的相关性等级样本之间,由于相关性等级的不同也会具有不同程度的相关性或者不具有相关性。因此并不能直接将样本的相关性等级信息作为样本的类别标号信息对样本进行处理。
发明人在实现本发明的过程中,发现现有图像/视频的搜索排序技术中存在以下问题:
图像或视频搜索排序中需要对图像或视频提取视觉特征,视觉特征具有高维特性。样本的类别标号不等同于样本的相关性等级信息,传统的维数约简算法往往是针对分类任务提出的,而分类任务与排序任务并不相同,因此直接应用于图像或视频搜索排序中并不合理。
图像或视频搜索排序中的样本数据与查询主题存在着不同程度的相关性,样本数据之间也存在着不同程度的相关性,而数据之间的这种复杂关系用超球体分布的形式可以很好的描述。超球体内是与查询最相关的样本,靠近球体的位置是与查询一般相关的样本,最外面则是与查询不相关的样本。一方面,目前并没有能解决这种数据分布的维数约简方法。另一方面,传统的图像或视频的搜索排序方法设计中并没有考虑到数据呈现超球形分布这一特点。不同于传统的一分器SVDD(Support Vector Data Description),SVDD是利用核变换的思想将样本映射到高维空间里,认为其在未知的高维空间中目标样本是具有超球体分布。因为核变换具有不可控性及未知性,在实际中很难操作。
发明内容
本发明提供了基于相关保持映射和一分类器的图像视频搜索排序方法,本发明减少了用户标注负担,提高了检索性能,提升用户的搜索体验,详见下文描述:
基于相关保持映射和一分类器的图像视频搜索排序方法,所述方法包括以下步骤:
(1)通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本,组成训练样本集合;
(2)利用所述训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型;
在步骤(1)之前所述本方法还包括:
1)获取图像或视频数据;2)对所述基于文本的搜索结果提取视觉特征获取所有样本的特征向量集合。
所述利用所述训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型具体包括:
1)假设存在变换向量w∈RD,对训练样本集合中任意一个样本xi,使得变换后的新样本为yi=wTxi(1≤i≤r+h);
3)定义约束条件,并通过所述约束条件构造目标函数;
4)通过对所述目标函数的求解获取所述维数约简模型。
所述约束条件具体为:
构造最相关样本与中心向量的距离度量SR,所述距离度量SR越小越好,SR定义如下:
构造最相关样本的局部保持度量SP,所述局部保持度量SP越小越好定义如下:
构造不相关样本与中心向量的距离度量SU,即所述距离度量SU越大越好,SU定义如下:
2)通过拉格朗日求解所述目标函数Re(w),得到排序模型f(t)。
本发明提供的技术方案的有益效果是:本发明通过维数约简模型获取到排序模型f(t),将所有样本新特征矩阵中的任意一个样本ti作为排序模型f(t)的输入,由大到小排列输出所有样本排序后的结果,其优势主要体现在:
(1)新颖性:①提出从超球体的角度描述图像或视频搜索排序中的样本数据之间的关系,认为样本数据的本征特征向量分布规律呈现超球体分布。②针对上述假设设计了基于相关保持映射的维数约简方法,该方法仅利用与查询最相关及不相关的样本进行学习。③对传统的一分类器SVDD分析加以改进并将其与排序问题结合起来,使之适用于数据分布呈超球体分布的多媒体排序问题。④与传统的图像或视频搜索排序相比较,传统的排序需要对每个相关性等级进行标注,仅需要用户标注少量的相关性等级最高的样本与最低的样本。
(2)有效性:本方法与基于一分类器的排序学习方法都仅仅利用标注的样本计算,复杂度低,运算速度快。大量的实验表明,在排序的实验中所提方法利用少量的标注样本就能显著提高检索性能,增强用户的体验。
(3)实用性:本方法仅仅利用有限的标注样本进行学习,是一种典型的监督型的学习方法,具有简单有效的特点,可以用在多媒体检索领域的基于内容的检索、视觉搜索重排序、个性化推荐等与排序相关的领域。
附图说明
图1为本发明提供的超球体的示意图;
图2为本发明提供的维数约减的示意图;
图3为本发明提供的基于相关保持映射和一分类器的图像视频搜索排序方法的流程图;
图4为本发明提供的基于相关保持映射和一分类器的图像视频搜索排序方法的另一流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
为了减少用户标注负担,提高检索性能,提升用户的搜索体验,本发明实施例提供了基于相关保持映射和一分类器的图像视频搜索排序方法,参见图1、图2、图3和图4,详见下文描述:
101:通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本,组成训练样本集合;
图像样本集合按照与查询主题(例如:给定的查询q)相关性的程度划分为不同的相关性等级。由图像样本集合组成样本特征矩阵其中,p表示样本个数,D表示样本的特征维数。从图像样本集合中人工标注或自动标注若干个与查询最相关的样本及与查询不相关的样本组成标注样本特征矩阵其中,x1,…,xr表示与查询最相关的样本,共有r个样本,xr+1,…,xr+h为与查询不相关的样本,共h个,xi表示第i个样本。
其中,在步骤101之前本方法还包括以下步骤:
1)获取图像或视频数据。图像或视频数据可以有多种获取途径,例如可以是已有的数据集合,也可以是通过在搜索引擎中输入查询关键词而获得的搜索结果集合。
2)对基于文本的搜索结果提取视觉特征获取所有样本的特征向量集合。
其中,视觉特征特征包括:颜色特征、纹理特征和边缘特征等。
102:利用训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型;
其中,该步骤具体包括:
1)假设存在变换向量w∈RD,对训练样本集合中任意一个样本xi,使得变换后的新样本为yi=wTxi(1≤i≤r+h);
3)定义约束条件,并通过约束条件构造目标函数;
新样本满足如下3个条件,使所有样本在新空间中具有或近似超球形分布。
1°构造最相关样本与中心向量的距离度量SR,即距离度量SR越小越好,SR定义如下:
2°构造最相关样本的局部保持度量SP,与查询最相关的样本彼此之间应保持视觉上的一致性,即局部保持度量SP越小越好定义如下:
3°构造不相关样本与中心向量的距离度量SU,即距离度量SU越大越好,SU定义如下:
因此目标函数J(w)定义如下:
s.t.wTw=1
对上述目标函数J(w)可化简为:
s.t.wTw=1
其中,L的定义如下:L=W-M,W=[wij](r+h)×(r+h),
M为对角矩阵,其中的对角元素
4)通过对目标函数的求解获取维数约简模型。
上述目标函数J(w)的最优解可以通过如下表达式求解得到,XLXTwi=λiwi,其中λi为XLXT的第i个最大的特征值,wi为特征值λi对应的特征向量。设由前d个最大的特征值对应的特征向量组成的变换矩阵W=[w1,…,wd]∈Rn×d,R代表实数。
经变换后得到的新样本中,认为与查询相关的样本都位于超球体内,因此将其作为目标样本为内点,而与查询不相关的样本则认为是外点,分布在超球体外。离球心的距离越近则表示样本与查询的相关程度越高,离球心的距离越远则表示样本与查询的相关程度越低。经典的SVDD是用于分类任务中解决数据呈现超球形分布的机器学习方法,其优势在于仅利用内点训练即可获得分类模型,本方法对经典SVDD进行改进将其应用到排序任务中。
s.t.||li-o||2≤H2+ξi
ξi≥0,i=1,…,r
其中,o为超球体球心,H为超球体半径,ξi为松弛因子,C为惩罚因子,C的取值预先设定。
2)通过拉格朗日求解目标函数Re(w),得到排序模型f(t)。
将拉格朗日乘子αi≥0,βi≥0(i=1,…,r)分别乘以约束项,得到目标函数Re(w)的拉格朗日表达式如下:
经化简可以得到目标函数的对偶形式:
0≤αi≤C,i=1,…,r
至此,对于一个新的样本t,经过维数约简后得到新特征WTt,最终的排序分数可由如下公式计算得到:
f(t)=H2-||WTt-o||2
=H2-tTWWTt+2tTWo-oTo
下面以一个具体的面向图像搜索重排序的实验来验证本发明实施例提供的基于相关保持映射和一分类器的图像视频搜索排序方法的可行性,详见下文描述:
实验采用微软的MSRA-MM1.0图像数据库包含68个查询,共65443幅图片。每个查询所对应的图像按照初始的文本搜索结果的顺序进行排列,查询的类别涉及物体、人物、事件和环境等。由于初始的搜索结果中位置越靠后与查询相关的图像的数目越少,因此仅使用每个查询的前500幅图片进行重排序实验。实验中,选取数据库提供的颜色矩特征(225维)、颜色相关图特征(144维)、小波纹理特征(128维)、边缘特征(75维)、HSV颜色直方图特征(64维)、RGB颜色直方图(256维)以及人脸特征(7维)共899维作为图像样本的特征向量。在每个查询中,为每个相关性等级各标注5个图像样本,组成该查询的标注图像样本集合。在每个查询中,标注5个与查询最相关的样本,9个与查询不相关的样本,组成该查询的训练样本集合。实验的结果采用通用准则NDCGK衡量前K幅图像的排序性能,K表示图像的深度。分别对不同的组合方式测试性能,对68个查询的排序性能取平均得到的实验结果如下:
其中,Baseline是指初始的排序结果,S1是基于超球体数据分布的局部保持维数约简方法,S2是指基于一分类器的排序学习方法。S1+RankSVM是指利用维数约简方法S1再结合经典的排序学习方法Ranking SVM得出的重排序性能。不降维+S2指数据不经过降维处理直接利用排序学习方法S2进行重排序的性能。S1+S2是指重排序性能,通过对比实验可以看出,本方法中所提出的S1与S2的结合可以取得最好的重排序效果。而S2是用于解决超球体分布的学习方法,因此数据经过S1降维处理后确实呈现超球体分布。与初始的排序结果Baseline相对较可以看出,本方法确实可以大幅度的提高检索性能,增强用户体验。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.基于相关保持映射和一分类器的图像视频搜索排序方法,其特征在于,所述方法包括以下步骤:
(1)通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本,组成训练样本集合;
(2)利用所述训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型;
2.根据权利要求1所述的基于相关保持映射和一分类器的图像视频搜索排序方法,其特征在于,在步骤(1)之前所述本方法还包括:
1)获取图像或视频数据;2)对所述基于文本的搜索结果提取视觉特征获取所有样本的特征向量集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210594857.1A CN103049570B (zh) | 2012-12-31 | 2012-12-31 | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210594857.1A CN103049570B (zh) | 2012-12-31 | 2012-12-31 | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103049570A true CN103049570A (zh) | 2013-04-17 |
CN103049570B CN103049570B (zh) | 2015-12-02 |
Family
ID=48062210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210594857.1A Expired - Fee Related CN103049570B (zh) | 2012-12-31 | 2012-12-31 | 基于相关保持映射和一分类器的图像视频搜索排序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103049570B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268227A (zh) * | 2014-09-26 | 2015-01-07 | 天津大学 | 基于逆向k近邻的图像搜索中高质量相关样本自动选取法 |
RU2549525C2 (ru) * | 2013-07-15 | 2015-04-27 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Юго-Западный государственный университет" (ЮЗ ГУ) | Способ и устройство поиска составного образца в последовательности |
CN110321952A (zh) * | 2019-07-02 | 2019-10-11 | 腾讯医疗健康(深圳)有限公司 | 一种图像分类模型的训练方法及相关设备 |
CN112650870A (zh) * | 2020-12-30 | 2021-04-13 | 北京天广汇通科技有限公司 | 一种训练图片排序模型的方法、图片排序的方法以及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5805733A (en) * | 1994-12-12 | 1998-09-08 | Apple Computer, Inc. | Method and system for detecting scenes and summarizing video sequences |
US20050071329A1 (en) * | 2001-08-20 | 2005-03-31 | Microsoft Corporation | System and methods for providing adaptive media property classification |
CN101021852A (zh) * | 2006-10-10 | 2007-08-22 | 鲍东山 | 基于内容的视频搜索调度系统 |
CN101071439A (zh) * | 2007-05-24 | 2007-11-14 | 北京交通大学 | 一种基于多视角的交互式视频搜索方法 |
CN101634996A (zh) * | 2009-08-13 | 2010-01-27 | 浙江大学 | 基于综合考量的个性化视频排序方法 |
CN101826119A (zh) * | 2009-08-24 | 2010-09-08 | 张艳红 | 基于排序仿真技术的视频搜索引擎 |
CN102033937A (zh) * | 2010-12-20 | 2011-04-27 | 百度在线网络技术(北京)有限公司 | 视频搜索结果的展示方法及其系统 |
CN102629279A (zh) * | 2012-03-23 | 2012-08-08 | 天津大学 | 一种用于图像或视频搜索重排序的方法 |
CN102750347A (zh) * | 2012-06-08 | 2012-10-24 | 天津大学 | 一种用于图像或视频搜索重排序的方法 |
-
2012
- 2012-12-31 CN CN201210594857.1A patent/CN103049570B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5805733A (en) * | 1994-12-12 | 1998-09-08 | Apple Computer, Inc. | Method and system for detecting scenes and summarizing video sequences |
US20050071329A1 (en) * | 2001-08-20 | 2005-03-31 | Microsoft Corporation | System and methods for providing adaptive media property classification |
CN101021852A (zh) * | 2006-10-10 | 2007-08-22 | 鲍东山 | 基于内容的视频搜索调度系统 |
CN101071439A (zh) * | 2007-05-24 | 2007-11-14 | 北京交通大学 | 一种基于多视角的交互式视频搜索方法 |
CN101634996A (zh) * | 2009-08-13 | 2010-01-27 | 浙江大学 | 基于综合考量的个性化视频排序方法 |
CN101826119A (zh) * | 2009-08-24 | 2010-09-08 | 张艳红 | 基于排序仿真技术的视频搜索引擎 |
CN102033937A (zh) * | 2010-12-20 | 2011-04-27 | 百度在线网络技术(北京)有限公司 | 视频搜索结果的展示方法及其系统 |
CN102629279A (zh) * | 2012-03-23 | 2012-08-08 | 天津大学 | 一种用于图像或视频搜索重排序的方法 |
CN102750347A (zh) * | 2012-06-08 | 2012-10-24 | 天津大学 | 一种用于图像或视频搜索重排序的方法 |
Non-Patent Citations (2)
Title |
---|
冀中等: "面向新闻视频内容分析的音频分层分类算法", 《计算机应用研究》, vol. 26, no. 5, 31 May 2009 (2009-05-31) * |
张静等: "基于内容的图像和视频搜索重排序技术综述", 《计算机工程与应用》, 4 August 2011 (2011-08-04) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2549525C2 (ru) * | 2013-07-15 | 2015-04-27 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Юго-Западный государственный университет" (ЮЗ ГУ) | Способ и устройство поиска составного образца в последовательности |
CN104268227A (zh) * | 2014-09-26 | 2015-01-07 | 天津大学 | 基于逆向k近邻的图像搜索中高质量相关样本自动选取法 |
CN104268227B (zh) * | 2014-09-26 | 2017-10-10 | 天津大学 | 基于逆向k近邻的图像搜索中高质量相关样本自动选取法 |
CN110321952A (zh) * | 2019-07-02 | 2019-10-11 | 腾讯医疗健康(深圳)有限公司 | 一种图像分类模型的训练方法及相关设备 |
CN110321952B (zh) * | 2019-07-02 | 2024-02-09 | 腾讯医疗健康(深圳)有限公司 | 一种图像分类模型的训练方法及相关设备 |
CN112650870A (zh) * | 2020-12-30 | 2021-04-13 | 北京天广汇通科技有限公司 | 一种训练图片排序模型的方法、图片排序的方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103049570B (zh) | 2015-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10102443B1 (en) | Hierarchical conditional random field model for labeling and segmenting images | |
Tang et al. | SAR image content retrieval based on fuzzy similarity and relevance feedback | |
CN102750347B (zh) | 一种用于图像或视频搜索重排序的方法 | |
Afifi et al. | Image retrieval based on content using color feature | |
CN102750385B (zh) | 基于标签检索的相关性—质量排序图像检索方法 | |
CN102629279B (zh) | 一种用于图像或视频搜索重排序的方法 | |
CN110059807A (zh) | 图像处理方法、装置和存储介质 | |
EP3166020A1 (en) | Method and apparatus for image classification based on dictionary learning | |
CN106126585B (zh) | 基于质量分级与感知哈希特征组合的无人机图像检索方法 | |
Uricchio et al. | Fisher encoded convolutional bag-of-windows for efficient image retrieval and social image tagging | |
Bui et al. | Scalable sketch-based image retrieval using color gradient features | |
CN103810299A (zh) | 基于多特征融合的图像检索方法 | |
CN102663447B (zh) | 基于判别相关分析的跨媒体检索方法 | |
CN105808752A (zh) | 一种基于cca和2pknn的自动图像标注方法 | |
CN105938565A (zh) | 基于多层分类器和互联网图像辅助训练的彩色图像情感分类方法 | |
CN103049570A (zh) | 基于相关保持映射和一分类器的图像视频搜索排序方法 | |
CN108319959A (zh) | 一种基于图像特征压缩与检索的农作物病害图像识别方法 | |
CN102831161A (zh) | 用于图像检索的基于流形正则化的半监督排序学习方法 | |
Zhu et al. | Multimodal sparse linear integration for content-based item recommendation | |
CN105117735A (zh) | 一种大数据环境下的图像检测方法 | |
CN117036897A (zh) | 一种基于Meta RCNN的少样本目标检测方法 | |
Mironică et al. | Hierarchical clustering relevance feedback for content-based image retrieval | |
Böttcher et al. | BTU DBIS'Plant Identification Runs at ImageCLEF 2012. | |
CN117541882B (zh) | 一种基于实例的多视角视觉融合转导式零样本分类方法 | |
CN105701150A (zh) | 一种基于直觉模糊相似度的图像检索方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151202 Termination date: 20211231 |