CN103177121A - 加入皮尔逊相关系数的局部保持投影方法 - Google Patents

加入皮尔逊相关系数的局部保持投影方法 Download PDF

Info

Publication number
CN103177121A
CN103177121A CN2013101273957A CN201310127395A CN103177121A CN 103177121 A CN103177121 A CN 103177121A CN 2013101273957 A CN2013101273957 A CN 2013101273957A CN 201310127395 A CN201310127395 A CN 201310127395A CN 103177121 A CN103177121 A CN 103177121A
Authority
CN
China
Prior art keywords
sample
samples
correlation coefficient
training
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101273957A
Other languages
English (en)
Other versions
CN103177121B (zh
Inventor
冀中
于颜儒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201310127395.7A priority Critical patent/CN103177121B/zh
Publication of CN103177121A publication Critical patent/CN103177121A/zh
Application granted granted Critical
Publication of CN103177121B publication Critical patent/CN103177121B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及多媒体信息检索、数据处理领域,为更加准确地确定每个数据点的近邻,使降维之后的数据更能体现数据特征,本发明采取的技术方案是,加入皮尔逊相关系数的局部保持投影方法,包括下列步骤:首先得到初始的基于文本的搜索结果;为所有的样本提取不同模态下的特征向量,并组成特征向量集合;维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到加入皮尔逊相关系数的维数约简算法中进行处理,得到所有样本的新特征向量;训练排序模型是指把标注样本的新特征向量作为训练集,训练排序模型;最后用训练出来的排序模型,对所有待排序样本进行排序,得到重排序后的结果。本发明主要应用于多媒体信息检索、数据处理。

Description

加入皮尔逊相关系数的局部保持投影方法
技术领域
多媒体信息检索、数据处理领域,具体讲,涉及加入皮尔逊相关系数的局部保持投影方法。
背景技术
随着信息技术的快速发展,图像和视频等多媒体数据大量涌现,成为人们获取信息的重要途径之一。然而,这些数据通常具有高维特性,直接对它们进行分析和处理会导致如下重要问题:1)计算复杂度高;2)存储代价高昂;3)维数灾难。这成为严重制约多媒体内容分析和检索领域的关键问题。维数约简是有效解决这些问题的重要方法,其目标是通过对原始数据进行变换而得到的有效的低维表示。维数约简的定义为给定一批观察样本,记作
Figure BDA00003043878900011
即包含n个样本,每个样本均是D维,根据某个准则,找到数据的低维表示
Figure BDA00003043878900012
同时保持数据的几何结构。
在过去的几十年中,人们提出了大量的维数约减方法,主成分分析(Principle ComponentAnalysis,PCA)和线性判别分析(Linear Discriminant Analysis,LDA)是两种著名的降维方法,PCA的关键思想来源于K-L变换,其主要目标是通过线性变换寻找一组最优的单位正交向量基,并用它们的线性组合来重构原样本,以使重建构后的样本和原样本的误差最小。尽管PCA在许多模式识别应用中取得了较好的效果,但是由于它是以所有样本的最优重构为目的,并且PCA是一种无监督的学习方法,因此对于描述不同类别样本之间的差异而言,它不一定是最优的描述。相对于无监督的PCA方法而言,LDA是一种有监督的学习方法,它是以样本的可区分性为主要目标,通过寻找一组线性变换以达到类内散度最小且类间散度最大的目的。尽管PCA和LDA在模式识别应用中取得了较好的效果,但是他们仅仅能够发现全局的欧氏结构,而最近不同领域的研究者发现:高维空间中的数据点位于或者近似位于外部空间的一个子流形上,由于PCA和LDA仅能有效地发现全局欧氏结构,因而他们无法发现隐藏在高维数据中内在的非线性子流形结构。为了高效地发现位于高维数据空间中的内在流形结构,近年来基于流形学习的算法日益成为模式识别和机器学习中的研究热点问题。
流形学习是一种新的机器学习方法,其基本思想为:高维观测空间中的点是由少数独立变量的共同作用在观测空间张成一个流形,如果能有效地展开观测空间卷曲的流形或发现内在的主要变量,就可以对该数据集进行降维。由于流形学习能够对训练集中的高维数据空间进行非线性降维,揭示其流形分布,从中找出隐藏在高维观测数据中有意义的低维结构,以便从中提取易于识别的特征。
近年来,流形学习算法与应用取得了丰硕的成果,著名的流形学习算法有:等距映射(ISOMAP)、局部线形嵌入(Locally Linear Embedding,LLE),拉普拉斯特征映射(LaplacianEigenmap)和局部保持投影(Local Preserving Projection,LPP)等这些方法均能保持原始数据的拓扑结构不变,并能较好解决数据处理中的“维数灾难”问题。尤其是局部保持投影方法作为拉普拉斯特征映射的一种线性逼近可以较好的反映样本的流形结构,已经被广泛的应用到图像检索和图像修复中。
在流形学习方法中有着非常重要的一步是构建所有点的邻接图,距离定义为欧氏距离。实际上流形这一概念是欧式空间的推广,简单说就是一个拓扑空间,它在局部上是欧氏的。
有时在做相似度计算的时候经常会用到皮尔逊相关系数,它描述了两个定距变量间联系的紧密程度(线性关系)。在欧式距离的基础之上加入皮尔逊相关系数,能够得到更加准确的邻接图。
发明内容
本发明旨在克服现有技术的不足,更加准确地确定每个数据点的近邻,使降维之后的数据更能体现数据特征,为此,本发明采取的技术方案是,加入皮尔逊相关系数的局部保持投影方法,包括下列步骤:
首先在搜索引擎中输入查询关键词,会得到初始的基于文本的搜索结果;
提取多模态特征:为所有的样本提取不同模态下的特征向量,并组成特征向量集合;
维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到加入皮尔逊相关系数的维数约简算法中进行处理,得到所有样本的新特征向量;
训练排序模型是指把标注样本的新特征向量作为训练集,训练排序模型;
最后用训练出来的排序模型,对所有待排序样本进行排序,得到重排序后的结果。
加入皮尔逊相关系数的维数约简算法中进行处理具体为:
给定一个查询结果
Figure BDA00003043878900021
xi表示查询中的一个样本,i表示查询结果中第i个样本,n是查询结果中样本的个数:;
首先计算任意两个样本之间的皮尔逊相关度 r ij = Σ ( x i - x i ‾ ) ( x j - x j ‾ ) ( Σ i = 1 n ( x i - x i ‾ ) 2 ) ( Σ j = 1 n ( x j - x j ‾ ) 2 ) ; 然后计算任意两个样本之间的欧式距离d(xi,xj);将皮尔逊相关系数加入到欧式距离中得到新的样本距离为D(xi,xj)=d(xi,xj)/(rij+1),构造相邻无向图;
通过热核方式计算任意两个样本之间的相似度,计算公式如下:Wij=D(xi,xj)2/2σ2
其中
Figure BDA00003043878900023
这里采用了新的样本距离,使相似度计算更准确;
最后计算投影矩阵,局部保持投影LPP的投影矩阵A=[a1,a2,L,al]是由如下泛化特征方程:XLXTa=λXDXTa中对应最小的特征向量构成,即目标函数的求解可以转换为求解一个广义特征值问题,其中λ表示特征值,a表示投影矩阵A中的向量,也是特征向量,用样本特征与投影矩阵相乘得到新的特征向量:y=aTx,即维数约简后的结果。
本发明的技术特点及效果:本发明主要是针对现有的局部保持投影算法只应用欧式距离来构建邻接图这一特性加以改进的,设计适用于多媒体检索中与排序相关领域的维数约减方法,使之在加入皮尔逊相关系数的前提下,充分地利用数据的特有性质。其优势主要体现在:
(1)新颖性:首次把排序问题中样本的相关性等级信息引入到维数约减技术中,并在此基础上加入皮尔逊相关系数,加入了数据内部结构的特性,提出了适用于多媒体检索相关领域中的维数约减算法。
(2)有效性:通过实验证明了与标准的局部保持投影方法相比较,本发明设计的加入皮尔逊相关系数的局部保持投影方法在重排序的实验中的性能明显的优于前者,能够有效的利用样本特征提高排序性能,因此更适合于重排序问题中。
(3)实用性:简单可行,可以用在多媒体检索中的视觉搜索重排序、个性化推荐等与排序相关的领域。
附图说明
图1是本发明的加入皮尔逊相关系数的局部保持投影方法的流程图;
图2是本发明的提供的基于文本搜索结果的视觉搜索重排序系统的流程。
具体实施方式
本发明涉及一种面向多媒体信息检索领域的特征维数约简技术,它针对多媒体图像、视频数据特征维数很高、容易引起“维数灾难”的特点,利用检索结果与查询之间的相关程度信息,对传统的典型相关分析方法进行了改进,达到了有效利用数据信息、提高维数约简效果的目的。本发明还提供一种利用本方法实现的图像搜索引擎的检索结果重排序系统,能将符合用户需求的结果靠前优先呈现给用户,提高了检索的准确性。
本发明提供一种加入皮尔逊相关系数的局部保持投影算法,局部保持投影算法是一种最近提出的能够较好保持非线性子流形中局部数据特征的线性流形学习方法,在计算邻接图时使用欧式距离。本发明将皮尔逊相关系数加入到构建邻接图的过程中,更加准确地确定每个数据点的近邻,使降维之后的数据更能体现数据特征。
本发明所提供的方法主要是在局部保持投影的基础之上加入皮尔逊相关系数,局部保持投影通过计算欧氏距离来构建邻接图,它描述了两个定距变量间联系的紧密程度,将其与欧式距离相结合,能够得到更加准确的邻接图。此外,基于该方法还提供了一种应用于多媒体检索中的视觉搜索重排序系统。
LPP是一种最近提出的能够较好保持非线性子流形中局部数据特征的线性流形学习算法,它是Laplace-Beltrami算子特征函数的一个线形估计,其目标是保持数据之间的相似关系,即原始数据空间上相邻的数据点在投影后的空间上也保持相应的相邻关系。加入皮尔逊相关系数的局部保持投影方法是在构造相邻无向图和构造权值矩阵上加入了皮尔逊相关系数,具体方法如下:
给定一个查询结果X={x1,...,xn}∈Rm,xi表示查询中的一个样本,i表示查询结果中第i个样本,n是查询结果中样本的个数。
首先构造相邻无向图:该图的点即是所有的高维数据信息,判断任两点之间是否有边相连则有两种方式:
1)球形相近(ε-neighborhoods):即若两点之间的距离小于某个常数e(视需求可以不同),则两点之间有边相连。
2)k相近(k nearest neighbors):即若两点中,其中一点在另一点的最相近的k个点中,则两点之间有边相连。
无论哪种方式都需要计算两点之间的距离,最典型的距离计算方式是欧式距离,d(xi,xj)=‖xi,xj‖,欧式距离只是从数据的角度,并没有考虑到数据内部的结构,所以我们加入皮尔逊相关系数:
D(xi,xj)=d(xi,xj)/(rij+1)
其中:
r ij = Σ ( x i - x i ‾ ) ( x j - x j ‾ ) ( Σ i = 1 n ( x i - x i ‾ ) 2 ) ( Σ j = 1 n ( x j - x j ‾ ) 2 )
其中:
Figure BDA00003043878900042
是xi的均值.
r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。在这里我们认为r值越大表示两个样本的越相近,当r>0时,D(xi,xj)<d(xi,xj),使相近样本的距离更近,当r<0时,D(xi,xj)>d(xi,xj),使不相近的样本更远离。这样能够更加准确地得到邻近图。
其次构建权值矩阵W,若在相邻图中两点xi和xj之间没有边相连,则相关性Wij=0,否则利用下面其中一种方式计算相关性:
1)简单方式:Wij=1;
2)采用热核方式其中:Wij=d(xi,xj)2/2σ2
Figure BDA00003043878900043
本发明采用第二种方法,即热核方式,同样加入皮尔逊相关系数,用D(xi,xj)代替原来的欧式距离d(xi,xj)。得到新的权值矩阵:Wij=D(xi,xj)2/2σ2
最后计算投影矩阵,投影矩阵可以通过求解一下目标函数得到:
a opt = min y Σ i , j = 1 n ( y i - y j ) 2 w ij = arg min a Σ i , j = 1 n ( a T x i - a T x j ) 2 w ij
= arg min a a T XL X T a
约束条件为:aTXLXTa=1。
其中,L=D-W是拉普拉斯矩阵,D为对角阵,其定义为:
Figure BDA00003043878900046
采用权重Wij的主要目的是为了对原始邻居的点在映射后分离过远实施惩罚。因此上述目标函数主要是为了确保如果原始数据点xi和xj“邻近”,则经过映射后的点yi=aTxi和yj=aTxj也应当“邻近”。经过简单的几何变换可知,局部保持投影LPP的投影矩阵A=[a1,a2,L,al]是由如下泛化特征方程:XLXTa=λXDXTa中对应最小的特征向量构成,即目标函数的求解可以转换为求解一个广义特征值问题,其中λ表示特征值,a表示投影矩阵A中的向量,也是特征向量。
由此可见,加入皮尔逊相关系数的局部保持投影算法包括构建相邻无向图,构建权值矩阵和求解投影矩阵三个大部分,前两个部分中我们加入了皮尔逊相关系数。
下面结合附图和具体实施例进一步详细说明本发明。
图1描绘了加入皮尔逊相关系数的局部保持投影算法的具体流程,给定一个查询结果
Figure BDA00003043878900051
xi表示查询中的一个样本,i表示查询结果中第i个样本,n是查询结果中样本的个数。
首先计算任意两个样本之间的皮尔逊相关度 r ij = Σ ( x i - x i ‾ ) ( x j - x j ‾ ) ( Σ i = 1 n ( x i - x i ‾ ) 2 ) ( Σ j = 1 n ( x j - x j ‾ ) 2 ) ; 然后计算任意两个样本之间的欧式距离d(xi,xj);将皮尔逊相关系数加入到欧式距离中得到新的样本距离为D(xi,xj)=d(xi,xj)/(rij+1),构造相邻无向图。
通过热核方式计算任意两个样本之间的相似度,计算公式如下:Wij=D(xi,xj)2/2σ2
其中这里采用了新的样本距离,使相似度计算更准确。
最后计算投影矩阵,即求解广义特征值XLXTa=λXDXTa,得到投影矩阵。用样本特征与投影矩阵相乘得到新的特征向量:y=aTx,即维数约简后的结果。
图2描述了整个视觉搜索重排序系统的流程图,首先在搜索引擎中输入查询关键词,会得到初始的基于文本的搜索结果。
提取多模态特征是指为所有的样本提取不同模态下的特征向量,并组成特征向量集合。
维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到维数约简算法中进行处理,得到所有样本的新特征向量。即图1所描绘的过程。
训练排序模型是指把标注样本的新特征向量作为训练集,训练排序模型。
最后用训练出来的排序模型,对所有待排序样本进行排序,得到重排序后的结果。

Claims (2)

1.一种加入皮尔逊相关系数的局部保持投影方法,包括如下步骤:
首先在搜索引擎中输入查询关键词,得到初始的基于文本的搜索结果;
提取多模态特征:为所有的样本提取不同模态下的特征向量,并组成特征向量集合;
维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到加入皮尔逊相关系数的维数约简算法中进行处理,得到所有样本的新特征向量;
训练排序模型是指把标注样本的新特征向量作为训练集,训练排序模型;
最后用训练出来的排序模型,对所有待排序样本进行排序,得到重排序后的结果。
2.如权利要求1所述的加入皮尔逊相关系数的局部保持投影方法,其特征是,加入皮尔逊相关系数的维数约简算法中进行处理具体为:
给定一个查询结果
Figure FDA00003043878800011
xi表示查询中的一个样本,i表示查询结果中第i个样本,n是查询结果中样本的个数:;
首先计算任意两个样本之间的皮尔逊相关度 r ij = Σ ( x i - x i ‾ ) ( x j - x j ‾ ) ( Σ i = 1 n ( x i - x i ‾ ) 2 ) ( Σ j = 1 n ( x j - x j ‾ ) 2 ) ; 然后计算任意两个样本之间的欧式距离d(xi,xj);将皮尔逊相关系数加入到欧式距离中得到新的样本距离为D(xi,xj)=d(xi,xj)/(rij+1),构造相邻无向图;
通过热核方式计算任意两个样本之间的相似度,计算公式如下:Wij=D(xi,xj)2/2σ2
其中这里采用了新的样本距离,使相似度计算更准确;
最后计算投影矩阵,局部保持投影LPP的投影矩阵A=[a1,a2,L,al]是由如下泛化特征方程:XLXTa=λXDXTa中对应最小的特征向量构成,即目标函数的求解可以转换为求解一个广义特征值问题,其中λ表示特征值,a表示投影矩阵A中的向量,也是特征向量,用样本特征与投影矩阵相乘得到新的特征向量:y=aTx,即维数约简后的结果。
CN201310127395.7A 2013-04-12 2013-04-12 加入皮尔逊相关系数的局部保持投影方法 Expired - Fee Related CN103177121B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310127395.7A CN103177121B (zh) 2013-04-12 2013-04-12 加入皮尔逊相关系数的局部保持投影方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310127395.7A CN103177121B (zh) 2013-04-12 2013-04-12 加入皮尔逊相关系数的局部保持投影方法

Publications (2)

Publication Number Publication Date
CN103177121A true CN103177121A (zh) 2013-06-26
CN103177121B CN103177121B (zh) 2016-06-08

Family

ID=48636982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310127395.7A Expired - Fee Related CN103177121B (zh) 2013-04-12 2013-04-12 加入皮尔逊相关系数的局部保持投影方法

Country Status (1)

Country Link
CN (1) CN103177121B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239722A (zh) * 2014-09-18 2014-12-24 山东大学 一种基于因素间相关关系识别的预测方法
CN105025434A (zh) * 2014-04-29 2015-11-04 东北大学 基于皮尔逊相关系数的gsm基站定位方法
CN108731732A (zh) * 2018-05-22 2018-11-02 洛阳中科汇成科技有限公司 基于周期模态信息对足底压力的处理方法及系统
CN108846066A (zh) * 2018-06-06 2018-11-20 上海计算机软件技术开发中心 一种可视化的数据分析方法及系统
CN109325511A (zh) * 2018-08-01 2019-02-12 昆明理工大学 一种改进特征选择的算法
CN111340122A (zh) * 2020-02-29 2020-06-26 复旦大学 一种多模态特征融合的文本引导图像修复方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007113458A1 (en) * 2006-03-30 2007-10-11 British Telecommunications Public Limited Company Video abstraction
CN102629279A (zh) * 2012-03-23 2012-08-08 天津大学 一种用于图像或视频搜索重排序的方法
CN102831161A (zh) * 2012-07-18 2012-12-19 天津大学 用于图像检索的基于流形正则化的半监督排序学习方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007113458A1 (en) * 2006-03-30 2007-10-11 British Telecommunications Public Limited Company Video abstraction
CN102629279A (zh) * 2012-03-23 2012-08-08 天津大学 一种用于图像或视频搜索重排序的方法
CN102831161A (zh) * 2012-07-18 2012-12-19 天津大学 用于图像检索的基于流形正则化的半监督排序学习方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105025434A (zh) * 2014-04-29 2015-11-04 东北大学 基于皮尔逊相关系数的gsm基站定位方法
CN105025434B (zh) * 2014-04-29 2019-07-16 东北大学 基于皮尔逊相关系数的gsm基站定位方法
CN104239722A (zh) * 2014-09-18 2014-12-24 山东大学 一种基于因素间相关关系识别的预测方法
CN108731732A (zh) * 2018-05-22 2018-11-02 洛阳中科汇成科技有限公司 基于周期模态信息对足底压力的处理方法及系统
CN108731732B (zh) * 2018-05-22 2021-08-13 洛阳中科汇成科技有限公司 基于周期模态信息对足底压力的处理方法及系统
CN108846066A (zh) * 2018-06-06 2018-11-20 上海计算机软件技术开发中心 一种可视化的数据分析方法及系统
CN109325511A (zh) * 2018-08-01 2019-02-12 昆明理工大学 一种改进特征选择的算法
CN111340122A (zh) * 2020-02-29 2020-06-26 复旦大学 一种多模态特征融合的文本引导图像修复方法
CN111340122B (zh) * 2020-02-29 2022-04-12 复旦大学 一种多模态特征融合的文本引导图像修复方法

Also Published As

Publication number Publication date
CN103177121B (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
Hou et al. Convolutional neural network-based image representation for visual loop closure detection
Zhao et al. Learning to map social network users by unified manifold alignment on hypergraph
CN103177121A (zh) 加入皮尔逊相关系数的局部保持投影方法
CN102254015B (zh) 基于视觉词组的图像检索方法
CN103049526B (zh) 基于双空间学习的跨媒体检索方法
CN102663447B (zh) 基于判别相关分析的跨媒体检索方法
US20110022590A1 (en) Method of performing database search using relevance feedback and storage medium having program recorded thereon for executing the same
Gonzalez-Diaz et al. Neighborhood matching for image retrieval
Cholewa et al. Estimation of the number of states for gesture recognition with Hidden Markov Models based on the number of critical points in time sequence
Huang et al. Cross-modal deep metric learning with multi-task regularization
Pedronette et al. Exploiting clustering approaches for image re-ranking
Eravci et al. Diversity based relevance feedback for time series search
Zhang et al. Trajectory similarity assessment on road networks via embedding learning
CN117763185A (zh) 一种基于思考空间维度的哈希图像检索方法
Pelekis et al. Mining trajectory databases via a suite of distance operators
Tsai et al. Rotation-invariant texture image retrieval using particle swarm optimization and support vector regression
Kordopatis-Zilos et al. CERTH/CEA LIST at MediaEval Placing Task 2015.
Papadakis et al. Relevance feedback in content-based 3D object retrieval a comparative study
Jiang et al. Feature matching based on top k rank similarity
Pedronette et al. Distances correlation for re-ranking in content-based image retrieval
CN103488997B (zh) 基于各类重要波段提取的高光谱图像波段选择方法
Wang et al. Boosting 3d model retrieval with class vocabularies and distance vector revision
Ren et al. A bovw based query generative model
Lin et al. Image annotation based on recommendation model
CN113051962A (zh) 基于联合注意力机制孪生Margin-Softmax网络的行人重识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160608