CN103177121A

CN103177121A - 加入皮尔逊相关系数的局部保持投影方法

Info

Publication number: CN103177121A
Application number: CN2013101273957A
Authority: CN
Inventors: 冀中; 于颜儒
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2013-04-12
Filing date: 2013-04-12
Publication date: 2013-06-26
Anticipated expiration: 2033-04-12
Also published as: CN103177121B

Abstract

本发明涉及多媒体信息检索、数据处理领域，为更加准确地确定每个数据点的近邻，使降维之后的数据更能体现数据特征，本发明采取的技术方案是，加入皮尔逊相关系数的局部保持投影方法，包括下列步骤：首先得到初始的基于文本的搜索结果；为所有的样本提取不同模态下的特征向量，并组成特征向量集合；维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到加入皮尔逊相关系数的维数约简算法中进行处理，得到所有样本的新特征向量；训练排序模型是指把标注样本的新特征向量作为训练集，训练排序模型；最后用训练出来的排序模型，对所有待排序样本进行排序，得到重排序后的结果。本发明主要应用于多媒体信息检索、数据处理。

Description

加入皮尔逊相关系数的局部保持投影方法

技术领域

多媒体信息检索、数据处理领域，具体讲，涉及加入皮尔逊相关系数的局部保持投影方法。

背景技术

随着信息技术的快速发展，图像和视频等多媒体数据大量涌现，成为人们获取信息的重要途径之一。然而，这些数据通常具有高维特性，直接对它们进行分析和处理会导致如下重要问题：1)计算复杂度高；2)存储代价高昂；3)维数灾难。这成为严重制约多媒体内容分析和检索领域的关键问题。维数约简是有效解决这些问题的重要方法，其目标是通过对原始数据进行变换而得到的有效的低维表示。维数约简的定义为给定一批观察样本，记作

即包含n个样本，每个样本均是D维，根据某个准则，找到数据的低维表示

同时保持数据的几何结构。

在过去的几十年中，人们提出了大量的维数约减方法，主成分分析(Principle ComponentAnalysis，PCA)和线性判别分析(Linear Discriminant Analysis，LDA)是两种著名的降维方法，PCA的关键思想来源于K-L变换，其主要目标是通过线性变换寻找一组最优的单位正交向量基，并用它们的线性组合来重构原样本，以使重建构后的样本和原样本的误差最小。尽管PCA在许多模式识别应用中取得了较好的效果，但是由于它是以所有样本的最优重构为目的，并且PCA是一种无监督的学习方法，因此对于描述不同类别样本之间的差异而言，它不一定是最优的描述。相对于无监督的PCA方法而言，LDA是一种有监督的学习方法，它是以样本的可区分性为主要目标，通过寻找一组线性变换以达到类内散度最小且类间散度最大的目的。尽管PCA和LDA在模式识别应用中取得了较好的效果，但是他们仅仅能够发现全局的欧氏结构，而最近不同领域的研究者发现：高维空间中的数据点位于或者近似位于外部空间的一个子流形上，由于PCA和LDA仅能有效地发现全局欧氏结构，因而他们无法发现隐藏在高维数据中内在的非线性子流形结构。为了高效地发现位于高维数据空间中的内在流形结构，近年来基于流形学习的算法日益成为模式识别和机器学习中的研究热点问题。

流形学习是一种新的机器学习方法，其基本思想为：高维观测空间中的点是由少数独立变量的共同作用在观测空间张成一个流形，如果能有效地展开观测空间卷曲的流形或发现内在的主要变量，就可以对该数据集进行降维。由于流形学习能够对训练集中的高维数据空间进行非线性降维，揭示其流形分布，从中找出隐藏在高维观测数据中有意义的低维结构，以便从中提取易于识别的特征。

近年来，流形学习算法与应用取得了丰硕的成果，著名的流形学习算法有：等距映射(ISOMAP)、局部线形嵌入(Locally Linear Embedding，LLE)，拉普拉斯特征映射(LaplacianEigenmap)和局部保持投影(Local Preserving Projection，LPP)等这些方法均能保持原始数据的拓扑结构不变，并能较好解决数据处理中的“维数灾难”问题。尤其是局部保持投影方法作为拉普拉斯特征映射的一种线性逼近可以较好的反映样本的流形结构，已经被广泛的应用到图像检索和图像修复中。

在流形学习方法中有着非常重要的一步是构建所有点的邻接图，距离定义为欧氏距离。实际上流形这一概念是欧式空间的推广，简单说就是一个拓扑空间，它在局部上是欧氏的。

有时在做相似度计算的时候经常会用到皮尔逊相关系数，它描述了两个定距变量间联系的紧密程度(线性关系)。在欧式距离的基础之上加入皮尔逊相关系数，能够得到更加准确的邻接图。

发明内容

本发明旨在克服现有技术的不足，更加准确地确定每个数据点的近邻，使降维之后的数据更能体现数据特征，为此，本发明采取的技术方案是，加入皮尔逊相关系数的局部保持投影方法，包括下列步骤：

首先在搜索引擎中输入查询关键词，会得到初始的基于文本的搜索结果；

提取多模态特征：为所有的样本提取不同模态下的特征向量，并组成特征向量集合；

维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到加入皮尔逊相关系数的维数约简算法中进行处理，得到所有样本的新特征向量；

训练排序模型是指把标注样本的新特征向量作为训练集，训练排序模型；

最后用训练出来的排序模型，对所有待排序样本进行排序，得到重排序后的结果。

加入皮尔逊相关系数的维数约简算法中进行处理具体为：

给定一个查询结果

x_i表示查询中的一个样本，i表示查询结果中第i个样本，n是查询结果中样本的个数：；

首先计算任意两个样本之间的皮尔逊相关度

r_{ij} = \frac{Σ (x_{i} - \overset{&OverBar;}{x_{i}}) (x_{j} - \overset{&OverBar;}{x_{j}})}{(\sqrt{Σ_{i = 1}^{n} {(x_{i} - \overset{&OverBar;}{x_{i}})}^{2}}) (\sqrt{Σ_{j = 1}^{n} {(x_{j} - \overset{&OverBar;}{x_{j}})}^{2}})};

然后计算任意两个样本之间的欧式距离d(x_i，x_j)；将皮尔逊相关系数加入到欧式距离中得到新的样本距离为D(x_i，x_j)＝d(x_i，x_j)/(r_ij+1)，构造相邻无向图；

通过热核方式计算任意两个样本之间的相似度，计算公式如下：W_ij＝D(x_i，x_j)2/2σ²，

其中

这里采用了新的样本距离，使相似度计算更准确；

最后计算投影矩阵，局部保持投影LPP的投影矩阵A＝[a₁，a₂，L，a_l]是由如下泛化特征方程：XLX^Ta＝λXDX^Ta中对应最小的特征向量构成，即目标函数的求解可以转换为求解一个广义特征值问题，其中λ表示特征值，a表示投影矩阵A中的向量，也是特征向量，用样本特征与投影矩阵相乘得到新的特征向量：y＝a^Tx，即维数约简后的结果。

本发明的技术特点及效果：本发明主要是针对现有的局部保持投影算法只应用欧式距离来构建邻接图这一特性加以改进的，设计适用于多媒体检索中与排序相关领域的维数约减方法，使之在加入皮尔逊相关系数的前提下，充分地利用数据的特有性质。其优势主要体现在：

(1)新颖性：首次把排序问题中样本的相关性等级信息引入到维数约减技术中，并在此基础上加入皮尔逊相关系数，加入了数据内部结构的特性，提出了适用于多媒体检索相关领域中的维数约减算法。

(2)有效性：通过实验证明了与标准的局部保持投影方法相比较，本发明设计的加入皮尔逊相关系数的局部保持投影方法在重排序的实验中的性能明显的优于前者，能够有效的利用样本特征提高排序性能，因此更适合于重排序问题中。

(3)实用性：简单可行，可以用在多媒体检索中的视觉搜索重排序、个性化推荐等与排序相关的领域。

附图说明

图1是本发明的加入皮尔逊相关系数的局部保持投影方法的流程图；

图2是本发明的提供的基于文本搜索结果的视觉搜索重排序系统的流程。

具体实施方式

本发明涉及一种面向多媒体信息检索领域的特征维数约简技术，它针对多媒体图像、视频数据特征维数很高、容易引起“维数灾难”的特点，利用检索结果与查询之间的相关程度信息，对传统的典型相关分析方法进行了改进，达到了有效利用数据信息、提高维数约简效果的目的。本发明还提供一种利用本方法实现的图像搜索引擎的检索结果重排序系统，能将符合用户需求的结果靠前优先呈现给用户，提高了检索的准确性。

本发明提供一种加入皮尔逊相关系数的局部保持投影算法，局部保持投影算法是一种最近提出的能够较好保持非线性子流形中局部数据特征的线性流形学习方法，在计算邻接图时使用欧式距离。本发明将皮尔逊相关系数加入到构建邻接图的过程中，更加准确地确定每个数据点的近邻，使降维之后的数据更能体现数据特征。

本发明所提供的方法主要是在局部保持投影的基础之上加入皮尔逊相关系数，局部保持投影通过计算欧氏距离来构建邻接图，它描述了两个定距变量间联系的紧密程度，将其与欧式距离相结合，能够得到更加准确的邻接图。此外，基于该方法还提供了一种应用于多媒体检索中的视觉搜索重排序系统。

LPP是一种最近提出的能够较好保持非线性子流形中局部数据特征的线性流形学习算法，它是Laplace-Beltrami算子特征函数的一个线形估计，其目标是保持数据之间的相似关系，即原始数据空间上相邻的数据点在投影后的空间上也保持相应的相邻关系。加入皮尔逊相关系数的局部保持投影方法是在构造相邻无向图和构造权值矩阵上加入了皮尔逊相关系数，具体方法如下：

给定一个查询结果X＝{x₁，...，x_n}∈R^m，x_i表示查询中的一个样本，i表示查询结果中第i个样本，n是查询结果中样本的个数。

首先构造相邻无向图：该图的点即是所有的高维数据信息，判断任两点之间是否有边相连则有两种方式：

1)球形相近(ε-neighborhoods)：即若两点之间的距离小于某个常数e(视需求可以不同)，则两点之间有边相连。

2)k相近(k nearest neighbors)：即若两点中，其中一点在另一点的最相近的k个点中，则两点之间有边相连。

无论哪种方式都需要计算两点之间的距离，最典型的距离计算方式是欧式距离，d(x_i，x_j)＝‖x_i，x_j‖，欧式距离只是从数据的角度，并没有考虑到数据内部的结构，所以我们加入皮尔逊相关系数：

D(x_i，x_j)＝d(x_i，x_j)/(r_ij+1)

其中：

r_{ij} = \frac{Σ (x_{i} - \overset{&OverBar;}{x_{i}}) (x_{j} - \overset{&OverBar;}{x_{j}})}{(\sqrt{Σ_{i = 1}^{n} {(x_{i} - \overset{&OverBar;}{x_{i}})}^{2}}) (\sqrt{Σ_{j = 1}^{n} {(x_{j} - \overset{&OverBar;}{x_{j}})}^{2}})}

其中：

是x_i的均值.

r的取值在-1与+1之间，若r＞0，表明两个变量是正相关，即一个变量的值越大，另一个变量的值也会越大；若r＜0，表明两个变量是负相关，即一个变量的值越大另一个变量的值反而会越小。在这里我们认为r值越大表示两个样本的越相近，当r＞0时，D(x_i，x_j)＜d(x_i，x_j)，使相近样本的距离更近，当r＜0时，D(x_i，x_j)＞d(x_i，x_j)，使不相近的样本更远离。这样能够更加准确地得到邻近图。

其次构建权值矩阵W，若在相邻图中两点x_i和x_j之间没有边相连，则相关性W_ij＝0，否则利用下面其中一种方式计算相关性：

1)简单方式：W_ij＝1；

2)采用热核方式其中：W_ij＝d(x_i，x_j)²/2σ²，

本发明采用第二种方法，即热核方式，同样加入皮尔逊相关系数，用D(x_i，x_j)代替原来的欧式距离d(x_i，x_j)。得到新的权值矩阵：W_ij＝D(x_i，x_j)2/2σ²。

最后计算投影矩阵，投影矩阵可以通过求解一下目标函数得到：

a_{opt} = \min_{y} Σ_{i, j = 1}^{n} {(y_{i} - y_{j})}^{2} w_{ij} = \arg \min_{a} Σ_{i, j = 1}^{n} {(a^{T} x_{i} - a^{T} x_{j})}^{2} w_{ij}

= \arg \min_{a} a^{T} XL X^{T} a

约束条件为：a^TXLX^Ta＝1。

其中，L＝D-W是拉普拉斯矩阵，D为对角阵，其定义为：

采用权重W_ij的主要目的是为了对原始邻居的点在映射后分离过远实施惩罚。因此上述目标函数主要是为了确保如果原始数据点x_i和x_j“邻近”，则经过映射后的点y_i＝a^Tx_i和y_j＝a^Tx_j也应当“邻近”。经过简单的几何变换可知，局部保持投影LPP的投影矩阵A＝[a₁，a₂，L，a_l]是由如下泛化特征方程：XLX^Ta＝λXDX^Ta中对应最小的特征向量构成，即目标函数的求解可以转换为求解一个广义特征值问题，其中λ表示特征值，a表示投影矩阵A中的向量，也是特征向量。

由此可见，加入皮尔逊相关系数的局部保持投影算法包括构建相邻无向图，构建权值矩阵和求解投影矩阵三个大部分，前两个部分中我们加入了皮尔逊相关系数。

下面结合附图和具体实施例进一步详细说明本发明。

图1描绘了加入皮尔逊相关系数的局部保持投影算法的具体流程，给定一个查询结果

x_i表示查询中的一个样本，i表示查询结果中第i个样本，n是查询结果中样本的个数。

首先计算任意两个样本之间的皮尔逊相关度

r_{ij} = \frac{Σ (x_{i} - \overset{&OverBar;}{x_{i}}) (x_{j} - \overset{&OverBar;}{x_{j}})}{(\sqrt{Σ_{i = 1}^{n} {(x_{i} - \overset{&OverBar;}{x_{i}})}^{2}}) (\sqrt{Σ_{j = 1}^{n} {(x_{j} - \overset{&OverBar;}{x_{j}})}^{2}})};

然后计算任意两个样本之间的欧式距离d(x_i，x_j)；将皮尔逊相关系数加入到欧式距离中得到新的样本距离为D(x_i，x_j)＝d(x_i，x_j)/(r_ij+1)，构造相邻无向图。

通过热核方式计算任意两个样本之间的相似度，计算公式如下：W_ij＝D(x_i，x_j)2/2σ²。

其中这里采用了新的样本距离，使相似度计算更准确。

最后计算投影矩阵，即求解广义特征值XLX^Ta＝λXDX^Ta，得到投影矩阵。用样本特征与投影矩阵相乘得到新的特征向量：y＝a^Tx，即维数约简后的结果。

图2描述了整个视觉搜索重排序系统的流程图，首先在搜索引擎中输入查询关键词，会得到初始的基于文本的搜索结果。

提取多模态特征是指为所有的样本提取不同模态下的特征向量，并组成特征向量集合。

维数约减模块是指把样本的特征集合与样本的有关的标注信息输入到维数约简算法中进行处理，得到所有样本的新特征向量。即图1所描绘的过程。

训练排序模型是指把标注样本的新特征向量作为训练集，训练排序模型。

Claims

1.一种加入皮尔逊相关系数的局部保持投影方法，包括如下步骤：

首先在搜索引擎中输入查询关键词，得到初始的基于文本的搜索结果；

2.如权利要求1所述的加入皮尔逊相关系数的局部保持投影方法，其特征是，加入皮尔逊相关系数的维数约简算法中进行处理具体为：

给定一个查询结果

首先计算任意两个样本之间的皮尔逊相关度

r_{ij} = \frac{Σ (x_{i} - \overset{&OverBar;}{x_{i}}) (x_{j} - \overset{&OverBar;}{x_{j}})}{(\sqrt{Σ_{i = 1}^{n} {(x_{i} - \overset{&OverBar;}{x_{i}})}^{2}}) (\sqrt{Σ_{j = 1}^{n} {(x_{j} - \overset{&OverBar;}{x_{j}})}^{2}})};

其中这里采用了新的样本距离，使相似度计算更准确；