CN105989154A

CN105989154A - 相似性度量的方法及设备

Info

Publication number: CN105989154A
Application number: CN201510093574.2A
Authority: CN
Inventors: 李震国; 成杰峰; 范伟
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2015-03-03
Filing date: 2015-03-03
Publication date: 2016-10-05
Anticipated expiration: 2035-03-03
Also published as: EP3258368A4; CN105989154B; EP3258368B1; US20170364478A1; EP3258368A1; US10579703B2; WO2016138836A1

Abstract

本发明实施例提供了一种相似性度量的方法，包括：获取网络中的节点之间的指向关系并确定转移矩阵；根据转移矩阵和所获取的衰减因子计算约束矩阵；构建线性方程组，其中，线性方程组的系数矩阵为所述约束矩阵，线性方程组的变量为矫正向量；通过Jacobi方法迭代求解线性方程组，确定矫正向量；根据转移矩阵、衰减因子和由矫正向量所生成的对角矫正矩阵，计算节点之间的相似度。本发明实施例中，采用Jacobi方法确定矫正向量，进一步可计算节点之间的相似度。在Jacobi方法的每一次迭代中，计算矫正向量的各个元素是互相独立的，这样能够并行计算，从而能够利用计算机集群有效地减少计算时间，降低计算时的时间复杂度和空间复杂度，并且能够适用于大网络。

Description

相似性度量的方法及设备

技术领域

本发明实施例涉及数据处理领域，并且更具体地，涉及一种相似性度量的方法及设备。

背景技术

在如今的大数据互联网时代，大图和大网络是数据和信息的常见表达方式，例如，社交网络、互联网、电子商务、通信网络等。基于图的应用可以包括检索和推荐。其中，检索可以例如谷歌(google)搜索引擎。推荐可以例如脸书(Facebook)朋友推荐、领英(LinkedIn)职业推荐、网飞(Netflix)电影推荐、易贝(Ebay)和亚马逊(Amazon)商品推荐、推特(Twitter)消息推荐等。一般地，检索和推荐都是基于图中节点之间的相似性进行的。

例如，社交网络是朋友之间分享信息的重要平台。朋友越多，信息共享和交流越频繁。因此维护社交网络的一个重要功能是，根据节点之间的相似性进行朋友推荐。

再例如，在华为离网分析中，假设客户A放弃联通业务转向移动业务，那么对于联通来说，需要了解与客户A最为“相似”的客户，作为潜在的可能会流失的客户并重点关注。

一种衡量节点间的相似性的方法为：收集所有节点的各种属性，例如年龄、职业、收入、爱好等，然后根据各种属性的相似性来衡量节点之间的相似性。然而，这种方法不仅需要收集大量的客户信息，对存储要求高，并且这种方法可能会涉及到客户的个人隐私信息。

另一种较为有效地进行节点之间的相似性度量的方法为SimRank。目前，SimRank已经被广泛地应用在各种场景中，例如，推荐系统、信息检索、连接预测(link prediction)、引文网络(citation network)、学生课程网络等。但是，现有技术当中基于SimRank的相似性度量的方法是根据定义直接计算的，造成时间和空间复杂度高，不适于大网络。

发明内容

本发明实施例提供一种相似性度量的方法，时间和空间复杂度低，能够适于大网络。

第一方面，提供了一种相似性度量的方法，包括：

获取网络中的n个节点两两之间的指向关系，并根据所述指向关系确定转移矩阵，其中，所述转移矩阵的维度为n×n，n为大于或等于2的正整数；

获取衰减因子，并根据所述转移矩阵和所述衰减因子计算约束矩阵，其中，所述衰减因子为SimRank相似度方法中定义的衰减因子，且所述约束矩阵的维度为n×n；

根据所述约束矩阵，构建线性方程组，其中，所述线性方程组的系数矩阵为所述约束矩阵，所述线性方程组的变量为矫正向量；

采用雅可比Jacobi方法迭代求解所述线性方程组，确定所述矫正向量；

根据所述矫正向量生成对角矫正矩阵，其中，所述对角矫正矩阵的对角元素为所述矫正向量的分量，且所述对角矫正矩阵的维度为n×n；

根据所述转移矩阵、所述衰减因子和所述对角矫正矩阵，计算所述n个节点之间的相似度。

结合第一方面，在第一方面的第一种可能的实现方式中，所述采用Jacobi方法迭代求解所述线性方程组，确定所述矫正向量，包括：

采用Jacobi方法迭代求解所述线性方程组，并将收敛时的解确定为所述矫正向量，或者，将达到预设的最大迭代次数时的解确定为所述矫正向量。

结合第一方面或者第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，

其中，b为每个元素均为1的向量。

结合第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，所述采用Jacobi方法迭代求解所述线性方程组，确定所述矫正向量，包括：

通过

x_{i}^{(k)} = \frac{1}{a_{ii}} (b_{i} - \underset{j &NotEqual; i}{Σ} a_{ij} x_{j}^{(k - 1)})

计算所述矫正向量；

其中，x_i表示所述矫正向量x的第i个元素，x_j表示所述矫正向量x的第j个元素，a_ij表示所述约束矩阵A的第i行第j列的元素，a_ii表示所述约束矩阵A的第i行第i列的元素，b_i＝1，k表示所述Jacobi方法的迭代次数，i,j＝1,2,…,n，并且，k为正整数。

结合第一方面或者上述第一方面的任一种可能的实现方式，在第一方面的第四种可能的实现方式中，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，所述根据所述转移矩阵和所述衰减因子计算约束矩阵，包括：

确定所述约束矩阵A的元素为a_ij＝e_i·e_j+cPe_i·Pe_j+…+c^tP^te_i·P^te_j，

其中，e_i、e_j为正交单位向量，t为预设的正整数。

结合第一方面或者上述第一方面的任一种可能的实现方式，在第一方面的第五种可能的实现方式中，所述矫正向量表示为x，所述对角矫正矩阵表示为D，所述根据所述矫正向量生成对角矫正矩阵，包括：

确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix},

其中，D_ij表示所述对角矫正矩阵D的第i行第j列的元素，x_i表示所述矫正向量x的第i个元素，i,j＝1,2,…,n。

结合第一方面或者上述第一方面的任一种可能的实现方式，在第一方面的第六种可能的实现方式中，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述节点之间的相似度表示为S，所述根据所述转移矩阵、所述衰减因子和所述对角矫正矩阵，计算所述n个节点之间的相似度，包括：

根据下式计算所述n个节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t；

其中，T表示转置，t为预设的正整数，S所表示的矩阵的第i行第j列的元素s_ij表示第i个节点与第j个节点之间的相似度。

结合第一方面或者上述第一方面的任一种可能的实现方式，在第一方面的第七种可能的实现方式中，所述获取网络中的n个节点两两之间的指向关系，并根据所述指向关系确定转移矩阵，包括：

根据所述网络中的n个节点两两之间的指向关系，构建图，其中，所述n个节点构成所述图中的n个节点，所述指向关系构成所述图中的节点之间的有向边；

将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

结合第一方面或者上述第一方面的任一种可能的实现方式，在第一方面的第八种可能的实现方式中，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix},

其中，P_ij表示所述转移矩阵P的第i行第j列的元素，In(j)表示所有指向节点j的节点集合，E表示具有指向关系的节点组的集合。

第二方面，提供了一种用于相似性度量的设备，包括：

获取单元，用于获取网络中的n个节点两两之间的指向关系，并用于获取衰减因子，其中，所述衰减因子为SimRank相似度方法中定义的衰减因子，n为大于或等于2的正整数；

处理单元，用于根据所述获取单元获取的所述指向关系确定转移矩阵，并根据所述转移矩阵和所述获取单元获取的所述衰减因子计算约束矩阵，其中，所述转移矩阵的维度为n×n，所述约束矩阵的维度为n×n；

所述处理单元，还用于根据所述约束矩阵，构建线性方程组，其中，所述线性方程组的系数矩阵为所述约束矩阵，所述线性方程组的变量为矫正向量；

所述处理单元，还用于采用雅可比Jacobi方法迭代求解所述线性方程组，确定所述矫正向量；

所述处理单元，还用于根据所述矫正向量生成对角矫正矩阵，其中，所述对角矫正矩阵的对角元素为所述矫正向量的分量，且所述对角矫正矩阵的维度为n×n；

所述处理单元，还用于根据所述转移矩阵、所述对角矫正矩阵和所述获取单元获取的所述衰减因子，计算所述n个节点之间的相似度。

结合第二方面，在第二方面的第一种可能的实现方式中，所述处理单元，具体用于：

结合第二方面或者第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，

其中，b为每个元素均为1的向量。

结合第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，所述处理单元，具体用于：

通过

x_{i}^{(k)} = \frac{1}{a_{ii}} (b_{i} - \underset{j &NotEqual; i}{Σ} a_{ij} x_{j}^{(k - 1)})

计算所述矫正向量；

结合第二方面或者上述第二方面的任一种可能的实现方式，在第二方面的第四种可能的实现方式中，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，所述处理单元，具体用于：

其中，e_i、e_j为正交单位向量，t为预设的正整数。

结合第二方面或者上述第二方面的任一种可能的实现方式，在第二方面的第五种可能的实现方式中，所述矫正向量表示为x，所述对角矫正矩阵表示为D，所述处理单元，具体用于：

确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix},

结合第二方面或者上述第二方面的任一种可能的实现方式，在第二方面的第六种可能的实现方式中，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述n个节点之间的相似度表示为S，所述处理单元，具体用于：

根据下式计算所述节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t；

结合第二方面或者上述第二方面的任一种可能的实现方式，在第二方面的第七种可能的实现方式中，所述处理单元，具体用于：

根据所述获取单元获取的所述网络中的n个节点两两之间的指向关系，构建图，其中，所述n个节点构成所述图中的n个节点，所述指向关系构成所述图中的节点之间的有向边；

将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

结合第二方面或者上述第二方面的任一种可能的实现方式，在第二方面的第八种可能的实现方式中，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix},

第三方面，提供了一种用于相似性度量的设备，包括：

接收器，用于获取网络中的n个节点两两之间的指向关系，并用于获取衰减因子，其中，所述衰减因子为SimRank相似度方法中定义的衰减因子，n为大于或等于2的正整数；

处理器，用于根据所述接收器获取的所述指向关系确定转移矩阵，并根据所述转移矩阵和所述接收器获取的所述衰减因子计算约束矩阵，其中，所述转移矩阵的维度为n×n，所述约束矩阵的维度为n×n；

所述处理器，还用于根据所述约束矩阵，构建线性方程组，其中，所述线性方程组的系数矩阵为所述约束矩阵，所述线性方程组的变量为矫正向量；

所述处理器，还用于采用雅可比Jacobi方法迭代求解所述线性方程组，确定所述矫正向量；

所述处理器，还用于根据所述矫正向量生成对角矫正矩阵，其中，所述对角矫正矩阵的对角元素为所述矫正向量的分量，且所述对角矫正矩阵的维度为n×n；

所述处理器，还用于根据所述转移矩阵、所述对角矫正矩阵和所述接收器获取的所述衰减因子，计算所述n个节点之间的相似度。

结合第三方面，在第三方面的第一种可能的实现方式中，所述处理器，具体用于：

结合第三方面或者第三方面的第一种可能的实现方式，在第三方面的第二种可能的实现方式中，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，

其中，b为每个元素均为1的向量。

结合第三方面的第一种可能的实现方式，在第三方面的第三种可能的实现方式中，所述处理器，具体用于：

通过

x_{i}^{(k)} = \frac{1}{a_{ii}} (b_{i} - \underset{j &NotEqual; i}{Σ} a_{ij} x_{j}^{(k - 1)})

计算所述矫正向量；

结合第三方面或者上述第三方面的任一种可能的实现方式，在第三方面的第四种可能的实现方式中，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，所述处理器，具体用于：

其中，e_i、e_j为正交单位向量，t为预设的正整数。

结合第三方面或者上述第三方面的任一种可能的实现方式，在第三方面的第五种可能的实现方式中，所述矫正向量表示为x，所述对角矫正矩阵表示为D，所述处理器，具体用于：

确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix},

结合第三方面或者上述第三方面的任一种可能的实现方式，在第三方面的第六种可能的实现方式中，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述n个节点之间的相似度表示为S，所述处理器，具体用于：

根据下式计算所述节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t；

结合第三方面或者上述第三方面的任一种可能的实现方式，在第三方面的第七种可能的实现方式中，所述处理器，具体用于：

根据获取的所述网络中的n个节点两两之间的指向关系，构建图，其中，所述n个节点构成所述图中的n个节点，所述指向关系构成所述图中的节点之间的有向边；

将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

结合第三方面或者上述第三方面的任一种可能的实现方式，在第三方面的第八种可能的实现方式中，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix},

本发明实施例中，采用Jacobi方法确定矫正向量，进一步可计算节点之间的相似度。在Jacobi方法的每一次迭代中，计算矫正向量的各个元素是互相独立的，这样能够并行计算，从而能够利用计算机集群有效地减少计算时间，降低计算时的时间复杂度和空间复杂度，并且能够适用于大网络。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例的相似性度量的方法的流程图。

图2是本发明一个实施例的“图”的示意图。

图3是本发明一个实施例的用于相似性度量的设备的结构框图。

图4是本发明另一个实施例的用于相似性度量的设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

SimRank是一种基于图的拓扑结构信息来衡量任意两个节点间相似程度的模型。

在图G＝(V,E)中，V为顶点集，表示图中的节点的集合；E为弧集，表示具有指向关系的节点组的集合，即E为V×V的子集。

用In(i)表示所有指向节点i的节点集合(即入邻点集合)，用s(i,j)表示两个节点i和j之间的SimRank相似度，那么，SimRank的数学定义可以表示如下：

1.s(i,j)＝0，当或者

2.在其他情况下，

s (i, j) = \{\begin{matrix} 1, & i = j \\ \frac{c}{| In (i) | | In (j) |} \underset{i^{'} &Element; In (i), j^{'} &Element; In (j)}{Σ} s (i^{'}, j^{'}), & i &NotEqual; j \end{matrix}, - - - (1)

其中，c∈(0,1)是衰减因子，表示空集。

从定义可以看出，在SimRank的相似性度量中，节点和自己本身的相似性最高，为1；两节点之间的相似性是指向它们的节点的相似性的均值，乘以一个衰减因子。

根据上述的定义，SimRank矩阵表示形式可以为：

S＝(cP^TSP)∨I。 (2)

其中，I为单位矩阵，P为原图G＝(V,E)的逆向图G^T上的一阶转移矩阵，∨表示两个矩阵的对应元素取最大。

其中，一阶转移矩阵P的元素P_ij可以表示为

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix} . - - - (3)

根据SimRank矩阵表示形式S＝(cP^TSP)∨I，可以将S分解为：

S＝cP^TSP+D；

其中，D是对角阵，可以称为对角矫正矩阵。进一步地，S可以分解为：

S＝D+cP^TDP+c²(P^T)²DP²+…。 (4)

可见，计算SimRank相似度的关键是计算对角矫正矩阵D。目前采用高斯-赛德代数(Gauss-Seidel algorithm)的方法计算对角矫正矩阵D，每一步的计算都依赖于上一步的结果，这样，造成耗时长，计算效率低。

图1是本发明一个实施例的相似性度量的方法的流程图。图1所示的方法包括：

101，获取网络中的n个节点两两之间的指向关系，并根据所述指向关系确定转移矩阵，其中，所述转移矩阵的维度为n×n，n为大于或等于2的正整数。

102，获取衰减因子，并根据所述转移矩阵和所述衰减因子计算约束矩阵，其中，所述衰减因子为SimRank相似度方法中定义的衰减因子，且所述约束矩阵的维度为n×n。

103，根据所述约束矩阵，构建线性方程组，其中，所述线性方程组的系数矩阵为所述约束矩阵，所述线性方程组的变量为矫正向量。

104，采用雅可比Jacobi方法迭代求解所述线性方程组，确定所述矫正向量。

105，根据所述矫正向量生成对角矫正矩阵，其中，所述对角矫正矩阵的对角元素为所述矫正向量的分量，且所述对角矫正矩阵的维度为n×n。

106，根据所述转移矩阵、所述衰减因子和所述对角矫正矩阵，计算所述n个节点之间的相似度。

一般地，网络中的节点数众多，n的数量级也较大。例如，n可以为百万量级，甚至可以为亿量级。举例来说，Facebook的注册用户数量大于22亿，Facebook的用户构成其网络中的节点，因此，节点的数量n也会大于22亿。

本发明实施例中，101中的n个节点可以是网络中的所有节点，或者，也可以是网络中的部分节点。例如，对于Facebook来说，n个节点可以是指全部的大于22亿注册用户，或者也可以是指性别为女性的大约10亿用户，或者也可以是指最近一次登录地点为印度的用户。本发明对此不作限定。

应注意，本发明实施例对网络的具体场景不作限定。本发明实施例对获取网络中的n个节点两两之间的指向关系的方式不作限定。例如，可以根据n个节点之间的互相关注的关系确定指向关系，或者，也可以根据n个节点之间的通话记录确定指向关系，等等。

举例来说，本发明实施例中的网络可以是社交网络(social network)，网络中的节点可以用来表示社交网络中的用户，那么，节点两两之间的指向关系可以是指社交网络中的用户两两之间的关注关系。

例如，比较常用的社交网络有微博(Weibo或MicroBlog)、微信(WeChat)、易信、米聊(MiTalk)、脸书(Facebook)、推特(Twitter)和领英(LinkedIn)等。那么，在诸如微博的社交网络中，若用户U1为用户U2的关注者，则可理解为：用户U1到用户U2具有指向关系。在诸如微信的社交网络中，用户U1为用户U2的关注者，同时用户U2也一定为用户U1的关注者，则可理解为：用户U1到用户U2具有指向关系，且用户U2到用户U1也具有指向关系。

再举例来说，本发明实施例中的网络可以是通讯网络(如前所述的华为离网)，网络中的节点可以用来表示通讯网络中的用户，那么，节点两两之间的指向关系可以是指通讯网络中的用户两两之间的通话关系。

例如，若用户U1给用户U2打过电话，则可以理解为：用户U1到用户U2具有指向关系。

可见，本发明实施例中，指向关系具有方向性。例如，节点N1与节点N2之间的指向关系可以是：节点N1指向节点N2；或者节点N2指向节点N1；或者节点N1指向节点N2且节点N2指向节点N1。

可选地，101可以包括：根据所述网络中的n个节点两两之间的指向关系，构建图(Graph)；并将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。其中，所述n个节点构成所述图中的节点，所述指向关系构成所述图中的节点之间的有向边。

可理解，所构建的图为有向图。其中，图的逆向图上的一阶转移矩阵与图中的每个节点的被指向的数目有关。这里，可以确定指向每个节点的有向边的数目，并进一步根据指向每个节点的有向边的数目，计算所述转移矩阵。

例如，在图2所示的“图”中，包括五个节点，分别为N1、N2、N3、N4和N5，并且图中还包括节点之间的有向边。那么，可以很容易地确定：节点N1被指向的节点数为2；节点N2被指向的节点数为1；节点N3被指向的节点数为3；节点N4被指向的节点数为1，节点N5被指向的节点数为2。

应注意，关于图(Graph)的具体描述可以参见现有技术的图论中的相关定义和描述，为避免重复，这里不再赘述。

具体地，本发明实施例中，所述转移矩阵表示为P，所述衰减因子表示为c，约束矩阵表示为A，所述矫正向量表示为x，所述对角矫正矩阵表示为D，所述节点之间的相似度表示为S。

并且，所述转移矩阵P的维度为n×n，所述约束矩阵A的维度为n×n，所述对角矫正矩阵D的维度为n×n，所述节点之间的相似度S的维度为n×n。所述矫正向量x的维度为n。其中，n为正整数。

相应地，P_ij表示所述转移矩阵P的第i行第j列的元素，a_ij表示所述约束矩阵A的第i行第j列的元素，x_i表示所述矫正向量x的第i个元素，D_ij表示所述对角矫正矩阵D的第i行第j列的元素。其中，i,j＝1,2,…,n。

本发明实施例中，转移矩阵P为原图G＝(V,E)的逆向图G^T上的一阶转移矩阵，101可以由下式确定：

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix},

其中，In(j)表示所有指向节点j的节点集合，V表示图中的节点的集合，E表示具有指向关系的节点组的集合。

其中，节点之间的指向关系可以在构建图的过程中确定。举例来说，在前述的华为离网分析中，可以根据客户之间的通话记录构建节点之间的指向关系。假如客户A对应的为图中的节点A，客户B对应的为图中的节点B。那么，如果客户A给客户B打过电话，便可以在构建图时建立一条从节点A指向节点B的有向边。也就是说，节点A指向节点B。

本发明实施例中，104可以包括：采用Jacobi方法计算线性方程组Ax＝b，其中，b为每个元素均为1的向量。这里，该线性方程组的变量即为矫正向量。

具体地，104中的矫正向量可以是在矫正向量的初值的基础上，经过迭代所确定的。其中，所述矫正向量的初值为初始化的矫正向量，表示为x⁽⁰⁾。104可包括：采用Jacobi方法迭代求解所述线性方程组，并将收敛时的解确定为所述矫正向量，或者，将达到预设的最大迭代次数时的解确定为所述矫正向量。

具体地，理论分析过程可以如下所述：

由于衰减因子c∈(0,1)，因此，根据前述(4)式，可以将节点之间的相似度S近似为：

S≈S^t＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t。 (5)

其中，t为正整数。例如，t＝5。

进一步，根据(1)式，由于一个节点和其本身的相关性为1，即s(i,i)＝1，于是有：

1 = e_{i}^{T} S e_{i} = e_{i}^{T} (D + c P^{T} DP + . . . + c^{t} {(P^{T})}^{t} {DP}^{t}) e_{i}, - - - (6)

其中，e_i为正交单位向量，具体地，满足

e_{i} \cdot e_{j} = \{\begin{matrix} 1, & i = j \\ 0, & i &NotEqual; j \end{matrix} .

如果假设x＝(D₁₁,D₂₂,…,D_nn)^T，那么在(6)式的基础上可以得到：

1＝x^T(e_i·e_i+cPe_i·Pe_i+…+c^tP^te_i·P^te_i)。 (7)

这样，便可以通过计算线性方程组Ax＝b来计算对角矫正矩阵D。其中，b＝(b₁,b₂,…,b_n)^T，且b₁＝b₂＝…＝b_n＝1，A称为约束矩阵，并且A的元素由(7)式可得

a_ij＝e_i·e_j+cPe_i·Pe_j+…+c^tP^te_i·P^te_j。 (8)

经过上述分析可知，102可以包括：确定所述约束矩阵A的元素为a_ij＝e_i·e_j+cPe_i·Pe_j+…+c^tP^te_i·P^te_j，其中，e_i和e_j为正交单位向量，t为预设的正整数。

进一步地，在103中，可以利用约束矩阵A构建线性方程组Ax＝b，进而在104通过迭代求解线性方程组Ax＝b得到矫正向量x。

例如，104中，可以先初始化矫正向量，得到初始化的矫正向量x⁽⁰⁾，且然后再利用该初始化的矫正向量x⁽⁰⁾进行迭代计算。

应注意，本发明实施例对初始化矫正向量的方法不作限定，对初始化的矫正向量的值也不作限定。例如，可以采用随机(Random)函数进行初始化；例如，可以定义初始化的矫正向量等于1；等等。

那么，104可以具体包括：通过计算所述矫正向量。其中，x_i表示所述矫正向量x的第i个元素，x_j表示所述矫正向量x的第j个元素，a_ij表示所述约束矩阵A的第i行第j列的元素，a_ii表示所述约束矩阵A的第i行第i列的元素，b_i＝1，k表示所述Jacobi方法的迭代次数，i,j＝1,2,…,n，所述约束矩阵A的维度为n×n，并且，k和n均为正整数。

可选地，作为一个实施例，104所确定的矫正向量，可以是线性方程组收敛后的解。

例如，若则认为解达到收敛，便可以将第k次迭代后的值作为该线性方程组的解。这里，ε为预定义的值，例如ε＝10^-6。

可选地，作为一个实施例，104所确定的矫正向量，可以是线性方程组达到预设的最大迭代次数时的值。

例如，若假设预设的最大迭代次数为N，那么，如果当k＝N时仍然没有达到收敛，此时便可以将第N次迭代后的值作为该线性方程组的解。

同时，在采用Jacobi方法进行迭代的过程中，从可以看出，第k次迭代时依赖于第k-1次迭代的结果，而不互相依赖。也就是说，的计算与有关，但是与无关。这样，在第k次迭代时，对于n个的计算，可以并行地进行。从而能够缩短计算的时间，提高计算的效率。

并且，并行的计算可以是由多个CPU独立地进行的，或者采用高性能计算机集群并行地进行，能够充分计算机集群的资源，提高计算机的利用率，降低空间复杂度和时间复杂度。

进一步地，从可以看出，在102中计算约束矩阵A时，可以不需要显示地构造整个约束矩阵A，而只需要在线地每次计算约束矩阵A的每一行即可。

也就是说，本发明实施例中，102、103和104可以并行地进行。例如，可以先在102计算约束矩阵A的第一行，然后在103中采用约束矩阵A的第一行构建出一个线性方程，并在104计算该线性方程。而且，在103和104计算的同时可以在102计算约束矩阵A的第二行，……，等等。

进一步地，105可以包括：确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix},

其中，D_ij表示所述对角矫正矩阵D的第i行第j列的元素，x_i表示所述矫正向量x的第i个元素，i,j＝1,2,…,n，所述对角矫正矩阵D的维度为n×n，并且，n为正整数。

也就是说，对角矫正矩阵D为：

这样，本发明实施例中，利用Jacobi方法计算的到对角矫正矩阵D，进一步利用(5)式，便可以计算得到节点间的相似度。也就是说，106可以包括：根据下式计算所述节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t，

其中，T表示转置，t为预设的正整数。

可理解，矩阵S的第i行第j列的元素s_ij表示第i个节点与第j个节点之间的相似度。这样，可以计算得到n个节点中每两个节点之间的相似度。也即，可以计算得到两两节点之间的相似度。

本发明实施例中，对t的大小不作限定，例如，可以是t＝5，或者可以是t＝20，等。可以理解，t的值越大，计算的精度越高，但是时间成本也越高。

本发明实施例中，衰减因子c∈(0,1)的大小可以是预设置的，例如，可以是c＝0.6，本发明对此不作限定。

本发明实施例中，假设n个节点中的第i个节点为节点i，n个节点中的第j个节点为节点j。对于给定的节点i和节点j，那么，节点i和节点j之间的相似度可以通过如下的代码1(Algorithm 1)实现，可以称为SinglePairSimRank(i,j)：

举例来说，针对社交网络，如果只期望计算客户A与客户B之间的相似度，那么可以通过上述的Algorithm 1进行计算。并且，若假设网络中有向边的数量为Q，那么SinglePairSimRank的时间复杂度为O(MQ)，空间复杂度为O(Q)。

本发明实施例中，假设n个节点中的第i个节点为节点i，对于给定的节点i，可以计算其他所有的节点(即n个节点中除节点i之外的其他n-1个节点)与该节点i之间的相似度。并且可以通过如下的代码2(Algorithm 2)实现，可以称为SingleSourceSimRank(i)：

举例来说，在华为离网分析中，如果期望判断与客户A“相似”的客户，那么可以通过上述的Algorithm 2进行计算。并且，若假设网络中有向边的数量为Q，那么SingleSourceSimRank的时间复杂度为O(M²Q)，空间复杂度为O(Q)。

本发明实施例中，可以利用上述的代码2(Algorithm 2)，计算所有节点两两之间的相似度，并且可以通过如下的代码3(Algorithm 3)实现，可以称为AllPairsSimRank：

举例来说，在信息推荐的过程中，可以通过Algorithm 3计算所有节点之间的相似度，进而可以确定给每个客户分别推荐哪一类信息。并且，若假设网络中有向边的数量为Q，那么AllPairsSimRank的时间复杂度为O(M²Qn)，空间复杂度为O(Q)。

图3是本发明一个实施例的用于相似性度量的设备的结构框图。图3所示的设备200包括获取单元201和处理单元202。

获取单元201，用于获取网络中的n个节点两两之间的指向关系，并用于获取衰减因子，其中，所述衰减因子为SimRank相似度方法中定义的衰减因子，n为大于或等于2的正整数；

处理单元202，用于根据获取单元201获取的所述指向关系确定转移矩阵，并根据所述转移矩阵和获取单元201获取的所述衰减因子计算约束矩阵，其中，所述转移矩阵的维度为n×n，所述约束矩阵的维度为n×n；

处理单元202，还用于根据所述约束矩阵，构建线性方程组，其中，所述线性方程组的系数矩阵为所述约束矩阵，所述线性方程组的变量为矫正向量；

处理单元202，还用于采用雅可比Jacobi方法迭代求解所述线性方程组，确定所述矫正向量；

处理单元202，还用于根据所述矫正向量生成对角矫正矩阵，其中，所述对角矫正矩阵的对角元素为所述矫正向量的分量，且所述对角矫正矩阵的维度为n×n；

处理单元202，还用于根据所述转移矩阵、所述对角矫正矩阵和获取单元201获取的所述衰减因子，计算所述n个节点之间的相似度。

并且，所述转移矩阵P的维度为n×n，所述约束矩阵A的维度为n×n，所述对角矫正矩阵D的维度为n×n，所述节点之间的相似度S的维度为n×n。所述矫正向量x的维度为n。其中，n为正整数，并且n与节点的数量有关。

可选地，作为一个实施例中，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，处理单元202，具体用于：采用Jacobi方法计算线性方程组Ax＝b，其中，b为每个元素均为1的向量。

具体地，可以先初始化矫正向量为x⁽⁰⁾，进一步通过迭代求解该线性方程组Ax＝b。

在采用Jacobi方法迭代求解所述线性方程组，确定所述矫正向量时，处理单元202，具体用于：采用Jacobi方法迭代求解所述线性方程组，并将收敛时的解确定为所述矫正向量，或者，将达到预设的最大迭代次数时的解确定为所述矫正向量。

可选地，作为另一个实施例中，处理单元202，具体用于：通过计算所述矫正向量。其中，x_i表示所述矫正向量x的第i个元素，x_j表示所述矫正向量x的第j个元素，a_ij表示所述约束矩阵A的第i行第j列的元素，a_ii表示所述约束矩阵A的第i行第i列的元素，b_i＝1，k表示所述Jacobi方法的迭代次数，i,j＝1,2,…,n，所述约束矩阵A的维度为n×n，并且，k和n均为正整数。

可选地，作为另一个实施例中，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，处理单元202，具体用于：确定所述约束矩阵A的元素为a_ij＝e_i·e_j+cPe_i·Pe_j+…+c^tP^te_i·P^te_j。其中，e_i、e_j为正交单位向量，t为预设的正整数。

可选地，作为另一个实施例中，所述矫正向量表示为x，所述对角矫正矩阵表示为D，处理单元202，具体用于：确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix} .

可选地，作为另一个实施例中，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述节点之间的相似度表示为S，处理单元202，具体用于：根据下式计算所述节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t，其中，T表示转置，t为预设的正整数，S所表示的矩阵的第i行第j列的元素s_ij表示第i个节点与第j个节点之间的相似度。

可选地，作为另一个实施例中，在获取单元201获取指向关系之后，处理单元202具体用于：根据获取单元201获取的所述网络中的n个节点两两之间的指向关系，构建图，其中，所述n个节点构成所述图中的n个节点，所述指向关系构成所述图中的节点之间的有向边；将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

可选地，作为另一个实施例中，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix} .

可选地，本发明实施例中，设备200可以为用于处理数据的服务器。例如，可以为社交网络的服务器。

设备200能够用于实现前述图1的实施例中的方法，为避免重复，这里不再赘述。

图4是本发明另一个实施例的用于相似性度量的设备的结构框图。图4所示的设备300包括处理器301、接收器302、发送器303和存储器304。

接收器302，用于获取网络中的n个节点两两之间的指向关系，并用于获取衰减因子，其中，所述衰减因子为SimRank相似度方法中定义的衰减因子，n为大于或等于2的正整数；

处理器301，用于根据接收器302获取的所述指向关系确定转移矩阵，并根据所述转移矩阵和接收器302获取的所述衰减因子计算约束矩阵，其中，所述转移矩阵的维度为n×n，所述约束矩阵的维度为n×n；

处理器301，还用于根据所述约束矩阵，构建线性方程组，其中，所述线性方程组的系数矩阵为所述约束矩阵，所述线性方程组的变量为矫正向量；

处理器301，还用于采用雅可比Jacobi方法迭代求解所述线性方程组，确定所述矫正向量；

处理器301，还用于根据所述矫正向量生成对角矫正矩阵，其中，所述对角矫正矩阵的对角元素为所述矫正向量的分量，且所述对角矫正矩阵的维度为n×n；

处理器301，还用于根据所述转移矩阵、所述对角矫正矩阵和接收器302获取的所述衰减因子，计算所述n个节点之间的相似度。

设备300中的各个组件通过总线系统305耦合在一起，其中总线系统305除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图4中将各种总线都标为总线系统305。

上述本发明实施例揭示的方法可以应用于处理器301中，或者由处理器301实现。处理器301可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器301中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器301可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器304，处理器301读取存储器304中的信息，结合其硬件完成上述方法的步骤。

可以理解，本发明实施例中的存储器304可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。本文描述的系统和方法的存储器304旨在包括但不限于这些和任意其它适合类型的存储器。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

当在软件、固件、中间件或微码、程序代码或代码段中实现实施例时，它们可存储在例如存储部件的机器可读介质中。代码段可表示过程、函数、子程序、程序、例程、子例程、模块、软件分组、类、或指令、数据结构或程序语句的任意组合。代码段可通过传送和/或接收信息、数据、自变量、参数或存储器内容来稿合至另一代码段或硬件电路。可使用包括存储器共享、消息传递、令牌传递、网络传输等任意适合方式来传递、转发或发送信息、自变量、参数、数据等。

对于软件实现，可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器单元中并通过处理器执行。存储器单元可以在处理器中或在处理器外部实现，在后一种情况下存储器单元可经由本领域己知的各种手段以通信方式耦合至处理器。

可选地，作为一个实施例中，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，处理器301，具体用于：采用Jacobi方法计算线性方程组Ax＝b，其中，b为每个元素均为1的向量。

在采用Jacobi方法迭代求解所述线性方程组，确定所述矫正向量时，处理器301，具体用于：采用Jacobi方法迭代求解所述线性方程组，并将收敛时的解确定为所述矫正向量，或者，将达到预设的最大迭代次数时的解确定为所述矫正向量。

可选地，作为另一个实施例中，处理器301，具体用于：通过计算所述矫正向量。其中，x_i表示所述矫正向量x的第i个元素，x_j表示所述矫正向量x的第j个元素，a_ij表示所述约束矩阵A的第i行第j列的元素，a_ii表示所述约束矩阵A的第i行第i列的元素，b_i＝1，k表示所述Jacobi方法的迭代次数，i,j＝1,2,…,n，所述约束矩阵A的维度为n×n，并且，k和n均为正整数。

可选地，作为另一个实施例中，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，处理器301，具体用于：确定所述约束矩阵A的元素为a_ij＝e_i·e_j+cPe_i·Pe_j+…+c^tP^te_i·P^te_j。其中，e_i、e_j为正交单位向量，t为预设的正整数。

可选地，作为另一个实施例中，所述矫正向量表示为x，所述对角矫正矩阵表示为D，处理器301，具体用于：确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix} .

可选地，作为另一个实施例中，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述节点之间的相似度表示为S，处理器301，具体用于：根据下式计算所述节点之间的相似度：

可选地，作为另一个实施例中，在接收器302获取指向关系之后，处理器301具体用于：根据获取的所述网络中的n个节点两两之间的指向关系，构建图，其中，所述n个节点构成所述图中的n个节点，所述指向关系构成所述图中的节点之间的有向边；将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

可选地，作为另一个实施例中，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix} .

可理解，本发明实施例中，发送器303可用于将处理器301计算得到的相似度的值进行输出，例如，可以输出至设备300的显示屏，或者可以输出至于该设备300连接的其他的设备或装置。

可理解，本发明实施例中，存储器304可用于存储计算所需要的预设值(如c，t的值)，还可以用于存储处理器301所执行的代码(例如，图1所示的实施例中的Algorithm 1、Algorithm 2和Algorithm 3)，还可以用于存储计算过程中的中间结果等。

可选地，本发明实施例中，设备300可以为用于处理数据的服务器。例如，可以为社交网络的服务器。

设备300能够用于实现前述图1的实施例中的方法，为避免重复，这里不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种相似性度量的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述采用Jacobi方法迭代求解所述线性方程组，确定所述矫正向量，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，

其中，b为每个元素均为1的向量。

4.根据权利要求3所述的方法，其特征在于，所述采用Jacobi方法迭代求解所述线性方程组，确定所述矫正向量，包括：

通过

x_{i}^{(k)} = \frac{1}{a_{ii}} (b_{i} - \underset{j &NotEqual; i}{Σ} a_{ij} x_{j}^{(k - 1)})

计算所述矫正向量；

5.根据权利要求1至4任一项所述的方法，其特征在于，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，所述根据所述转移矩阵和所述衰减因子计算约束矩阵，包括：

确定所述约束矩阵A的元素为a_ij＝e_i·e_j+cPe_i·Pe_j+…^tP^te_i·P^te_j，

其中，e_i、e_j为正交单位向量，t为预设的正整数。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述矫正向量表示为x，所述对角矫正矩阵表示为D，所述根据所述矫正向量生成对角矫正矩阵，包括：

确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; \end{matrix},

7.根据权利要求1至6任一项所述的方法，其特征在于，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述节点之间的相似度表示为S，所述根据所述转移矩阵、所述衰减因子和所述对角矫正矩阵，计算所述n个节点之间的相似度，包括：

根据下式计算所述n个节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t；

8.根据权利要求1至7任一项所述的方法，其特征在于，所述获取网络中的n个节点两两之间的指向关系，并根据所述指向关系确定转移矩阵，包括：

将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

9.根据权利要求8所述的方法，其特征在于，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix},

10.一种用于相似性度量的设备，其特征在于，包括：

11.根据权利要求10所述的设备，其特征在于，所述处理单元，具体用于：

12.根据权利要求10或11所述的设备，其特征在于，所述约束矩阵表示为A，所述矫正向量表示为x，所述线性方程组表示为Ax＝b，

其中，b为每个元素均为1的向量。

13.根据权利要求12所述的设备，其特征在于，所述处理单元，具体用于：

通过

x_{i}^{(k)} = \frac{1}{a_{ii}} (b_{i} - \underset{j &NotEqual; i}{Σ} a_{ij} x_{j}^{(k - 1)})

计算所述矫正向量；

其中，x_i表示所述矫正向量x的第i个元素，x_j表示所述矫正向量x的第j个元素，a_ij表示所述约束矩阵A的第i行第j列的元素，a_ii表示所述约束矩阵A的第i行第i列的元素，b_i＝1，k表示所述Jacobi方法的迭代次数，i,j＝1,2，…，n，并且，k为正整数。

14.根据权利要求10至13任一项所述的设备，其特征在于，所述衰减因子表示为c，所述转移矩阵表示为P，所述约束矩阵表示为A，所述处理单元，具体用于：

其中，e_i、e_j为正交单位向量，t为预设的正整数。

15.根据权利要求10至14任一项所述的设备，其特征在于，所述矫正向量表示为x，所述对角矫正矩阵表示为D，所述处理单元，具体用于：

确定所述对角矫正矩阵D的元素D_ij为：

D_{ij} = \{\begin{matrix} x_{i}, & i = j \\ 0, & i &NotEqual; j \end{matrix},

16.根据权利要求10至15任一项所述的设备，其特征在于，所述衰减因子表示为c，所述转移矩阵表示为P，所述对角矫正矩阵表示为D，所述n个节点之间的相似度表示为S，所述处理单元，具体用于：

根据下式计算所述节点之间的相似度：

S＝D+cP^TDP+c²(P^T)²DP²+…+c^t(P^T)^tDP^t；

17.根据权利要求10至16任一项所述的设备，其特征在于，所述处理单元，具体用于：

将所述图的逆向图上的一阶转移矩阵作为所述转移矩阵。

18.根据权利要求17所述的设备，其特征在于，所述转移矩阵表示为P，并且

P_{ij} = \{\begin{matrix} 1 / | In (j) |, & (i, j) &Element; E \\ 0, & (i, j) &NotElement; E \end{matrix},