CN107633263A

CN107633263A - 基于边的网络图嵌入方法

Info

Publication number: CN107633263A
Application number: CN201710763470.7A
Authority: CN
Inventors: 王朝坤; 叶晓俊; 郭高扬; 王昶平; 王铮
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2017-08-30
Filing date: 2017-08-30
Publication date: 2018-01-26

Abstract

本发明公开一种基于边的网络图嵌入方法，包括：构建Edge2vec算法模型；使用随机梯度下降法训练Edge2vec算法模型；使用Edge2vec算法模型实现网络图嵌入。本发明提供的方法通过基于深度自动编码器的神经网络模型将网络图中的边直接映射到低维向量空间中，该方法可以保留边与边的局部近邻度信息和全局近邻度信息，与现有技术相比，本发明的方法能更有效地保留网络图中边的结构信息，在关于边的网络图分析任务中能达到更好的性能，本发明可以应用到所有关于边的网络图分析任务中。

Description

基于边的网络图嵌入方法

技术领域

本发明涉及计算机技术领域，特别是涉及一种基于边的网络图嵌入方法。

背景技术

近年来，网络图嵌入吸引了越来越多研究者的关注。网络图嵌入研究的是如何将网络图有效地映射到低维向量空间，这个过程对于分析网络信息有很大的帮助，比如我们可以将嵌入后的图应用到链接预测、节点聚类等网络图分析任务中。

传统的网络图嵌入方法主要是基于拉普拉斯矩阵或者邻接矩阵进行维度归约，然而，现有技术往往受限于计算开销和性能，近些年一些研究者提出了基于Skip-gram模型的网络图嵌入方法，其原理是将网络图中的节点类比于文档中的单词，然后采用不同的方法来获取节点之间的局部“上下文”关系，如DeepWalk使用随机游走的方式来获取节点的“上下文”信息；Node2vec将DeepWalk中的随机游走替换成了一种同时结合深度优先搜索和广度优先搜索性质的新的搜索策略；LINE将节点的邻居作为“上下文”；GraRep额外考虑了节点的间接邻居而对LINE进行了扩展，但是会受限于嵌入向量的长度。

现有技术的网络图嵌入方法有一个共同特征，它们都是基于节点的，即将网络图中的节点映射到低维向量空间，而网络图中的边不能直接被映射到低维向量空间。所以，边的向量只能通过节点的向量间接获得，而间接获得边向量的方法会有性能缺陷，因为使用边的端点的向量来间接表示边向量并不能保留一条边的完整信息。因此，对于一些基于边的网络图分析任务如链接预测等，使用间接获得边向量的方法往往不能达到最优性能。

因此，现有技术需要改进。

发明内容

本发明实施例所要解决的技术问题是提供一种基于边的网络图嵌入方法，以解决现有技术存在的问题。

为了解决上述问题，本发明公开了一种基于边的网络图嵌入方法，包括：

构建Edge2vec算法模型，所述Edge2vec算法模型为将网络图中的边直接映射到低维向量空间的模型；

使用随机梯度下降法训练Edge2vec算法模型；

使用Edge2vec算法模型实现网络图嵌入。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述Edge2vec算法模型是一个深度神经网络模型，该神经网络由多个共享相同结构和参数的深度自动编码器构成。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述构建Edge2vec算法模型包括：

输入网络图，所述网络图使用有向图G＝(V，E)表示，其中，V代表网络图的节点集合，E代表网络图的边集合，每个节点v∈V代表一个个体，每条边e∈E是一个有序节点对(s，t)(s，t∈V)，代表s到t的关系，其中s叫源节点，t叫目标节点；

定义网络图中边的局部近邻度，所述局部近邻度表示为对于任意两条边e₁＝(s₁，t₁)，e₂＝(s₂，t₂)，如果s₁＝s₂或t₁＝t₂，则e₁和e₂的局部近邻度为1，否则为0；

定义网络图中边的全局近邻度，所述全局近邻度表示为对于任意一条边e＝(s，t)，使用一个邻居向量n_e＝(w_s1，...，w_s|V|，w_t1，...，w_t|V|)来表示e的邻居结构，其中w_ij∈[0，1]表示节点i和节点j之间的邻居关系，两条边e₁和e₂的全局近邻度定义为两个邻居向量和的相似度；

将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息，对于给定一个网络图G＝(V，E)，将每条边e∈E映射到低维向量空间R^d(d＜＜|E|)中，且映射之后保留所有边之间的局部近邻度和全局近邻度信息。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息包括：

计算节点与节点之间的邻居关系；

生成网络图中所有边的邻居向量；

使用深度自动编码器将邻居向量变换成低维向量。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述节点与节点之间的邻居关系使用k步邻接关系来表示：

式中，A表示网络图G的邻接矩阵，β是衰减因子。表示节点i到节点j在k步长度内的邻居关系的强度，如果节点i可以在k步之内到达节点j，则的值大于0，节点i到节点j的距离越短，的值就越大，来表示节点i和节点j的邻居关系，k为一个人为设置的参数。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述深度自动编码器包括编码器部分和解码器部分。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述编码器部分的工作原理为：

输入给定边e的邻居向量

编码器的每层进行非线性变换：

式中，W⁽ⁿ⁾和b⁽ⁿ⁾分别是编码器第n层变换的权重和偏移，σ是sigmoid函数，N是深度自动编码器的编码器部分深度，则是边e的嵌入向量。

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述解码器部分的工作原理为：

解码器的每层非线性变换：

式中，M⁽ⁿ⁾和d⁽ⁿ⁾分别是解码器第n层变换的权重和偏移，是基于嵌入向量重构出的向量，

在基于上述基于边的网络图嵌入方法的另一个实施例中，所述深度自动编码器的损失函数为：

式中，代表Hadamard积，I_e是针对的指示器向量，则I_e为：

其中，p是惩罚因子，p＞1；

对于局部近邻度为1的两条边e和e′，e生成e′的概率为：

式中，即为边e经过深度自动编码器变换后的嵌入向量；

采用负采样方法近似后的目标函数为：

对于包括局部近邻度为1的两条边e和e′，以及λ个负样本，L_local表示为：

L_local(ep，Θ)-o(e，e′)

极大化o(e，e′)的过程与极小化L_local(ep，Θ)的过程是等价的；

Edge2vec算法模型最终的损失函数包括L_global(e，Θ)和L_local(ep，Θ)两部分，其公式为：

其中，α是组合因子，用于平衡两部分损失函数的权重。

与现有技术相比，本发明包括以下优点：

本发明提供的方法通过基于深度自动编码器的神经网络模型将网络图中的边直接映射到低维向量空间中，该方法可以保留边与边的局部近邻度信息和全局近邻度信息，本发明的方法与现有技术相比，能更有效地保留网络图中边的结构信息，在关于边的网络图分析任务中能达到更好的性能，本发明可以应用到所有关于边的网络图分析任务中。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图进行简要介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的基于边的网络图嵌入方法的一个实施例的流程图；

图2是本发明的基于边的网络图嵌入方法的另一个实施例的流程图；

图3是本发明的基于边的网络图嵌入方法的又一个实施例的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明的基于边的网络图嵌入方法的一个实施例的流程图，如图1所示，所述基于边的网络图嵌入方法包括：

10，构建Edge2vec算法模型，所述Edge2vec算法模型为将网络图中的边直接映射到低维向量空间的模型，所述Edge2vec算法模型是一个深度神经网络模型，该神经网络由多个共享相同结构和参数的深度自动编码器构成；其中，Edge2vec算法模型是Edge toVector的简称，是一种基于边的网络图嵌入方法。

20，使用随机梯度下降法训练Edge2vec算法模型；

30，使用Edge2vec算法模型实现网络图嵌入。

图2是本发明的基于边的网络图嵌入方法的另一个实施例的流程图，如图2所示，所述构建Edge2vec算法模型包括：

101，输入网络图，所述网络图使用有向图G＝(V，E)表示，其中，V代表网络图的节点集合，E代表网络图的边集合，每个节点v∈V代表一个个体，每条边e∈E是一个有序节点对(s，t)(s，t∈V)，代表s到t的关系，其中s叫源节点，t叫目标节点，对于有向的网络图，可以把它表示为有向图，而对于无向的网络图，可以将每条无向的边转化为两条方向相反的有向边，以此把它表示为有向图；

102，定义网络图中边的局部近邻度，所述局部近邻度表示为对于任意两条边e₁＝(s₁，t₁)，e₂＝(s₂，t₂)，如果s₁＝s₂或t₁＝t₂，则e₁和e₂的局部近邻度为1，否则为0，局部近邻度的合理性在于，如果两条边的源节点或目标节点相同，那么从网络的局部结构信息角度看，这两条边是相似的；

103，定义网络图中边的全局近邻度，所述全局近邻度表示为对于任意一条边e＝(s，t)，使用一个邻居向量n_e＝(w_s1，...，w_s|V|，w_t1，...，w_t|V|)来表示e的邻居结构，其中w_ij∈[0，1]表示节点i和节点j之间的邻居关系，两条边e₁和e₂的全局近邻度定义为两个邻居向量和的相似度，全局近邻度的合理性在于，如果两条边有相似的邻居向量，那么它们在网络图中扮演着相似的连接角色；

104，将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息，对于给定一个网络图G＝(V，E)，将每条边e∈E映射到低维向量空间R^d(d《|E|)中，且映射之后保留所有边之间的局部近邻度和全局近邻度信息，其中R^d表示d维实数空间。

对于每个深度自动编码器，输入是一个给定边的邻居向量，编码器中间层的表征向量即作为该条边的嵌入向量，也就是将该条边映射到低维向量空间R^d的结果，损失函数L_global的作用是确保嵌入向量能够保留邻居向量的性质。因此，使用Edge2vec算法模型对整个网络图进行嵌入操作后，边与边之间的全局近邻度信息可以被保留。

Edge2vec算法模型是由多个深度自动编码器构成的，而每个深度自动编码器以一条边的邻居向量为输入，所以Edge2vec算法模型是以一组边对应的一组邻居向量为输入的，损失函数L_local借鉴了Skip-gram模型的思想，并基于这组边对应的嵌入向量进行定义，使得边与边之间的局部近邻度信息可以被保留。

所以，Edge2vec算法模型将L_global和L_local联合起来作为整体的损失函数，使得对网络图进行嵌入操作后，边与边之间的局部近邻度信息和全局近邻度信息都尽可能被保留。

图3是本发明的基于边的网络图嵌入方法的又一个实施例的流程图，如图3所示，所述将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息包括：

201，计算节点与节点之间的邻居关系；

202，生成网络图中所有边的邻居向量；

203，使用深度自动编码器将各边的邻居向量变换成低维向量。

所述深度自动编码器包括编码器部分和解码器部分。

所述节点与节点之间的邻居关系使用k步邻接关系来表示：

知道任意两点间的邻居关系后，就可以表示出任意一条边的邻居向量，其长度为网络图中节点数量的两倍，两条边的全局近邻度被定义为对应的两个邻居向量的相似度，使用深度自动编码器来将邻居向量变换成低维向量，这种方法可以很好地保留邻居向量的属性信息。

所述编码器部分的工作原理为：

输入给定边e的邻居向量

编码器的每层进行非线性变换：

所述解码器部分的工作原理为：

解码器的每层非线性变换：

所述深度自动编码器的损失函数为：

式中，代表Hadamard积，I_e是针对的指示器向量，则I_e为：

其中，p是惩罚因子，p＞1；

网络图中的边往往比较稀疏，导致边的邻居向量也很稀疏，所以需要对邻居向量中的非零值更加关注，能尽可能地重构出中的非0值，通过在损失函数中引入指示器向量I_e，可以对非零值的重构误差赋予更大的惩罚，以此来鼓励尽可能地重构出中的非0值，通过梯度下降法最小化损失函数L_global(e，Θ)，可以学习出深度自动编码器的参数。

因为深度自动编码器编码后的嵌入向量可以尽可能地保留邻居向量的属性，所以使用训练好的深度自动编码器对网络图进行嵌入操作后，可以尽可能的保留边与边的全局近邻度信息。

Edge2vec算法利用Skip-gram对网络图中的局部结构性质进行建模，对于局部近邻度为1的两条边e和e′，根据Skip-gram，最大化e生成e′的概率为：

式中，即为边e经过深度自动编码器变换后的嵌入向量；

在实际应用中，由于p(e′|e)较难计算，采用负采样方法来近似化p(e′|e)，对于一对局部近邻度为1的边(e，e′)，按照某种噪声分布采集λ个负样本(e_n，1，e_n，2，...，e_n，λ)，得到近似后的目标函数为：

L_local(ep，Θ)＝-o(e，e′) (9)

极大化o(e，e′)的过程与极小化L_local(ep，Θ)的过程是等价的；通过梯度下降法极小化L_local(ep，Θ)，可以学习出深度自动编码器的参数，因为边e′和负样本包含着与“当前边”e的局部近邻度信息，所以使用训练好的深度自动编码器对网络图进行嵌入操作后，可以尽可能地保留边与边的局部近邻度信息。

L(ep，Θ)＝α∑_c∈epL_global(c，Θ)+(1-α)L_local(ep，Θ) (10)

其中，α是组合因子，用于平衡两部分损失函数的权重。

通过实验结果显示，Edge2vec算法模型在链接预测、社交关系方向预测等网络图分析任务中比DeepWalk、Nodevec、LINE、SDNE等基于节点的网络图嵌入方法拥有更好的性能，这是因为Edge2vec模型能更有效地保留网络图中边的结构信息。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

以上对本发明所提供的一种基于边的网络图嵌入方法，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的实现及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于边的网络图嵌入方法，其特征在于，包括：

构建基于边的网络图嵌入方法Edge2vec算法模型，所述Edge2vec算法模型为将网络图中的边直接映射到低维向量空间的模型；

使用随机梯度下降法训练Edge2vec算法模型；

使用Edge2vec算法模型实现网络图嵌入。

2.根据权利要求1所述的基于边的网络图嵌入方法，其特征在于，所述Edge2vec算法模型是一个深度神经网络模型，该神经网络由多个共享相同结构和参数的深度自动编码器构成。

3.根据权利要求1所述的基于边的网络图嵌入方法，其特征在于，所述构建Edge2vec算法模型包括：

将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息，对于给定一个网络图G＝(V，E)，将每条边e∈E映射到低维向量空间R^d(d＜＜|E|)中，且映射之后保留所有边之间的局部近邻度和全局近邻度信息，其中R^d表示d维实数空间。

4.根据权利要求3所述的基于边的网络图嵌入方法，其特征在于，所述将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息包括：

计算节点与节点之间的邻居关系；

生成网络图中所有边的邻居向量；

使用深度自动编码器将邻居向量变换成低维向量。

5.根据权利要求4所述的基于边的网络图嵌入方法，其特征在于，所述节点与节点之间的邻居关系使用k步邻接关系来表示：

6.根据权利要求4所述的基于边的网络图嵌入方法，其特征在于，所述深度自动编码器包括编码器部分和解码器部分。

7.根据权利要求6所述的基于边的网络图嵌入方法，其特征在于，所述编码器部分的工作原理为：

输入给定边e的邻居向量

编码器的每层进行非线性变换：

<mrow> <msubsup> <mi>x</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </msup> <msubsup> <mi>x</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </msup> <mo>)</mo> </mrow> <mo>,</mo> <mi>n</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

8.根据权利要求6所述的基于边的网络图嵌入方法，其特征在于，所述解码器部分的工作原理为：

解码器的每层非线性变换：

<mrow> <msubsup> <mi>y</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msup> <mi>M</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </msup> <msubsup> <mi>y</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <msup> <mi>d</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> </msup> <mo>)</mo> </mrow> <mo>,</mo> <mi>n</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

9.根据权利要求4所述的基于边的网络图嵌入方法，其特征在于，所述深度自动编码器的损失函数为：

式中，代表Hadamard积，I_e是针对的指示器向量，令则I_e定义为：

其中，p是惩罚因子，p＞1；

对于局部近邻度为1的两条边e和e′，e生成e′的概率为：

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msup> <mi>e</mi> <mo>&prime;</mo> </msup> <mo>|</mo> <mi>e</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>exp</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>&CenterDot;</mo> <msubsup> <mi>x</mi> <msup> <mi>e</mi> <mo>&prime;</mo> </msup> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> <mrow> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <mi>E</mi> <mo>|</mo> </mrow> </msubsup> <mi>exp</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>&CenterDot;</mo> <msubsup> <mi>x</mi> <msub> <mi>e</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

式中，即为边e经过深度自动编码器变换后的嵌入向量；

采用负采样方法近似后的目标函数为：

<mrow> <mi>o</mi> <mrow> <mo>(</mo> <mi>e</mi> <mo>,</mo> <msup> <mi>e</mi> <mo>&prime;</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>&CenterDot;</mo> <msubsup> <mi>x</mi> <msup> <mi>e</mi> <mo>&prime;</mo> </msup> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>&lambda;</mi> </msubsup> <mrow> <mo>(</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mi>&sigma;</mi> <mo>(</mo> <mrow> <mo>-</mo> <msubsup> <mi>x</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> <mo>&CenterDot;</mo> <msubsup> <mi>x</mi> <msub> <mi>e</mi> <mrow> <mi>n</mi> <mo>,</mo> <mi>i</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msubsup> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

L_local(ep，Θ)＝-o(e，e′) (9)

L(ep，Θ)＝α∑_c∈epL_global(c，Θ)+(1-α)L_local(ep，Θ) (10)

其中，α是组合因子，用于平衡两部分损失函数的权重。