CN107633263A - 基于边的网络图嵌入方法 - Google Patents
基于边的网络图嵌入方法 Download PDFInfo
- Publication number
- CN107633263A CN107633263A CN201710763470.7A CN201710763470A CN107633263A CN 107633263 A CN107633263 A CN 107633263A CN 201710763470 A CN201710763470 A CN 201710763470A CN 107633263 A CN107633263 A CN 107633263A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msubsup
- network
- node
- msup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于边的网络图嵌入方法,包括:构建Edge2vec算法模型;使用随机梯度下降法训练Edge2vec算法模型;使用Edge2vec算法模型实现网络图嵌入。本发明提供的方法通过基于深度自动编码器的神经网络模型将网络图中的边直接映射到低维向量空间中,该方法可以保留边与边的局部近邻度信息和全局近邻度信息,与现有技术相比,本发明的方法能更有效地保留网络图中边的结构信息,在关于边的网络图分析任务中能达到更好的性能,本发明可以应用到所有关于边的网络图分析任务中。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种基于边的网络图嵌入方法。
背景技术
近年来,网络图嵌入吸引了越来越多研究者的关注。网络图嵌入研究的是如何将网络图有效地映射到低维向量空间,这个过程对于分析网络信息有很大的帮助,比如我们可以将嵌入后的图应用到链接预测、节点聚类等网络图分析任务中。
传统的网络图嵌入方法主要是基于拉普拉斯矩阵或者邻接矩阵进行维度归约,然而,现有技术往往受限于计算开销和性能,近些年一些研究者提出了基于Skip-gram模型的网络图嵌入方法,其原理是将网络图中的节点类比于文档中的单词,然后采用不同的方法来获取节点之间的局部“上下文”关系,如DeepWalk使用随机游走的方式来获取节点的“上下文”信息;Node2vec将DeepWalk中的随机游走替换成了一种同时结合深度优先搜索和广度优先搜索性质的新的搜索策略;LINE将节点的邻居作为“上下文”;GraRep额外考虑了节点的间接邻居而对LINE进行了扩展,但是会受限于嵌入向量的长度。
现有技术的网络图嵌入方法有一个共同特征,它们都是基于节点的,即将网络图中的节点映射到低维向量空间,而网络图中的边不能直接被映射到低维向量空间。所以,边的向量只能通过节点的向量间接获得,而间接获得边向量的方法会有性能缺陷,因为使用边的端点的向量来间接表示边向量并不能保留一条边的完整信息。因此,对于一些基于边的网络图分析任务如链接预测等,使用间接获得边向量的方法往往不能达到最优性能。
因此,现有技术需要改进。
发明内容
本发明实施例所要解决的技术问题是提供一种基于边的网络图嵌入方法,以解决现有技术存在的问题。
为了解决上述问题,本发明公开了一种基于边的网络图嵌入方法,包括:
构建Edge2vec算法模型,所述Edge2vec算法模型为将网络图中的边直接映射到低维向量空间的模型;
使用随机梯度下降法训练Edge2vec算法模型;
使用Edge2vec算法模型实现网络图嵌入。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述Edge2vec算法模型是一个深度神经网络模型,该神经网络由多个共享相同结构和参数的深度自动编码器构成。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述构建Edge2vec算法模型包括:
输入网络图,所述网络图使用有向图G=(V,E)表示,其中,V代表网络图的节点集合,E代表网络图的边集合,每个节点v∈V代表一个个体,每条边e∈E是一个有序节点对(s,t)(s,t∈V),代表s到t的关系,其中s叫源节点,t叫目标节点;
定义网络图中边的局部近邻度,所述局部近邻度表示为对于任意两条边e1=(s1,t1),e2=(s2,t2),如果s1=s2或t1=t2,则e1和e2的局部近邻度为1,否则为0;
定义网络图中边的全局近邻度,所述全局近邻度表示为对于任意一条边e=(s,t),使用一个邻居向量ne=(ws1,...,ws|V|,wt1,...,wt|V|)来表示e的邻居结构,其中wij∈[0,1]表示节点i和节点j之间的邻居关系,两条边e1和e2的全局近邻度定义为两个邻居向量和的相似度;
将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息,对于给定一个网络图G=(V,E),将每条边e∈E映射到低维向量空间Rd(d<<|E|)中,且映射之后保留所有边之间的局部近邻度和全局近邻度信息。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息包括:
计算节点与节点之间的邻居关系;
生成网络图中所有边的邻居向量;
使用深度自动编码器将邻居向量变换成低维向量。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述节点与节点之间的邻居关系使用k步邻接关系来表示:
式中,A表示网络图G的邻接矩阵,β是衰减因子。表示节点i到节点j在k步长度内的邻居关系的强度,如果节点i可以在k步之内到达节点j,则的值大于0,节点i到节点j的距离越短,的值就越大,来表示节点i和节点j的邻居关系,k为一个人为设置的参数。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述深度自动编码器包括编码器部分和解码器部分。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述编码器部分的工作原理为:
输入给定边e的邻居向量
编码器的每层进行非线性变换:
式中,W(n)和b(n)分别是编码器第n层变换的权重和偏移,σ是sigmoid函数,N是深度自动编码器的编码器部分深度,则是边e的嵌入向量。
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述解码器部分的工作原理为:
解码器的每层非线性变换:
式中,M(n)和d(n)分别是解码器第n层变换的权重和偏移,是基于嵌入向量重构出的向量,
在基于上述基于边的网络图嵌入方法的另一个实施例中,所述深度自动编码器的损失函数为:
式中,代表Hadamard积,Ie是针对的指示器向量, 则Ie为:
其中,p是惩罚因子,p>1;
对于局部近邻度为1的两条边e和e′,e生成e′的概率为:
式中,即为边e经过深度自动编码器变换后的嵌入向量;
采用负采样方法近似后的目标函数为:
对于包括局部近邻度为1的两条边e和e′,以及λ个负样本,Llocal表示为:
Llocal(ep,Θ)-o(e,e′)
极大化o(e,e′)的过程与极小化Llocal(ep,Θ)的过程是等价的;
Edge2vec算法模型最终的损失函数包括Lglobal(e,Θ)和Llocal(ep,Θ)两部分,其公式为:
其中,α是组合因子,用于平衡两部分损失函数的权重。
与现有技术相比,本发明包括以下优点:
本发明提供的方法通过基于深度自动编码器的神经网络模型将网络图中的边直接映射到低维向量空间中,该方法可以保留边与边的局部近邻度信息和全局近邻度信息,本发明的方法与现有技术相比,能更有效地保留网络图中边的结构信息,在关于边的网络图分析任务中能达到更好的性能,本发明可以应用到所有关于边的网络图分析任务中。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图进行简要介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的基于边的网络图嵌入方法的一个实施例的流程图;
图2是本发明的基于边的网络图嵌入方法的另一个实施例的流程图;
图3是本发明的基于边的网络图嵌入方法的又一个实施例的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明的基于边的网络图嵌入方法的一个实施例的流程图,如图1所示,所述基于边的网络图嵌入方法包括:
10,构建Edge2vec算法模型,所述Edge2vec算法模型为将网络图中的边直接映射到低维向量空间的模型,所述Edge2vec算法模型是一个深度神经网络模型,该神经网络由多个共享相同结构和参数的深度自动编码器构成;其中,Edge2vec算法模型是Edge toVector的简称,是一种基于边的网络图嵌入方法。
20,使用随机梯度下降法训练Edge2vec算法模型;
30,使用Edge2vec算法模型实现网络图嵌入。
图2是本发明的基于边的网络图嵌入方法的另一个实施例的流程图,如图2所示,所述构建Edge2vec算法模型包括:
101,输入网络图,所述网络图使用有向图G=(V,E)表示,其中,V代表网络图的节点集合,E代表网络图的边集合,每个节点v∈V代表一个个体,每条边e∈E是一个有序节点对(s,t)(s,t∈V),代表s到t的关系,其中s叫源节点,t叫目标节点,对于有向的网络图,可以把它表示为有向图,而对于无向的网络图,可以将每条无向的边转化为两条方向相反的有向边,以此把它表示为有向图;
102,定义网络图中边的局部近邻度,所述局部近邻度表示为对于任意两条边e1=(s1,t1),e2=(s2,t2),如果s1=s2或t1=t2,则e1和e2的局部近邻度为1,否则为0,局部近邻度的合理性在于,如果两条边的源节点或目标节点相同,那么从网络的局部结构信息角度看,这两条边是相似的;
103,定义网络图中边的全局近邻度,所述全局近邻度表示为对于任意一条边e=(s,t),使用一个邻居向量ne=(ws1,...,ws|V|,wt1,...,wt|V|)来表示e的邻居结构,其中wij∈[0,1]表示节点i和节点j之间的邻居关系,两条边e1和e2的全局近邻度定义为两个邻居向量和的相似度,全局近邻度的合理性在于,如果两条边有相似的邻居向量,那么它们在网络图中扮演着相似的连接角色;
104,将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息,对于给定一个网络图G=(V,E),将每条边e∈E映射到低维向量空间Rd(d《|E|)中,且映射之后保留所有边之间的局部近邻度和全局近邻度信息,其中Rd表示d维实数空间。
对于每个深度自动编码器,输入是一个给定边的邻居向量,编码器中间层的表征向量即作为该条边的嵌入向量,也就是将该条边映射到低维向量空间Rd的结果,损失函数Lglobal的作用是确保嵌入向量能够保留邻居向量的性质。因此,使用Edge2vec算法模型对整个网络图进行嵌入操作后,边与边之间的全局近邻度信息可以被保留。
Edge2vec算法模型是由多个深度自动编码器构成的,而每个深度自动编码器以一条边的邻居向量为输入,所以Edge2vec算法模型是以一组边对应的一组邻居向量为输入的,损失函数Llocal借鉴了Skip-gram模型的思想,并基于这组边对应的嵌入向量进行定义,使得边与边之间的局部近邻度信息可以被保留。
所以,Edge2vec算法模型将Lglobal和Llocal联合起来作为整体的损失函数,使得对网络图进行嵌入操作后,边与边之间的局部近邻度信息和全局近邻度信息都尽可能被保留。
图3是本发明的基于边的网络图嵌入方法的又一个实施例的流程图,如图3所示,所述将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息包括:
201,计算节点与节点之间的邻居关系;
202,生成网络图中所有边的邻居向量;
203,使用深度自动编码器将各边的邻居向量变换成低维向量。
所述深度自动编码器包括编码器部分和解码器部分。
所述节点与节点之间的邻居关系使用k步邻接关系来表示:
式中,A表示网络图G的邻接矩阵,β是衰减因子。表示节点i到节点j在k步长度内的邻居关系的强度,如果节点i可以在k步之内到达节点j,则的值大于0,节点i到节点j的距离越短,的值就越大,来表示节点i和节点j的邻居关系,k为一个人为设置的参数。
知道任意两点间的邻居关系后,就可以表示出任意一条边的邻居向量,其长度为网络图中节点数量的两倍,两条边的全局近邻度被定义为对应的两个邻居向量的相似度,使用深度自动编码器来将邻居向量变换成低维向量,这种方法可以很好地保留邻居向量的属性信息。
所述编码器部分的工作原理为:
输入给定边e的邻居向量
编码器的每层进行非线性变换:
式中,W(n)和b(n)分别是编码器第n层变换的权重和偏移,σ是sigmoid函数,N是深度自动编码器的编码器部分深度,则是边e的嵌入向量。
所述解码器部分的工作原理为:
解码器的每层非线性变换:
式中,M(n)和d(n)分别是解码器第n层变换的权重和偏移,是基于嵌入向量重构出的向量,
所述深度自动编码器的损失函数为:
式中,代表Hadamard积,Ie是针对的指示器向量, 则Ie为:
其中,p是惩罚因子,p>1;
网络图中的边往往比较稀疏,导致边的邻居向量也很稀疏,所以需要对邻居向量中的非零值更加关注,能尽可能地重构出中的非0值,通过在损失函数中引入指示器向量Ie,可以对非零值的重构误差赋予更大的惩罚,以此来鼓励尽可能地重构出中的非0值,通过梯度下降法最小化损失函数Lglobal(e,Θ),可以学习出深度自动编码器的参数。
因为深度自动编码器编码后的嵌入向量可以尽可能地保留邻居向量的属性,所以使用训练好的深度自动编码器对网络图进行嵌入操作后,可以尽可能的保留边与边的全局近邻度信息。
Edge2vec算法利用Skip-gram对网络图中的局部结构性质进行建模,对于局部近邻度为1的两条边e和e′,根据Skip-gram,最大化e生成e′的概率为:
式中,即为边e经过深度自动编码器变换后的嵌入向量;
在实际应用中,由于p(e′|e)较难计算,采用负采样方法来近似化p(e′|e),对于一对局部近邻度为1的边(e,e′),按照某种噪声分布采集λ个负样本(en,1,en,2,...,en,λ),得到近似后的目标函数为:
对于包括局部近邻度为1的两条边e和e′,以及λ个负样本,Llocal表示为:
Llocal(ep,Θ)=-o(e,e′) (9)
极大化o(e,e′)的过程与极小化Llocal(ep,Θ)的过程是等价的;通过梯度下降法极小化Llocal(ep,Θ),可以学习出深度自动编码器的参数,因为边e′和负样本包含着与“当前边”e的局部近邻度信息,所以使用训练好的深度自动编码器对网络图进行嵌入操作后,可以尽可能地保留边与边的局部近邻度信息。
Edge2vec算法模型最终的损失函数包括Lglobal(e,Θ)和Llocal(ep,Θ)两部分,其公式为:
L(ep,Θ)=α∑c∈epLglobal(c,Θ)+(1-α)Llocal(ep,Θ) (10)
其中,α是组合因子,用于平衡两部分损失函数的权重。
通过实验结果显示,Edge2vec算法模型在链接预测、社交关系方向预测等网络图分析任务中比DeepWalk、Nodevec、LINE、SDNE等基于节点的网络图嵌入方法拥有更好的性能,这是因为Edge2vec模型能更有效地保留网络图中边的结构信息。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种基于边的网络图嵌入方法,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的实现及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种基于边的网络图嵌入方法,其特征在于,包括:
构建基于边的网络图嵌入方法Edge2vec算法模型,所述Edge2vec算法模型为将网络图中的边直接映射到低维向量空间的模型;
使用随机梯度下降法训练Edge2vec算法模型;
使用Edge2vec算法模型实现网络图嵌入。
2.根据权利要求1所述的基于边的网络图嵌入方法,其特征在于,所述Edge2vec算法模型是一个深度神经网络模型,该神经网络由多个共享相同结构和参数的深度自动编码器构成。
3.根据权利要求1所述的基于边的网络图嵌入方法,其特征在于,所述构建Edge2vec算法模型包括:
输入网络图,所述网络图使用有向图G=(V,E)表示,其中,V代表网络图的节点集合,E代表网络图的边集合,每个节点v∈V代表一个个体,每条边e∈E是一个有序节点对(s,t)(s,t∈V),代表s到t的关系,其中s叫源节点,t叫目标节点;
定义网络图中边的局部近邻度,所述局部近邻度表示为对于任意两条边e1=(s1,t1),e2=(s2,t2),如果s1=s2或t1=t2,则e1和e2的局部近邻度为1,否则为0;
定义网络图中边的全局近邻度,所述全局近邻度表示为对于任意一条边e=(s,t),使用一个邻居向量ne=(ws1,...,ws|V|,wt1,...,wt|V|)来表示e的邻居结构,其中wij∈[0,1]表示节点i和节点j之间的邻居关系,两条边e1和e2的全局近邻度定义为两个邻居向量和的相似度;
将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息,对于给定一个网络图G=(V,E),将每条边e∈E映射到低维向量空间Rd(d<<|E|)中,且映射之后保留所有边之间的局部近邻度和全局近邻度信息,其中Rd表示d维实数空间。
4.根据权利要求3所述的基于边的网络图嵌入方法,其特征在于,所述将网络图中的边映射到低维向量空间并保留局部近邻度和全局近邻度信息包括:
计算节点与节点之间的邻居关系;
生成网络图中所有边的邻居向量;
使用深度自动编码器将邻居向量变换成低维向量。
5.根据权利要求4所述的基于边的网络图嵌入方法,其特征在于,所述节点与节点之间的邻居关系使用k步邻接关系来表示:
<mrow>
<msubsup>
<mi>w</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mn>1</mn>
</msubsup>
<mo>=</mo>
<msub>
<mi>A</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>w</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mi>k</mi>
</msubsup>
<mo>=</mo>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>max</mi>
<mi>m</mi>
</msub>
<mo>(</mo>
<mrow>
<msubsup>
<mi>w</mi>
<mrow>
<mi>i</mi>
<mi>m</mi>
</mrow>
<mrow>
<mi>k</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>*</mo>
<msubsup>
<mi>w</mi>
<mrow>
<mi>m</mi>
<mi>j</mi>
</mrow>
<mn>1</mn>
</msubsup>
<mo>*</mo>
<mi>&beta;</mi>
</mrow>
<mo>)</mo>
<mo>,</mo>
<msubsup>
<mi>w</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
<mrow>
<mi>k</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,A表示网络图G的邻接矩阵,β是衰减因子。表示节点i到节点j在k步长度内的邻居关系的强度,如果节点i可以在k步之内到达节点j,则的值大于0,节点i到节点j的距离越短,的值就越大,来表示节点i和节点j的邻居关系,k为一个人为设置的参数。
6.根据权利要求4所述的基于边的网络图嵌入方法,其特征在于,所述深度自动编码器包括编码器部分和解码器部分。
7.根据权利要求6所述的基于边的网络图嵌入方法,其特征在于,所述编码器部分的工作原理为:
输入给定边e的邻居向量
编码器的每层进行非线性变换:
<mrow>
<msubsup>
<mi>x</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>=</mo>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</msup>
<msubsup>
<mi>x</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</msubsup>
<mo>+</mo>
<msup>
<mi>b</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</msup>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<mi>N</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,W(n)和b(n)分别是编码器第n层变换的权重和偏移,σ是sigmoid函数,N是深度自动编码器的编码器部分深度,则是边e的嵌入向量。
8.根据权利要求6所述的基于边的网络图嵌入方法,其特征在于,所述解码器部分的工作原理为:
解码器的每层非线性变换:
<mrow>
<msubsup>
<mi>y</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</msubsup>
<mo>=</mo>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>M</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</msup>
<msubsup>
<mi>y</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>+</mo>
<msup>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</msup>
<mo>)</mo>
</mrow>
<mo>,</mo>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<mn>2</mn>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<mi>N</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,M(n)和d(n)分别是解码器第n层变换的权重和偏移,是基于嵌入向量重构出的向量,
9.根据权利要求4所述的基于边的网络图嵌入方法,其特征在于,所述深度自动编码器的损失函数为:
式中,代表Hadamard积,Ie是针对的指示器向量,令 则Ie定义为:
<mrow>
<msub>
<mi>I</mi>
<mrow>
<mi>e</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>p</mi>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msubsup>
<mi>x</mi>
<mrow>
<mi>e</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
</msubsup>
<mo>></mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>1</mn>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msubsup>
<mi>x</mi>
<mrow>
<mi>e</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
</msubsup>
<mo>=</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,p是惩罚因子,p>1;
对于局部近邻度为1的两条边e和e′,e生成e′的概率为:
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>|</mo>
<mi>e</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>&CenterDot;</mo>
<msubsup>
<mi>x</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mrow>
<mo>|</mo>
<mi>E</mi>
<mo>|</mo>
</mrow>
</msubsup>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>&CenterDot;</mo>
<msubsup>
<mi>x</mi>
<msub>
<mi>e</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
式中,即为边e经过深度自动编码器变换后的嵌入向量;
采用负采样方法近似后的目标函数为:
<mrow>
<mi>o</mi>
<mrow>
<mo>(</mo>
<mi>e</mi>
<mo>,</mo>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>&CenterDot;</mo>
<msubsup>
<mi>x</mi>
<msup>
<mi>e</mi>
<mo>&prime;</mo>
</msup>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>&lambda;</mi>
</msubsup>
<mrow>
<mo>(</mo>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mi>&sigma;</mi>
<mo>(</mo>
<mrow>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>&CenterDot;</mo>
<msubsup>
<mi>x</mi>
<msub>
<mi>e</mi>
<mrow>
<mi>n</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>)</mo>
</mrow>
</msubsup>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
对于包括局部近邻度为1的两条边e和e′,以及λ个负样本,Llocal表示为:
Llocal(ep,Θ)=-o(e,e′) (9)
极大化o(e,e′)的过程与极小化Llocal(ep,Θ)的过程是等价的;
Edge2vec算法模型最终的损失函数包括Lglobal(e,Θ)和Llocal(ep,Θ)两部分,其公式为:
L(ep,Θ)=α∑c∈epLglobal(c,Θ)+(1-α)Llocal(ep,Θ) (10)
其中,α是组合因子,用于平衡两部分损失函数的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710763470.7A CN107633263A (zh) | 2017-08-30 | 2017-08-30 | 基于边的网络图嵌入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710763470.7A CN107633263A (zh) | 2017-08-30 | 2017-08-30 | 基于边的网络图嵌入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107633263A true CN107633263A (zh) | 2018-01-26 |
Family
ID=61100863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710763470.7A Pending CN107633263A (zh) | 2017-08-30 | 2017-08-30 | 基于边的网络图嵌入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107633263A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108665056A (zh) * | 2018-03-14 | 2018-10-16 | 中山大学 | 一种基于nrl的智能搬运机器人预测任务状态的方法 |
CN109034960A (zh) * | 2018-07-12 | 2018-12-18 | 电子科技大学 | 一种基于用户节点嵌入的多属性推断的方法 |
CN109063041A (zh) * | 2018-07-17 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 关系网络图嵌入的方法及装置 |
CN109102393A (zh) * | 2018-08-15 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 训练和使用关系网络嵌入模型的方法及装置 |
CN109284414A (zh) * | 2018-09-30 | 2019-01-29 | 中国科学院计算技术研究所 | 基于语义保持的跨模态内容检索方法和系统 |
CN109344295A (zh) * | 2018-08-24 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 分布式图嵌入方法、装置、设备及系统 |
CN109389151A (zh) * | 2018-08-30 | 2019-02-26 | 华南师范大学 | 一种基于半监督嵌入表示模型的知识图谱处理方法和装置 |
CN109558494A (zh) * | 2018-10-29 | 2019-04-02 | 中国科学院计算机网络信息中心 | 一种基于异质网络嵌入的学者名字消歧方法 |
CN109635147A (zh) * | 2018-12-13 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 一种顶点的图嵌入向量生成、查询方法和装置 |
CN109753589A (zh) * | 2018-11-28 | 2019-05-14 | 中国科学院信息工程研究所 | 一种基于图卷积网络的图可视化方法 |
CN110032606A (zh) * | 2019-03-29 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 一种样本聚类方法及装置 |
CN110097893A (zh) * | 2019-05-23 | 2019-08-06 | 北京搜狐新媒体信息技术有限公司 | 音频信号的转换方法及装置 |
CN110119475A (zh) * | 2019-01-29 | 2019-08-13 | 成都信息工程大学 | 一种poi推荐方法及推荐系统 |
CN110278175A (zh) * | 2018-03-14 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 图结构模型训练、垃圾账户识别方法、装置以及设备 |
WO2019205571A1 (zh) * | 2018-04-26 | 2019-10-31 | 清华大学 | 十亿规模网络嵌入的迭代随机投影算法及装置 |
CN110619564A (zh) * | 2018-06-20 | 2019-12-27 | 天云融创数据科技(北京)有限公司 | 一种反欺诈特征生成方法和装置 |
CN112163848A (zh) * | 2020-09-21 | 2021-01-01 | 哈尔滨工业大学(威海) | 一种面向流网络的角色划分系统及其工作方法、介质 |
US11159549B2 (en) | 2016-03-30 | 2021-10-26 | British Telecommunications Public Limited Company | Network traffic threat identification |
US11194901B2 (en) | 2016-03-30 | 2021-12-07 | British Telecommunications Public Limited Company | Detecting computer security threats using communication characteristics of communication protocols |
US11520882B2 (en) | 2018-12-03 | 2022-12-06 | British Telecommunications Public Limited Company | Multi factor network anomaly detection |
US11552977B2 (en) | 2019-01-09 | 2023-01-10 | British Telecommunications Public Limited Company | Anomalous network node behavior identification using deterministic path walking |
US11960610B2 (en) | 2018-12-03 | 2024-04-16 | British Telecommunications Public Limited Company | Detecting vulnerability change in software systems |
US11973778B2 (en) | 2018-12-03 | 2024-04-30 | British Telecommunications Public Limited Company | Detecting anomalies in computer networks |
US11989307B2 (en) | 2018-12-03 | 2024-05-21 | British Telecommunications Public Company Limited | Detecting vulnerable software systems |
US11989289B2 (en) | 2018-12-03 | 2024-05-21 | British Telecommunications Public Limited Company | Remediating software vulnerabilities |
-
2017
- 2017-08-30 CN CN201710763470.7A patent/CN107633263A/zh active Pending
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11194901B2 (en) | 2016-03-30 | 2021-12-07 | British Telecommunications Public Limited Company | Detecting computer security threats using communication characteristics of communication protocols |
US11159549B2 (en) | 2016-03-30 | 2021-10-26 | British Telecommunications Public Limited Company | Network traffic threat identification |
CN110278175B (zh) * | 2018-03-14 | 2020-06-02 | 阿里巴巴集团控股有限公司 | 图结构模型训练、垃圾账户识别方法、装置以及设备 |
CN108665056A (zh) * | 2018-03-14 | 2018-10-16 | 中山大学 | 一种基于nrl的智能搬运机器人预测任务状态的方法 |
CN110278175A (zh) * | 2018-03-14 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 图结构模型训练、垃圾账户识别方法、装置以及设备 |
US10917425B2 (en) | 2018-03-14 | 2021-02-09 | Advanced New Technologies Co., Ltd. | Graph structure model training and junk account identification |
WO2019205571A1 (zh) * | 2018-04-26 | 2019-10-31 | 清华大学 | 十亿规模网络嵌入的迭代随机投影算法及装置 |
CN110619564A (zh) * | 2018-06-20 | 2019-12-27 | 天云融创数据科技(北京)有限公司 | 一种反欺诈特征生成方法和装置 |
CN109034960A (zh) * | 2018-07-12 | 2018-12-18 | 电子科技大学 | 一种基于用户节点嵌入的多属性推断的方法 |
CN109034960B (zh) * | 2018-07-12 | 2022-09-06 | 电子科技大学 | 一种基于用户节点嵌入的多属性推断的方法 |
CN109063041B (zh) * | 2018-07-17 | 2020-04-07 | 阿里巴巴集团控股有限公司 | 关系网络图嵌入的方法及装置 |
TWI700599B (zh) * | 2018-07-17 | 2020-08-01 | 香港商阿里巴巴集團服務有限公司 | 關係網絡圖嵌人的方法及裝置、電腦可讀儲存媒體及計算設備 |
WO2020015464A1 (zh) * | 2018-07-17 | 2020-01-23 | 阿里巴巴集团控股有限公司 | 关系网络图嵌入的方法及装置 |
CN109063041A (zh) * | 2018-07-17 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 关系网络图嵌入的方法及装置 |
CN109102393B (zh) * | 2018-08-15 | 2021-06-29 | 创新先进技术有限公司 | 训练和使用关系网络嵌入模型的方法及装置 |
CN109102393A (zh) * | 2018-08-15 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 训练和使用关系网络嵌入模型的方法及装置 |
US11074295B2 (en) | 2018-08-24 | 2021-07-27 | Advanced New Technologies Co., Ltd. | Distributed graph embedding method and apparatus, device, and system |
CN109344295B (zh) * | 2018-08-24 | 2020-05-05 | 阿里巴巴集团控股有限公司 | 分布式图嵌入方法、装置、设备及系统 |
CN109344295A (zh) * | 2018-08-24 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 分布式图嵌入方法、装置、设备及系统 |
CN109389151A (zh) * | 2018-08-30 | 2019-02-26 | 华南师范大学 | 一种基于半监督嵌入表示模型的知识图谱处理方法和装置 |
CN109284414A (zh) * | 2018-09-30 | 2019-01-29 | 中国科学院计算技术研究所 | 基于语义保持的跨模态内容检索方法和系统 |
CN109284414B (zh) * | 2018-09-30 | 2020-12-04 | 中国科学院计算技术研究所 | 基于语义保持的跨模态内容检索方法和系统 |
CN109558494A (zh) * | 2018-10-29 | 2019-04-02 | 中国科学院计算机网络信息中心 | 一种基于异质网络嵌入的学者名字消歧方法 |
CN109753589A (zh) * | 2018-11-28 | 2019-05-14 | 中国科学院信息工程研究所 | 一种基于图卷积网络的图可视化方法 |
US11989307B2 (en) | 2018-12-03 | 2024-05-21 | British Telecommunications Public Company Limited | Detecting vulnerable software systems |
US11960610B2 (en) | 2018-12-03 | 2024-04-16 | British Telecommunications Public Limited Company | Detecting vulnerability change in software systems |
US11973778B2 (en) | 2018-12-03 | 2024-04-30 | British Telecommunications Public Limited Company | Detecting anomalies in computer networks |
US11520882B2 (en) | 2018-12-03 | 2022-12-06 | British Telecommunications Public Limited Company | Multi factor network anomaly detection |
US11989289B2 (en) | 2018-12-03 | 2024-05-21 | British Telecommunications Public Limited Company | Remediating software vulnerabilities |
CN109635147B (zh) * | 2018-12-13 | 2023-08-22 | 创新先进技术有限公司 | 一种顶点的图嵌入向量生成、查询方法和装置 |
CN109635147A (zh) * | 2018-12-13 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 一种顶点的图嵌入向量生成、查询方法和装置 |
US11552977B2 (en) | 2019-01-09 | 2023-01-10 | British Telecommunications Public Limited Company | Anomalous network node behavior identification using deterministic path walking |
CN110119475A (zh) * | 2019-01-29 | 2019-08-13 | 成都信息工程大学 | 一种poi推荐方法及推荐系统 |
CN110032606B (zh) * | 2019-03-29 | 2021-05-14 | 创新先进技术有限公司 | 一种样本聚类方法及装置 |
CN110032606A (zh) * | 2019-03-29 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 一种样本聚类方法及装置 |
CN110097893B (zh) * | 2019-05-23 | 2021-04-20 | 北京搜狐新媒体信息技术有限公司 | 音频信号的转换方法及装置 |
CN110097893A (zh) * | 2019-05-23 | 2019-08-06 | 北京搜狐新媒体信息技术有限公司 | 音频信号的转换方法及装置 |
CN112163848A (zh) * | 2020-09-21 | 2021-01-01 | 哈尔滨工业大学(威海) | 一种面向流网络的角色划分系统及其工作方法、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633263A (zh) | 基于边的网络图嵌入方法 | |
CN109887282B (zh) | 一种基于层级时序图卷积网络的路网交通流预测方法 | |
Ding et al. | Complex network theory applied to the growth of Kuala Lumpur’s public urban rail transit network | |
CN104102745B (zh) | 基于局部最小边的复杂网络社团挖掘方法 | |
CN112070779A (zh) | 一种基于卷积神经网络弱监督学习的遥感影像道路分割方法 | |
CN108920678A (zh) | 一种基于谱聚类与模糊集的重叠社区发现方法 | |
CN109743196B (zh) | 一种基于跨双层网络随机游走的网络表征方法 | |
Zheng et al. | Improving the efficiency of multi-objective evolutionary algorithms through decomposition: An application to water distribution network design | |
CN104392094A (zh) | 一种基于浮动车数据的城市道路网络可靠性评价方法 | |
Gutiérrez et al. | Labeling algorithm for the shortest path problem with turn prohibitions with application to large-scale road networks | |
CN107742169A (zh) | 一种基于复杂网络的城市公交网络系统构建方法及性能评估方法 | |
CN104462773B (zh) | 一种用于生物多样性保护的河流网络构建方法及其应用 | |
CN105162654A (zh) | 一种基于局部社团信息的链路预测方法 | |
CN115131560A (zh) | 基于全局特征学习和局部特征判别聚合的点云分割方法 | |
CN114969532A (zh) | 一种基于异质图神经网络的多模态交通推荐方法 | |
CN107292440A (zh) | 一种基于ba无标度网络理论的集装箱班轮航线优化方法 | |
CN108536825A (zh) | 一种识别房源数据是否重复的方法 | |
CN102819581B (zh) | 一种地理信息系统拓扑集中的多边形链生成方法 | |
CN106341258A (zh) | 一种基于二阶局部社团和种子节点结构信息的预测网络未知连边的方法 | |
Ghorbani et al. | Computing geometric-arithmetic index of Some Graphs | |
Bettinelli et al. | Algorithm for parametric community detection in networks | |
Zhang et al. | Solving multi-class traffic assignment problem with genetic algorithm | |
CN115544307A (zh) | 基于关联矩阵的有向图数据特征提取与表达方法和系统 | |
CN108363563A (zh) | 基于数据图谱、信息图谱和知识图谱架构的uml模型一致性检测方法 | |
CN114599043A (zh) | 一种基于深度强化学习的空天地一体化网络资源分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180126 |
|
RJ01 | Rejection of invention patent application after publication |