CN113988464A - 基于图神经网络的网络链路属性关系预测方法及设备 - Google Patents
基于图神经网络的网络链路属性关系预测方法及设备 Download PDFInfo
- Publication number
- CN113988464A CN113988464A CN202111362895.XA CN202111362895A CN113988464A CN 113988464 A CN113988464 A CN 113988464A CN 202111362895 A CN202111362895 A CN 202111362895A CN 113988464 A CN113988464 A CN 113988464A
- Authority
- CN
- China
- Prior art keywords
- node
- matrix
- attribute
- graph structure
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 136
- 239000011159 matrix material Substances 0.000 claims abstract description 94
- 230000007246 mechanism Effects 0.000 claims abstract description 23
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000004087 circulation Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Abstract
本发明公开了一种基于图神经网络的网络链路属性关系预测方法及设备。所述方法包括:将网络数据映射为对应的拓扑图结构,并得到拓扑图结构的节点属性矩阵;基于拓扑图结构获取无权重拓扑图结构的邻接矩阵,基于节点属性矩阵获取带权重拓扑图结构的邻接矩阵;根据无权重拓扑图结构的邻接矩阵,经过包含集成更新的传播机制生成节点的空间嵌入向量;根据拓扑图结构的节点属性矩阵和带权重拓扑图结构的邻接矩阵,经过包含集成更新的传播机制生成节点的属性嵌入向量;将空间嵌入向量和属性嵌入向量进行拼接,得到合成嵌入向量;将合成嵌入向量输入节点对关系提取器,最终得到节点之间的链路关系预测结果。本发明可提高网络链路属性关系预测的性能。
Description
技术领域
本发明涉及网络的链路关系预测,具体涉及一种网络链路属性关系预测方法及设备。
背景技术
现实生活中存在众多以拓扑图为结构的数据集,它们广泛存在于社交网络、金融网 络、蛋白质结构网络以及互联网网站网络等等网络中,具有网络结构是这些数据的显著共同特征。如何正确的利用这些数据的网络结构特征,在数据处理的过程中有效的区分 出不同网络结构的特性,是值得研究的地方。特别的,网络链路可以体现网络的结构关 系,可以体现个体的相关性和相互作用关系,掌握网络的链路关系可以全面的了解网络 整体结构以及个体之间的关系。
针对拓扑图结构的数据集的链接预测任务主要预测图中的两个节点之间是否存在 链接。例如,在社交网络中预测用户是否可能成为好友,在计算机通信网络中预测节点之间的相互通信状态。在复杂网络的结构预测中需要高效的网络链路预测算法来实现链接预测,这也称为链路关系预测。
目前针对网络链路关系预测最简单的框架是基于相似性的算法,其中两两节点都被 分配一个分数,分数被直接定义为两个节点之间的相似性,如果网络的链路未知,算法会根据两两节点之间的分数来对节点之间的链路进行预测,分数越高的节点对应的节点相似性也就越大,节点之间存在链路的可能性也就越大。尽管基于相似性的算法在思想 上很简单,但当前仍然是主流研究方向。事实上,节点相似性的定义具有不小的挑战, 基于特定相似性定义的算法可能对一些网络很有效,但对另一些网络则会失去作用。
此外,网络链路预测算法还包括基于最大似然估计的算法,这一类算法会预先假设 网络结构的一些组织原则,并通过最大化所观察到的结构的似然性而获得详细的规则和 具体的参数。然后,可以根据这些规则和参数来计算出任何未观察到的链路的可能性。这种基于假设的方法其预测的准确性有待提高。
根据当前署名的发明人的工作发现,网络数据存在一些和其他样本数据集(如图像 数据、语音数据、文字数据等)不一样的地方,这些数据集中的样本数据之间可能存在一定的相关性,例如,在社交网络中,部分用户的好友关系,可能会对其他用户的好友 关系存在一定的影响,这种相关性对网络数据的属性恢复带来一定的挑战性,因为需要 利用好这种样本数据之间的相关性,这可以为网络的链路关系预测的准确性带来帮助。 但是如何将这种样本数据之间的相关性应用到网络的链路预测中去,是需要思考和解决 的问题。现有的网络链路预测方法普遍缺乏对于此类数据属性相关性的挖掘和利用。
发明内容
针对现有技术的不足,本发明提出一种基于图神经网络的网络链路属性关系预测方 法,能够从根本上解决现有网络链路预测算法无法有效利用相关属性信息的依赖性导致 链路属性预测性能不够高的问题。
本发明的另一目的是提供一种实现上述预测方法的计算机设备。
为了实现以上发明目的,本发明的技术方案如下:
根据第一方面,一种基于图神经网络的网络链路属性关系预测方法,包括以下步骤:
将网络数据映射为对应的拓扑图结构,并得到拓扑图结构的节点属性矩阵X;
基于拓扑图结构获取无权重拓扑图结构的邻接矩阵A,基于节点属性矩阵X获取带权重拓扑图结构的邻接矩阵A';
根据无权重拓扑图结构的邻接矩阵A,经过包含集成更新的传播机制生成节点的空 间嵌入向量;
根据拓扑图结构的节点属性矩阵X和带权重拓扑图结构的邻接矩阵A',经过包含集成更新的传播机制生成节点的属性嵌入向量;
将空间嵌入向量和属性嵌入向量进行拼接,得到合成嵌入向量;
将合成嵌入向量输入节点对关系提取器,最终得到节点之间的链路关系预测结果。
根据第一方面的一种实施方式,所述将网络数据映射为对应的拓扑图结构,并得到 拓扑图结构的节点属性矩阵X包括:
将网络中的实体转化为图节点,若网络实体之间存在相关性,则相应的图节点之间 存在边,建立拓扑图结构G=(J,E),其中J表示图结构中的图节点,E表示图中的边;
根据网络实体的多个方面的信息,建立拓扑图结构的节点属性矩阵X,所述节点属性矩阵X是一个N*D的二维矩阵,其中N表示网络中实体的个数,D表述实体拥有的 信息的种类数。
根据第一方面的一种实施方式,无权重拓扑图结构的邻接矩阵A是一个N*N的二维矩阵,每一行表示某个实体和其他N个实体之间的关系,矩阵元素的取值为0或1, 当第i个实体和第j个实体之间存在连接关系时,邻接矩阵A中Aij等于1,反之等于0。
根据第一方面的一种实施方式,带权重的图结构的邻接矩阵A'是一个N*N的二维矩阵,每一行表示某个实体和其他N个实体之间的关系,矩阵元素的取值计算方式为: 计算两个实体对应图节点的属性向量的单位空间距离,计算公式为其中xi和xj表示属性矩阵X中第i行的属性向量和第j行的属性向量,如果计算公式获得的结果大 于0,则A'ij等于该公式获得的结果,如果小于0,则A'ij等于0。
根据第一方面的一种实施方式,包含集成更新的传播机制的公式表示为:
其中,σ表示激活函数,Aggregate(·)表示集成函数,W表示参数矩阵,传播次数为K,concat表示对两个向量的拼接操作,N表示网络中实体的个数,Uij表示输入矩阵 中第i行第j列元素;
该公式表示将参数矩阵W和每个已经进行过Aggregate函数操作的节点向量相乘,得到更新后的节点向量;
针对拓扑图结构中的每一个图节点,都对其进行上述公式的操作,并且对每个节点 操作的次数由传播次数K决定,公式中每个变量都带有上标k,表示这些变量都是在第 k次公式操作中得到的或者是需要使用到的,其中hj k-1表示第k-1次公式操作后得到的 节点的嵌入向量,利用hj k-1进行第k次公式操作,得到第k次公式更新后的节点嵌入向 量hj k。。
第二方面,提供一种计算机设备所述计算机设备包括:
存储器,存储有一个或多个计算机程序,所述一个或多个计算机程序被一个或多个 处理器执行时,致使所述一个或多个处理器执行本发明第一方面所述的基于图神经网络 的网络链路属性关系预测方法。
本发明首次提出使用图神经网络模型来解决网络链路属性预测问题,利用拓扑图结 构的数据集,将这些带网络结构的节点数据,转化成可以反应问题本质、体现节点特性的特征向量。首先获得图结构的空间结构,利用双向并行的图结构传播机制集成更新图 结构的空间信息和属性信息,最终获得具有丰富表达的嵌入向量,然后通过两两节点预 测关系算法,得到关于两个节点的未知网络关系,从根本上解决现有网络数据链路预测 算法无法有效利用相关属性信息的依赖性导致链路预测性能不够高的问题。此外,本发 明采用基于策略梯度的图神经网络学习算法,直接对网络数据的链路预测问题进行端到 端的建模和学习,从而提高网络链路属性预测的性能。本发明涉及的网络链路预测方法, 在复杂网络的结构预测中具有广泛的应用。例如,在社交网络中,可以根据部分用户的 好友关系来预测其他用户是否可能成为好友,在计算机通信网络中,可以根据部分节点 之间的通信关系来预测其他节点之间的相互通信状态。
附图说明
图1是根据本发明实施例的基于图神经网络的网络链路属性关系预测方法的主要过 程示意图;
图2是根据本发明实施例的一次传播机制示例图;
图3是根据本发明实施例的双向传播在链路关系预测中的应用示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图1所示,在本发明实施例中提出了一种端到端的机器学习模型Dual-Graphlrp框架。这里,Graphlrp指的是基于图的链接关系预测(graph link relation prediction)的 缩写,Dual指的是双向,即使用两次Graphlrp来完成工作。框架由三个大块组成,首 先是构建图结构的模块,所谓构建数据集的图结构信息,就是要根据数据集的样本数据 来定义图结构中的节点是什么,边的关系是什么,即需要获取节点的定义和反应图结构 的邻接矩阵。根据数据集的样本数据的信息特征来构建图结构。框架的第二个部分是获 取样本数据的嵌入向量,在这个部分中,将利用在上一个部分获取得到的数据集的属性 特征和图结构的邻接矩阵,使用这两个矩阵信息来获取每个样本的嵌入向量,本发明分 别提取关于样本数据的有关空间结构的嵌入向量以及有关属性特征的嵌入向量,以此来 保证样本的嵌入向量包含丰富的空间结构信息和属性特征信息,利用两个Graphlrp模型 组成一个双向的分别提取图结构空间信息和属性特征信息的模型。框架的第三个部分是 根据第二个部分获得的嵌入向量,进行拼接,将两种属性的嵌入向量整合成一个嵌入向 量,本发明利用最终得到的合成嵌入向量,输入节点对关系提取器中,得到最终的链路 关系的预测结果,利用定义的损失函数来计算真实的链路关系和预测值之间的误差,利 用误差来对端到端的模型进行梯度的反向传播。
具体而言,方法包括以下步骤:
(1)将网络数据映射为对应的拓扑图结构,并得到拓扑图结构的节点属性矩阵X。
首先将网络中的实体转化为图节点,再获取边,若网络实体之间存在相关性,则相应的图节点之间存在边,建立拓扑图结构G=(J,E),其中J表示图结构中的图节点,E表 示图中的边;根据网络实体的多个方面的信息,建立拓扑图结构的节点属性矩阵X,这 里节点属性矩阵X是一个N*D的二维矩阵,其中N表示网络中实体的个数,D表述实 体拥有的信息的种类数。
在一个实施例中,网络中的实体为网络的用户或设备,如社交网络的一个用户或通 信网络的一台计算机设备。在图结构中,这样的实体作为网络节点,每个节点都拥有一些体现用户特点的属性特征,例如用户的年龄、用户的知识水平、用户的职业信息等等, 例如反应移动设备实体的信息,包括设备型号、设备地理位置、设备与附近基站的信号 强弱情况等等,这些信息是对应的图节点的属性向量,使用一个属性向量以数值化的形 式来表示这些属性特征。例如,用D维度的属性向量来表示移动设备拥有D种不同类 型的信息,D表示实体拥有的信息的种类数,也表示对应的图节点的属性向量拥有D维 的属性元素,例如一个移动设备实体记录的信息包括设备型号、设备地理位置、设备与 附近基站的信号强弱情况,共计3种类型的信息,则D等于3,对应的图节点的属性向 量即为3维。所有节点的属性向量形成一个属性矩阵。网络的边代表节点之间的相互关 系,例如社交网络中的好友关系或通信网络中的相互通信关系。网络的节点及其之间的 边可以用一个邻接矩阵来表示。邻接矩阵的权重代表节点之间的关联紧密程度(如通信 的次数),邻接矩阵的节点附带有一个用于描述其特征的属性向量。
(2)基于拓扑图结构获取无权重拓扑图结构的邻接矩阵A,基于节点属性矩阵X 获取带权重拓扑图结构的邻接矩阵A'。
邻接矩阵是一个N*N的二维矩阵,每一行表示某个实体和其他N个实体之间的关系。对于无权重拓扑图结构的邻接矩阵A,其只有0和1两种元素,其判断方法为如果 实体之间存在明显的相关性,则相应邻接矩阵中的元素值等于1,反之等于0,例如第i 个实体和第j个实体之间存在明显的相关性,例如,通信网络中设备之间存在通信关系, 社交网络中的用户之间存在好友关系,则邻接矩阵A中Aij等于1,反之等于0。
对于带权重的图结构的邻接矩阵A',其元素为0到1之间的连续数值,其计算方法为计算两个实体对应图节点的属性向量的单位空间距离,计算公式为其中xi和 xj表示属性矩阵X中第i行的属性向量和第j行的属性向量,如果计算公式获得的结果 大于0,则A'ij等于该公式获得的结果,如果小于0,则A'ij等于0。
(3)根据无权重拓扑图结构的邻接矩阵A,经过Graphlrp算法的传播机制生成节点的空间嵌入向量。
以无权重拓扑图结构的邻接矩阵A为Graphlrp算法的输入,同时设置好传播次数、参数矩阵、激活函数以及集成函数,经过传播机制生成节点的嵌入向量。通过将无权重 邻接矩阵A作为空间信息的载体输入,从而得到可以提现节点空间信息的嵌入向量,这 里称得到的嵌入向量为空间嵌入向量。
(4)根据拓扑图结构的节点属性矩阵X和带权重拓扑图结构的邻接矩阵A',经过Graphlrp算法的传播机制生成节点的属性嵌入向量。
以拓扑图结构的节点属性矩阵X和带权重拓扑图结构的邻接矩阵A'为Graphlrp算法的输入,同样地设置好传播次数、参数矩阵、激活函数以及集成函数,经过传播机制 生成节点的嵌入向量。利用带权重邻接矩阵A’以及属性矩阵X可以得到体现节点属性 信息的嵌入向量,这里称为属性嵌入向量。
应当理解,虽然这里以步骤(3)和步骤(4)的顺序描述了Graphlrp算法的两种操作,但是具体实施时并不一定要以这样的顺序来执行,例如也可以先执行步骤(4)再 执行步骤(3),或者同步执行,在本发明中,称为双向嵌入向量生成算法Dual-Graphlrp, 在双线并行的Graphlrp算法中,其中一个Graphlrp算法的输入为邻接矩阵A,另一个输 入为属性矩阵X和邻接矩阵A’,两种不同的输入形式分别训练可以捕获空间特征和属 性特征的图神经网络模型,最终分别获得包含空间特征的嵌入向量和包含属性特征的嵌 入向量。
节点数据转化后的特征向量可以有效的包括节点的网络结构的空间信息以及其自 身的属性特征,举例来说,在一个社交网络中,存在两个用户节点,这两个用户节点的社交关系是亲密好友,那么反映到社交网络的结构中,这两个用户节点之间应该存在一 条边将这两个用户节点连接起来,更进一步,如果是用带权重的拓扑图结构来反映这种 网络结构,这两个用户节点之间的边的权重应该还是一个很大的数值。所以,本发明希 望转化后的特征向量可以有效的包括节点的空间信息,将这两个用户节点的数据转化成 特征向量之后,这两个特征向量之间的空间距离应该很小,从而可以体现出两个用户节 点在社交网络中的亲密关系,另一方面,每个用户节点都拥有一些体现用户特点的属性 特征,例如用户的年龄、用户的知识水平、用户的职业信息等等,本发明希望转化后的 特征向量可以以数值化的形式囊括对后续机器学习任务有用的属性特征。总的来说,一 个可以表达节点有效信息的特征向量,对后续机器学习任务的推进有很重要的作用。
其次,本发明针对基于网络的链路关系预测问题,需要寻找方式方法来利用节点特 征向量,以获得关于节点对之间的链路关系的预测概率。上述描述的过程得到的节点特征向量已经拥有丰富的节点信息的表达,可以通过分析节点对应的特征向量之间的关系来获取节点之间的链路关系。
图2是根据本发明实施例的一次传播机制示例图。集成所做的事情就是要获取节点的邻居节点的嵌入向量,如图2所示,节点U拥有两个邻居节点B和C,那么想要更 新得到U的嵌入向量,就需要收集B和C的嵌入向量。矩形框表示的就是传播机制中 的集成操作,它会将上一次经过传播机制得到的B和C的嵌入向量进行汇总,通过图 神经网络模型定义的处理方式来获得一个新的嵌入向量,提供给节点U的更新使用。接 着,在处理完邻居节点的嵌入向量以后,需要考虑加入节点U自身的嵌入向量,以及加 入激活函数,最后更新完成节点U的嵌入向量,而对节点进行集成更新操作的具体公式为其中,Aij是邻接矩阵A 的元素。concat表示对两个向量的拼接操作,Aggregate函数具体是使用平均函数MEAN 来进行节点操作,即对Aggregate函数括号中的向量集合求平均。
根据本发明实施例的Graphlrp嵌入向量生成算法如下所示:
根据数据集输入算法图结构G(N,E)以及节点输入向量而参数传播次数K表示传播机制对图中所有节点进行集成更新的次数,即算法中的步骤3、步骤4、 步骤5以及步骤6,传播次数K也被认为是图神经网络模型中的模型深度。与之相对的, 参数矩阵Wk,表示每一层神经网络模型或者说每一次传播过程中都存在 一个参数矩阵,它的作用是更新经过集成操作以后的节点嵌入向量,从而可以进行下一 次的节点传播机制,参数矩阵Wk,是需要经过训练学习得到的。集成操 作Aggregatek,会在输入算法时给出具体的定义。算法指导思想是在经过 每一次的传播机制以后,节点可以从它们的邻居节点集合中集成属性信息,并且随着迭 代次数的增加,节点可以逐渐获得它的一节邻居信息、二阶邻居信息直到迭代结束,由 此可以,节点最终可以获得邻居信息的范围,和传播的次数有关,同时,这个传播次数, 也会影响到节点获得信息的质量也就是节点最终输出的嵌入向量的质量。
在算法中,首先将每个节点的输入向量xv作为节点的初始特征向量h0 v,其中0也就表示目前的节点向量是在经过第0次传播机制后的节点嵌入向量,即还没有开始传播 的初始向量。主要步骤有两个循环组成,首先外循环即为传播次数,也就是控制节点一 共会进行几次传播机制,其中k表示当前是第k次循环,即在进行第k次传播机制,hk v表示节点v在第k次循环时的节点向量。在每一次外循环中,都存在一个内循环,这个 内循环表示会对图中所有的节点都进行一次集成更新操作,对于内循环中选择节点的顺 序没有要求,只需要保证每个节点都被更新,因为在内循环中,节点进行更新操作所需 要的邻居节点集合的向量是上一次外循环以后生成的向量,在当前外循环中,先更新的 节点的节点向量不会影响其他节点的集成更新操作,因为使用的是上一次外循环后的节 点向量。在内循环中,每个节点v∈V都集成它的邻居节点集合的节点向量hk u-1,并且 将集成得到的向量赋值给向量hk N(v),在集成得到节点的邻居节点集合信息以后,将节 点本身的向量hv k-1和刚刚获得的向量hk N(v)进行拼接,将两个向量连接成一个更大维度 的向量,这一步的目的是为了将节点本身的信息和邻居节点集合的信息在经过更新操作 后可以同时赋值给该节点。在得到拼接的向量以后,乘上参数矩阵Wk,并且再作用一 个激活函数,意为将拼接的向量输入到一个带激活层的全连接层当中进行更新向量,拼 接向量在输入全连接层的这个过程中,就是对拼接向量进行向量转换的一个过程,通过 可训练学习的参数矩阵Wk,将拼接向量的信息提取成一个更具有表达能力的向量hk v, 即节点在第k次外循环后得到的节点向量。经过了K次外循环后,最终得到的节点向量 hv K即为最终的输出向量zv。其中,针对属性嵌入向量和空间嵌入向量,第1次公式操 作时输入公式的hj 0为节点的属性向量xj。
步骤(5)将空间嵌入向量和属性嵌入向量进行拼接,得到合成嵌入向量。
步骤(6)将合成嵌入向量输入节点对关系提取器,最终得到节点之间的链路关系预测结果。
节点对关系提取器是一个多层的全连接网络,其中包含两层隐藏层,隐藏层的神经 元个数范围在32至128之间,当然关键取决于输入向量的维度,输出层的神经元个数 为2,分别表示链接关系存在和不存在的概率,利用softmax函数最终得到预测的链接 关系。在具体实施过程中,传播次数K设置为2,将节点对关系提取器中的全连接神经 网络的隐藏层层数设置为两层,神经元个数设置为100,采用Adam优化器,学习率设 置为0.0001。
图3是本发明实施例的Dual-Graphlrp应用于链路关系判断的流程图。利用Graphlrp 框架来分别获得属于属性的嵌入向量和属于空间的嵌入向量,然后将两个嵌入向量进行 拼接,得到最终的嵌入向量,该嵌入向量就完整包含了关于节点的属性信息和空间信息, 然后利用一个多层的全连接网络作为节点对的关系提取器。通过深度学习可以通过非线 性的网络提取复杂的输入数据的特征的能力,将可以反应节点对关系的特征从特征向量 组合中提取出来,本发明利用ReLU激活函数来提供对非线性计算的能力,节点对关系 提取器的输出就是对链路关系的预测结果。通过和真实的链路关系进行比较,利用交叉熵损失函数得到预测结果和真实值之间的误差,通过梯度下降算法来训练优化端到端模型。两个嵌入向量拼接组合后,输入到节点对关系提取器,输出最终的预测结果,预测 节点对之间是否有边。
基于与方法实施例相同的技术构思,根据本发明的另一实施例,提供一种计算机设 备,所述设备包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个 或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述 程序被处理器执行时实现方法实施例中的各步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面 的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的 计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的 计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产 生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功 能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定 方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算 机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管 参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (8)
1.一种基于图神经网络的网络链路属性关系预测方法,其特征在于,包括以下步骤:
将网络数据映射为对应的拓扑图结构,并得到拓扑图结构的节点属性矩阵X;
基于拓扑图结构获取无权重拓扑图结构的邻接矩阵A,基于节点属性矩阵X获取带权重拓扑图结构的邻接矩阵A';
根据无权重拓扑图结构的邻接矩阵A,经过包含集成更新的传播机制生成节点的空间嵌入向量;
根据拓扑图结构的节点属性矩阵X和带权重拓扑图结构的邻接矩阵A',经过包含集成更新的传播机制生成节点的属性嵌入向量;
将空间嵌入向量和属性嵌入向量进行拼接,得到合成嵌入向量;
将合成嵌入向量输入节点对关系提取器,最终得到节点之间的链路关系预测结果。
2.根据权利要求1所述的基于图神经网络的网络链路属性关系预测方法,其特征在于,所述将网络数据映射为对应的拓扑图结构,并得到拓扑图结构的节点属性矩阵X包括:
将网络中的实体转化为图节点,若网络实体之间存在相关性,则相应的图节点之间存在边,建立拓扑图结构G=(J,E),其中J表示图结构中的图节点,E表示图中的边;
根据网络实体的多个方面的信息,建立拓扑图结构的节点属性矩阵X,所述节点属性矩阵X是一个N*D的二维矩阵,其中N表示网络中实体的个数,D表述实体拥有的信息的种类数。
3.根据权利要求1所述的基于图神经网络的网络链路属性关系预测方法,其特征在于,无权重拓扑图结构的邻接矩阵A是一个N*N的二维矩阵,每一行表示某个实体和其他N个实体之间的关系,矩阵元素的取值为0或1,当第i个实体和第j个实体之间存在连接关系时,邻接矩阵A中Aij等于1,反之等于0。
5.根据权利要求1所述的基于图神经网络的网络链路属性关系预测方法,其特征在于,包含集成更新的传播机制的公式表示为:
其中,σ表示激活函数,Aggregate(·)表示集成函数,W表示参数矩阵,传播次数为K,concat表示对两个向量的拼接操作,N表示网络中实体的个数,Aij表示邻接矩阵中第i行第j列元素;
该公式表示将参数矩阵W和每个已经进行过Aggregate函数操作的节点向量相乘,得到更新后的节点向量;
针对拓扑图结构中的每一个图节点,都对其进行上述公式的操作,并且对每个节点操作的次数由传播次数K决定,公式中每个变量都带有上标k,表示这些变量都是在第k次公式操作中得到的或者是需要使用到的,其中hj k-1表示第k-1次公式操作后得到的节点的嵌入向量,利用hj k-1进行第k次公式操作,得到第k次公式更新后的节点嵌入向量hj k。。
6.根据权利要求5所述的基于图神经网络的网络链路属性关系预测方法,其特征在于,针对属性嵌入向量和空间嵌入向量,第1次公式操作时输入公式的hj 0为节点的属性向量xj。
7.根据权利要求1所述的基于图神经网络的网络链路属性关系预测方法,其特征在于,节点对关系提取器是一个多层的全连接网络,其中包含两层隐藏层,隐藏层的神经元个数范围在32至128之间,输出层的神经元个数为2,分别表示链接关系存在和不存在的概率,利用softmax函数最终得到预测的链接关系。
8.一种计算机设备,其特征在于,所述计算机设备包括:
存储器,存储有一个或多个计算机程序,所述一个或多个计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器执行如权利要求1-7任一项所述的基于图神经网络的网络链路属性关系预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111362895.XA CN113988464A (zh) | 2021-11-17 | 2021-11-17 | 基于图神经网络的网络链路属性关系预测方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111362895.XA CN113988464A (zh) | 2021-11-17 | 2021-11-17 | 基于图神经网络的网络链路属性关系预测方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113988464A true CN113988464A (zh) | 2022-01-28 |
Family
ID=79749093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111362895.XA Pending CN113988464A (zh) | 2021-11-17 | 2021-11-17 | 基于图神经网络的网络链路属性关系预测方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988464A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114900435A (zh) * | 2022-01-30 | 2022-08-12 | 华为技术有限公司 | 一种连接关系预测方法及相关设备 |
CN115051934A (zh) * | 2022-06-29 | 2022-09-13 | 亚信科技(中国)有限公司 | 网络性能预测方法、装置、电子设备、存储介质及产品 |
CN115941501A (zh) * | 2023-03-08 | 2023-04-07 | 华东交通大学 | 基于图神经网络的主机设备管控方法 |
CN117151279A (zh) * | 2023-08-15 | 2023-12-01 | 哈尔滨工业大学 | 一种基于线图神经网络的同构网络链路预测方法及系统 |
-
2021
- 2021-11-17 CN CN202111362895.XA patent/CN113988464A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114900435A (zh) * | 2022-01-30 | 2022-08-12 | 华为技术有限公司 | 一种连接关系预测方法及相关设备 |
CN114900435B (zh) * | 2022-01-30 | 2023-12-08 | 华为技术有限公司 | 一种连接关系预测方法及相关设备 |
CN115051934A (zh) * | 2022-06-29 | 2022-09-13 | 亚信科技(中国)有限公司 | 网络性能预测方法、装置、电子设备、存储介质及产品 |
CN115941501A (zh) * | 2023-03-08 | 2023-04-07 | 华东交通大学 | 基于图神经网络的主机设备管控方法 |
CN117151279A (zh) * | 2023-08-15 | 2023-12-01 | 哈尔滨工业大学 | 一种基于线图神经网络的同构网络链路预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022083624A1 (zh) | 一种模型的获取方法及设备 | |
CN113988464A (zh) | 基于图神经网络的网络链路属性关系预测方法及设备 | |
CN110428046B (zh) | 神经网络结构的获取方法及装置、存储介质 | |
CN110782015A (zh) | 神经网络的网络结构优化器的训练方法、装置及存储介质 | |
CN111079931A (zh) | 一种基于图神经网络的状态空间概率性多时间序列预测方法 | |
US20220414426A1 (en) | Neural Architecture Search Method and Apparatus, Device, and Medium | |
CA3080050A1 (en) | Training tree-based machine-learning modeling algorithms for predicting outputs and generating explanatory data | |
CN114915630B (zh) | 基于物联网设备的任务分配方法、网络训练方法及装置 | |
Scardapane et al. | Distributed training of graph convolutional networks | |
CN111275172A (zh) | 一种基于搜索空间优化的前馈神经网络结构搜索方法 | |
CN111797327B (zh) | 社交网络建模的方法及装置 | |
CN110414627A (zh) | 一种模型的训练方法及相关设备 | |
Yang et al. | Deep reinforcement learning based wireless network optimization: A comparative study | |
CN116681104B (zh) | 分布式空间图神经网络的模型建立及实现方法 | |
Bi et al. | Large-scale network traffic prediction with LSTM and temporal convolutional networks | |
CN113869521A (zh) | 构建预测模型的方法、装置、计算设备和存储介质 | |
CN111325340A (zh) | 信息网络关系预测方法及系统 | |
Krishnamoorthy et al. | Deep learning techniques and optimization strategies in big data analytics: automated transfer learning of convolutional neural networks using Enas algorithm | |
Coutino et al. | Self-driven graph volterra models for higher-order link prediction | |
CN114900435B (zh) | 一种连接关系预测方法及相关设备 | |
CN115544307A (zh) | 基于关联矩阵的有向图数据特征提取与表达方法和系统 | |
KR20080024126A (ko) | 검색 알고리즘을 위한 제약된 조사 | |
CN112396477B (zh) | 业务预测模型的构建方法及装置 | |
CN113111308B (zh) | 基于数据驱动遗传编程算法的符号回归方法及系统 | |
CN112633516B (zh) | 性能预测和机器学习编译优化方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |