CN111756587B - 一种采用GraphSAGE预测时序网络链路的方法 - Google Patents

一种采用GraphSAGE预测时序网络链路的方法 Download PDF

Info

Publication number
CN111756587B
CN111756587B CN202010746960.8A CN202010746960A CN111756587B CN 111756587 B CN111756587 B CN 111756587B CN 202010746960 A CN202010746960 A CN 202010746960A CN 111756587 B CN111756587 B CN 111756587B
Authority
CN
China
Prior art keywords
node
network
nodes
similarity
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010746960.8A
Other languages
English (en)
Other versions
CN111756587A (zh
Inventor
朱文俊
舒坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN202010746960.8A priority Critical patent/CN111756587B/zh
Publication of CN111756587A publication Critical patent/CN111756587A/zh
Application granted granted Critical
Publication of CN111756587B publication Critical patent/CN111756587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种采用GraphSAGE预测时序网络链路的方法,包括:S1,利用时间切片方法将时序网络切分成一系列的网络快照,然后对网络快照内节点对的连边次数和连边时长信息进行数据预处理;S2,将预处理后的数据作为GraphSAGE算法的输入并学习训练获得节点embedding生成模型;S3,通过结合节点的embedding相似性和节点拓扑结构相似性构造节点相似性指标,从而对相应节点对在未来的连接状态进行预测。本发明能够对时序网络链路进行有效的预测,解决使用静态网络研究方法分析时序网络时,对网络的拓扑结构、传播动力学分析造成误差的问题。

Description

一种采用GraphSAGE预测时序网络链路的方法
技术领域
本发明涉及网络分析技术领域,特别是涉及一种采用GraphSAGE预测时序网络链路的方法。
背景技术
现实生活中大多数应用都可以用网络来表示,如电力网络、蛋白质互作用网络、社会网路、交通网路、机会网路、通信网络等。
现有技术中,通常采用静态网络结构对网络进行分析,然而在很多实际问题上静态网络不能给出很好的结论,因为现实世界的复杂网络往往是动态的,随着时间的变化而变化,而静态网络不考虑网络的时态性。在分析时,静态网络仅考虑当前状态的有效的连接,很多实际复杂网络中事件的发生往往具有多次性、非连续性等特点。使用静态网络研究方法分析时序网络时,会对网络的拓扑结构、传播动力学分析造成误差。
发明内容
针对上述问题,本发明的目的在于提出一种采用GraphSAGE预测时序网络链路的方法,以对时序网络链路进行有效的预测,解决使用静态网络研究方法分析时序网络时,对网络的拓扑结构、传播动力学分析造成误差的问题。
时序网络拓扑结构随着时间的变化而变化,而链路的变化具有一些隐含特征,这些特征能在一定程度上体现节点对连边状态的变化趋势。通过挖掘影响节点间链路状态的隐含特征,并计算得到节点间的关联性,从而预测下一时刻节点间链路的状态。
基于上传内容,本发明提供一种采用GraphSAGE预测时序网络链路的方法,包括:
S1,利用时间切片方法将时序网络切分成一系列的网络快照,然后对网络快照内节点对的连边次数和连边时长信息进行数据预处理;
S2,将预处理后的数据作为GraphSAGE算法的输入并学习训练获得节点embedding生成模型;
S3,通过结合节点的embedding相似性和节点拓扑结构相似性构造节点相似性指标,从而对相应节点对在未来的连接状态进行预测。
本发明首先将初始样本数据进行时间切片,并对样本中节点间的连边次数及节点间连边时长信息进行数据预处理,构造节点连边时长权重矩阵和节点连边状态矩阵。然后将每一网络快照的节点连边状态矩阵作为GraphSAGE算法的输入,在不断地迭代训练后获取每一网络快照的节点embedding的生成模型。通过结合Pearson相关系数和节点的连边时长信息计算每一网络快照的节点间embedding的相似性并进行算数平均化处理。最后结合节点间embedding的相似性和节点的拓扑结构信息构造节点相似性指标,能够准确的把握时序网络节点对在时域上的演变规律,从而对时序网络链路进行有效的预测。
本发明利用GraphSAGE算法能快速学习获得节点embedding的优势,结合节点拓扑结构信息、节点连边时长信息构造节点相似性指标,并通过节点相似性指标计算获得节点间的关联性,从而学习到时序网络链路变化的内在特征,能够更好的分析动态网络中链路的变化,有效解决了使用静态网络研究方法分析时序网络时,对网络的拓扑结构、传播动力学分析造成误差的问题。此外,基于GraphSAGE算法训练学习得出的embedding生成模型能够快速获得节点的embedding信息,从而提高节点对相似性计算的效率。
另外,根据本发明上述的采用GraphSAGE预测时序网络链路的方法,还可以具有如下附加的技术特征:
进一步地,步骤S1具体包括:
采用时间序列分析方法,对网络数据进行切片处理获得一系列的网络快照,并将网络快照中节点间的连边次数及连边时长信息进行数据预处理获得节点连边时长权重矩阵及节点连边状态矩阵。
进一步地,步骤S1中,采用下式计算节点连边时长权重矩阵ω和节点连边状态矩阵A:
Figure BDA0002608700980000031
Figure BDA0002608700980000032
其中,ωxy T为节点x,y的连边时长权重,n为节点x,y在当前网络快照中连边的次数,ti为当前网络快照中第i次连边时长,slice为一个网络快照的时间长度,Axy T为节点x,y的连边状态,T为快照。
进一步地,步骤S2具体包括:
将预处理后每个网络快照的节点连边状态矩阵作为GraphSAGE算法的输入,首先设定每一阶的采样范围并对邻居节点进行多阶采样,然后通过将每个采样节点的邻居特征进行聚合拼接获得目标节点的embedding,通过不断地迭代训练以获取每个网络快照的节点embedding的生成模型。
进一步地,步骤S3具体包括:
通过结合Pearson相关系数、节点连边时长权重矩阵、历史节点对embedding相似性计算每个网络快照的节点对embedding相似性,然后结合节点的拓扑结构信息构造节点相似性指标,从而对时序网络链路进行有效的预测。
进一步地,步骤S3中,采用下式计算节点对embedding相似性ρxy
Figure BDA0002608700980000033
其中,
Figure BDA0002608700980000034
分别为节点x,y的embedding,T为快照;
然后采用下式计算节点拓扑结构信息相似性
Figure BDA0002608700980000035
Figure BDA0002608700980000036
其中,Γ(x)T,Γ(y)T分别为节点x,y的度,
Figure BDA0002608700980000037
为节点x,y的连边数,
Figure BDA0002608700980000038
为节点x,y的距离;
最后通过结合节点的embedding相似性和节点拓扑结构信息相似性从而构造节点相似性指标:
Figure BDA0002608700980000041
附图说明
本发明实施例的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是时序网络链路演化过程示意图;
图2是时序网络数据处理示意图;
图3是GraphSAGE算法采样和聚类的过程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
时序网络拓扑结构随着时间的变化而变化,而链路的变化具有一些隐含特征,这些特征能在一定程度上体现节点对连边状态的变化趋势。构建基于GraphSAGE算法的链路预测模型旨在有效分析节点对间链路变化的内在规律。下面结合附图和具体的实施方式进一步的说明。
如图1所示,定义时序网络为G=(V,E),其中V为节点集合,E为边集合。如图2所示,利用时间切片方法将时序网络切分成一系列的网络快照,网络快照的集合为G={G1,G2,...,Gn},其中Gi=(Vi,Ei),Gi表示i时刻的网络拓扑结构图,Vi表示i时刻节点的集合,Ei表示i时刻边的集合。
基于上述内容,本发明的实施例提供一种采用GraphSAGE预测时序网络链路的方法,通过建立基于GraphSAGE算法的链路预测模型来实现自发地提取节点间链路特征并进行链路预测,该方法具体步骤如下步骤S1~S3:
S1,利用时间切片方法将时序网络切分成一系列的网络快照,然后对网络快照内节点对的连边次数和连边时长信息进行数据预处理。
其中,数据预处理时,针对时序网络节点移动存在的时序性、社会性等,采用时间序列分析方法对网络数据进行切片处理获得一系列的网络快照,并将快照中节点间的连边次数及节点间连边时长信息进行数据预处理。
通过计算同一时间快照内节点x,y的连边时长占比,获得节点连边时长权重,并构建节点连边时长权重矩阵ω:
Figure BDA0002608700980000051
其中,ωxy T为在快照T中节点x,y的连边时长权重,n为节点x,y在当前网络快照中存在连边的次数,ti为当前网络快照第i次连边时长,slice为一个网络快照的时间长度。
计算节点在当前时间快照中的连边状态,本发明仅考虑节点在当前快照中是否存在过连边,并构建节点连边状态矩阵A,节点连边状态矩阵如式(2)所示:
Figure BDA0002608700980000052
其中,Axy T为在快照T中节点x,y的连边状态。
S2,将预处理后的数据作为GraphSAGE算法的输入并学习训练获得节点embedding生成模型。
其中,获取节点embedding时,分别将预处理后每一网络快照的节点连边状态矩阵作为GraphSAGE算法的输入。GraphSAGE算法首先需要设定每一阶的采样范围并对邻居节点进行多阶采样,然后通过将每个采样节点的邻居特征进行聚合拼接获得目标节点的embedding。通过不断地迭代训练并测试以获取每一网络快照的节点embedding的生成模型,然后运用该模型生成当前网络快照中所有节点的embedding。
S3,通过结合节点的embedding相似性和节点拓扑结构相似性构造节点相似性指标,从而对相应节点对在未来的连接状态进行预测。
其中,构建节点相似性指标中,本发明主要考虑节点的embedding相似性和节点拓扑结构信息相似性,通过结合两者构建节点相似性指标。
首先结合Pearson相关系数、节点连边时长权重矩阵、历史节点对embedding相似性来计算当前网络快照的节点对embedding相似性ρxy,以下为在快照T中的表达方式:
Figure BDA0002608700980000061
其中
Figure BDA0002608700980000062
分别为节点x,y的embedding。
本发明通过考虑节点的度数、节点对连边数、节点间的距离构建节点拓扑结构相似性计算。由于节点对的距离越小其相似性越大,本发明主要考虑节点四阶以内邻居的拓扑结构相似性,并分为三种情况进行讨论。以下为在快照T中节点拓扑结构信息相似性
Figure BDA0002608700980000063
的计算方法:
Figure BDA0002608700980000064
其中,Γ(x)T,Γ(y)T分别为节点x,y的度,
Figure BDA0002608700980000065
为节点x,y的连边数,
Figure BDA0002608700980000066
为节点x,y的距离。最后通过结合节点的embedding相似性和节点拓扑结构信息相似性构造节点相似性指标:
Figure BDA0002608700980000067
本发明中使用的GraphSAGE算法结构如图3所示,该模型主要分为两部分:采样邻居,聚合邻居。采样邻居的定义是采用小批量的训练方法对大规模网络数据的训练进行分布式拓展,对邻居进行k阶子图采样,每阶设定一个采样倍率Sk,即每个节点的一阶邻居采样总量不能超过Sk个节点,采样总数不超过
Figure BDA0002608700980000068
聚合邻居的方法将每个采样节点的邻居特征进行整合输出到上一阶的特征并进行拼接,最终通过层层拼接获得中心节点新的特征向量。其中,聚合算子可分为平均/加和聚合算子(mean/sum)或池化聚合算子(pooling)。
时序网络链路预测问题的目的就是通过分析历史链路的特征,得出下一时刻链路的状态。本发明使用节点间链路预测的精度来衡量特征特征提取的优劣,选用GraphSAGE算法作为模型训练工具,将数据集根据8:2的比例划分为训练集和测试集,历史网络快照作为模型的输入,下一时刻的节点的embedding作为输出,并结合构建的节点相似性指标计算获得节点间的相似性。通过测试集来验证模型,若测试结果满足一定的精度则预测成功,即可使用该模型来预测时序网络的链路。
综上,根据本发明提供的采用GraphSAGE预测时序网络链路的方法,首先将初始样本数据进行时间切片,并对样本中节点间的连边次数及节点间连边时长信息进行数据预处理,构造节点连边时长权重矩阵和节点连边状态矩阵。然后将每一网络快照的节点连边状态矩阵作为GraphSAGE算法的输入,在不断地迭代训练后获取每一网络快照的节点embedding的生成模型。通过结合Pearson相关系数和节点的连边时长信息计算每一网络快照的节点间embedding的相似性并进行算数平均化处理。最后结合节点间embedding的相似性和节点的拓扑结构信息构造节点相似性指标,能够准确的把握时序网络节点对在时域上的演变规律,从而对时序网络链路进行有效的预测。
本发明利用GraphSAGE算法能快速学习获得节点embedding的优势,结合节点拓扑结构信息、节点连边时长信息构造节点相似性指标,并通过节点相似性指标计算获得节点间的关联性,从而学习到时序网络链路变化的内在特征,能够更好的分析动态网络中链路的变化,有效解决了使用静态网络研究方法分析时序网络时,对网络的拓扑结构、传播动力学分析造成误差的问题。此外,基于GraphSAGE算法训练学习得出的embedding生成模型能够快速获得节点的embedding信息,从而提高节点对相似性计算的效率。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (4)

1.一种采用GraphSAGE预测时序网络链路的方法,其特征在于,包括以下步骤:
S1,利用时间切片方法将时序网络切分成一系列的网络快照,然后对网络快照内节点对的连边次数和连边时长信息进行数据预处理;
S2,将预处理后的数据作为GraphSAGE算法的输入并学习训练获得节点embedding生成模型;
S3,通过结合节点的embedding相似性和节点拓扑结构相似性构造节点相似性指标,从而对相应节点对在未来的连接状态进行预测;
步骤S3具体包括:
通过结合Pearson相关系数、节点连边时长权重矩阵、历史节点对embedding相似性计算每个网络快照的节点对embedding相似性,然后结合节点的拓扑结构信息构造节点相似性指标,从而对时序网络链路进行有效的预测;
步骤S3中,采用下式计算节点对embedding相似性ρxy
Figure FDA0003008522570000011
其中,
Figure FDA0003008522570000012
分别为节点x,y的embedding,T为快照;
然后采用下式计算节点拓扑结构信息相似性
Figure FDA0003008522570000013
Figure FDA0003008522570000014
其中,Γ(x)T,Γ(y)T分别为节点x,y的度,
Figure FDA0003008522570000017
为节点x,y的连边数,
Figure FDA0003008522570000015
为节点x,y的距离;
最后通过结合节点的embedding相似性和节点拓扑结构信息相似性从而构造节点相似性指标:
Figure FDA0003008522570000016
2.根据权利要求1所述的采用GraphSAGE预测时序网络链路的方法,其特征在于,步骤S1具体包括:
采用时间序列分析方法,对网络数据进行切片处理获得一系列的网络快照,并将网络快照中节点间的连边次数及连边时长信息进行数据预处理获得节点连边时长权重矩阵及节点连边状态矩阵。
3.根据权利要求2所述的采用GraphSAGE预测时序网络链路的方法,其特征在于,步骤S1中,采用下式计算节点连边时长权重矩阵ω和节点连边状态矩阵A:
Figure FDA0003008522570000021
Figure FDA0003008522570000022
其中,ωxy T为节点x,y的连边时长权重,n为节点x,y在当前网络快照中连边的次数,ti为当前网络快照中第i次连边时长,slice为一个网络快照的时间长度,Axy T为节点x,y的连边状态,T为快照。
4.根据权利要求1所述的采用GraphSAGE预测时序网络链路的方法,其特征在于,步骤S2具体包括:
将预处理后每个网络快照的节点连边状态矩阵作为GraphSAGE算法的输入,首先设定每一阶的采样范围并对邻居节点进行多阶采样,然后通过将每个采样节点的邻居特征进行聚合拼接获得目标节点的embedding,通过不断地迭代训练以获取每个网络快照的节点embedding的生成模型。
CN202010746960.8A 2020-07-29 2020-07-29 一种采用GraphSAGE预测时序网络链路的方法 Active CN111756587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010746960.8A CN111756587B (zh) 2020-07-29 2020-07-29 一种采用GraphSAGE预测时序网络链路的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010746960.8A CN111756587B (zh) 2020-07-29 2020-07-29 一种采用GraphSAGE预测时序网络链路的方法

Publications (2)

Publication Number Publication Date
CN111756587A CN111756587A (zh) 2020-10-09
CN111756587B true CN111756587B (zh) 2021-06-15

Family

ID=72712189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010746960.8A Active CN111756587B (zh) 2020-07-29 2020-07-29 一种采用GraphSAGE预测时序网络链路的方法

Country Status (1)

Country Link
CN (1) CN111756587B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112562312B (zh) * 2020-10-21 2022-10-28 浙江工业大学 一种基于融合特征的GraphSAGE交通路网数据预测的方法
CN113537613B (zh) * 2021-07-28 2023-11-21 浙江大学 一种模体感知的时态网络预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110351118A (zh) * 2019-05-28 2019-10-18 华为技术有限公司 根因告警决策网络构建方法、装置和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8699328B1 (en) * 2013-09-24 2014-04-15 tw telecom holdings, inc. Determining feasibility of a network service using a ring analysis
CN108923983B (zh) * 2018-07-13 2021-01-12 南昌航空大学 机会网络链路的预测方法、装置及可读存储介质
CN108811028B (zh) * 2018-07-23 2021-07-16 南昌航空大学 一种机会网络链路的预测方法、装置及可读存储介质
CN109120462B (zh) * 2018-09-30 2021-07-16 南昌航空大学 机会网络链路的预测方法、装置及可读存储介质
CN109347697B (zh) * 2018-10-10 2019-12-03 南昌航空大学 机会网络链路预测方法、装置及可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110351118A (zh) * 2019-05-28 2019-10-18 华为技术有限公司 根因告警决策网络构建方法、装置和存储介质

Also Published As

Publication number Publication date
CN111756587A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN111130839B (zh) 一种流量需求矩阵预测方法及其系统
CN110149237B (zh) 一种Hadoop平台计算节点负载预测方法
Nie et al. Network traffic prediction based on deep belief network in wireless mesh backbone networks
CN109120462B (zh) 机会网络链路的预测方法、装置及可读存储介质
CN110766080B (zh) 一种标注样本确定方法、装置、设备及存储介质
CN111756587B (zh) 一种采用GraphSAGE预测时序网络链路的方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
Das et al. Detecting a conditional extreme value model
CN112132430B (zh) 一种配电主设备分布式状态传感器可靠性评估方法及系统
CN115906954A (zh) 一种基于图神经网络的多变量时间序列预测方法及装置
Mendonça et al. Approximating network centrality measures using node embedding and machine learning
CN105471647A (zh) 一种电力通信网故障定位方法
CN112181659A (zh) 云仿真内存资源预测模型构建方法与内存资源预测方法
CN117156442A (zh) 基于5g网络的云数据安全保护方法及系统
CN115640337A (zh) 针对符号图网络的异常数据预测方法、系统及相关设备
CN117035013A (zh) 一种采用脉冲神经网络预测动态网络链路的方法
Tan et al. Grading your models: Assessing dynamics learning of models using persistent homology
CN116226336A (zh) 基于贝叶斯网的移动基站投诉根因分析方法
CN113837481B (zh) 一种基于区块链的金融大数据管理系统
Singham et al. Density estimation of simulation output using exponential epi-splines
Alrubaie Cascade-Forward neural network for volterra integral equation solution
Fu et al. A software size estimation method based on improved FPA
US20210144171A1 (en) A Method of Digital Signal Feature Extraction Comprising Multiscale Analysis
CN114238106A (zh) 测试时间预测方法及装置、电子设备、存储介质
US20200244537A1 (en) Computing Environment Node and Edge Network to Optimize Data Identity Resolution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant