CN110020379B - 一种基于深度动态网络嵌入表示模型的链路预测方法 - Google Patents

一种基于深度动态网络嵌入表示模型的链路预测方法 Download PDF

Info

Publication number
CN110020379B
CN110020379B CN201810008394.3A CN201810008394A CN110020379B CN 110020379 B CN110020379 B CN 110020379B CN 201810008394 A CN201810008394 A CN 201810008394A CN 110020379 B CN110020379 B CN 110020379B
Authority
CN
China
Prior art keywords
embedded representation
network
representation model
dynamic network
deep dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810008394.3A
Other languages
English (en)
Other versions
CN110020379A (zh
Inventor
李太松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Beijing Kexin Technology Co Ltd
Original Assignee
Institute of Acoustics CAS
Beijing Kexin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Beijing Kexin Technology Co Ltd filed Critical Institute of Acoustics CAS
Priority to CN201810008394.3A priority Critical patent/CN110020379B/zh
Publication of CN110020379A publication Critical patent/CN110020379A/zh
Application granted granted Critical
Publication of CN110020379B publication Critical patent/CN110020379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度动态网络嵌入表示模型的链路预测方法,所述方法包括:步骤1)构建深度动态网络嵌入表示模型;步骤2)从互联网抓取大量的网络数据,对网络数据进行预处理;步骤3)按一定时间长度将网络数据划分为时间片,每个时间片下构造网络图G={Gt‑N,…,Gt‑1,Gt},将G用时序邻接矩阵表达为X={Xt‑N,…,Xt‑1,Xt};步骤4)将{Xt‑N,…,Xt‑1}输入深度动态网络嵌入表示模型,其中{Xt‑N,…,Xt‑2}作为训练样本的X,{Xt‑1}为训练样本的y值,多次迭代并用随机梯度下降法训练深度动态网络嵌入表示模型;步骤5)时间窗往前移动一个单位,将{Xt‑N,…,Xt‑1}输入深度动态网络嵌入表示模型,输出为t时刻的网络连接矩阵Xt

Description

一种基于深度动态网络嵌入表示模型的链路预测方法
技术领域
本发明涉及互联网领域,涉及在复杂网络中,如何利用网络的拓扑特征和深度学习方法,对动态网络进行嵌入学习,并将学习的结果用于链路预测,具体涉及一种基于深度动态网络嵌入表示模型的链路预测方法。
背景技术
伴随着互联网和移动通信技术的飞速发展,人们之间的联系变得越来越紧密。通过互联网和通信网,人与人之间组成了一个巨大的复杂网络。网络中的人与人之间的互动、交流和影响已融入到生活中的各个方面。对社会网络的研究也逐渐受到关注,并成为当前科学领域的研究热点之一。当前,社交网络分析的研究方向之一就是对时序数据中,网络节点的链接变化进行建模分析,发掘动态网络的演变规律,从而对网络节点行为的趋势进行预测。动态网络的链路预测在社交媒体领域可以帮助人们更有效地配置资源和信息处理;在医学生物学领域可以帮助研究人员更有效地发现生物个体或者微观世界的连接规律;在学术领域可以发现学术人员之间的合作模式,从而促进不同学科领域之间的合作。总之链路预测在指导商业生产、人类生活、科学研究、自然规划等方面的管理、判读和决策中起到重要的作用。
链路预测方法用来描述网络未来的发展趋势,可以细化至节点之间的连接预测,也可以在现有的不完整网络中找出残缺的或者是隐藏的边。传统的链路预测方法一般利用网络拓扑特征和节点属性,采用机器学习的方法进行预测。然而这些方法多数是采用线性模型,对捕捉非线性变化的能力有限,因而不能对多个时刻的动态网络变化进行良好地建模;此外,传统的方法由于复杂度比较高,当网络的规模较大时,需要耗费极大的运算资源和时间,因而往往不能对所有的节点对进行预测。
近些年,随着深度学习的兴起和广泛应用,链路预测领域也开始采用深度学习框架进行建模。深度学习方法可以对非线性变化进行建模,很好地适用于动态网络的链接变化。
发明内容
本发明的目的在于克服现有的链路预测方法采用的线性模型存在的上述缺陷,提出了一个深度动态网络嵌入表示模型(Deep Dynamic Network Embedding),该模型能够对动态网络的历史链接数据进行学习,得到每个节点的向量表示,再将该向量用于预测未来的链路状态。
为了实现上述目的,本发明提出了一种基于深度动态网络嵌入表示模型的链路预测方法,所述方法包括:
步骤1)构建深度动态网络嵌入表示模型;
步骤2)从互联网抓取大量的网络数据,对网络数据进行预处理;
步骤3)按一定时间长度将网络数据划分为时间片,每个时间片下构造网络图G={Gt-N,…,Gt-1,Gt},将G用时序邻接矩阵表达为X={Xt-N,…,Xt-1,Xt};
步骤4)将{Xt-N,…,Xt-1}输入深度动态网络嵌入表示模型,其中{Xt-N,…,Xt-2}作为训练样本的X,{Xt-1}为训练样本的y值,多次迭代并用随机梯度下降法训练深度动态网络嵌入表示模型;
步骤5)时间窗往前移动一个单位,将{Xt-N,…,Xt-1}输入深度动态网络嵌入表示模型,输出为t时刻的网络连接矩阵Xt
作为上述方法的一种改进,所述步骤1)的深度动态网络嵌入表示模型包括依次连接的编码器和解码器;所述编码器采用若干个门控递归单元,用于对历史连接矩阵进行迭代编码,所述解码器利用多层感知机网络对向量C进行解码,得到每个向量的嵌入表示,然后乘以一个权值矩阵得到下一个时刻的连接状态预测Xt
作为上述方法的一种改进,所述步骤2)的预处理为删除包含孤立节点或节点对的网络数据。
本发明的优点在于:
1、本发明的方法有效地融合了所有的历史连接数据,通过深度学习方法敏锐地捕捉节点的演变规律,最终产生的节点向量包含了未来网络的信息。因此比静态网络嵌入方法和普通链路预测方法取得更好的预测效果;
2、本发明的DDNE模型的解码器的输出(嵌入表示和预测向量)不仅可以用于链路预测,通过进一步的优化损失函数,还可以用于节点分类,社区发现,网络可视化等实际应用;
3、本发明的链路预测方法不仅对不同网络具有普适性,而且对不同网络特性,不同大小的网络都有很好的鲁棒性。
附图说明
图1为本发明的用于链路预测的动态网络嵌入方法的示意图;
图2为本发明的用于链路预测的动态网络嵌入方法的流程图;
图3为本发明的深度动态网络嵌入表示模型的结构图;
图4为本发明的门控递归单元结构图以及运算公式。
具体实施方式
下面结合附图和具体实施例对本发明进行详细的说明。
为了更好地理解本方法,其流程图如图1所示。通过对N个历史连接数据(t-N,t-1)进行学习,得到每个节点的嵌入表示(Embedding),然后将学习到的嵌入表示预测未来链路(t时刻)。
该深度学习结构由本申请首次提出,并成功用于链路预测领域。模型在现实网络数据中表现优异,相比当前最优的链路预测模型有很大的性能提升。
如图2所示,本发明的方法包括以下步骤:
步骤S1)从互联网或其它多媒体中抓取大量的网络数据,对网络数据进行预处理,使网络数据不包含孤立节点或节点对;
步骤S2)按一定时间长度将网络数据划分为时间片,每个时间片下构造网络图G={Gt-N,…,Gt-1,Gt},将G用时序邻接矩阵表达为X={Xt-N,…,Xt-1,Xt},然后确认{Gt-N,…,Gt-3,Gt-2}为历史网络图,{Gt-1}为现有网络图,{Gt}是将要预测的网络图;
本发明的核心部分DDNE模型是指深度动态网络嵌入表示模型(Deep DynamicNetwork Embedding),其主要框架图3所示。整个编码(ENCODER)部分是采用GRU对历史连接矩阵进行迭代编码,将所有历史连接和变化信息压缩到向量C;解码器(DECODER)将对C进行解码:将向量C作为输入,经过多层感知机(Multiple Layer Perception,MLP)网络之后,得到每个向量的嵌入表示(Embeddings)以及下一个时刻的连接状态预测Xt
其中,GRU(Gated Recurrent Unit)单元是门控递归单元,是属于递归神经网络RNN(Recurrent Neural Network)的改进版本。单元内部结构如图4:
在任一时刻t下,输入GRU单元的是当前时刻t下第i个节点的链接向量Xt(i,:),以及GRU的上一个状态ht-1。在图4中多个GRU单元进行串联,因而输入分别对应Xt-N(i,:)、…Xt -1(i,:)和串联单元中的上一时刻GRU的输出。最后,GRU单元的输出是经过图4右式多个门计算后的向量ht。由于多个门函数的计算,GRU单元比传统RNN模型具有更强的时序编码能力,可将多时序下的信息进行迭代融合,最后压缩至低维空间。在DDNE模型中,Vi,Vj代表节点i,,j,Xt(i,:)表示t时刻下序邻接矩阵X的第i行向量,即节点Vi的链接相量。
GRU单元相较于普通递归神经单元具有更强的拟合能力,相比于长短时记忆单元有更低的计算复杂度。因此可以将所有历史连接和变化信息有效地压缩到向量C;对于网络中的每一个节点,其链接变化不是独立的,而是受周边节点影响的。通过向量C之间的相似度比较,将联系紧密的节点映射到相近的向量空间,使得历史中互动频繁的节点在未来的连接概率增大,符合现实中动态网络的演化规律。
步骤S3)将历史数据和现有数据{Xt-N,…,Xt-1}输入DDNE(Deep Dynamic NetworkEmbedding)模型,其中{Xt-N,…,Xt-2}作为训练样本的X,{Xt-1}为训练样本的y值,多次迭代并用随机梯度下降法训练模型;
步骤S4)时间窗往前移动一个单位,历史数据变成{Xt-N,…,Xt-1},输入DDNE模型,模型的输出是每个节点在时刻t的嵌入表示(Embedding),再将模型的输出乘以一个权值矩阵(该矩阵已由训练部分得到),最后得到t时刻的网络连接矩阵;
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种基于深度动态网络嵌入表示模型的链路预测方法,所述方法包括:
步骤1)构建深度动态网络嵌入表示模型;
步骤2)从互联网抓取大量的网络数据,对网络数据进行预处理;
步骤3)按一定时间长度将网络数据划分为时间片,每个时间片下构造网络图G = {Gt -N, … , Gt-1 , Gt},将G用时序邻接矩阵表达为X={ Xt-N, … , Xt-1 , Xt};
步骤4)将{ Xt-N, … , Xt-1} 输入深度动态网络嵌入表示模型,其中{ Xt-N, … , Xt -2} 作为训练样本的X,{ Xt-1}为训练样本的y值,多次迭代并用随机梯度下降法训练深度动态网络嵌入表示模型;
步骤5)时间窗往前移动一个单位,将 { Xt-N, … , Xt-1}输入深度动态网络嵌入表示模型,输出为t时刻的网络连接矩阵Xt
所述步骤1)的深度动态网络嵌入表示模型包括依次连接的编码器和解码器;所述编码器采用若干个门控递归单元,用于对历史连接矩阵进行迭代编码,输出向量C;所述解码器利用多层感知机网络对向量C进行解码,得到每个向量的嵌入表示,然后乘以一个权值矩阵得到下一个时刻的连接状态预测Xt
2.根据权利要求1所述的基于深度动态网络嵌入表示模型的链路预测方法,其特征在于,所述步骤2)的预处理为删除包含孤立节点或节点对的网络数据。
CN201810008394.3A 2018-01-04 2018-01-04 一种基于深度动态网络嵌入表示模型的链路预测方法 Active CN110020379B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810008394.3A CN110020379B (zh) 2018-01-04 2018-01-04 一种基于深度动态网络嵌入表示模型的链路预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810008394.3A CN110020379B (zh) 2018-01-04 2018-01-04 一种基于深度动态网络嵌入表示模型的链路预测方法

Publications (2)

Publication Number Publication Date
CN110020379A CN110020379A (zh) 2019-07-16
CN110020379B true CN110020379B (zh) 2021-02-09

Family

ID=67187368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810008394.3A Active CN110020379B (zh) 2018-01-04 2018-01-04 一种基于深度动态网络嵌入表示模型的链路预测方法

Country Status (1)

Country Link
CN (1) CN110020379B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369374B (zh) * 2020-02-19 2023-06-02 山西大学 一种基于概率产生式的社交网络时序链接预测方法及装置
CN112232489A (zh) * 2020-10-26 2021-01-15 南京明德产业互联网研究院有限公司 一种门控循环网络的方法和装置及链路预测的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326637A (zh) * 2016-08-10 2017-01-11 浙江工业大学 一种基于局部有效路径度的链路预测方法
CN106959967A (zh) * 2016-01-12 2017-07-18 中国科学院声学研究所 一种链路预测模型的训练及链路预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9818409B2 (en) * 2015-06-19 2017-11-14 Google Inc. Context-dependent modeling of phonemes

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959967A (zh) * 2016-01-12 2017-07-18 中国科学院声学研究所 一种链路预测模型的训练及链路预测方法
CN106326637A (zh) * 2016-08-10 2017-01-11 浙江工业大学 一种基于局部有效路径度的链路预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于深度神经网络的文本表示及其应用》;户保田;《中国博士学位论文全文数据库 信息科技辑》;20170215(第02期);I138-220 *

Also Published As

Publication number Publication date
CN110020379A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN110263280B (zh) 一种基于多视图的动态链路预测深度模型及应用
CN113905391B (zh) 集成学习网络流量预测方法、系统、设备、终端、介质
CN112560432A (zh) 基于图注意力网络的文本情感分析方法
CN111709474A (zh) 一种融合拓扑结构和节点属性的图嵌入链路预测方法
CN112559764B (zh) 一种基于领域知识图谱的内容推荐方法
CN112529184B (zh) 融合领域知识与多源数据的工业过程优化决策方法
CN112183742B (zh) 基于渐进式量化和Hessian信息的神经网络混合量化方法
CN112417289B (zh) 一种基于深度聚类的资讯信息智能推荐方法
CN112148891A (zh) 一种基于图感知张量分解的知识图谱补全方法
CN110020379B (zh) 一种基于深度动态网络嵌入表示模型的链路预测方法
CN115952424A (zh) 一种基于多视图结构的图卷积神经网络聚类方法
CN113420868A (zh) 一种基于深度强化学习的旅行商问题求解方法及求解系统
Shi et al. Data recovery algorithm based on generative adversarial networks in crowd sensing Internet of Things
CN108769674A (zh) 一种基于自适应层次化运动建模的视频预测方法
CN116306780A (zh) 一种动态图链接生成方法
CN116561376A (zh) 一种多智能体超图建模与表示方法
ABBAS A survey of research into artificial neural networks for crime prediction
CN114298290A (zh) 一种基于自监督学习的神经网络编码方法及编码器
CN114386600A (zh) 基于自适应结构和位置编码的网络表征方法
Rathee et al. A machine learning approach to predict the next word in a statement
CN113935458A (zh) 基于卷积自编码深度学习的空气污染多站点联合预测方法
CN113111308A (zh) 基于数据驱动遗传编程算法的符号回归方法及系统
CN112598044A (zh) 一种基于多通道图卷积的文本分类方法
CN112418386A (zh) 一种基于网络结构信息熵的网络嵌入方法
Xie et al. Mobile big data analysis with machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant