CN111369374B - 一种基于概率产生式的社交网络时序链接预测方法及装置 - Google Patents

一种基于概率产生式的社交网络时序链接预测方法及装置 Download PDF

Info

Publication number
CN111369374B
CN111369374B CN202010102869.2A CN202010102869A CN111369374B CN 111369374 B CN111369374 B CN 111369374B CN 202010102869 A CN202010102869 A CN 202010102869A CN 111369374 B CN111369374 B CN 111369374B
Authority
CN
China
Prior art keywords
link
users
network
probability
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010102869.2A
Other languages
English (en)
Other versions
CN111369374A (zh
Inventor
王智强
梁吉业
梁建青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Jinxinan Technology Co ltd
Original Assignee
Shanxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi University filed Critical Shanxi University
Priority to CN202010102869.2A priority Critical patent/CN111369374B/zh
Publication of CN111369374A publication Critical patent/CN111369374A/zh
Application granted granted Critical
Publication of CN111369374B publication Critical patent/CN111369374B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于概率产生式的社交网络时序链接预测方法及装置,其中,包括以下步骤:采集用户之间的链接信息,并获取时间信息;将链接信息平均分割成多个时间片段,以获取每个时间片段中的链接信息;根据所有时间片段的链接信息,建立网络的概率产生式模型;通过训练网络的概率产生式模型,获取每个时间片段中用户的向量表示及链接参数;根据最后一个时间片段用户向量表示与链接参数,估计下一时间片段用户间的链接概率;根据所估计链接概率进行链接预测。本发明实施例的链接预测方法,通过概率产生式模型天然地建模了网络演化过程,从而有效解决动态环境中的时序链接预测问题,提高链接预测精度。

Description

一种基于概率产生式的社交网络时序链接预测方法及装置
技术领域
本发明属于网络数据挖掘技术领域,具体涉及一种基于概率产生式的社交网络时序链接预测方法及装置。
背景技术
链接预测属于网络数据领域中的一个基础研究问题,对于探究网络的形成机理与演化规律具有重要科学意义,同时在推荐系统、影响力分析、专家用户发现等领域发挥着重要应用价值。如在推荐系统中,链接预测可以用来给用户进行朋友推荐;在影响力分析领域,链接预测可以用来估计网络中节点的影响力;在科学研究领域,链接预测能够用于科研合作者网络中的专家识别等。
目前针对动态网络的链接预测问题,主要有基于度量的方法与基于张量分解的方法。基于度量的方法是通过加权组合不同时刻节点之间的度量来实现链接预测,此类方法中的度量设计以及权重赋予,都十分依赖于人工经验,鲁棒性较差。基于张量分解的方法是将多个时刻的网络邻接矩阵组合在一起进行分解,包括CP(CANDECOMP/PARAFAC)分解与Tucker解等。此类张量分解方法能够自适应学习不同时刻节点的低维向量表示,进而基于不同时刻的向量表示能够实现时序的链接预测,但此类方法存在的问题为:当对多个网络邻接矩阵进行联合分解时,缺乏对不同时刻网络邻接矩阵之间关系的建模,即对网络演化规律的建模不足,影响最终链接预测的准确性。
发明内容
针对上述问题本发明提供了一种基于概率产生式的社交网络时序链接预测方法及装置。
为了达到上述目的,本发明采用了下列技术方案:
一种基于概率产生式的社交网络时序链接预测方法,包括以下步骤:
步骤S1,采集用户之间的链接信息,并获取用户之间链接形成的时间信息;
步骤S2,根据所述用户之间链接形成的时间信息将用户之间的链接信息平均分割成多个时间片段,以获取每个时间片段中用户之间的链接信息;
步骤S3,根据所有时间片段中用户之间的链接信息,建立网络的概率产生式模型;
步骤S4,训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数;
步骤S5,根据最后一个时间片段中用户的低维潜在表示向量与用户之间的链接参数,估计下一个时间片段中用户之间的链接概率;
步骤S6,根据所估计的下一个时间片段中用户之间的链接概率大小对用户对进行排序,输出时序链接预测结果。
进一步,所述步骤3根据所有时间片段中用户之间的链接信息,建立网络的概率产生式模型包括以下步骤:
步骤S3.1:t=1时,建立网络N1的概率产生式模型;
步骤S3.2:2≤t≤s时,建立网络N2,...,Ns的概率产生式模型;
其中,N1,N2,...,Ns分别表示网络在t=1,2,...,s时刻的邻接矩阵。
再进一步,所述步骤S3.1:t=1时,建立网络N1的概率产生式模型包括以下步骤:
步骤S3.1.1:网络N1中任意节点i的低维潜在表示向量
Figure BDA0002387457600000021
是由高斯分布
Figure BDA0002387457600000022
产生;
步骤S3.1.2:网络N1中节点间链接参数矩阵W1的每一行
Figure BDA0002387457600000031
是由高斯分布
Figure BDA0002387457600000032
产生。
再进一步,所述步骤S3.2:2≤t≤s时,建立网络N2,...,Ns的概率产生式模型包括以下步骤:
步骤S3.2.1:网络Nt(2≤t≤s)中任意节点i的低维潜在表示向量
Figure BDA0002387457600000033
是由高斯分布
Figure BDA0002387457600000034
产生;
步骤S3.2.2:网络Nt中节点间链接参数矩阵Wt的每一行
Figure BDA0002387457600000035
是由高斯分布
Figure BDA0002387457600000036
产生。
进一步,所述步骤S4,训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数,包括以下步骤:
步骤S4.1:极大化网络的产生概率,得到优化目标为:
Figure BDA0002387457600000037
其中,Nt表示网络在t时刻的邻接矩阵;
Figure BDA0002387457600000038
Figure BDA0002387457600000039
分别表示用户i与用户j在t时刻的低维潜在向量表示;Ut表示所有用户在t时刻的低维潜在矩阵表示;Wt表示t时刻用户间的链接参数矩阵;
Figure BDA00023874576000000310
表示约束项
Figure BDA00023874576000000311
与约束项
Figure BDA00023874576000000312
的权重;
Figure BDA00023874576000000313
表示约束项
Figure BDA00023874576000000314
与约束项
Figure BDA00023874576000000315
的权重;
步骤S4.2:通过梯度下降得到每个时间片段t中每个用户i的低维潜在表示向量
Figure BDA00023874576000000316
及用户之间的链接参数Wt
进一步,所述步骤S5中估计下一个时间片段中用户之间的链接概率表达式为:
Figure BDA0002387457600000041
其中,
Figure BDA0002387457600000042
Figure BDA0002387457600000043
分别表示用户i与用户j在t时刻的低维潜在向量表示,Wt表示t时刻用户间的链接参数矩阵,σ为上述高斯分布的标准差,为超参数。
一种基于概率产生式的社交网络时序链接预测装置,由采集模块,预处理模块,概率产生式模型建立模块,概率产生式模型训练模块,链接概率估计模块,链接预测模块,顺序串联而成。
进一步,所述采集模块:用于采集用户之间的链接信息,并获取所述用户之间链接形成的时间信息;
所述预处理模块:用于根据所述用户之间链接形成的时间信息将用户之间的链接信息平均分割成多个时间片段,以获取每个时间片段中用户之间的链接信息;
所述概率产生式模型建立模块:用于根据所有时间片段用户之间的链接信息,建立网络的概率产生式模型;
所述概率产生式模型训练模块:用于训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数;
所述链接概率估计模块:用于根据最后一个时间片段中用户的低维潜在表示向量与用户之间的链接参数,估计下一个时间片段中用户之间的链接概率;
所述链接预测模块:用于根据所估计的下一个时间片段中用户之间的链接概率大小对用户对进行排序,输出时序链接预测结果。
进一步,所述概率产生式模型建立模块包括:
t=1时,建立网络N1的概率产生式模型;
建立网络N1的概率产生式模型中包括网络N1中任意节点i的低维潜在表示向量
Figure BDA0002387457600000051
是由高斯分布
Figure BDA0002387457600000052
产生和网络N1中节点间链接参数矩阵W1的每一行
Figure BDA0002387457600000053
是由高斯分布
Figure BDA0002387457600000054
产生;
2≤t≤s时,建立网络N2,...,Ns的概率产生式模型;
建立网络N2,...,Ns的概率产生式模型中包括网络Nt(2≤t≤s)中任意节点i的低维潜在表示向量
Figure BDA0002387457600000055
是由高斯分布
Figure BDA0002387457600000056
产生和网络Nt中节点间链接参数矩阵Wt的每一行
Figure BDA0002387457600000057
是由高斯分布
Figure BDA0002387457600000058
产生。
进一步,所述概率产生式模型训练模块包括:
极大化网络的产生概率,得到优化目标为:
Figure BDA0002387457600000059
其中,Nt表示网络在t时刻的邻接矩阵;
Figure BDA00023874576000000510
Figure BDA00023874576000000511
分别表示用户i与用户j在t时刻的低维潜在向量表示;Ut表示所有用户在t时刻的低维潜在矩阵表示;Wt表示t时刻用户间的链接参数矩阵;
Figure BDA00023874576000000512
表示约束项
Figure BDA00023874576000000513
与约束项
Figure BDA00023874576000000514
的权重;
Figure BDA00023874576000000515
表示约束项
Figure BDA00023874576000000516
与约束项
Figure BDA00023874576000000517
的权重;
通过梯度下降得到每个时间片段t中每个用户i的低维潜在表示向量
Figure BDA00023874576000000518
及用户之间的链接参数Wt
所述链接预测模块中,估计下一个时间片段st+1中用户之间的链接概率为:
Figure BDA00023874576000000519
其中,
Figure BDA0002387457600000061
Figure BDA0002387457600000062
分别表示用户i与用户j在t时刻的低维潜在向量表示,Wt表示t时刻用户间的链接参数矩阵,σ为上述高斯分布的标准差,为超参数。
与现有技术相比本发明具有以下优点:
本发明基于概率产生式的思想,能够天然地建模动态环境中社交网络的演化过程。解决了传统度量方法过度依赖人类经验对度量进行人工赋权的问题,同时改善了传统张量分解方法对网络演化规律建模不足的问题。该方法天然地建模网络演化过程,能够在动态环境中获得比传统度量与张量分解更高的社交网络链接预测精度,有效适用于社会化推荐、专家识别、影响力分析等应用系统。
附图说明
图1为本发明基于概率产生式的社交网络时序链接预测方法流程图;
图2为本发明社交网络的概率产生式建模示意图;
图3为本发明基于概率产生式的社交网络时序链接预测装置结构示意图。
具体实施方式
实施例1
本实施例一种基于概率产生式的社交网络时序链接预测方法,如图1为本发明基于概率产生式的社交网络时序链接预测方法流程图所示,包括以下步骤:
S101:采集用户之间的链接信息,并获取所述用户之间链接形成的时间信息。
S102:根据所述用户之间链接形成的时间信息将用户之间的链接信息平均分割成多个时间片段,以获取每个时间片段中用户之间的链接信息。
S103:根据所有时间片段用户之间的链接信息,建立网络的概率产生式模型。
具体地,t=1时,建立网络N1的概率产生式模型,包括:网络N1中任意节点i的低维潜在表示向量
Figure BDA0002387457600000071
是由高斯分布
Figure BDA0002387457600000072
产生;网络N1中节点间链接参数矩阵W1的每一行
Figure BDA0002387457600000073
是由高斯分布
Figure BDA0002387457600000074
产生。2≤t≤s时,建立网络N2,...,Ns的概率产生式模型,包括:网络Nt(2≤t≤s)中任意节点i的低维潜在表示向量
Figure BDA0002387457600000075
是由高斯分布
Figure BDA0002387457600000076
产生;网络Nt中节点间链接参数矩阵Wt的每一行
Figure BDA0002387457600000077
是由高斯分布
Figure BDA0002387457600000078
产生。
S104:训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数。
具体地,极大化网络的产生概率,得到优化目标为:
Figure BDA0002387457600000079
其中,Nt表示网络在t时刻的邻接矩阵;
Figure BDA00023874576000000710
Figure BDA00023874576000000711
分别表示用户i与用户j在t时刻的低维潜在向量表示;Ut表示所有用户在t时刻的低维潜在矩阵表示;Wt表示t时刻用户间的链接参数矩阵;
Figure BDA00023874576000000712
表示上式中约束项
Figure BDA00023874576000000713
与约束项
Figure BDA00023874576000000714
的权重;
Figure BDA00023874576000000715
表示上式中约束项
Figure BDA00023874576000000716
与约束项
Figure BDA00023874576000000717
的权重。
通过梯度下降得到每个时间片段t中每个用户i的低维潜在表示向量
Figure BDA00023874576000000718
及用户之间的链接参数Wt。其中,梯度计算公式如下:
t=1时,变量
Figure BDA00023874576000000719
与W1的梯度为:
Figure BDA00023874576000000720
Figure BDA0002387457600000081
2≤t≤s时,变量
Figure BDA0002387457600000082
与Wt的梯度为:
Figure BDA0002387457600000083
Figure BDA0002387457600000084
t=s时,变量
Figure BDA0002387457600000085
与Ws的梯度为:
Figure BDA0002387457600000086
Figure BDA0002387457600000087
S105:根据最后一个时间片段中用户的低维潜在表示向量与用户之间的链接参数,估计下一个时间片段中用户之间的链接概率。
具体地,估计下一个时间片段s+1中用户之间的链接概率为:
Figure BDA0002387457600000088
其中,
Figure BDA0002387457600000089
Figure BDA00023874576000000810
分别表示用户i与用户j在t时刻的低维潜在向量表示,Wt表示t时刻用户间的链接参数矩阵,σ为上述高斯分布的标准差,为超参数。
S106:根据所估计的下一个时间片段中用户之间的链接概率大小对用户对进行排序,输出时序链接预测结果。如图2为本发明社交网络的概率产生式建模示意图所示。
在本发明的实施例中,根据用户之间链接形成的时间信息将用户之间的链接信息平均分割成个多个时间片段,基于后一时间片段网络的链接从上一时间片段产生而来的假设构建网络的概率产生式模型,并通过训练网络的概率产生式模型来解决未来时刻网络节点间的链接概率估计与预测问题,此过程天然地建模了网络的动态演化,提高了链接预测的精度。
一种基于概率产生式的社交网络时序链接预测装置,如图3为本发明基于概率产生式的社交网络时序链接预测装置结构示意图所示,本发明装置10由:采集模块100、预处理模块200、概率产生式模型建立模块300、概率产生式模型训练模块400、链接概率估计模块500和链接预测模块600顺序串联而成。
采集模块100用于采集用户之间的链接信息,并获取所述用户之间链接形成的时间信息。
预处理模块200用于根据所述用户之间链接形成的时间信息将用户之间的链接信息平均分割成s个时间片段t=1,2,...,s,以获取每个时间片段t中用户之间的链接信息Nt
概率产生式模型建立模块300用于根据所有时间片段用户之间的链接信息{Nt}t=1,2,...,s建立网络的概率产生式模型。
概率产生式模型训练模块400用于训练网络的概率产生式模型,以获取每个时间片段t中每个用户i的低维潜在表示向量
Figure BDA0002387457600000091
及用户之间的链接参数Wt
链接概率估计模块500用于根据最后一个时间片段s中用户的低维潜在表示向量与用户之间的链接参数,估计下一个时间片段s+1中用户之间的链接概率。
链接预测模块600用于根据所估计的下一个时间片段s+1中用户之间的链接概率大小对用户对进行排序,输出时序链接预测结果。
其中,所述概率产生式模型建立模块包括:
t=1时,建立网络N1的概率产生式模型;
2≤t≤s时,建立网络N2,...,Ns的概率产生式模型。
进一步地,所述建立网络N1的概率产生式模型包括:
网络N1中任意节点i的低维潜在表示向量
Figure BDA0002387457600000101
是由高斯分布
Figure BDA0002387457600000102
产生;
网络N1中节点间链接参数矩阵W1的每一行
Figure BDA0002387457600000103
是由高斯分布
Figure BDA0002387457600000104
产生。
进一步地,建立网络N2,...,Ns的概率产生式模型包括:
网络Nt(2≤t≤s)中任意节点i的低维潜在表示向量
Figure BDA0002387457600000105
是由高斯分布
Figure BDA0002387457600000106
产生;
网络Nt中节点间链接参数矩阵Wt的每一行
Figure BDA0002387457600000107
是由高斯分布
Figure BDA0002387457600000108
产生;
其中,所述概率产生式模型训练模块包括:
极大化网络的产生概率,得到优化目标为:
Figure BDA0002387457600000109
其中,Nt表示网络在t时刻的邻接矩阵;
Figure BDA00023874576000001010
Figure BDA00023874576000001011
分别表示用户i与用户j在t时刻的低维潜在向量表示;Ut表示所有用户在t时刻的低维潜在矩阵表示;Wt表示t时刻用户间的链接参数矩阵;
Figure BDA00023874576000001012
表示上式中约束项
Figure BDA00023874576000001013
与约束项
Figure BDA00023874576000001014
的权重,
Figure BDA00023874576000001015
表示上式中约束项
Figure BDA00023874576000001016
与约束项
Figure BDA00023874576000001017
的权重;
通过梯度下降得到每个时间片段t中每个用户i的低维潜在表示向量
Figure BDA00023874576000001018
及用户之间的链接参数Wt
优选地,所述链接预测模块中估计下一个时间片段s+1中用户之间的链接概率为:
Figure BDA0002387457600000111
其中,
Figure BDA0002387457600000112
Figure BDA0002387457600000113
分别表示用户i与用户j在t时刻的低维潜在向量表示,Wt表示t时刻用户间的链接参数矩阵,σ为上述高斯分布的标准差,为超参数。
在本发明的实施例中,本发明提供的基于概率产生式的社交网络时序链接预测装置,通过构建概率产生式模型,天然地建模了动态数据环境中网络的演化过程,解决了传统度量方法过度依赖人类经验对度量进行人工赋权的问题,同时改善了传统张量分解方法对网络演化规律建模不足的问题,提高了动态环境中的社交网络链接预测的精度。
本发明实施例所描述的步骤可以通过计算机程序来指令相关的硬件完成,所述程序可以存储在计算机可读取存储介质中。其中,随机存取存储器(RAM)、只读存储器(ROM)、光盘以及磁碟等可以作为存储程序的介质。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (5)

1.一种基于概率产生式的社交网络时序链接预测方法,其特征在于:包括以下步骤:
步骤S1,采集用户之间的链接信息,并获取用户之间链接形成的时间信息;
步骤S2,根据所述用户之间链接形成的时间信息将用户之间的链接信息平均分割成多个时间片段,以获取每个时间片段中用户之间的链接信息;
步骤S3,根据所有时间片段中用户之间的链接信息,建立网络的概率产生式模型;
步骤S4,训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数;
步骤S5,根据最后一个时间片段中用户的低维潜在表示向量与用户之间的链接参数,估计下一个时间片段中用户之间的链接概率;
步骤S6,根据所估计的下一个时间片段中用户之间的链接概率大小对用户对进行排序,输出时序链接预测结果;
所述步骤3根据所有时间片段中用户之间的链接信息,建立网络的概率产生式模型包括以下步骤:
步骤S3.1:t=1时,建立网络N1的概率产生式模型;
步骤S3.2:2≤t≤s时,建立网络N2,...,Ns的概率产生式模型;
其中,N1,N2,...,Ns分别表示网络在t=1,2,...,s时刻的邻接矩阵;
所述步骤S3.1:t=1时,建立网络N1的概率产生式模型包括以下步骤:
步骤S3.1.1:网络N1中任意节点i的低维潜在表示向量
Figure FDA0004103742480000011
是由高斯分布
Figure FDA0004103742480000012
产生;
步骤S3.1.2:网络N1中节点间链接参数矩阵W1的每一行Wl 1是由高斯分布
Figure FDA0004103742480000013
产生;
所述步骤S3.2:2≤t≤s时,建立网络N2,...,Ns的概率产生式模型包括以下步骤:
步骤S3.2.1:网络Nt(2≤t≤s)中任意节点i的低维潜在表示向量
Figure FDA00041037424800000214
是由高斯分布
Figure FDA0004103742480000021
产生;
步骤S3.2.2:网络Nt中节点间链接参数矩阵Wt的每一行Wl t是由高斯分布
Figure FDA0004103742480000022
产生;
所述步骤S4,训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数,包括以下步骤:
步骤S4.1:极大化网络的产生概率,得到优化目标为:
Figure FDA0004103742480000023
其中,Nt表示网络在t时刻的邻接矩阵;
Figure FDA0004103742480000024
Figure FDA0004103742480000025
分别表示用户i与用户j在t时刻的低维潜在向量表示;Ut表示所有用户在t时刻的低维潜在矩阵表示;Wt表示t时刻用户间的链接参数矩阵;
Figure FDA0004103742480000026
表示约束项
Figure FDA0004103742480000027
与约束项
Figure FDA0004103742480000028
的权重;
Figure FDA0004103742480000029
表示约束项
Figure FDA00041037424800000210
与约束项
Figure FDA00041037424800000211
的权重;
步骤S4.2:通过梯度下降得到每个时间片段t中每个用户i的低维潜在表示向量
Figure FDA00041037424800000212
及用户之间的链接参数Wt
所述步骤S5中估计下一个时间片段中用户之间的链接概率表达式为:
Figure FDA00041037424800000213
其中,
Figure FDA0004103742480000031
Figure FDA0004103742480000032
分别表示用户i与用户j在t时刻的低维潜在向量表示,Wt表示t时刻用户间的链接参数矩阵,σ为上述高斯分布的标准差,为超参数。
2.一种基于概率产生式的社交网络时序链接预测装置,其特征在于:由采集模块,预处理模块,概率产生式模型建立模块,概率产生式模型训练模块,链接概率估计模块,链接预测模块,顺序串联而成。
3.根据权利要求2所述的一种基于概率产生式的社交网络时序链接预测装置,其特征在于:
所述采集模块:用于采集用户之间的链接信息,并获取所述用户之间链接形成的时间信息;
所述预处理模块:用于根据所述用户之间链接形成的时间信息将用户之间的链接信息平均分割成多个时间片段,以获取每个时间片段中用户之间的链接信息;
所述概率产生式模型建立模块:用于根据所有时间片段用户之间的链接信息,建立网络的概率产生式模型;
所述概率产生式模型训练模块:用于训练网络的概率产生式模型,以获取每个时间片段中每个用户的低维潜在表示向量及用户之间的链接参数;
所述链接概率估计模块:用于根据最后一个时间片段中用户的低维潜在表示向量与用户之间的链接参数,估计下一个时间片段中用户之间的链接概率;
所述链接预测模块:用于根据所估计的下一个时间片段中用户之间的链接概率大小对用户对进行排序,输出时序链接预测结果。
4.根据权利要求2所述的一种基于概率产生式的社交网络时序链接预测装置,其特征在于:所述概率产生式模型建立模块包括:
t=1时,建立网络N1的概率产生式模型;
建立网络N1的概率产生式模型中包括网络N1中任意节点i的低维潜在表示向量
Figure FDA0004103742480000041
是由高斯分布
Figure FDA0004103742480000042
产生和网络N1中节点间链接参数矩阵W1的每一行Wl 1是由高斯分布
Figure FDA0004103742480000043
产生;
2≤t≤s时,建立网络N2,...,Ns的概率产生式模型;
建立网络N2,...,Ns的概率产生式模型中包括网络Nt(2≤t≤s)中任意节点i的低维潜在表示向量
Figure FDA0004103742480000044
是由高斯分布
Figure FDA0004103742480000045
产生和网络Nt中节点间链接参数矩阵Wt的每一行Wl t是由高斯分布
Figure FDA0004103742480000046
产生。
5.根据权利要求2所述的一种基于概率产生式的社交网络时序链接预测装置,其特征在于:所述概率产生式模型训练模块包括:
极大化网络的产生概率,得到优化目标为:
Figure FDA0004103742480000047
其中,Nt表示网络在t时刻的邻接矩阵;
Figure FDA0004103742480000048
Figure FDA0004103742480000049
分别表示用户i与用户j在t时刻的低维潜在向量表示;Ut表示所有用户在t时刻的低维潜在矩阵表示;Wt表示t时刻用户间的链接参数矩阵;
Figure FDA00041037424800000410
表示约束项
Figure FDA00041037424800000411
与约束项
Figure FDA00041037424800000412
的权重;
Figure FDA00041037424800000413
表示约束项
Figure FDA00041037424800000414
与约束项
Figure FDA00041037424800000415
的权重;
通过梯度下降得到每个时间片段t中每个用户i的低维潜在表示向量
Figure FDA00041037424800000416
及用户之间的链接参数Wt
所述链接预测模块中,估计下一个时间片段st+1中用户之间的链接概率为:
Figure FDA0004103742480000051
其中,
Figure FDA0004103742480000052
Figure FDA0004103742480000053
分别表示用户i与用户j在t时刻的低维潜在向量表示,Wt表示t时刻用户间的链接参数矩阵,σ为上述高斯分布的标准差,为超参数。
CN202010102869.2A 2020-02-19 2020-02-19 一种基于概率产生式的社交网络时序链接预测方法及装置 Active CN111369374B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010102869.2A CN111369374B (zh) 2020-02-19 2020-02-19 一种基于概率产生式的社交网络时序链接预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010102869.2A CN111369374B (zh) 2020-02-19 2020-02-19 一种基于概率产生式的社交网络时序链接预测方法及装置

Publications (2)

Publication Number Publication Date
CN111369374A CN111369374A (zh) 2020-07-03
CN111369374B true CN111369374B (zh) 2023-06-02

Family

ID=71211513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010102869.2A Active CN111369374B (zh) 2020-02-19 2020-02-19 一种基于概率产生式的社交网络时序链接预测方法及装置

Country Status (1)

Country Link
CN (1) CN111369374B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012176863A1 (ja) * 2011-06-24 2012-12-27 日本電気株式会社 情報処理システム、ネットワーク構造学習装置、リンク強度予測装置、リンク強度予測方法およびプログラム
CN106649659A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 一种面向社交网络的链接预测系统及方法
CN109299418A (zh) * 2018-07-23 2019-02-01 东南大学 一种基于网络嵌入的时序社交网络链接预测方法
CN110020379A (zh) * 2018-01-04 2019-07-16 中国科学院声学研究所 一种基于深度动态网络嵌入表示模型的链路预测方法
CN110263280A (zh) * 2019-06-11 2019-09-20 浙江工业大学 一种基于多视图的动态链路预测深度模型及应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361926B2 (en) * 2017-03-03 2019-07-23 Nec Corporation Link prediction with spatial and temporal consistency in dynamic networks

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012176863A1 (ja) * 2011-06-24 2012-12-27 日本電気株式会社 情報処理システム、ネットワーク構造学習装置、リンク強度予測装置、リンク強度予測方法およびプログラム
CN106649659A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 一种面向社交网络的链接预测系统及方法
CN110020379A (zh) * 2018-01-04 2019-07-16 中国科学院声学研究所 一种基于深度动态网络嵌入表示模型的链路预测方法
CN109299418A (zh) * 2018-07-23 2019-02-01 东南大学 一种基于网络嵌入的时序社交网络链接预测方法
CN110263280A (zh) * 2019-06-11 2019-09-20 浙江工业大学 一种基于多视图的动态链路预测深度模型及应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于动态网络表示的链接预测;韩忠明;李胜男;郑晨烨;段大高;杨伟杰;;物理学报(第16期);全文 *
基于监督联合去噪模型的社交网络链接预测;郝占刚;章伟雄;陈政;;中国科学:信息科学(第11期);全文 *
王智强."社交网络链接预测方法研究".《中国博士学位论文全文数据库(信息科技辑)》.2019,全文. *

Also Published As

Publication number Publication date
CN111369374A (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
CN108763319B (zh) 融合用户行为和文本信息的社交机器人检测方法和系统
JP6708847B1 (ja) 機械学習装置及び方法
CN110929164A (zh) 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN112288086B (zh) 一种神经网络的训练方法、装置以及计算机设备
CN112235384A (zh) 分布式系统中的数据传输方法、装置、设备及存储介质
CN110969251A (zh) 基于无标签数据的神经网络模型量化方法及装置
CN109272332B (zh) 一种基于递归神经网络的客户流失预测方法
CN117523291A (zh) 基于联邦知识蒸馏和集成学习的图像分类方法
CN107103359A (zh) 基于卷积神经网络的大服务系统在线可靠性预测方法
CN114639483A (zh) 一种基于图神经网络的电子病历检索方法及装置
CN113821668A (zh) 数据分类识别方法、装置、设备及可读存储介质
CN107895223A (zh) 基于大数据的学生宿舍分配方法及系统
CN115510042A (zh) 基于生成对抗网络的电力系统负荷数据填补方法及装置
Chennapragada et al. Time series-based deep learning model for personal thermal comfort prediction
CN114490618A (zh) 基于蚁狮算法的数据填补方法、装置、设备及存储介质
CN114139782A (zh) 交通预测方法、装置、设备及计算机可读存储介质
CN111369374B (zh) 一种基于概率产生式的社交网络时序链接预测方法及装置
CN113762370A (zh) 一种结合高斯随机场的深度网络集合生成方法
CN111415265A (zh) 生成式对抗网络的社交关系数据生成方法
CN115544307A (zh) 基于关联矩阵的有向图数据特征提取与表达方法和系统
CN115510948A (zh) 一种基于鲁棒图分类的区块链钓鱼检测方法
CN115049458A (zh) 基于用户人群建模的商品推送方法及装置、介质、设备
CN115081323A (zh) 求解多目标约束优化问题的方法及其存储介质
CN109918659B (zh) 一种基于不保留最优个体遗传算法优化词向量的方法
CN111564200A (zh) 基于快速随机梯度下降的老人饮食特征提取的装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231012

Address after: Room 1806, Block B, Huanya Times Square, No. 7 Yari Street, Taiyuan Xuefu Park, Shanxi Comprehensive Reform Demonstration Zone, Taiyuan City, Shanxi Province, 030000

Patentee after: Shanxi Jinxinan Technology Co.,Ltd.

Address before: 030006 No. 92, Hollywood Road, Taiyuan, Shanxi

Patentee before: SHANXI University

TR01 Transfer of patent right