CN113610299B - 基于特征衰减强化神经网络的信息传播预测方法及装置 - Google Patents

基于特征衰减强化神经网络的信息传播预测方法及装置 Download PDF

Info

Publication number
CN113610299B
CN113610299B CN202110904109.8A CN202110904109A CN113610299B CN 113610299 B CN113610299 B CN 113610299B CN 202110904109 A CN202110904109 A CN 202110904109A CN 113610299 B CN113610299 B CN 113610299B
Authority
CN
China
Prior art keywords
user
propagation
information
characteristic
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110904109.8A
Other languages
English (en)
Other versions
CN113610299A (zh
Inventor
李弼程
万旺
熊尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN202110904109.8A priority Critical patent/CN113610299B/zh
Publication of CN113610299A publication Critical patent/CN113610299A/zh
Application granted granted Critical
Publication of CN113610299B publication Critical patent/CN113610299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于特征衰减强化神经网络的信息传播预测方法及装置,通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对用户初始特征表示进行更新,得到用户特征表示;将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态,将隐藏态融合时间衰减特征,得到时间衰减隐藏态;聚合多个被影响的用户特征表示,得到聚合用户特征,结合聚合用户特征和时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据激活概率预测出信息传播路径;基于传播序列的真实热度规模结合GRU模型与强化学习网络,获得信息传播的预测热度规模。本发明融合多阶邻居衰减影响力机制与时间衰减特征进行信息传播预测,提高模型预测能力。

Description

基于特征衰减强化神经网络的信息传播预测方法及装置
技术领域
本发明涉及网络信息传播预测领域,具体涉及一种基于特征衰减强化神经网络的信息传播预测方法及装置。
背景技术
信息传播预测可以预测单条信息传播的发展趋势,所以网络信息传播预测可以用于引导帖文的传播预测,从而实现引导帖文传播规模和传播对象的预判。信息传播发生在我们的每一个人身边。其传播过程,也称为级联。从信息传播预测的任务来看分为两类:一类是宏观传播预测,即单条信息转发规模预测;另一类是微观传播预测,即具体预测下一个转发该条信息的用户。如今信息传播预测在许多实际应用中发挥着重要作用,例如产品推荐、影响力最大化、流行病学、社交网络以及新闻和观点的传播。因此传播预测问题非常重要,因为它可以控制(或加速)信息在各种情况下的传播。
现有的基于深度学习的信息传播预测有一套通用的流程。首先,将参与信息传播的用户结点进行网络表示,将网络结构数据表示为低维稠密向量;然后,将表示为低维稠密向量的网络节点输入进各类深度、强化模型进行有监督的训练;最后,再利用训练好的模型,实验信息的传播预测。
现有的网络表示的研究也十分丰富,其中DeepWalk最具有代表性的也是第一个被提出的网络表示学习模型,由于考虑到社交网络的结构变化是随时间动态变化的,为了解决这个问题动态网络表示学习研究兴起,代表性模型Dyngraphgan被提出进行动态网络表示。信息传播预测一般包括两个研究目标,分别为目标一,预测下一个可能转发的用户;目标二,预测一共可能有多少用户参与转发。现有的研究多数是将目标一和目标二分别实现,其中FOREST模型首次在同一模型中实现目标一与目标二。但是该模型没有考虑数据序列的时间特征和区别多阶邻居的影响力。
对2010年10月间Twitter上信息进行传播分析。信息在发出三小时的信息传播数量会达到信息总传播数量的70%,特别是信息发出后七小时后传播数量会达到近90%,信息转发数量会随着时间的推移增长速度变得缓慢,由此可见信息传播序列的时间特征在进行传播预测时具有极大的意义。
综上,目前合并预测信息转发路径和信息传播规模的统一预测模型仍存在一些问题,没有考虑到以下两点。第一,统计数据表明随着时间的推移信息的传播速率会明显下降,现有研究未考虑融入时间特征,将信息传播简单的处理为一串序列数据;第二,信息传播时用户转发与否会受到邻居的影响,邻居的决策会受到邻居的邻居的影响,现有研究采用对多阶邻居平均分配权重的策略,并未对多阶邻居节点的影响力进行差异表示。
发明内容
针对上述提到的技术问题。本申请的实施例的目的在于提出了一种基于特征衰减强化神经网络的信息传播预测方法及装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请的实施例提供了一种基于特征衰减强化神经网络的信息传播预测方法,包括以下步骤:
S1,通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对用户初始特征表示进行更新,得到用户特征表示;
S2,将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态,将隐藏态融合时间衰减特征,得到时间衰减隐藏态;
S3,聚合多个被影响的用户特征表示,得到聚合用户特征,结合聚合用户特征和时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据激活概率预测出信息传播路径;
S4,基于传播序列的真实热度规模结合GRU模型与强化学习网络,获得信息传播的预测热度规模。
在一些实施例中,网络表示模型为node2vec,网络数据为用户的关注与被关注的社交网络结构。
在一些实施例中,步骤S1具体包括:
S11,对每一个用户v都有用户初始特征表示
Figure BDA0003200888080000021
寻找用户v的邻居Y(v),在Y(v)中随机采样N个用户{v1,v2,…,vn};
S12,融合邻居特征表示,采用以下公式对用户初始特征表示
Figure BDA0003200888080000022
进行更新,得到用户特征表示:
Figure BDA0003200888080000023
其中,k=1,2,3,…,n,
Figure BDA0003200888080000024
是用户v的s阶邻居特征表示,
Figure BDA0003200888080000025
是用户v的s+1阶邻居特征表示,vk是用户v的邻居采样节点,W,b是权重矩阵和偏执向量,激活函数为relu(·)=max(·,0),用户特征表示融合三阶邻居的特征,采用
Figure BDA0003200888080000026
表示用户特征表示,d是用户特征表示的维度。
在一些实施例中,步骤S2中将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态具体包括:
将给定的传播序列
Figure BDA0003200888080000031
中的
Figure BDA0003200888080000032
按照时间顺序输入GRU模型并计算隐藏态hj
Figure BDA00032008880800000335
其中,i为第i个传播序列,j为第j次转发,输入值
Figure BDA0003200888080000033
为用户特征表示,输入值
Figure BDA00032008880800000331
是前一隐藏态,输出值
Figure BDA00032008880800000332
H为GRU模型中的隐藏单元;
计算重置门
Figure BDA00032008880800000333
Figure BDA0003200888080000037
其中,σ(·)是sigmoid激活函数,
Figure BDA00032008880800000325
为GRU模型在训练过程中学习的参数,h为隐藏态;
计算更新门
Figure BDA00032008880800000334
Figure BDA00032008880800000312
其中,
Figure BDA00032008880800000326
Figure BDA00032008880800000327
计算新状态
Figure BDA00032008880800000316
Figure BDA00032008880800000317
其中,
Figure BDA00032008880800000328
Figure BDA00032008880800000329
计算隐藏态
Figure BDA00032008880800000330
Figure BDA00032008880800000322
针对传播序列
Figure BDA00032008880800000323
隐藏态
Figure BDA00032008880800000324
编码了已参与信息转发的所有用户的历史信息。
在一些实施例中,步骤S2中将隐藏态融合时间衰减特征,得到时间衰减隐藏态具体包括:
假设传播序列ci的传播时间长度是[0,T],将传播时间长度分割为连续l个时间间隔,即{[t0=0,t1),[t1,t2),…,[tl-1,tl)},
为需要学习时间衰减效应的离散变量λ={λm,m∈(1,2,…,l)},定义了一个函数来计算时间衰减效应的对应时间间隔:
Figure BDA0003200888080000041
其中,t0是原始的发文时间,l是时间间隔数目;
对于给定传播序列ci,假设在时间窗口[0,T]有j个转发用户,则得到隐藏态
Figure BDA0003200888080000042
将各个隐藏状态分别与时间衰减参数λm相乘得到时间衰减隐藏态
Figure BDA0003200888080000043
Figure BDA0003200888080000044
在一些实施例中,步骤S3具体包括:
聚合a个被影响的用户特征表示,得到聚合用户特征
Figure BDA0003200888080000045
Figure BDA0003200888080000046
其中,
Figure BDA00032008880800000411
计算下一个转发用户的激活概率:
Figure BDA0003200888080000048
其中,
Figure BDA0003200888080000049
V为用户集合,concat(·)是拼接函数,WP为权重矩阵,bp为偏执向量;
设定GRU模型在预测下一个转发用户的目标函数,模型的训练目标是最大化用户的激活概率:
Figure BDA00032008880800000410
其中,Θ是模型中的所有参数。
在一些实施例中,步骤S4具体包括:
在每个传播序列的末尾加入结束标记用户<end>,将每个传播序列的前b个确定用户输入模型,将预测到的下一个转发用户作为下一步的输入并继续预测,预测到下一个用户为<end>标记时则停止预测,进一步统计信息最终被影响的用户数量;
将MSLE作为信息传播热度预测的评价标准和目标函数,即
Figure BDA0003200888080000051
其中,|ci|是传播序列ci的真实热度规模,predi是传播序列ci的预测热度规模,C为传播序列集合C={c1,c2,…,ci};
每个GRU模型的行为action是选择下一时刻转发信息的用户,当前的状态state决定的行为action,当<end>标记被行为action时,信息传播人数预测结束,MSLE的相反数将作为reward反馈;
假设传播序列ci将前b个确定用户输入GRU模型,后续都存在一个行为action序列
Figure BDA0003200888080000052
是传播序列ci的第j个行为action预测的用户,MSLE的相反数表示为reward(seq,ci),然后训练目标是使得传播序列ci的reward期望最大化:
Figure BDA0003200888080000053
其中,Pr(seq;Θ,
Figure BDA0003200888080000054
)是选择行为action序列seq的概率;
用REINFORCE算法来计算Ji(Θ)的梯度:
Figure BDA0003200888080000055
其中,seqm中的m=1,2,…,M是Pr(seq;Θ,
Figure BDA0003200888080000056
)中随机抽样的M个采样,最后,参数Θ通过最大化reward的期望来更新。
第二方面,本申请的实施例提供了一种基于特征衰减强化神经网络的信息传播预测装置,包括:
用户特征表示模块,被配置为通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对用户初始特征表示进行更新,得到用户特征表示;
隐藏态计算模块,被配置为将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态,将隐藏态融合时间衰减特征,得到时间衰减隐藏态;
信息传播路径预测模块,被配置为聚合多个被影响的用户特征表示,得到聚合用户特征,结合聚合用户特征和时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据激活概率预测出信息传播路径;
热度规模预测模块,被配置为基于传播序列的真实热度规模结合GRU模型与强化学习网络,获得信息传播的预测热度规模。
第三方面,本申请的实施例提供了一种电子设备,包括一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明结合多阶邻居影响力衰减机制,重新更新网络用户表示,解决现有统一预测模型的多阶邻居节点权重平均问题。
(2)本发明提出将GRU模型结合强化学习模型并融合时间衰减特征来改进信息传播预测方法,提高模型预测性能。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的一个实施例可以应用于其中的示例性装置架构图;
图2为信息传播部分网络示意图;
图3为本发明的实施例的传播序列ci的部分传播示意图;
图4为本发明的实施例的基于特征衰减强化神经网络的信息传播预测方法的流程示意图;
图5为本发明的实施例的基于特征衰减强化神经网络的信息传播预测方法的用户v的邻居采样与特征融合示意图;
图6为本发明的实施例的基于特征衰减强化神经网络的信息传播预测方法的信息传播路径预测模型图;
图7为本发明的实施例的基于特征衰减强化神经网络的信息传播预测方法的信息规模预测模型图;
图8为本发明的实施例的Twitter数据集的数据分析图,其中8(a)为Twitter数据集的传播规模的分布情况,8(b)为信息发布24小时内转发的数量的饱和程度;
图9为本发明的实施例的Douban数据集的数据分析图,其中9(a)为Douban数据集的传播规模的分布情况,9(b)为书籍上线十年内传阅数量的饱和程度;
图10为本发明的实施例的Twitter数据集实验结果;
图11为本发明的实施例的Douban数据集实验结果;
图12为本发明的实施例的基于特征衰减强化神经网络的信息传播预测装置的示意图;
图13是适于用来实现本申请实施例的电子设备的计算机装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示出了可以应用本申请实施例的基于特征衰减强化神经网络的信息传播预测方法或基于特征衰减强化神经网络的信息传播预测装置的示例性装置架构100。
如图1所示,装置架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如数据处理类应用、文件处理类应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上传的文件或数据进行处理的后台数据处理服务器。后台数据处理服务器可以对获取的文件或数据进行处理,生成处理结果。
需要说明的是,本申请实施例所提供的基于特征衰减强化神经网络的信息传播预测方法可以由服务器105执行,也可以由终端设备101、102、103执行,相应地,基于特征衰减强化神经网络的信息传播预测装置可以设置于服务器105中,也可以设置于终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。在所处理的数据不需要从远程获取的情况下,上述装置架构可以不包括网络,而只需服务器或终端设备。
信息的转发过程可以形成用户转发网络,如图2所示,用户d的直接关联用户是c,但是用户c的直接关联用户是a,所以用户d是否受到影响与用户a存在非直接的间接关系,因此存在传播序列。
现有用户集合V和传播序列集合C={c1,c2,…,ci},其中V是所有在网络环境中的用户的集合,C是所有传播序列的集合。每一个传播序列ci∈C是一系列连续数对
Figure BDA0003200888080000081
Figure BDA0003200888080000082
其中
Figure BDA0003200888080000083
表示传播序列ci的第j次转发,用户
Figure BDA0003200888080000084
参与了转发,并且
Figure BDA0003200888080000087
如图3所示,用户v0发出信息后,用户v1转发,随后用户v2转发,第i个传播序列为
Figure BDA0003200888080000086
如果信息传播来自社交网络,则可以获得用户的社交网络结构G=(V,E)。
图4示出了本申请的实施例提供的一种基于特征衰减强化神经网络的信息传播预测方法,包括以下步骤:
S1,通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对用户初始特征表示进行更新,得到用户特征表示;
S2,将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态,将隐藏态融合时间衰减特征,得到时间衰减隐藏态;
S3,聚合多个被影响的用户特征表示,得到聚合用户特征,结合聚合用户特征和时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据激活概率预测出信息传播路径;
S4,基于传播序列的真实热度规模结合GRU模型与强化学习网络,获得信息传播的预测热度规模。
在具体的实施例中,步骤S1具体包括:
S11,网络表示模型为node2vec,网络数据为用户的关注与被关注的社交网络结构。对每一个用户v都有用户初始特征表示
Figure BDA0003200888080000091
寻找用户v的邻居Y(v),在Y(v)中随机采样N个用户{v1,v2,…,vn};
S12,融合邻居特征表示,采用以下公式对用户初始特征表示
Figure BDA0003200888080000092
进行更新,得到用户特征表示:
Figure BDA0003200888080000093
其中,k=1,2,3,…,n,
Figure BDA0003200888080000094
是用户v的s阶邻居特征表示,
Figure BDA0003200888080000095
是用户v的s+1阶邻居特征表示,vk是用户v的邻居采样节点,W,b是权重矩阵和偏执向量,激活函数为relu(·)=max(·,0)。
Figure BDA0003200888080000096
为邻居阶层影响力系数,邻居阶层越大影响力越小。用户v的特征表示更新过程如图5所示,图中标有1的圆圈代表用户v的一阶邻居节点,标有2的圆圈代表用户v的一阶邻居节点,实线表示邻居采样的过程,虚线表示多阶邻居特征融合的过程。利用递归计算可以融合多阶邻居的特征表示,本申请的实施例融合了三阶邻居的特征,最终用
Figure BDA00032008880800000916
表示最新的用户特征表示,d是用户表特征表示的维度。
以上多阶邻居特征融合算法,在原算法的基础之上增加了阶层影响力系数。用户转发与否,受到邻居节点的影响,但是邻居节点的影响力会随着网络条数的增加而减小,所以多阶邻居特征融合的计算应该区别占比。
在具体的实施例中,步骤S2中将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态具体包括:
将给定的传播序列
Figure BDA0003200888080000098
中的
Figure BDA0003200888080000099
按照时间顺序输入GRU模型并计算隐藏态hj
Figure BDA00032008880800000917
其中,i为第i个传播序列,j为第j次转发,输入值
Figure BDA00032008880800000911
为用户特征表示,输入值
Figure BDA00032008880800000918
是前一隐藏态,输出值
Figure BDA00032008880800000919
H为GRU模型中的隐藏单元;
计算重置门
Figure BDA00032008880800000920
Figure BDA00032008880800000915
其中,σ(·)是sigmoid激活函数,
Figure BDA00032008880800001022
为GRU模型在训练过程中学习的参数,h为隐藏态。
计算更新门
Figure BDA00032008880800001023
Figure BDA0003200888080000105
其中,
Figure BDA00032008880800001024
Figure BDA00032008880800001025
计算新状态
Figure BDA0003200888080000109
Figure BDA00032008880800001010
其中,
Figure BDA00032008880800001026
Figure BDA00032008880800001027
计算隐藏态
Figure BDA00032008880800001028
Figure BDA00032008880800001015
隐藏态
Figure BDA00032008880800001029
编码了传播序列
Figure BDA00032008880800001017
中已参与信息转发的所有用户的历史信息。
在具体的实施例中,步骤S2中将隐藏态融合时间衰减特征,得到时间衰减隐藏态具体包括:
假设传播序列ci的传播时间长度是[0,T],将传播时间长度分割为连续l个时间间隔,即{[t0=0,t1),[t1,t2),…,[tl-1,tl)},
为需要学习时间衰减效应的离散变量λ={λm,m∈(1,2,…,l)},定义了一个函数来计算时间衰减效应的对应时间间隔:
Figure BDA00032008880800001018
其中,t0是原始的发文时间,l是时间间隔数目。
对于给定传播序列ci,假设在时间窗口[0,T]有j个转发用户,则得到隐藏态
Figure BDA00032008880800001019
将各个隐藏状态分别与时间衰减参数λm相乘得到时间衰减隐藏态
Figure BDA00032008880800001020
Figure BDA00032008880800001021
在具体的实施例中,将融合多阶邻居影响力的用户特征表示输入GRU模型,利用GRU模型对序列数据的友好性用以信息转发传播路径的预测。结合时间衰减效应特征融合,GRU模型在第j步的时间衰减隐藏态
Figure BDA0003200888080000111
编码了信息传播路径的历史信息。虽然结合了多阶邻居影响力和时间衰减效应特征融合,但是信息的传播具有时效性。假设网民会受到已转发用户影响进而转发信息,并且网民容易受到最近转发用户的影响,早时间段被转发的用户信息容易被新信息淹没。因此提出用户窗口a,即预测下一被转发用户。
则步骤S3具体包括:
预测下一被转发用户,只聚合a个被影响用户的特征,得到聚合用户特征
Figure BDA0003200888080000112
Figure BDA0003200888080000113
其中,
Figure BDA0003200888080000119
计算下一个转发用户的激活概率:
Figure BDA0003200888080000115
其中,
Figure BDA0003200888080000116
V为用户集合,concat(·)是拼接函数,WP为权重矩阵,bp为偏执向量;
设定GRU模型在预测下一个转发用户的目标函数,模型的训练目标是最大化用户的激活概率:
Figure BDA0003200888080000117
其中,Θ是模型中的所有参数,信息传播路径预测模型图如图6所示。
在具体的实施例中,信息规模预测模型图如图7所示。步骤S4具体包括:
在每个传播序列的末尾加入结束标记用户<end>,将每个传播序列的前b个确定用户输入GRU模型,将预测到的下一个转发用户作为下一步的输入并继续预测,预测到下一个用户为<end>标记时则停止预测,进一步统计信息最终被影响的用户数量。
将MSLE(Mean Square Log-Transformed Error)作为信息传播热度预测的评价标准和目标函数,即
Figure BDA0003200888080000118
其中,|ci|是传播序列ci的真实热度规模,predi是传播序列ci的预测热度规模,C为传播序列集合
Figure BDA0003200888080000121
将GRU模型对应到强化学习过程当中,每个GRU模型的行为action是选择下一时刻转发信息的用户,当前的状态state决定的行为action,当<end>标记被行为action时,信息传播人数预测结束,MSLE的相反数将作为reward反馈;
假设传播序列ci将前b个确定用户输入GRU模型,后续都存在一个行为action序列
Figure BDA0003200888080000122
是传播序列ci的第j个行为action预测的用户,MSLE的相反数表示为reward(seq,ci),训练目标是使得传播序列ci的reward期望最大化:
Figure BDA0003200888080000123
其中,Pr(seq;Θ,
Figure BDA0003200888080000124
)是选择行为action序列seq的概率;
用REINFORCE算法来计算Ji(Θ)的梯度:
Figure BDA0003200888080000125
其中,seqm中的m=1,2,…,M是Pr(seq;Θ,
Figure BDA0003200888080000126
)中随机抽样的M个采样,最后,参数Θ通过最大化reward的期望来更新。
为了评估模型的可行性,提高模型的可比较性,本发明选择的数据是前人工作中使用的数据集,一类数据集是Twitter平台上信息的转发记录,另一类数据集是Douban平台上用户的读书数据。
Twitter数据记录了Twitter平台2010年十月期间的原创信息,以及这些信息的传播过程。其中包括309631条信息的传播路径,以及用户之间的关注亲密关系。传播规模的分布情况如图8(a)所示,符合幂律分布;信息发布24小时内转发的数量的饱和程度如图8(b)所示。由图8(b)可知,信息在发出三小时的信息传播序列数量会达到信息传播总数量的70%。本发明借鉴Deephawkes模型,遵循类似的实验设置,设置数据集的观察时间窗口的长度t=1小时、2小时和3小时,即预测信息在发出后1小时、2小时和3小时内的转发情况。Twitter平台是重要的舆论引导平台,平台信息传播情况在一定程度上代表了舆论信息的走势,Twitter数据集能够拟合引导帖文传播场景。利用Twitter数据集作为本发明方法的实验数据集,验证了本发明可用于舆论引导帖文的传播预测。
Douban数据集记录了豆瓣书籍阅读情况,每一本书都可被认为是一条信息的传播。数据集中记录了豆瓣用户之间的关注关系,包含了348280本数的阅读记录。传播规模的分布情况如图9(a)所示,断层幂律分布;书籍上线十年内传阅数量的饱和程度如图9(b)所示。由图9(b)可知,书籍在上线三年的传播数量会达到传播总数量的73%。本发明设置数据集的观察时间窗口的长度t=1年、2年和3年,即预测书籍信息上线后1年、2年和3年内的阅读情况。
通过以下评价标准评价模型:
(1)信息转发预测评价标准。转发预测就是为了预测下一个可能转发的的用户,由于有大量潜在的目标用户,因此精确的预测下一个用户通常是不现实的,但是可以预测一个用户候选集,所以预测下一个可能转发信息的用户可以被视为一个检索问题,将所有还未参与转发的用户进行转发可能性排序,采用排名指标作为评价标准。参照现有的信息转发预测研究,选择HITS@k和MAP@k作为评价指标,这两个指标越大越好。
HITS@k:前k个排名包含正确用户的比例(HITS@k)。其中,k∈{10,50,100}。
MAP@k:平均检索精度。其中,k∈{10,50,100}。
(2)信息热度预测评价标准。根据前人的研究,本申请的实施例中选择了标准的评估度量MSLE,值得注意的是MSLE越小,预测性能越好。
为了进行模型信息转发预测效果的对比,本发明选择了四种具有代表性的方法,作为对比方法,具体如下:
(1)Topo-LSTM模型。将信息传播形成的网络结构变成循环神经网络中隐藏中间状态的传播结构。
(2)DeepDiffuse模型。利用循环神经网络和注意力机制预测下一个被影响用户和被影响的时间,模型只用到用户的传播序列和被影响的时间。
(3)NDM模型。基于卷积神经网络和注意力机制来预测下一被影响用户。
(4)FOREST模型。利用带门循环单元和结构上下文用户特征提取的方法进行预测。
超参数设置为:用户的特征表示维度d=64,GRU网络的隐藏状态维度H=64,用户窗口a=4,一阶邻居采样数为30,二阶邻居采样数为20,三阶邻居采样数为10,训练的batch_size=8,dropout=0.4。两个数据集分别都用70%的数据作为训练集,15%作为测试集,15%作为验证集。
使用相同的数据集,但是考虑到时间特性对数据集的影响,所以将Twitter数据集划分为1小时、2小时和3小时,将Douban数据集划分为1年、2年和3年,根据时间的不同,表1-3记录了本发明的模型与对比模型的实验结果,其中将每个指标下性能最好的模型用粗体展示,次好的模型用下划线展示,评价指标值越大性能越好。结果表明无论是在Twitter数据集上还是在Douban数据集上本发明所有的评价指标均优于现有的最优方法,其中Twitter数据集Hits@10(%)指标上提高了2%以上。
表1 Twitter 1小时与Douban 1年的模型对比结果
Figure BDA0003200888080000141
表2 Twitter 2小时与Douban 2年的模型对比结果
Figure BDA0003200888080000142
表3 Twitter 3小时与Douban 3年的模型对比结果
Figure BDA0003200888080000143
Figure BDA0003200888080000151
从表1-3中,可得出以下分析结果:
(1)与DeepDiffuse模型相比。DeepDiffuse模型的贡献在于能够预测下一个被影响用户以及预测被影响的时间,但是因为DeepDiffuse模型仅利用了信息传播序列和时间点,没有考虑用户的网络结构信息,用户在输入LSTM模型之前用的是最简单的one-hot表示方法。因此,本发明的模型将会明显性能优于DeepDiffuse模型。
(2)与Topo-LSTM模型对比。Topo-LSTM模型根据用户的信息传播路径更改LSTM的隐藏状态的输出路劲,模拟了信息传播过程。但是Topo-LSTM没有考虑用户的多阶邻居对用户的影响,同时也没有考虑最近受影响用户的影响力更大。
(3)与NDM模型对比。NDM模型采用卷积神经网络和注意力机制进行预测,通过注意力机制区别了最近受影响用户和早期受影响用户的影响力,但是卷积神经网络没能体现数据的序列性,没能体现信息的传递过程,同时NDM模型也没有考虑信息传播的时间特征对性能的影响。
(4)与FOREST模型对比。本发明的模型主要是基于FOREST模型的改进,在该模型的基础之上考虑了多阶邻居的影响力差异问题和信息影响力的时间衰减特性,由对比结果可知,融合多阶邻居影响力衰减和时间衰减效应,对模型的性能有明显的提升。
对比图10和图11可知,采用本发明的模型进行实验,Twitter数据集的性能随着输入模型数据的时间增加而减小,然而Douban数据集的性能却随着输入模型数据时间的增加而增加。根据模型的一致性,从数据集寻找产生这样差异的原因,最后发现:Twitter数据的前三个小时的数据的增长速率是递减的,如图8所示。Douban数据前三年的数据增长速率是下降的,如图9所示。数据的增长速率越低,数据的离散性越高,数据之间的关联性减小。信息的传播过程是受最近被影响用户的影响,所以数据之间的关联性越小,模型的预测效果越差。
为了对比模型信息热度预测效果,同样选择了四种具有代表性的方法,进行模型对比,具体如下。
(1)Node2Vec模型。一种网络表示方法,可以抽取用户的网络结构信息表示为稠密低维向量,本节作为对比实验用于预测信息热度,将通过Node2Vec模型表示出的用户特征输入多层感知机(MLP)用以预测信息传播规模。
(2)DeepCas模型。首个提出用于信息传播预测的深度学习体系结构,它将传播图表示为一组随机游走路径,并通过双向带门循环单元神经网络结合注意机制来预测传播规模的大小。它主要利用结构和节点标识的信息进行预测。
(3)DeepHawkes模型。将Hawkes过程的可解释因素集成到深度学习中,用于信息规模预测。该模型结合深度学习技术与传播动力学,弥补了基于深度学习技术的信息传播预测的可理解性。该方法既属于生成方法,也属于基于深度学习的方法。
(4)FOREST模型。结合GRU模型和强化学习,将误差信息作为强化学习的反馈,解决信息热度预测问题。
表4给出在本发明的模型与对比模型在Twitter数据集和Douban数据集上的信息热度预测评价性能对比。将每个指标下性能最好的模型用粗体展示,次好的模型用下划线展示。比对结果表示,本发明的模型在两个数据集的信息热度预测表现良好,对比最先进的基于深度学习热度预测的模型,评价指标值越小性能越好,评价指标MSLE值下降。
表4本发明的模型与对比模型在信息热度预测评价结果
Figure BDA0003200888080000161
根据表4可得出以下分析结果:
(1)Node2Vec模型的效果最差,证明了仅将节点嵌入作为图表示是不够的,与将用户特征表示为一组低维向量再输入预测模型的效果不可比拟。
(2)DeepCas模型是首个提出用于信息传播预测的深度学习模型,比基于特征表示的方法和传统的基于生成过程的方法表现出更好的性能。但由于不考虑时间信息和用户的多阶邻居影响力,它的性能仍然比其他基于深度学习的方法差得多。
(3)DeepHawkes模型虽然结合深度学习技术与传播动力学,弥补了基于深度学习技术的信息传播预测的可理解性,但是该模型的的用户输入特征表示是一个自学习的过程,不能很好的获取用户的结构信息。
(4)本发明的模型是在FOREST模型基础之上融合了多阶邻居影响力衰减和时间衰减效应,比FOREST在信息的热度预测方面的性能提升稳定,但是性能提升效果不明显。
进一步参考图12,作为对上述各图所示方法的实现,本申请提供了一种基于特征衰减强化神经网络的信息传播预测装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
本申请实施例提供了一种基于特征衰减强化神经网络的信息传播预测装置,包括:
用户特征表示模块1,被配置为通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对用户初始特征表示进行更新,得到用户特征表示;
隐藏态计算模块2,被配置为将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态,将隐藏态融合时间衰减特征,得到时间衰减隐藏态;
信息传播路径预测模块3,被配置为聚合多个被影响的用户特征表示,得到聚合用户特征,结合聚合用户特征和时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据激活概率预测出信息传播路径;
热度规模预测模块4,被配置为基于传播序列的真实热度规模结合GRU模型与强化学习网络,获得信息传播的预测热度规模。
下面参考图13,其示出了适于用来实现本申请实施例的电子设备(例如图1所示的服务器或终端设备)的计算机装置1300的结构示意图。图13示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图13所示,计算机装置1300包括中央处理单元(CPU)1301和图形处理器(GPU)1302,其可以根据存储在只读存储器(ROM)1303中的程序或者从存储部分1309加载到随机访问存储器(RAM)1304中的程序而执行各种适当的动作和处理。在RAM 1304中,还存储有装置1300操作所需的各种程序和数据。CPU 1301、GPU1302、ROM 1303以及RAM 1304通过总线1305彼此相连。输入/输出(I/O)接口1306也连接至总线1305。
以下部件连接至I/O接口1306:包括键盘、鼠标等的输入部分1307;包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分1308;包括硬盘等的存储部分1309;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1310。通信部分1310经由诸如因特网的网络执行通信处理。驱动器1311也可以根据需要连接至I/O接口1306。可拆卸介质1312,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1311上,以便于从其上读出的计算机程序根据需要被安装入存储部分1309。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1310从网络上被下载和安装,和/或从可拆卸介质1312被安装。在该计算机程序被中央处理单元(CPU)1301和图形处理器(GPU)1302执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对用户初始特征表示进行更新,得到用户特征表示;将传播序列所对应的用户特征表示输入GRU模型,得到隐藏态,将隐藏态融合时间衰减特征,得到时间衰减隐藏态;聚合多个被影响的用户特征表示,得到聚合用户特征,结合聚合用户特征和时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据激活概率预测出信息传播路径;基于传播序列的真实热度规模结合GRU模型与强化学习网络,获得信息传播的预测热度规模。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (9)

1.一种基于特征衰减强化神经网络的信息传播预测方法,其特征在于,包括以下步骤:
S1,通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对所述用户初始特征表示进行更新,得到用户特征表示;
S2,将传播序列所对应的所述用户特征表示输入GRU模型,得到隐藏态,将所述隐藏态融合时间衰减特征,得到时间衰减隐藏态;
S3,聚合多个被影响的所述用户特征表示,得到聚合用户特征,结合所述聚合用户特征和所述时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据所述激活概率预测出信息传播路径;
S4,基于所述传播序列的真实热度规模结合所述GRU模型与强化学习网络,获得信息传播的预测热度规模,所述步骤S4具体包括:
在每个传播序列的末尾加入结束标记用户<end>,将每个传播序列的前b个确定用户输入模型,将预测到的下一个转发用户作为下一步的输入并继续预测,预测到下一个用户为<end>标记时则停止预测,进一步统计信息最终被影响的用户数量;
将MSLE作为信息传播热度预测的评价标准和目标函数,即
Figure FDA0004110265590000011
其中,|ci|是传播序列ci的真实热度规模,predi是传播序列ci的预测热度规模,C为传播序列集合C={c1,c2,…,ci};
每个GRU模型的行为action是选择下一时刻转发信息的用户,当前的状态state决定的行为action,当<end>标记被行为action时,信息传播人数预测结束,MSLE的相反数将作为reward反馈;
假设传播序列ci将前b个确定用户输入GRU模型,后续都存在一个行为action序列
Figure FDA0004110265590000012
Figure FDA0004110265590000013
是传播序列ci的第j个行为action预测的用户,MSLE的相反数表示为reward(seq,ci),然后训练目标是使得传播序列ci的reward期望最大化:
Figure FDA0004110265590000014
其中,
Figure FDA0004110265590000015
是选择行为action序列seq的概率;
用REINFORCE算法来计算Ji(Θ)的梯度:
Figure FDA0004110265590000021
其中,seqm中的m=1,2,…,M是
Figure FDA0004110265590000022
中随机抽样的M个采样,最后,参数Θ通过最大化reward的期望来更新。
2.根据权利要求1所述的基于特征衰减强化神经网络的信息传播预测方法,其特征在于,所述网络表示模型为node2vec,所述网络数据为用户的关注与被关注的社交网络结构。
3.根据权利要求1所述的基于特征衰减强化神经网络的信息传播预测方法,其特征在于,所述步骤S1具体包括:
S11,对每一个用户v都有用户初始特征表示
Figure FDA0004110265590000023
寻找用户v的邻居Y(v),在Y(v)中随机采样N个用户{v1,v2,…,vn};
S12,融合邻居特征表示,采用以下公式对所述用户初始特征表示
Figure FDA0004110265590000024
进行更新,得到用户特征表示:
Figure FDA0004110265590000025
其中,k=1,2,3,…,n,
Figure FDA0004110265590000026
是用户v的s阶邻居特征表示,
Figure FDA0004110265590000027
是用户v的s+1阶邻居特征表示,vk是用户v的邻居采样节点,W,b是权重矩阵和偏执向量,激活函数为relu(·)=max(·,0),所述用户特征表示融合三阶邻居的特征,采用
Figure FDA0004110265590000028
表示用户特征表示,d是用户特征表示的维度。
4.根据权利要求3所述的基于特征衰减强化神经网络的信息传播预测方法,其特征在于,所述步骤S2中将传播序列所对应的所述用户特征表示输入GRU模型,得到隐藏态具体包括:
将给定的传播序列
Figure FDA0004110265590000029
中的
Figure FDA00041102655900000210
按照时间顺序输入GRU模型并计算隐藏态hj
Figure FDA0004110265590000031
其中,i为第i个传播序列,j为第j次转发,输入值
Figure FDA0004110265590000032
为所述用户特征表示,输入值
Figure FDA0004110265590000033
是前一隐藏态,输出值
Figure FDA0004110265590000034
H为GRU模型中的隐藏单元;
计算重置门
Figure FDA0004110265590000035
Figure FDA0004110265590000036
其中,σ(·)是sigmoid激活函数,
Figure FDA0004110265590000037
为GRU模型在训练过程中学习的参数,h为隐藏态;
计算更新门
Figure FDA0004110265590000038
Figure FDA0004110265590000039
其中,
Figure FDA00041102655900000310
Figure FDA00041102655900000311
计算新状态
Figure FDA00041102655900000312
Figure FDA00041102655900000313
其中,
Figure FDA00041102655900000314
Figure FDA00041102655900000315
计算隐藏态
Figure FDA00041102655900000316
Figure FDA00041102655900000317
针对传播序列
Figure FDA00041102655900000318
隐藏态
Figure FDA00041102655900000319
编码了已参与信息转发的所有用户的历史信息。
5.根据权利要求4所述的基于特征衰减强化神经网络的信息传播预测方法,其特征在于,所述步骤S2中将所述隐藏态融合时间衰减特征,得到时间衰减隐藏态具体包括:
假设传播序列ci的传播时间长度是[0,T],将所述传播时间长度分割为连续l个时间间隔,即{[t0=0,t1),[t1,t2),…,[tl-1,tl)},
为需要学习时间衰减效应的离散变量λ={λm,m∈(1,2,…,l)},定义了一个函数来计算时间衰减效应的对应时间间隔:
Figure FDA0004110265590000041
其中,t0是原始的发文时间,l是时间间隔数目;
对于给定传播序列ci,假设在时间窗口[0,T]有j个转发用户,则得到隐藏态
Figure FDA0004110265590000042
将各个隐藏状态分别与时间衰减参数λm相乘得到时间衰减隐藏态
Figure FDA0004110265590000043
Figure FDA0004110265590000044
6.根据权利要求5所述的基于特征衰减强化神经网络的信息传播预测方法,其特征在于,所述步骤S3具体包括:
聚合a个被影响的所述用户特征表示,得到聚合用户特征
Figure FDA0004110265590000045
Figure FDA0004110265590000046
其中,
Figure FDA0004110265590000047
计算下一个转发用户的激活概率:
Figure FDA0004110265590000048
其中,
Figure FDA0004110265590000049
V为用户集合,concat(·)是拼接函数,WP为权重矩阵,bp为偏执向量;
设定GRU模型在预测下一个转发用户的目标函数,模型的训练目标是最大化用户的激活概率:
Figure FDA00041102655900000410
其中,Θ是模型中的所有参数。
7.一种基于特征衰减强化神经网络的信息传播预测装置,其特征在于,包括:
用户特征表示模块,被配置为通过网络表示模型对网络数据的用户构建用户初始特征表示,并结合多阶邻居影响力衰减机制对所述用户初始特征表示进行更新,得到用户特征表示;
隐藏态计算模块,被配置为将传播序列所对应的所述用户特征表示输入GRU模型,得到隐藏态,将所述隐藏态融合时间衰减特征,得到时间衰减隐藏态;
信息传播路径预测模块,被配置为聚合多个被影响的所述用户特征表示,得到聚合用户特征,结合所述聚合用户特征和所述时间衰减隐藏态,计算得到下一个转发用户的激活概率,根据所述激活概率预测出信息传播路径;
热度规模预测模块,被配置为基于所述传播序列的真实热度规模结合所述GRU模型与强化学习网络,获得信息传播的预测热度规模,所述热度规模预测模块具体包括:
在每个传播序列的末尾加入结束标记用户<end>,将每个传播序列的前b个确定用户输入模型,将预测到的下一个转发用户作为下一步的输入并继续预测,预测到下一个用户为<end>标记时则停止预测,进一步统计信息最终被影响的用户数量;
将MSLE作为信息传播热度预测的评价标准和目标函数,即
Figure FDA0004110265590000051
其中,|ci|是传播序列ci的真实热度规模,predi是传播序列ci的预测热度规模,C为传播序列集合C={c1,c2,…,ci};
每个GRU模型的行为action是选择下一时刻转发信息的用户,当前的状态state决定的行为action,当<end>标记被行为action时,信息传播人数预测结束,MSLE的相反数将作为reward反馈;
假设传播序列ci将前b个确定用户输入GRU模型,后续都存在一个行为action序列
Figure FDA0004110265590000052
Figure FDA0004110265590000053
是传播序列ci的第j个行为action预测的用户,MSLE的相反数表示为reward(seq,ci),然后训练目标是使得传播序列ci的reward期望最大化:
Figure FDA0004110265590000054
其中,
Figure FDA0004110265590000055
是选择行为action序列seq的概率;
用REINFORCE算法来计算Ji(Θ)的梯度:
Figure FDA0004110265590000056
Figure FDA0004110265590000061
其中,seqm中的m=1,2,…,M是
Figure FDA0004110265590000062
中随机抽样的M个采样,最后,参数Θ通过最大化reward的期望来更新。
8.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN202110904109.8A 2021-08-06 2021-08-06 基于特征衰减强化神经网络的信息传播预测方法及装置 Active CN113610299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110904109.8A CN113610299B (zh) 2021-08-06 2021-08-06 基于特征衰减强化神经网络的信息传播预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110904109.8A CN113610299B (zh) 2021-08-06 2021-08-06 基于特征衰减强化神经网络的信息传播预测方法及装置

Publications (2)

Publication Number Publication Date
CN113610299A CN113610299A (zh) 2021-11-05
CN113610299B true CN113610299B (zh) 2023-05-26

Family

ID=78307512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110904109.8A Active CN113610299B (zh) 2021-08-06 2021-08-06 基于特征衰减强化神经网络的信息传播预测方法及装置

Country Status (1)

Country Link
CN (1) CN113610299B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114519606A (zh) * 2022-01-29 2022-05-20 北京京东尚科信息技术有限公司 信息传播效果的预测方法及装置
CN115080870B (zh) * 2022-07-12 2023-04-07 黑龙江大学 基于Skip-gram的信息传播预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126674A (zh) * 2019-12-04 2020-05-08 浙江工业大学 基于深度模型的传播预测方法及其系统
CN111310975A (zh) * 2020-01-19 2020-06-19 浙江工业大学 一种基于深度模型的多任务消息传播预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361926B2 (en) * 2017-03-03 2019-07-23 Nec Corporation Link prediction with spatial and temporal consistency in dynamic networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126674A (zh) * 2019-12-04 2020-05-08 浙江工业大学 基于深度模型的传播预测方法及其系统
CN111310975A (zh) * 2020-01-19 2020-06-19 浙江工业大学 一种基于深度模型的多任务消息传播预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于分层注意力的信息级联预测模型;张志扬;张凤荔;陈学勤;王瑞锦;;计算机科学(06);全文 *

Also Published As

Publication number Publication date
CN113610299A (zh) 2021-11-05

Similar Documents

Publication Publication Date Title
Banik et al. Uncertain wind power forecasting using LSTM‐based prediction interval
Zhang et al. Deep learning for day‐ahead electricity price forecasting
CN116569189A (zh) 被配置为在机器学习模型中实现动态离群值偏倚减少的基于计算机的系统、计算组件和计算对象
Cerqueira et al. Arbitrage of forecasting experts
US11586919B2 (en) Task-oriented machine learning and a configurable tool thereof on a computing environment
CN113610299B (zh) 基于特征衰减强化神经网络的信息传播预测方法及装置
CN106502799A (zh) 一种基于长短时记忆网络的主机负载预测方法
Sadat Hosseini et al. Short-term load forecasting of power systems by gene expression programming
Branchi et al. Learning to act: a reinforcement learning approach to recommend the best next activities
Darvishan et al. Unit commitment-based load uncertainties based on improved particle swarm optimisation
Song et al. Ada-boundary: accelerating DNN training via adaptive boundary batch selection
Mohammed et al. Improving forecasts of the EGARCH model using artificial neural network and fuzzy inference system
CN116595356A (zh) 时序信号预测方法、装置、电子设备及存储介质
Yan Software ageing prediction using neural network with ridge
Acharya et al. An improved gradient boosting tree algorithm for financial risk management
Ma et al. A novel kernel extreme learning machine algorithm based on self-adaptive artificial bee colony optimisation strategy
Ashofteh et al. Application of bi-objective genetic programming for optimizing irrigation rules using two reservoir performance criteria
CN117573961A (zh) 信息推荐方法、装置、电子设备、存储介质及程序产品
Wang et al. Improving the Method of Short-term Forecasting of Electric Load in Distribution Networks using Wavelet transform combined with Ridgelet Neural Network Optimized by Self-adapted Kho-Kho Optimization Algorithm
Gong et al. Optimization of Local Prediction Algorithm of Financial Time Series Based on Fuzzy Neural Network
Duan et al. A fast algorithm for short term electric load forecasting by a hidden semi-markov process
Munikoti et al. GraMeR: Graph meta reinforcement learning for multi-objective influence maximization
Tec et al. A Comparative Tutorial of Bayesian Sequential Design and Reinforcement Learning
Zhang et al. Hydrological time series prediction based on IWOA-ALSTM
Shi et al. Practical POMDP-based test mechanism for quality assurance in volunteer crowdsourcing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant