CN115759482A - 一种社交媒体内容传播预测方法和装置 - Google Patents

一种社交媒体内容传播预测方法和装置 Download PDF

Info

Publication number
CN115759482A
CN115759482A CN202211708983.5A CN202211708983A CN115759482A CN 115759482 A CN115759482 A CN 115759482A CN 202211708983 A CN202211708983 A CN 202211708983A CN 115759482 A CN115759482 A CN 115759482A
Authority
CN
China
Prior art keywords
social media
media content
processing result
propagation
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211708983.5A
Other languages
English (en)
Inventor
仝春艳
轩占伟
杨松
张铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konami Sports Club Co Ltd
Original Assignee
People Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by People Co Ltd filed Critical People Co Ltd
Priority to CN202211708983.5A priority Critical patent/CN115759482A/zh
Publication of CN115759482A publication Critical patent/CN115759482A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种社交媒体内容传播预测方法和装置,该方法包括:获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图;通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果;根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。本发明聚合了社交媒体内容传播过程中的拓扑信息,对历史内容发布、转发时间、转发用户层面和时间层面的不确定性进行建模,提升了预测效果。

Description

一种社交媒体内容传播预测方法和装置
技术领域
本发明涉及数据分析技术领域,具体涉及一种社交媒体内容传播预测方法和装置。
背景技术
网站内容在传播之前,需要进行预先检测,对用户发布的不良言论等内容需要早期进行管控,实现舆情治理,现有的网站内容传播预测方法包括基于特征设计、基于生成过程、基于扩散过程、基于深度学习的四类方法;这些方法在进行内容传播预测时,选择的观测时间窗是内容发布一段时间后,观测时间窗为1—5小时;而在实际应用中,有时需要在新闻或事件发生的很短时间内进行传播规模预测,实现早期预警。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种社交媒体内容传播预测方法和装置。
根据本发明的一个方面,提供了一种社交媒体内容传播预测方法,包括:
获取历史社交媒体内容以及所述历史社交媒体内容对应的历史转发关系数据,依据所述历史社交媒体内容以及所述历史转发关系数据构建得到内容传播过程对应的级联结构图;
通过基于注意力机制的Transformer网络为所述级联结构图中的节点设置时间特征,得到第一处理结果;
利用变分编码器对所述级联结构图在节点维度和时间维度进行处理,得到第二处理结果;
根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果,预测所述待预测社交媒体内容在指定预测时段内的传播数据。
根据本发明的另一方面,提供了一种社交媒体内容传播预测装置,包括:
级联结构图构建模块,用于获取历史社交媒体内容以及所述历史社交媒体内容对应的历史转发关系数据,依据所述历史社交媒体内容以及所述历史转发关系数据构建得到内容传播过程对应的级联结构图;
数据处理模块,用于通过基于注意力机制的Transformer网络为所述级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对所述级联结构图在节点维度和时间维度进行处理,得到第二处理结果;
预测模块,用于根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果,预测所述待预测社交媒体内容在指定预测时段内的传播数据。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述一种社交媒体内容传播预测方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述一种社交媒体内容传播预测方法对应的操作。
根据本发明的一种社交媒体内容传播预测方法和装置,通过获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图;通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果;根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。本发明通过捕捉历史内容传播过程中的动态性,聚合了传播过程中的拓扑信息,对历史内容发布、转发时间、转发用户层面和时间层面的不确定性进行建模,考虑了内容传播过程中文本特征的变化,显著提升了预测效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种社交媒体内容传播预测方法流程图;
图2a示出了本发明实施例提供的一种社交媒体内容传播预测方法的模型结构示意图;
图2b示出了本发明实施例提供的GraphSAGE模型示意图;
图3示出了本发明实施例提供的一种社交媒体内容传播预测装置的结构示意图;
图4示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明一种社交媒体内容传播预测方法实施例的流程图,如图1所示,该方法包括以下步骤:
步骤S101:获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图。
图2a示出了本发明实施例提供的一种社交媒体内容传播预测方法的模型结构示意图,如图2a所示,本实施例提供了依据上下文依赖的动态变分自编码(CD-VAE)模型,主要包含5个部分:
1)结构嵌入:CD-VAE主要对社交媒体内容(例如微博博文)传播过程中的结构模式和用户在社交网络中的潜在关系进行捕捉;具体地,利用图深度学习技术来对网络结构进行学习,采用一种归纳式的图神经网络方法(GraphSAGE)来进行节点嵌入从而形成级联结构图。
2)文本特征嵌入:CD-VAE利用自然语言处理方法将文本表示为节点属性,采用GraphSAGE进行嵌入带属性的无向无环图得到文本表示。
3)时间特征嵌入:CD-VAE采用基于注意力机制的Transformer网络来对传播过程中的时间特征信息进行嵌入。
4)不确定性嵌入:CD-VAE采用了变分自编码器(Variational Auto-Encoder,VAE)来对内容传播过程中节点层面和时间层面的不确定性进行建模。
5)预测:CD-VAE结合了Transformer、变分推断、文本嵌入来得到最终表示,并输入多层感知机(MLP)进行分类和回归预测任务。
在一种可选的方式中,步骤S101进一步包括:对历史转发关系数据进行分析,确定参与内容传播过程的各个用户以及各个用户之间的转发关系;对历史社交媒体内容进行分析,确定各个用户的传播文本内容;依据各个用户以及各个用户之间的转发关系,构建级联结构图,并根据各个用户的传播文本内容为级联结构图中的每个节点设置文本特征。
在一种可选的方式中,步骤S101进一步包括:将各个用户作为各个节点,依据各个用户之间的转发关系确定各个节点之间的边,得到级联结构图。
在一种可选的方式中,步骤S101进一步包括:针对每个节点,将该节点对应的用户的传播文本内容进行向量表示后作为该节点的文本特征。
社交媒体内容传播的网络结构一般为级联结构,以一条转发微博“\\@A:XXX\\@B:YYY\\@C:ZZZ.....”为例,其中,A、B、C分别代表不同的用户,XXX、YYY、ZZZ为用户转发时所评论的文本,而级联结构则表示用户C所转发内容被用户B转发后,又由用户A转发;抽取单条微博博文中所有此类转发关系构建级联结构图,依据各个用户以及各个用户之间的转发关系,构建级联结构图,在本实施例中,通过归纳式的图神经网络方法即GraphSAGE来学习级联结构信息,GraphSAGE核心包括邻居采样和特征聚合,其思想是不断聚合每个用户的邻居信息,即级联结构图中与对应节点直接相连的节点信息,然后进行迭代,随着迭代次数增加,能学习到全局图信息。
图2b示出了本发明实施例提供的GraphSAGE模型示意图,如图2b所示,在本实施例中,GraphSAGE将直推式学习转化为归纳式学习,避免了训练时每次都需要重新训练节点特征的情况;此外,GraphSAGE通过邻居采样实现了直推式节点只能对一种局部结构进行表示转化到对应多种局部结构的节点归纳表示,充分提高模型的泛化、迁移能力,减少过拟合。
GraphSAGE进行特征聚合方式主要包括两种:平均聚合和池化聚合,分别如公式(1)、(2)所示:
Figure BDA0004026757820000051
Figure BDA0004026757820000052
其中ξ(v)为节点v的邻居集合,
Figure BDA0004026757820000053
Figure BDA0004026757820000054
分别为节点v和u的k-1层表示,W为权重矩阵,σ为激活函数,MEAN、max分别为求均值和求最大值函数。采用GraphSAGE进行结构嵌入时,当没有用户属性时,则
Figure BDA0004026757820000055
采用随机初始化。
通过GraphSAGE归纳式记忆局部模式结构信息,一方面通过节点嵌入捕获到了用户在传播过程中的行为,另一方面通过局部图学习能够捕捉到用户之间潜在的社交特性。GraphSAGE通过多次迭代后能够实现局部图学习近似为全局图学习,能够捕获全局结构。通过结构嵌入,能够捕捉到内容传播过程中的一些特性,1)用户影响力:在传播过程中具有更多邻居节点的用户往往是具有更大影响力的用户;2)用户社交特性:具有好友关系的用户之间传播内容的可能性更大。
构建级联结构图之后,需要根据各个用户的传播文本内容为级联结构图中的每个节点设置文本特征,文本特征嵌入具体方法如下:内容在转发过程中,用户进行转发时往往会附加评论,生成新的文本,生成文本也是内容传播的影响因子,即用户评论滋生的文本可能会滋生传播的新方向。
对于内容Ci,其在T时刻所形成的级联结构图为Gi(T),将其记作G(V,ε),对于任意节点v∈V,其文本记作tx(v)。句子嵌入是将{tx(v),v∈V}嵌入成一个向量,作为G(V,ε)的节点属性。首先使用word2vec将tx(v)中每个词
Figure BDA0004026757820000061
嵌入到低维向量表示
Figure BDA0004026757820000062
其中L表示词数量,WE(·)表示自然语言处理方法中文本转向量(word2vec)嵌入过程,如公式(3)所示。
Figure BDA0004026757820000063
再利用双向卷积神经网络(Bidirectional Gate Recurrent Unit,Bi-GRU)捕捉词序列之间的依赖关系,将序列
Figure BDA0004026757820000064
表示成另一个序列
Figure BDA0004026757820000065
具体如公式(4)所示,BG(·)表示Bi-GRU嵌入过程:
Figure BDA0004026757820000066
经过Bi-GRU得到一个序列,利用公式(5)进行平均池化得到一个向量xv
Figure BDA0004026757820000067
其中,mean(.)表示取平均值。然后便将每个节点的文本特征嵌入成了隐藏向量表示,后续便利用GraphSAGE对节点带属性的无向无环图进行嵌入得到最终的文本表示H,如公式(6),GS(·)表示GraphSAGE嵌入过程:
H=GS(G(V,ε),{xv,v∈V}); (6)
步骤S102:通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果。
在一种可选的方式中,步骤S102进一步包括:根据级联结构图,确定在观测时间窗内的时间序列,时间序列中包含有多个节点;通过基于注意力机制的Transformer网络对时间序列进行位置编码,对位置编码结果进行注意力机制求解和特征组合处理,得到多个节点的时间特征。
CD-VAE采用一种不依赖于顺序结构以及历史状态的序列处理方法,即基于注意力机制的Transformer网络来进行时间特征嵌入;具体地,对于内容Ci,在t时刻其形成的级联结构图为Gi(t),经过上述步骤进行结构嵌入后表示为Zi(t);则在观测时间窗T内形成的时间序列为Zi={Zi(t),t=1,2,…,T},随后将时间序列Zi输入Transformer网络,Transformer网络主要过程包括位置编码、多头注意力机制;具体地,Transformer虽然摒弃了这种时间依赖的思想,但是也需要区分输入时间序列的顺序,其是通过位置编码来实现的,位置编码过程如公式(7)和(8)所示:
Figure BDA0004026757820000071
Figure BDA0004026757820000072
其中PE表示位置编码,pos表示位置,而i表示特征维度;由于三角函数的性质,可将任意位置都可以进行编码表示,解决了序列长度问题,即可以针对任意长度序列进行处理。
而后是将位置编码后的输入求注意力机制,注意力求解如公式(9)所示:
Figure BDA0004026757820000073
其中Q、K、V分别表示输入的矩阵,dk表示向量维度,Att(·)表示自注意力机制,sm(·)表示归一化指数函数softmax计算过程,则多头注意力计算如公式(10)、(11):
Hmulti=Concat(head1,…,headM); (10)
Figure BDA0004026757820000074
经过M头注意力后输出为Hmulti,head()表示取特征数据字符串的头部,Concat()表示字符串拼接,Att(·)表示自注意力机制,Q、K、V分别表示输入的矩阵,则经过transformer后的输出为式(12):
Figure BDA0004026757820000075
TS(·)表示Transformer计算过程,第一处理结果
Figure BDA0004026757820000076
聚合了结构信息和时间信息,且能够处理长序列、非长期依赖序列问题。为了要提高模型准确率,可以采用更多层数的Transformer网络,更好地捕捉社交媒体内容传播内容的时间特征。
步骤S103:利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果。
在一种可选的方式中,步骤S103进一步包括:将级联结构图对应的节点序列输入至第一变分编码器得到节点维度的第一隐藏向量,利用第一隐藏向量进入输入重构得到第一重构结果;根据节点序列和第一重构结果之间的重构损失确定第一隐藏向量的目标值;将第一隐藏向量的目标值输入至第二变分编码器得到时间维度的第二隐藏向量,利用第二隐藏向量进行输入重构得到第二重构结果;根据第一隐藏向量的目标值和第二重构结果之间的重构损失确定第二隐藏向量的目标值;依据级联结构图、第一隐藏向量的目标值和第二隐藏向量的目标值,得到第二处理结果。
其中,第一隐藏向量用于表示在节点维度下的各个节点所具有的分布;第二隐藏向量用于表示在时间维度下的序列依赖特性所具有的分布。
本步骤用于利用变分编码器对级联结构图在节点维度和时间维度的不确定性进行嵌入,具体地,不确定性嵌入包括两个方面:1)用户(即节点维度)不确定性嵌入;2)时间维度不确定性嵌入。例如,微博传播内容早期预测中,可观测到的用户和转发行为都相对较少,直接从早期观测结果中学习得到的行为模式泛用性不强,从中总结用户转发规律和时间分布规律可能会导致预测结果失真,稳定性不高,因此我们需要对早期预测中的不确定性进行建模。
具体方法如下:
1)节点维度不确定性嵌入:对于内容Ci,其中的用户随着时间会进行增长,而用户增长则是依赖于转发结构,其用户层面不确定性来源于转发结构是否存在,故采用GraphSAGE嵌入结果zj作为第一变分编码器的输入,其中j=1,…,N表示节点,即内容传播中观测到的每一个用户。定义第一变分编码器中的编码器和解码器分别为Enc(·)和Dec(·),则自编码器可表示如公式(13)、(14):
Figure BDA0004026757820000081
Figure BDA0004026757820000082
其中
Figure BDA0004026757820000083
表示zj输入的重构,xj表示第一隐藏向量,NN(·)表示线性神经网络,相当于多层感知机。经过第一变分编码器将输入表示成一个均值为μ,方差为logσ2的第一隐藏向量xj。然后可以通过该第一隐藏向量来重构原始输入zj得到第一重构结果
Figure BDA0004026757820000084
为了要表示内容传播过程中节点层面的不确定性,第一变分编码器的编码器对μ和logσ2进行采样来实现对服从高斯分布的隐藏向量进行采样,如公式(15)。
xj=μj+εσj,ε~N(0,1); (15)
对于内容传播过程中的每个用户,其对于原始输入zj的边缘对数似然表示为公式(16):
log2pθ(zj)=log2∫pθ(zj|xj)p(xj)dxj; (16)
在高维度时难以对zj的边缘对数似然进行计算,可通过观察一个参数化的先验
Figure BDA0004026757820000091
来最大化证据下界(MaximizingtheEvidenceLowerBound,ELBO),从而实现近似的后验概率pθ(xj|zj)的计算,如公式(17)。
Figure BDA0004026757820000092
其中
Figure BDA0004026757820000093
是一个参数为
Figure BDA0004026757820000094
的编码器,其是后验概率pθ(xj|zj)的近似表达,用于生成第一隐藏向量xj,DKL(·)表示KL散度(Kullback-Leibler divergence),具体定义如公式(18):
Figure BDA0004026757820000095
根据节点序列和第一重构结果之间的重构损失确定第一隐藏向量的目标值,具体地,目标值是最小化
Figure BDA0004026757820000096
和pθ(xj|zj)的KL散度,可以将它们转化为最大化log2pθ(zj,xj)的证据下界,其中参数θ,
Figure BDA0004026757820000097
可以使用不同的非线性函数进行拟合,例如神经网络等。
通过最小化输入zj和重构输出
Figure BDA0004026757820000098
之间的重构损失,可以保证隐藏表示Xi捕捉到所有参与者j=1,2,…,L具有的数据分布,从而能够对效果进行提升,现在可将生成的隐藏表示Xi输入到Transformer网络来进行结果预测,这就是实现用户(节点)层面不确定性的模型,记作CD-VAE-node,但是CD-VAE-node仅捕捉到了节点层面的不确定性,忽略了节点所形成序列之间的依赖性,因此还需要对时间层面的不确定性进行建模。
2)时间维度不确定性嵌入:对于内容Ci,其经过节点层面第一变分自编码器后输出的第一隐藏向量为Xi={xi(j),j=1,…,L},采用最小化重构损失的思想,定义得到的时间维度的第二隐藏向量Yi,其需要捕捉数据中序列依赖特性所具有的分布。
建模序列特征时采用的是Transformer,可将编码器Enc(·)表示为基于Transformer的第二变分编码器中的编码器输入,将解码器Dec(·)表示为基于Transformer的第二变分编码器中的解码器来实现对输入的重构。则基于Transformer的第二变分编码器可表示如公式(19)-(21):
Figure BDA0004026757820000101
其中,
Figure BDA0004026757820000102
μ=TS(Xi),logσ2=TS(Xi); (20)
Figure BDA0004026757820000103
其中,
Figure BDA0004026757820000104
是对Xi进行重构的输入,M表示序列的长度,Yi是学习到的时间层面变分编码的第二隐藏向量。若定义Ri表示序列的输入,则内容ci的联合概率分布可被定义为公式(22):
pθ(Ri,Xi,Yi)=pθ(Yi|Xi)pθ(Ri|Xi,Yi); (22)
第一隐藏向量Xi是一个中心各向同性多元高斯分布,则条件概率分布pθ(Yi|Xi)的参数通过基于Transformer的第二变分编码器来确定,pθ(Ri|Xi,Yi)可作为隐藏因子中重构的内容级联表示,定义如公式(23)、(24):
Figure BDA0004026757820000105
Figure BDA0004026757820000106
其中已观测的Ri的条件分布是具有对角协方差矩阵的多元高斯函数,其均值和方差由神经网络
Figure BDA0004026757820000107
Figure BDA0004026757820000108
来确定,其中θ和
Figure BDA0004026757820000109
是神经网络参数;Diag()表示对角矩阵;证据下界(ELBO)可定义如公式(25)。
公式(25)中第一项是重构成本,对序列的负对数似然函数进行估计,其激励着对隐藏变量Xi和Yi的序列的节点进行解码,两个KL散度是DKL(·)是模型的正则化项,其反映了在优化证据下界下的信息损失。基于此,CD-VAE通过第一变分编码器和第二变分编码器将用户和序列的数据假设为高斯分布来完成了节点维度和时间维度的不确定性建模。
Figure BDA00040267578200001010
Figure BDA0004026757820000111
步骤S104:根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。
在本步骤中,预测任务可以包括三个方面:1)回归任务;2)分类任务。3)计算复杂度分析。
在一种可选的方式中,步骤S104进一步包括:根据待预测社交媒体内容、第一处理结果和第二处理结果进行回归处理,预测待预测社交媒体内容在指定预测时段内的传播规模增量;根据待预测社交媒体内容、第一处理结果和第二处理结果进行分类处理,预测待预测社交媒体内容在指定预测时段内的传播规模对应的分类区间。
具体地,根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果进行回归处理,目标是根据观测时间窗T内待预测社交媒体内容Ci的节点、文本、结构、时间等特征得到指定预测时段τ内的传播规模增量ΔPi,如公式(26)。
Figure BDA0004026757820000112
损失函数定义如公式(27):
Figure BDA0004026757820000113
其中,c是待预测社交媒体内容数量;
Figure BDA0004026757820000114
为第一处理结果;ΔPi
Figure BDA0004026757820000115
分别表示内容Ci的预测增量、真实增量;Yi为第二隐藏向量;Hi为待预测社交媒体内容最终表示;Concat()用于连接两个或多个数组;Lreg表示L2正则化项;其是为了防止训练过程中过拟合,而λ是超参数;ELBO(Ri)是通过变分编码来实现的最大化证据下界。
根据待预测社交媒体内容、第一处理结果和第二处理结果进行分类处理,预测待预测社交媒体内容在指定预测时段内的传播规模对应的分类区间;具体地,可以将待预测社交媒体内容的传播规模划分为5个区间,例如为(0,10],(10,50],(50,150],(150,300],(300,∞],以微博博文为例,其中(0,10]表示单条博文的转发量为大于0且小于等于10;将传播规模划分成一个分类任务,为了符合对于早期传播预警的要求,即对于内容传播规模预测,更加关注其是否达到某个阈值,而非具体的数值,在计算准确率时对上述五个分类区间的权重进行区别设置,例如分别设置为为1、10、50、100、300,即表示比较关注的是传播规模较大的任务,从而实现精准营销、早期预警、内容传播治理,分类任务的输出如下式(28):
Figure BDA0004026757820000121
其中y为通过softmax(sf)进行预测的类别,损失函数定义为带权重的交叉熵损失,如公式(29):
Figure BDA0004026757820000122
其中,
Figure BDA0004026757820000123
Figure BDA0004026757820000124
分别表示内容Ci属于第j类的概率,Ci表示第j类的权重,以上述5分类区间为例,则权重weight=[1,10,50,100,300]。
在一种可选的方式中,该方法还包括:计算级联结构图、第一处理结果和/或第二处理结果的复杂度。
具体地说,由于CD-VAE模型在进行结构信息学习时采用的是GraphSAGE网络,GraphSAGE是基于空域的图嵌入方法,其计算复杂度为O(|E|dm),其中|E|、dm分别表示级联结构图的边数量和输入节点特征;另外,CD-VAE模型在时间信息学习时采用的是Transformer网络,Transformer是基于自注意力的网络,其计算复杂度为
Figure BDA0004026757820000125
其中dn表示输入Transformer的特征维度即GraphSAGE的输出特征维度;文本特征嵌入时采用图依赖的方式,其计算复杂度约等于O(|E|dm);在进行节点维度和时间维度不确定性嵌入时会存在很多的线性层,其计算复杂度主要是受隐藏变量的特征维度影响。
采用本实施例的方法,通过捕捉历史内容传播过程中的动态性,聚合了传播过程中的拓扑信息,从概率的角度对历史内容发布/转发时间和转发用户层面的不确定性进行建模,考虑了内容传播过程中文本特征的变化,显著提升了预测效果。本发明基于深度学习和贝叶斯学习的方法,结合了社交媒体内容的早期传播的特性,通过归纳式的图神经网络GraphSAGE来学习级联结构图,采用基于注意力机制的Transformer网络学习时间特征信息,同时采用两个变分自编码器来学习内容传播过程中节点维度和时间维度的不确定性;并且将涉及到的原始博文和转发内容信息通过自然语言处理技术进行文本特征嵌入为节点属性,实现传播规模预测,解决了现有预测模型只考虑发布文本,在聚合文本信息时,未考虑到转发结构依赖,以及未考虑内容传播过程中的节点和时间层面的不确定性。
图3示出了本发明一种社交媒体内容传播预测装置实施例的结构示意图。如图3所示,该装置包括:级联结构图构建模块301、数据处理模块302和预测模块303。
级联结构图构建模块301,用于获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图。
在一种可选的方式中,级联结构图构建模块301进一步用于:对历史转发关系数据进行分析,确定参与内容传播过程的各个用户以及各个用户之间的转发关系;对历史社交媒体内容进行分析,确定各个用户的传播文本内容;依据各个用户以及各个用户之间的转发关系,构建级联结构图,并根据各个用户的传播文本内容为级联结构图中的每个节点设置文本特征。
在一种可选的方式中,级联结构图构建模块301进一步用于:将各个用户作为各个节点,依据各个用户之间的转发关系确定各个节点之间的边,得到级联结构图。
在一种可选的方式中,级联结构图构建模块301进一步用于:针对每个节点,将该节点对应的用户的传播文本内容进行向量表示后作为该节点的文本特征。
数据处理模块302,用于通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果。
在一种可选的方式中,数据处理模块302进一步用于:根据级联结构图,确定在观测时间窗内的时间序列,时间序列中包含有多个节点;通过基于注意力机制的Transformer网络对时间序列进行位置编码,对位置编码结果进行注意力机制求解和特征组合处理,得到多个节点的时间特征。
在一种可选的方式中,数据处理模块302进一步用于:将级联结构图对应的节点序列输入至第一变分编码器得到节点维度的第一隐藏向量,利用第一隐藏向量进入输入重构得到第一重构结果;根据节点序列和第一重构结果之间的重构损失确定第一隐藏向量的目标值;将第一隐藏向量的目标值输入至第二变分编码器得到时间维度的第二隐藏向量,利用第二隐藏向量进行输入重构得到第二重构结果;根据第一隐藏向量的目标值和第二重构结果之间的重构损失确定第二隐藏向量的目标值;依据级联结构图、第一隐藏向量的目标值和第二隐藏向量的目标值,得到第二处理结果。
在一种可选的方式中,第一隐藏向量用于表示在节点维度下的各个节点所具有的分布;第二隐藏向量用于表示在时间维度下的序列依赖特性所具有的分布。
预测模块303,用于根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。
在一种可选的方式中,预测模块303进一步用于:根据待预测社交媒体内容、第一处理结果和第二处理结果进行回归处理,预测待预测社交媒体内容在指定预测时段内的传播规模增量;根据待预测社交媒体内容、第一处理结果和第二处理结果进行分类处理,预测待预测社交媒体内容在指定预测时段内的传播规模对应的分类区间。
在一种可选的方式中,预测模块303进一步用于:计算级联结构图、第一处理结果和/或第二处理结果的复杂度。
采用本实施例的装置,通过获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图;通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果;根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。本装置通过捕捉历史内容传播过程中的动态性,聚合了传播过程中的拓扑信息,从概率的角度对历史内容发布、转发时间、转发用户层面和时间层面的不确定性进行建模,进行建模,考虑了内容传播过程中文本特征的变化,显著提升了预测效果。
本发明实施例提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的一种社交媒体内容传播预测方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图;
通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;
利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果;
根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。
图4示出了本发明计算设备实施例的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:
处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。
其中:处理器、通信接口、以及存储器通过通信总线完成相互间的通信。通信接口,用于与其它设备比如客户端或其它服务器等的网元通信。处理器,用于执行程序,具体可以执行上述一种社交媒体内容传播预测方法实施例中的相关步骤。
具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。
处理器可能是中央处理器CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。服务器包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器,用于存放程序。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序具体可以用于使得处理器执行以下操作:
获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图;
通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;
利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果;
根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (12)

1.一种社交媒体内容传播预测方法,其特征在于,包括:
获取历史社交媒体内容以及所述历史社交媒体内容对应的历史转发关系数据,依据所述历史社交媒体内容以及所述历史转发关系数据构建得到内容传播过程对应的级联结构图;
通过基于注意力机制的Transformer网络为所述级联结构图中的节点设置时间特征,得到第一处理结果;
利用变分编码器对所述级联结构图在节点维度和时间维度进行处理,得到第二处理结果;
根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果,预测所述待预测社交媒体内容在指定预测时段内的传播数据。
2.根据权利要求1所述的方法,其特征在于,所述依据所述历史社交媒体内容以及所述历史转发关系数据构建得到内容传播过程对应的级联结构图进一步包括:
对所述历史转发关系数据进行分析,确定参与内容传播过程的各个用户以及所述各个用户之间的转发关系;
对所述历史社交媒体内容进行分析,确定所述各个用户的传播文本内容;
依据所述各个用户以及所述各个用户之间的转发关系,构建级联结构图,并根据所述各个用户的传播文本内容为所述级联结构图中的每个节点设置文本特征。
3.根据权利要求2所述的方法,其特征在于,所述依据所述各个用户以及所述各个用户之间的转发关系,构建级联结构图进一步包括:
将所述各个用户作为各个节点,依据所述各个用户之间的转发关系确定各个节点之间的边,得到级联结构图。
4.根据权利要求2所述的方法,其特征在于,所述根据所述各个用户的传播文本内容为所述级联结构图中的每个节点设置文本特征进一步包括:
针对每个节点,将该节点对应的用户的传播文本内容进行向量表示后作为该节点的文本特征。
5.根据权利要求1所述的方法,其特征在于,所述通过基于注意力机制的Transformer网络为所述级联结构图中的节点设置时间特征,得到第一处理结果进一步包括:
根据所述级联结构图,确定在观测时间窗内的时间序列,所述时间序列中包含有多个节点;
通过基于注意力机制的Transformer网络对所述时间序列进行位置编码,对位置编码结果进行注意力机制求解和特征组合处理,得到所述多个节点的时间特征。
6.根据权利要求1所述的方法,其特征在于,所述利用变分编码器对所述级联结构图在节点维度和时间维度进行处理,得到第二处理结果进一步包括:
将所述级联结构图对应的节点序列输入至第一变分编码器得到节点维度的第一隐藏向量,利用所述第一隐藏向量进入输入重构得到第一重构结果;
根据所述节点序列和所述第一重构结果之间的重构损失确定所述第一隐藏向量的目标值;
将所述第一隐藏向量的目标值输入至第二变分编码器得到时间维度的第二隐藏向量,利用所述第二隐藏向量进行输入重构得到第二重构结果;
根据所述第一隐藏向量的目标值和所述第二重构结果之间的重构损失确定所述第二隐藏向量的目标值;
依据所述级联结构图、所述第一隐藏向量的目标值和所述第二隐藏向量的目标值,得到所述第二处理结果。
7.根据权利要求6所述的方法,其特征在于,所述第一隐藏向量用于表示在所述节点维度下的各个节点所具有的分布;
所述第二隐藏向量用于表示在所述时间维度下的序列依赖特性所具有的分布。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果,预测所述待预测社交媒体内容在指定预测时段内的传播数据进一步包括:
根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果进行回归处理,预测所述待预测社交媒体内容在指定预测时段内的传播规模增量;
根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果进行分类处理,预测所述待预测社交媒体内容在指定预测时段内的传播规模对应的分类区间。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
计算所述级联结构图、所述第一处理结果和/或所述第二处理结果的复杂度。
10.一种社交媒体内容传播预测装置,其特征在于,包括:
级联结构图构建模块,用于获取历史社交媒体内容以及所述历史社交媒体内容对应的历史转发关系数据,依据所述历史社交媒体内容以及所述历史转发关系数据构建得到内容传播过程对应的级联结构图;
数据处理模块,用于通过基于注意力机制的Transformer网络为所述级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对所述级联结构图在节点维度和时间维度进行处理,得到第二处理结果;
预测模块,用于根据待预测社交媒体内容、所述第一处理结果和所述第二处理结果,预测所述待预测社交媒体内容在指定预测时段内的传播数据。
11.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-9中任一项所述的一种社交媒体内容传播预测方法对应的操作。
12.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-9中任一项所述的一种社交媒体内容传播预测方法对应的操作。
CN202211708983.5A 2022-12-29 2022-12-29 一种社交媒体内容传播预测方法和装置 Pending CN115759482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211708983.5A CN115759482A (zh) 2022-12-29 2022-12-29 一种社交媒体内容传播预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211708983.5A CN115759482A (zh) 2022-12-29 2022-12-29 一种社交媒体内容传播预测方法和装置

Publications (1)

Publication Number Publication Date
CN115759482A true CN115759482A (zh) 2023-03-07

Family

ID=85347932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211708983.5A Pending CN115759482A (zh) 2022-12-29 2022-12-29 一种社交媒体内容传播预测方法和装置

Country Status (1)

Country Link
CN (1) CN115759482A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116842398A (zh) * 2023-06-27 2023-10-03 哈尔滨工业大学 一种基于屏蔽自注意力网络的话题感知信息转发预测方法及系统
CN117610717A (zh) * 2023-11-13 2024-02-27 重庆大学 一种基于双变分级联自编码器的信息流行度预测方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102182159A (zh) * 2011-03-21 2011-09-14 武汉大学 一种梯级水库汛限水位联合运用调度方法
CN110737778A (zh) * 2019-09-04 2020-01-31 北京邮电大学 基于知识图谱和Transformer的专利推荐方法
CN111080032A (zh) * 2019-12-30 2020-04-28 成都数之联科技有限公司 一种基于Transformer结构的负荷预测方法
CN112446489A (zh) * 2020-11-25 2021-03-05 天津大学 基于变分自编码器的动态网络嵌入链接预测方法
CN112528015A (zh) * 2020-10-26 2021-03-19 复旦大学 在消息交互传播中进行谣言判别的方法及装置
CN112686765A (zh) * 2020-12-09 2021-04-20 天津大学 一种基于社交网络的信息传播规律挖掘方法
CN113505924A (zh) * 2021-07-09 2021-10-15 福州大学 一种基于级联时空特征的信息传播预测方法及系统
CN113536144A (zh) * 2021-06-17 2021-10-22 中国人民解放军国防科技大学 一种社交网络信息的传播规模预测方法、装置
CN114048395A (zh) * 2021-11-05 2022-02-15 中国科学院信息工程研究所 基于时间感知与关键信息抽取的用户转发预测方法和系统
CN114519606A (zh) * 2022-01-29 2022-05-20 北京京东尚科信息技术有限公司 信息传播效果的预测方法及装置
CN115409155A (zh) * 2022-08-17 2022-11-29 电子科技大学 基于Transformer增强霍克斯过程的信息级联预测系统及方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102182159A (zh) * 2011-03-21 2011-09-14 武汉大学 一种梯级水库汛限水位联合运用调度方法
CN110737778A (zh) * 2019-09-04 2020-01-31 北京邮电大学 基于知识图谱和Transformer的专利推荐方法
CN111080032A (zh) * 2019-12-30 2020-04-28 成都数之联科技有限公司 一种基于Transformer结构的负荷预测方法
CN112528015A (zh) * 2020-10-26 2021-03-19 复旦大学 在消息交互传播中进行谣言判别的方法及装置
CN112446489A (zh) * 2020-11-25 2021-03-05 天津大学 基于变分自编码器的动态网络嵌入链接预测方法
CN112686765A (zh) * 2020-12-09 2021-04-20 天津大学 一种基于社交网络的信息传播规律挖掘方法
CN113536144A (zh) * 2021-06-17 2021-10-22 中国人民解放军国防科技大学 一种社交网络信息的传播规模预测方法、装置
CN113505924A (zh) * 2021-07-09 2021-10-15 福州大学 一种基于级联时空特征的信息传播预测方法及系统
CN114048395A (zh) * 2021-11-05 2022-02-15 中国科学院信息工程研究所 基于时间感知与关键信息抽取的用户转发预测方法和系统
CN114519606A (zh) * 2022-01-29 2022-05-20 北京京东尚科信息技术有限公司 信息传播效果的预测方法及装置
CN115409155A (zh) * 2022-08-17 2022-11-29 电子科技大学 基于Transformer增强霍克斯过程的信息级联预测系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
汪荣贵: "《大数据架构技术与实例分析》", 机械工业出版社, pages: 178 - 182 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116842398A (zh) * 2023-06-27 2023-10-03 哈尔滨工业大学 一种基于屏蔽自注意力网络的话题感知信息转发预测方法及系统
CN117610717A (zh) * 2023-11-13 2024-02-27 重庆大学 一种基于双变分级联自编码器的信息流行度预测方法

Similar Documents

Publication Publication Date Title
Michelot et al. moveHMM: an R package for the statistical modelling of animal movement data using hidden Markov models
CN111400620B (zh) 基于时空嵌入Self-Attention的用户轨迹位置预测方法
CN107330731B (zh) 一种识别广告位点击异常的方法和装置
CN112528275B (zh) 基于元路径学习与子图采样的apt网络攻击检测方法
CN111079532A (zh) 一种基于文本自编码器的视频内容描述方法
Yang et al. A time‐series water level forecasting model based on imputation and variable selection method
CN113536144B (zh) 一种社交网络信息的传播规模预测方法、装置
CN111340112B (zh) 分类方法、装置、服务器
CN111950692B (zh) 用于改进的通用化的基于汉明距离的稳健输出编码
CN113868474A (zh) 一种基于自注意力机制和动态图的信息级联预测方法
CN115759482A (zh) 一种社交媒体内容传播预测方法和装置
JP7205640B2 (ja) 学習方法、学習プログラム、および学習装置
CN115565038A (zh) 内容审核、内容审核模型的训练方法及相关装置
Zhou et al. Functional networks and applications: A survey
CN111079930A (zh) 数据集质量参数的确定方法、装置及电子设备
JPWO2021059348A5 (zh)
Li et al. Graph convolution recurrent denoising diffusion model for multivariate probabilistic temporal forecasting
JP7205641B2 (ja) 学習方法、学習プログラム、および学習装置
KR20220066554A (ko) Qa 모델을 이용하여 지식 그래프를 구축하는 방법, 장치 및 컴퓨터 프로그램
CN116310728A (zh) 基于CNN-Linformer模型的浏览器识别方法
CN115049852A (zh) 一种轴承故障诊断方法、装置、存储介质及电子设备
CN114357160A (zh) 基于生成传播结构特征的早期谣言检测方法及装置
CN115131605A (zh) 一种基于自适应子图的结构感知图对比学习方法
CN115705464A (zh) 一种信息的处理方法、装置及设备
CN114091429A (zh) 基于异构图神经网络的文本摘要生成方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination