CN113536144B - 一种社交网络信息的传播规模预测方法、装置 - Google Patents

一种社交网络信息的传播规模预测方法、装置 Download PDF

Info

Publication number
CN113536144B
CN113536144B CN202110672645.XA CN202110672645A CN113536144B CN 113536144 B CN113536144 B CN 113536144B CN 202110672645 A CN202110672645 A CN 202110672645A CN 113536144 B CN113536144 B CN 113536144B
Authority
CN
China
Prior art keywords
information
propagation
vector
feature vector
cascade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110672645.XA
Other languages
English (en)
Other versions
CN113536144A (zh
Inventor
尚颖丹
周斌
张文瑾
王晔
李爱平
江荣
涂宏魁
高立群
宋怡晨
陈恺
林昌建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110672645.XA priority Critical patent/CN113536144B/zh
Publication of CN113536144A publication Critical patent/CN113536144A/zh
Application granted granted Critical
Publication of CN113536144B publication Critical patent/CN113536144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种社交网络信息的传播规模预测方法、装置,可以提供更准确地信息传播规模预测结果,为社交网络中信息的管理提供科学的依据,步骤:从社交网络平台中提取信息的传播数据,获取信息的文本内容、信息传播级联图、信息传播的时间间隔;通过句嵌入模型获得信息文本的特征向量;将信息传播的时间间隔输入LSTM网络模型获得时间间隔的隐藏表示,对时间间隔的隐藏表示进行采样,加权平均后得到时间间隔的特征向量;通过信息级联图向量表示生成模型获得信息级联图的特征向量;构建并训练传播规模预测模型,将信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模。

Description

一种社交网络信息的传播规模预测方法、装置
技术领域
本发明涉及社交网络分析和神经网络技术领域,具体涉及一种社交网络信息的传播规模预测方法、装置。
背景技术
无线通信技术和Internet的飞速发展,以及移动设备的小型化和高可用性极大地改变了人们在相互交互时获取和使用数据和信息的方式,大量社交网络平台如新浪微博、twitter在此环境中应运而生并迅速发展,进而推动自媒体时代的到来。与传统的报纸、电视、新闻网站等媒体从点到面的传播方式截然不同,自媒体时代信息传播的主体是广泛的普通大众,大众拥有了前有未来的自由度和话语空间。当今社会大量热点事件首先在社交网络平台曝光,并通过社交网络平台的共享机制如微博的转发、评论机制产生广泛传播,进而在社会上形成较大舆论效应。
社交网络信息的传播规模预测任务旨在研究信息在社交网络用户之间的传播机制,理解社交网络信息传播规律,对信息未来可能的传播规模进行评估和预测。该项研究工作对于相关的决策支持系统很有意义,一方面可以帮助我们理解用户交互背后包含的公众的兴趣和公众注意力,另一方面预测信息传播规模使我们能够及早对网络信息传播可能引起的社会反响有基本的了解,为相关部门对舆情事件的积极引导和相关决策提供科学依据。
现有社交网络信息的传播规模预测方法通常从信息传播早期的级联信息中学习具有预测性的特征,并建模这些特征和最终传播规模间的关系。传统的信息传播规模预测方法主要分为基于特征的方法和生成式方法。基于特征的方法利用社交网络的先验知识采用特征工程提取信息传播的各类特征,并借助机器学习方法训练回归或分类模型来预测信息未来的传播规模,由于特征的选取可能特定于某个平台,因此此类模型难以推广应用。生成式方法建模信息传播过程中新的传播事件发生的概率,但模型通常对信息传播的底层机制有较强的假设,导致模型表达能力有限,准确率相对不高。
当前基于深度学习的社交网络信息传播规模预测方法能够自动化地从早期信息传播的数据中学习信息传播的特征表示,无需耗时耗力的特征抽取,且能够更好地建模影响信息传播的复杂因素,模型预测准确率有了较大提升。但已有基于深度学习的方法存在以下问题:一、现有基于深度学习的研究利用图神经网络建模信息级联图,普遍采用简单的池化策略基于用户表示构建出信息级联图表示,并不能准确地反映信息传播过程中用户的不同重要程度,导致生成的信息级联图表示的表达能力有限,进而影响了信息传播流行度预测任务的准确性。二、现有研究侧重于对信息级联图的建模,普遍忽视信息传播过程中用户参与传播的时间信息,两次传播事件之间的时间间隔信息反映了信息的传播速度,更短的传播时间间隔通常意味着信息本身的吸引力更大,能够引发更广泛的传播。三、现有研究缺乏将信息的文本内容作为传播的上下文信息进行信息传播规模预测的相关研究工作。信息的文本内容反映了信息的语义特征和主题分布,不同的主题在社交网络平台中的传播模式存在较大差异,具有影响力的用户群体不同,因此不同的信息文本语境下,影响信息最终传播规模的级联图特征和时间特征也不同。
综上所述,已有基于深度学习的研究侧重于对信息级联图的建模,普遍忽视信息传播过程中的时间特征,且未考虑不同信息文本语境对信息级联图特征和时间特征的影响,导致现有信息传播规模预测模型对信息传播的特征表示的学习不足,模型表达能力有限,信息传播规模预测任务的准确性较低。
发明内容
针对上述问题,本发明提供了一种社交网络信息的传播规模预测方法、装置,可以综合利用信息传播早期的时间特征和信息的文本内容特征,提供更准确地信息传播规模预测结果,为社交网络中信息的管理提供科学的依据。
其技术方案是这样的:一种社交网络信息的传播规模预测方法,其特征在于,包括以下步骤:
步骤1:从社交网络平台中提取信息的传播数据,获取信息的文本内容、信息传播级联图、信息传播的时间间隔;
步骤2:通过句嵌入模型获得信息文本的特征向量;
步骤3:将信息传播的时间间隔输入LSTM网络模型获得时间间隔的隐藏表示,对时间间隔的隐藏表示进行采样,加权平均后得到时间间隔的特征向量;
步骤4:构建信息级联图向量表示生成模型,通过信息级联图向量表示生成模型获得信息级联图的特征向量;
步骤5:构建并训练传播规模预测模型,将信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模。
进一步的,在步骤1中,对社交网络平台中信息m,提取信息从发布时间到发布后tf时间段的传播数据,从传播数据中获取信息的文本内容C、信息传播的级联图G、传播事件发生的时间间隔序列T,其中,信息的文本内容C包括若干由单词组成的短文本信息,对于信息传播的级联图Gt={Vt,Et},Vt表示截止t时刻已参与信息m传播的用户集合,Et表示截止t时刻用户间的传播关系,对于时间间隔序列T={x0,x1,...xt},xt表示第t次传播事件和第t-1次传播事件的时间间隔。
进一步的,在步骤2中,采用的句向量模型为Sentence-BERT模型,将信息的文本内容C输入Sentence-BERT模型,生成文本的特征向量hc
进一步的,在步骤3中,具体包括以下步骤:
步骤301:将时间间隔序列T={x0,x1,...xt}输入LSTM网络模型中,输出时间间隔输入xt的隐藏表示ot,通过如下公式表示:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
ct=ft*ct-1+it*tanh(Wc·[ht-1,xt]+bc)
ot=σ(Wo·[ht-1,xt]+bo)
其中σ表示sigmoid函数,tanh代表双曲正切函数,ft,it,ct,ot分别表示LSTM网络模型中第t个输入对应的遗忘门、输入门、记忆门、输出门,W*,b*是LSTM网络模型中可学习的参数;
步骤302:按照设定的采样间隔进行采样,对LSTM网络模型输出的时间间隔序列的隐藏表示{o1,o2,...omax}进行采样,对采样后的序列通过加权平均和得到时间间隔的特征向量ht,表示为:
Figure GDA0003266099780000031
其中α代表通过模型训练自动生成的输出对应的权重向量。
进一步的,步骤4具体包括:构建信息级联图向量表示生成模型,所述信息级联图向量表示生成模型包括低维向量映射层、图卷积网络层、TOP-K池化层,信息传播的级联图中的用户节点在低维向量映射层中转化为低维向量表示;将转化后的用户节点的低维向量表示通过图卷积网络层,按照邻居关系进行图卷积操作得到用户节点的特征向量;对信息传播的级联图中的所有用户节点,通过TOP-K池化层生成级联图的特征向量。
进一步的,在所述信息级联图向量表示生成模型中:
在低维向量映射层中,对于信息传播的级联图Gt={Vt,Et}的用户节点,通过one-hot的方式表示为向量qv,将向量qv映射为低维向量表示hv
hv=Eqv
其中E为随机生成的矩阵,E∈RD×M,其中D表示特征维度,M表示用户总数;
在图卷积网络层中,将信息传播的级联图Gt输入图卷积神经网络层,得到邻居聚合向量表示,表示为:
Figure GDA0003266099780000041
其中,
Figure GDA0003266099780000042
为节点v第k次卷积对应的邻居聚合向量表示,其中
Figure GDA0003266099780000043
表示节点v的邻居节点u在第k-1次卷积时的向量表示,聚合函数max表示采用聚合邻居特征值中的最大值进行计算,Wpool、bpool分别为图卷积神经网络中的可学习参数,σ表示sigmoid函数;
拼接节点v的k-1层特征向量
Figure GDA0003266099780000044
和其邻居聚合向量表示
Figure GDA0003266099780000045
通过全连接层生成k层卷积的节点表示
Figure GDA0003266099780000046
Figure GDA0003266099780000047
其中,σ表示sigmoid函数,Concat操作代表向量拼接;
在TOP-K池化层中,计算每个用户节点的重要系数sv
Figure GDA0003266099780000048
其中,p为利用可学习向量;按照节点重要系数选取一定比例的节点组成节点集合V,节点集合V按照以重要系数作为节点权重并按照最大池化方生成级联图的特征向量hg
Figure GDA0003266099780000049
进一步的,所述传播规模预测模型包括上下文连接层、MLP网络层,
将信息文本的特征向量和时间间隔的特征向量输入上下文连接层,输出更新的时间间隔的向量;
将信息文本的特征向量和信息级联图的特征向量输入上下文连接层,输出更新的信息级联图的特征向量;
将更新的时间间隔的向量和更新的信息级联图的特征向量输入上下文连接层,输出融合特征向量;
将融合特征向量输入MLP网络层,输出预测的传播规模。
进一步的,步骤5具体包括以下步骤:
步骤501:传播规模预测模型的构建:
以文本的特征向量hc作为信息传播的上下文,将信息文本的特征向量hc和时间间隔的特征向量输入上下文连接层,得到更新的时间间隔的特征向量
Figure GDA0003266099780000051
Figure GDA0003266099780000052
其中,ht为输入的时间间隔的特征向量,hc为输入的信息文本的特征向量,tanh代表双曲正切函数,Wt、bt分别为上下文连接层中的可学习参数,[ht,hc]表示两个向量的拼接操作;
以文本的特征向量hc作为信息传播的上下文,将信息文本的特征向量hc和时间间隔的特征向量输入上下文连接层,得到更新的级联图的特征向量
Figure GDA0003266099780000053
Figure GDA0003266099780000054
其中,hg为输入的级联图的特征向量,hc为输入的信息文本的特征向量,tanh代表双曲正切函数,Wg、bg分别为上下文连接层中的可学习参数;
将更新的时间间隔的向量
Figure GDA0003266099780000055
Figure GDA0003266099780000056
更新的信息级联图的特征向量输入上下文连接层,输出融合特征向量hm
Figure GDA0003266099780000057
σ表示sigmoid函数,Wm,bm是上下文连接层中可学习的参数。
将融合特征向量hm输入MLP网络层,输出预测的传播规模:
ΔP=MLP(hm)=σ(Whm+b)
ΔP表示预测的传播规模,σ表示sigmoid函数,w,b是上下文连接层中可学习的参数。
步骤502:传播规模预测模型的训练:
信息mi的传播数据生成对应样本
Figure GDA0003266099780000061
其中ΔPi代表截止最终时刻tf参与信息mi传播的用户数与截止观测时间to参与信息传播的用户数差值,
Figure GDA0003266099780000062
Figure GDA0003266099780000063
通过样本训练传播规模预测模型;
通过Adam梯度下降方法求解损失函数最小值,自动化学习传播规模预测模型中的参数,损失函数采用MSLE:
Figure GDA0003266099780000064
其中,loss为损失函数,N是消息的总数,ΔPi是预测的信息规模增量,
Figure GDA0003266099780000065
是真实的信息规模增量,通过样本对传播规模预测模型进行训练迭代,更新模型参数,直至模型收敛,得到训练后的传播规模预测模型;
步骤503:传播规模预测:将需要预测的信息对应的信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模。
一种计算机装置,包括存储器、处理器以及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如上述的社交网络信息的传播规模预测方法。
一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现如上述的社交网络信息的传播规模预测方法。
本发明的社交网络信息的传播规模预测方法,针对信息级联图表示的表达能力有限的问题,我们采用了Top-K池化方法,通过神经网络自动学习信息级联图中的重要用户节点,生成高效地信息级联图的特征向量;针对已有研究忽视时间特征的问题,我们利用LSTM神经网络捕获传播早期的时间特征;同时利用自然语言处理领域中的Sentence-BERT模型生成有效地信息文本表示,利用信息文本表示作为上下文更新时间特征表示和信息级联图表示,将融合后的特征向量作为信息传播的整体特征用于传播规模预测。本发明综合利用了信息传播过程中的信息级联图特征、时间间隔特征、信息文本特征,提出了一种以信息文本内容作为传播上下文信息的传播规模预测模型,能够充分建模社交网络平台信息传播的特征,提升社交网络平台中信息传播规模预测任务的准确性。
附图说明
图1为本发明的一种社交网络信息的传播规模预测方法的主要流程示意图;
图2为本发明的信息级联图向量表示生成模型执行的流程示意图;
图3为本发明的一个实施例中社交网络信息的传播规模预测方法的流程示意图;
图4为一个实施例中计算机装置的内部结构图。
具体实施方式
见图1,本发明的一种社交网络信息的传播规模预测方法,至少包括以下步骤:
步骤1:从社交网络平台中提取信息的传播数据,获取信息的文本内容、信息传播级联图、信息传播的时间间隔;
步骤2:通过句嵌入模型获得信息文本的特征向量;
步骤3:将信息传播的时间间隔输入LSTM网络模型获得时间间隔的隐藏表示,对时间间隔的隐藏表示进行采样,加权平均后得到时间间隔的特征向量;
步骤4:构建信息级联图向量表示生成模型,通过信息级联图向量表示生成模型获得信息级联图的特征向量;
步骤5:构建并训练传播规模预测模型,将信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模。
见图3,具体在本发明的一个实施例中,在步骤1中,对社交网络平台中信息m,提取信息从发布时间到发布后tf时间段的传播数据,信息的传播指信息的转发,本实例中我们设置tf为24小时。从传播数据中获取信息的文本内容C、信息传播的级联图G、传播事件发生的时间间隔序列T,对数据进行预处理,构成信息集合M={m1,m2,…mN},N为信息总数;
其中,信息的文本内容C包括若干由单词组成的短文本信息,信息传播的级联图指:例如参与一条微博转发的用户和用户之间的转发关系构成的图结构,对于信息传播的级联图Gt={Vt,Et},Vt表示截止t时刻已参与信息m传播的用户集合,Et表示截止t时刻用户间的传播关系,
对于时间间隔序列T={x0,x1,...xt},xt表示第t次传播事件和第t-1次传播事件的时间间隔。
具体在本实施例中,在步骤2中,采用的句向量模型为Sentence-BERT模型,将信息的文本内容C输入Sentence-BERT模型,生成文本的特征向量hc。该模型将不同的信息文本内容映射到同一个向量空间,使得语义相似度高的文本内容对应的向量欧式距离更近。
具体在本实施例中,在步骤3中,对于时间间隔序列T,通过LSTM网络模型训练得到时间间隔的特征同量ht。具体包括以下步骤:
步骤301:将时间间隔序列T={x0,x1,...xt}输入LSTM网络模型中,输出时间间隔输入xt的隐藏表示ot,通过如下公式表示:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
ct=ft*ct-1+it*tanh(Wc·[ht-1,xt]+bc)
ot=σ(Wo·[ht-1,xt]+bo)
其中σ表示sigmoid函数,tanh代表双曲正切函数,ft,it,ct,ot分别表示LSTM网络模型中第t个输入对应的遗忘门、输入门、记忆门、输出门,W*,b*是LSTM网络模型中可学习的参数;
步骤302:按照设定的采样间隔,在本实施例中,按照如下形式进行采样,{n*10m,n∈{1,2,..10},m={0,1,...,log10max}}的采样,假设max=1000,max代表这条信息共有1000个人参与传播,每个人参与传播时间不同,LSTM输出1000个{o1,o2,...omax},上式的采样就是从这1000次传播时间序列中采样{0,1,2,3,…10,20,30,…,100,200,300,..900}对应位置的向量。
对LSTM网络模型输出的时间间隔序列的隐藏表示{o1,o2,...omax}进行采样,对采样后的序列通过加权平均和得到时间间隔的特征向量ht,表示为:
Figure GDA0003266099780000091
其中α代表通过模型训练自动生成的输出对应的权重向量。
见图2,在本实施例中,在步骤4中,构建信息级联图向量表示生成模型,信息级联图向量表示生成模型包括低维向量映射层、图卷积网络层、TOP-K池化层,信息传播的级联图中的用户节点在低维向量映射层中转化为低维向量表示;将转化后的用户节点的低维向量表示通过图卷积网络层,按照邻居关系进行图卷积操作得到用户节点的特征向量;对信息传播的级联图中的所有用户节点,通过TOP-K池化层生成级联图的特征向量。
具体在信息级联图向量表示生成模型中:
在低维向量映射层中,信息传播的级联图中的用户节点转化为低维向量表示,对于信息传播的级联图Gt={Vt,Et}的用户节点,通过one-hot的方式表示为向量qv,将向量qv映射为低维向量表示hv
hv=Eqv
其中E为随机生成的矩阵,E∈RD×M,其中D表示特征维度,M表示用户总数;
在图卷积网络层中,将转化后的用户节点的低维向量表示按照邻居关系进行图卷积操作得到用户节点的特征向量,具体的,将信息传播的级联图Gt输入图卷积神经网络层,得到邻居聚合向量表示,表示为:
Figure GDA0003266099780000092
其中,
Figure GDA0003266099780000093
为节点v第k次卷积对应的邻居聚合向量表示,其中
Figure GDA0003266099780000094
表示节点v的邻居节点u在第k-1次卷积时的向量表示,聚合函数max表示采用聚合邻居特征值中的最大值进行计算,Wpool、bpool分别为图卷积神经网络中的可学习参数,σ表示sigmoid函数;
拼接节点v的k-1层特征向量
Figure GDA0003266099780000095
和其邻居聚合向量表示
Figure GDA0003266099780000096
通过全连接层生成k层卷积的节点表示
Figure GDA0003266099780000097
Figure GDA0003266099780000098
其中,σ表示sigmoid函数,Concat操作代表向量拼接;
在TOP-K池化层中,对信息传播的级联图中的所有用户节点,采用Top-K池化策略生成级联图的特征向量hg,计算每个用户节点的重要系数sv
Figure GDA0003266099780000101
其中,p为利用可学习向量;按照节点重要系数选取一定比例的节点组成节点集合V,节点集合V以重要系数作为节点权重并按照最大池化方生成级联图的特征向量hg
Figure GDA0003266099780000102
在本实施例中,步骤5中的传播规模预测模型包括上下文连接层、MLP网络层,
将信息文本的特征向量和时间间隔的特征向量输入上下文连接层,输出更新的时间间隔的特征向量;
将信息文本的特征向量和信息级联图的特征向量输入上下文连接层,输出更新的信息级联图的特征向量;
将更新的时间间隔的向量和更新的信息级联图的特征向量输入上下文连接层,输出融合特征向量;
将融合特征向量输入MLP网络层,输出预测的传播规模。
进一步的,步骤5具体包括以下步骤:
步骤501:传播规模预测模型的构建:
以文本的特征向量hc作为信息传播的上下文,将信息文本的特征向量hc和时间间隔的特征向量输入上下文连接层,生成特定语境下的时间间隔的特征向量
Figure GDA0003266099780000103
Figure GDA0003266099780000104
其中,ht为输入的时间间隔的特征向量,hc为输入的信息文本的特征向量,tanh代表双曲正切函数,Wt、bt分别为上下文连接层中的可学习参数,[ht,hc]表示两个向量的拼接操作;
以文本的特征向量hc作为信息传播的上下文,将信息文本的特征向量hc和时间间隔的特征向量输入上下文连接层,生成特定语境下的级联图的特征向量
Figure GDA0003266099780000105
Figure GDA0003266099780000111
其中,hg为输入的级联图的特征向量,hc为输入的信息文本的特征向量,tanh代表双曲正切函数,Wg、bg分别为上下文连接层中的可学习参数;
将更新的时间间隔的向量
Figure GDA0003266099780000112
Figure GDA0003266099780000113
更新的信息级联图的特征向量输入上下文连接层,输出融合特征向量hm
Figure GDA0003266099780000114
σ表示sigmoid函数,Wm,bm是上下文连接层中可学习的参数。
将融合特征向量hm输入MLP网络层,输出预测的传播规模:
ΔP=MLP(hm)=σ(Whm+b)
ΔP表示预测的传播规模,σ表示sigmoid函数,w,b是上下文连接层中可学习的参数。
步骤502:传播规模预测模型的训练:
设置观测时间为to,按照观测时间分割信息的传播数据,信息mi的传播数据生成对应样本
Figure GDA0003266099780000115
其中ΔPi代表截止最终时刻tf参与信息mi传播的用户数与截止观测时间to参与信息传播的用户数差值,
Figure GDA0003266099780000116
Ci
Figure GDA0003266099780000117
分别是观测时间内的信息的文本内容、信息传播级联图、信息传播的时间间隔序列;
通过样本训练传播规模预测模型,传播规模预测模型通过Adam梯度下降方法求解损失函数最小值,自动化学习传播规模预测模型中的参数,损失函数采用MSLE:
Figure GDA0003266099780000118
其中,loss为损失函数,N是消息的总数,ΔPi是预测的信息规模增量,
Figure GDA0003266099780000119
是真实的信息规模增量,通过样本对传播规模预测模型进行训练迭代,更新模型参数,直至模型收敛,得到训练后的传播规模预测模型;
步骤503:传播规模预测:将需要预测的信息对应的信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模,输出预测的传播规模的数值表示预测的信息未来可能还有若干个人参与传播。
在本实施例中,信息传播规模预测任务的目标是理解社交网络信息传播规律,利用信息传播早期的数据对信息未来可能的传播规模进行评估和预测。该预测任务有助于相关部门更好地预测信息可能引发的舆论效应,从而及时进行有效地引导和管理;也能够帮助我们理解公众的兴趣,为信息推荐系统提供科学支撑。
传统的信息传播规模预测方法主要分为基于特征的方法和生成式方法。基于特征的方法利用社交网络的先验知识手工提取信息传播的各类特征,并借助机器学习方法训练回归/分类模型来预测信息未来的流行度。传统的信息传播规模预测方法证明了信息传播早期的特征如信息级联图特征、时间特征、文本内容特征是影响信息传播规模的关键因素。由于特征的提取通常基于人类的先验领域知识,并且可能特定于某个平台,当这些特征不在特定上下文中时可能无法直接应用,因此这类模型很难推广到新领域。生成式方法建模信息传播过程中新的传播事件发生的概率,但模型通常对信息传播的底层机制有较强的假设,且仅从传播事件发生的时间序列中提取信息,导致模型表达能力有限,该类模型的准确性有待提高。
现有基于深度学习的传播规模预测模型普遍将观察到的信息传播早期的数据作为深度学习模型的输入,以信息最终的传播规模作为输出,利用损失函数通过自动梯度学习模型的各项参数。已有研究实验性地证明,基于深度学习的传播规模预测模型能够自动化地学习信息传播早期的特征,用于信息未来的传播规模预测并取得了优于传统方法的预测效果。但已有基于深度学习的方法存在以下问题:一、现有基于深度学习的研究利用图神经网络建模信息级联图,普遍采用简单的池化策略基于用户表示构建出信息级联图表示,并不能准确地反映信息传播过程中用户的不同重要程度,导致生成的信息级联图表示的表达能力有限,进而影响了信息传播流行度预测任务的准确性。二、现有研究侧重于对信息级联图的建模,普遍忽视信息传播过程中用户参与传播的时间信息,两次传播事件之间的时间间隔信息反映了信息的传播速度,更短的传播时间间隔通常意味着信息本身的吸引力更大,能够引发更广泛的传播。三、现有研究缺乏将信息的文本内容作为传播的上下文信息进行信息传播规模预测的相关研究工作。信息的文本内容反映了信息的语义特征和主题分布,不同的主题在社交网络平台中的传播模式存在较大差异,具有影响力的用户群体不同,因此不同的信息文本语境下,影响信息最终传播规模的级联图特征和时间特征也不同。已有基于深度学习的研究侧重于对信息级联图的建模,普遍忽视信息传播过程中的时间特征,且未考虑不同信息文本语境对信息级联图特征和时间特征的影响,导致现有信息传播规模预测模型对信息传播的特征表示的学习不足,模型表达能力有限,信息传播规模预测任务的准确性较低。
针对信息级联图表示的表达能力有限的问题,通过在图池化过程中学习信息级联图中的用户节点的重要程度,选取重要的用户构成新的用户集,以用户的重要系数作为用户权重从新的用户集池化生成信息级联图的向量表示;
针对已有基于深度学习的研究忽视对时间特征建模的问题,我们利用LSTM神经网络捕获信息传播的时间间隔特征,考虑到在传播过程中不同的信息所对应的参与传播的用户数量不同,我们对时序的输出序列采取采样的方式,重点考虑早期时间特征,提取信息从发布时间起的时间间隔,并自动学习每个输出的权重,通过加权求和的方式生成时间间隔特征的向量表示;
针对已有研究未能考虑不同文本主题的传播特征不同的问题,我们利用自然语言处理领域中的Sentence-BERT模型生成有效地信息文本的特征,以信息文本特征表示作为上下文得到特定信息文本主题下的时间间隔特征表示和信息级联图特征表示。通过将信息文本特征、时间间隔特征、信息级联图特征输入全连接网络层学习两者之间的关系,生成符合特定文本主题语境下的时间间隔特征表示和信息级联图表示。将时间间隔特征表示和信息级联图表示融合后的特征向量作为信息传播的整体特征用于传播规模预测。研究表明,不同的主题/话题在社交网络平台上的传播模式不同,即热度曲线何时到达波峰何时到达波谷等,换言之,不同的主题/话题下的信息级联图特征、时间特征也是不同的,利用信息文本特征作为上下文更新信息级联图的向量表示、时间间隔特征表示,能够使模型更关注于该主题下的级联图、时间信息中的重点特征,更好的捕捉信息传播过程中的特征用于预测其最终规模。
本实施例的方法提出了一种高效地建模信息级联图的方法,也提出了一种新颖的以信息文本内容作为传播的上下文融合时间间隔特征、信息级联图特征的传播规模预测模型,综合利用了信息传播过程中的信息级联图特征、时间间隔特征、文本特征,能够充分建模社交网络信息传播的特征,提升社交网络平台中信息传播规模预测任务的准确性。同时有利于在深度学习框架下展开对影响信息传播规模的不同特征的对比工作,有助于理解信息传播规律。
在本发明的实施例中,还提供了一种计算机装置,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述的社交网络信息的传播规模预测方法。
该计算机装置可以是终端,其内部结构图可以如图4所示。该计算机装置包括通过总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机装置的处理器用于提供计算和控制能力。该计算机装置的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机装置的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现社交网络信息的传播规模预测方法。该计算机装置的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机装置的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机装置外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机装置的限定,具体的计算机装置可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本发明的实施例中,还提供了一种计算机可读存储介质,其上存储有程序,程序被处理器执行时实现如上述的社交网络信息的传播规模预测方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、计算机装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (8)

1.一种社交网络信息的传播规模预测方法,其特征在于,包括以下步骤:
步骤1:从社交网络平台中提取信息的传播数据,获取信息的文本内容、信息传播级联图、信息传播的时间间隔;
步骤2:通过句嵌入模型获得信息文本的特征向量;
步骤3:将信息传播的时间间隔输入LSTM网络模型获得时间间隔的隐藏表示,对时间间隔的隐藏表示进行采样,加权平均后得到时间间隔的特征向量;
步骤4:构建信息级联图向量表示生成模型,通过信息级联图向量表示生成模型获得信息级联图的特征向量;
步骤5:构建并训练传播规模预测模型,将信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模;
步骤4具体包括:构建信息级联图向量表示生成模型,所述信息级联图向量表示生成模型包括低维向量映射层、图卷积网络层、TOP-K池化层,信息传播的级联图中的用户节点在低维向量映射层中转化为低维向量表示;将转化后的用户节点的低维向量表示通过图卷积网络层,按照邻居关系进行图卷积操作得到用户节点的特征向量;对信息传播的级联图中的所有用户节点,通过TOP-K池化层生成级联图的特征向量;
所述传播规模预测模型包括上下文连接层、MLP网络层,
将信息文本的特征向量和时间间隔的特征向量输入上下文连接层,输出更新的时间间隔的向量;
将信息文本的特征向量和信息级联图的特征向量输入上下文连接层,输出更新的信息级联图的特征向量;
将更新的时间间隔的向量和更新的信息级联图的特征向量输入上下文连接层,输出融合特征向量;
将融合特征向量输入MLP网络层,输出预测的传播规模。
2.根据权利要求1所述的一种社交网络信息的传播规模预测方法,其特征在于,在步骤1中,对社交网络平台中信息m,提取信息从发布时间到发布后tf时间段的传播数据,从传播数据中获取信息的文本内容C、信息传播的级联图G、传播事件发生的时间间隔序列T,其中,信息的文本内容C包括若干由单词组成的短文本信息,对于信息传播的级联图Gt={Vt,Et},Vt表示截止t时刻已参与信息m传播的用户集合,Et表示截止t时刻用户间的传播关系,对于时间间隔序列T={x0,x1,…xt},xt表示第t次传播事件和第t-1次传播事件的时间间隔。
3.根据权利要求1所述的一种社交网络信息的传播规模预测方法,其特征在于,在步骤2中,采用的句向量模型为Sentence-BERT模型,将信息的文本内容C输入Sentence-BERT模型,生成文本的特征向量hc
4.根据权利要求3所述的一种社交网络信息的传播规模预测方法,其特征在于,在步骤3中,具体包括以下步骤:
步骤301:将时间间隔序列T={x0,x1,…xt}输入LSTM网络模型中,输出时间间隔输入xt的隐藏表示ot,通过如下公式表示:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
ct=ft*ct-1+it*tanh(Wc·[ht-1,xt]+bc)
ot=σ(Wo·[ht-1,xt]+bo)
其中σ表示sigmoid函数,tanh代表双曲正切函数,ft,it,ct,ot分别表示LSTM网络模型中第t个输入对应的遗忘门、输入门、记忆门、输出门,W*,b*是LSTM网络模型中可学习的参数;
步骤302:按照设定的采样间隔进行采样,对LSTM网络模型输出的时间间隔序列的隐藏表示{o1,o2,…omax}进行采样,对采样后的序列通过加权平均和得到时间间隔的特征向量ht,表示为:
Figure FDA0003547401230000021
其中α代表通过模型训练自动生成的输出对应的权重向量。
5.根据权利要求1所述的一种社交网络信息的传播规模预测方法,其特征在于,在所述信息级联图向量表示生成模型中:
在低维向量映射层中,对于信息传播的级联图Gt={Vt,Et}的用户节点,通过one-hot的方式表示为向量qv,将向量qv映射为低维向量表示hv
hv=Eqv
其中E为随机生成的矩阵,E∈RD×M,其中D表示特征维度,M表示用户总数;
在图卷积网络层中,将信息传播的级联图Gt输入图卷积神经网络层,得到邻居聚合向量表示,表示为:
Figure FDA0003547401230000031
其中,
Figure FDA0003547401230000032
为节点v第k次卷积对应的邻居聚合向量表示,其中
Figure FDA0003547401230000033
表示节点v的邻居节点u在第k-1次卷积时的向量表示,聚合函数max表示采用聚合邻居特征值中的最大值进行计算,Wpool、bpool分别为图卷积神经网络中的可学习参数,σ表示sigmoid函数;
拼接节点v的k-1层特征向量
Figure FDA0003547401230000034
和其邻居聚合向量表示
Figure FDA0003547401230000035
通过全连接层生成k层卷积的节点表示
Figure FDA0003547401230000036
Figure FDA0003547401230000037
其中,σ表示sigmoid函数,Concat操作代表向量拼接;
在TOP-K池化层中,计算每个用户节点的重要系数sv
Figure FDA0003547401230000038
其中,p为可学习向量;按照节点重要系数选取一定比例的节点组成节点集合V,节点集合以重要系数作为节点权重并按照最大池化方法生成级联图的特征向量hg
Figure FDA0003547401230000039
6.根据权利要求5所述的一种社交网络信息的传播规模预测方法,其特征在于,步骤5具体包括以下步骤:
步骤501:传播规模预测模型的构建:
以文本的特征向量hc作为信息传播的上下文,将信息文本的特征向量hc和时间间隔的特征向量输入上下文连接层,得到更新的时间间隔的特征向量
Figure FDA0003547401230000041
Figure FDA0003547401230000042
其中,ht为输入的时间间隔的特征向量,hc为输入的信息文本的特征向量,tanh代表双曲正切函数,Wt、bt分别为上下文连接层中的可学习参数,[ht,hc]表示两个向量的拼接操作;
以文本的特征向量hc作为信息传播的上下文,将信息文本的特征向量hc和级联图的特征向量hg输入上下文连接层,得到更新的级联图的特征向量
Figure FDA0003547401230000043
Figure FDA0003547401230000044
其中,hg为输入的级联图的特征向量,hc为输入的信息文本的特征向量,tanh代表双曲正切函数,Wg、bg分别为上下文连接层中的可学习参数;
将更新的时间间隔的向量
Figure FDA0003547401230000045
和更新的信息级联图的特征向量
Figure FDA0003547401230000046
输入上下文连接层,输出融合特征向量hm
Figure FDA0003547401230000047
σ表示sigmoid函数,Wm,bm是上下文连接层中可学习的参数,
将融合特征向量hm输入MLP网络层,输出预测的传播规模:
ΔP=MLP(hm)=σ(Whm+b)
ΔP表示预测的传播规模,σ表示sigmoid函数,W,b是上下文连接层中可学习的参数;步骤502:传播规模预测模型的训练:
信息mi的传播数据生成对应样本
Figure FDA0003547401230000048
其中ΔPi代表截止最终时刻tf参与信息mi传播的用户数与截止观测时间to参与信息传播的用户数差值,
Figure FDA0003547401230000049
Figure FDA00035474012300000410
通过样本训练传播规模预测模型;
通过Adam梯度下降方法求解损失函数最小值,自动化学习传播规模预测模型中的参数,损失函数采用MSLE:
Figure FDA0003547401230000051
其中,loss为损失函数,N是消息的总数,ΔPi是预测的信息规模增量,
Figure FDA0003547401230000052
是真实的信息规模增量,通过样本对传播规模预测模型进行训练迭代,更新模型参数,直至模型收敛,得到训练后的传播规模预测模型;
步骤503:传播规模预测:将需要预测的信息对应的信息文本的特征向量、时间间隔的特征向量、信息级联图的特征向量输入训练后的传播规模预测模型,输出预测的传播规模。
7.一种计算机装置,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如权利要求1所述的社交网络信息的传播规模预测方法。
8.一种计算机可读存储介质,其上存储有程序,其特征在于:所述程序被处理器执行时实现如权利要求1所述的社交网络信息的传播规模预测方法。
CN202110672645.XA 2021-06-17 2021-06-17 一种社交网络信息的传播规模预测方法、装置 Active CN113536144B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110672645.XA CN113536144B (zh) 2021-06-17 2021-06-17 一种社交网络信息的传播规模预测方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110672645.XA CN113536144B (zh) 2021-06-17 2021-06-17 一种社交网络信息的传播规模预测方法、装置

Publications (2)

Publication Number Publication Date
CN113536144A CN113536144A (zh) 2021-10-22
CN113536144B true CN113536144B (zh) 2022-04-19

Family

ID=78125078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110672645.XA Active CN113536144B (zh) 2021-06-17 2021-06-17 一种社交网络信息的传播规模预测方法、装置

Country Status (1)

Country Link
CN (1) CN113536144B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114004709B (zh) * 2021-11-11 2024-04-30 重庆邮电大学 一种信息传播的监测方法、装置及计算机可读存储介质
CN114928548B (zh) * 2022-04-26 2023-07-28 苏州大学 一种社交网络信息传播规模预测方法及装置
CN115080870B (zh) * 2022-07-12 2023-04-07 黑龙江大学 基于Skip-gram的信息传播预测方法
CN115759482A (zh) * 2022-12-29 2023-03-07 人民网股份有限公司 一种社交媒体内容传播预测方法和装置
CN116955846B (zh) * 2023-07-20 2024-04-16 重庆理工大学 融合主题特征和交叉注意力的级联信息传播预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818514A (zh) * 2016-09-12 2018-03-20 腾讯科技(深圳)有限公司 一种控制在线社交网络信息传播的方法、装置及终端

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8473437B2 (en) * 2010-12-17 2013-06-25 Microsoft Corporation Information propagation probability for a social network
CN110336700B (zh) * 2019-07-10 2021-09-14 重庆大学 一种基于时间及用户的转发序列的微博流行度预测方法
CN112199608B (zh) * 2020-11-03 2021-05-28 北京中科研究院 基于网络信息传播图建模的社交媒体谣言检测方法
CN112580878B (zh) * 2020-12-23 2023-10-10 河南广播电视台 一种基于图神经网络的信息流行度预测方法
CN112580879B (zh) * 2020-12-23 2023-10-10 河南广播电视台 一种基于图神经网络的信息流行度预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107818514A (zh) * 2016-09-12 2018-03-20 腾讯科技(深圳)有限公司 一种控制在线社交网络信息传播的方法、装置及终端

Also Published As

Publication number Publication date
CN113536144A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN113536144B (zh) 一种社交网络信息的传播规模预测方法、装置
CN108536679B (zh) 命名实体识别方法、装置、设备及计算机可读存储介质
CN111897941B (zh) 对话生成方法、网络训练方法、装置、存储介质及设备
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
CN113704460B (zh) 一种文本分类方法、装置、电子设备和存储介质
WO2020238353A1 (zh) 数据处理方法和装置、存储介质及电子装置
CN113792937A (zh) 一种基于图神经网络的社交网络影响力预测方法、装置
CN113139134B (zh) 一种社交网络中用户生成内容的流行度预测方法、装置
CN110765269A (zh) 基于动态词向量和层级神经网络的文档级情感分类方法
CN111783903B (zh) 文本处理方法、文本模型的处理方法及装置、计算机设备
Windiatmoko et al. Developing facebook chatbot based on deep learning using rasa framework for university enquiries
Windiatmoko et al. Developing FB chatbot based on deep learning using RASA framework for university enquiries
Li et al. Birds of a feather rumor together? Exploring homogeneity and conversation structure in social media for rumor detection
CN113656563A (zh) 一种神经网络搜索方法及相关设备
CN115878902A (zh) 基于神经网络模型的融媒体平台自动信息关键主题提取系统
CN113158057A (zh) 佛经推荐处理、装置、计算机设备及存储介质
CN112508177A (zh) 一种网络结构搜索方法、装置、电子设备及存储介质
CN117132923A (zh) 视频分类方法、装置、电子设备及存储介质
CN115858899A (zh) 一种基于多标签影响的网络事件标签流行度预测方法
CN112861474B (zh) 一种信息标注方法、装置、设备及计算机可读存储介质
CN114048395A (zh) 基于时间感知与关键信息抽取的用户转发预测方法和系统
WO2021139220A1 (zh) 疫情监控方法、装置、计算机设备和存储介质
CN111177493B (zh) 数据处理方法、装置、服务器和存储介质
CN115705464A (zh) 一种信息的处理方法、装置及设备
Windiatmoko et al. Mi-Botway: A deep learning-based intelligent university enquiries chatbot

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant