CN112712210B - 突发性话题传播规模预测方法、系统、处理终端、介质 - Google Patents
突发性话题传播规模预测方法、系统、处理终端、介质 Download PDFInfo
- Publication number
- CN112712210B CN112712210B CN202011628435.2A CN202011628435A CN112712210B CN 112712210 B CN112712210 B CN 112712210B CN 202011628435 A CN202011628435 A CN 202011628435A CN 112712210 B CN112712210 B CN 112712210B
- Authority
- CN
- China
- Prior art keywords
- user
- influence
- topic
- time
- forwarding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 title claims abstract description 18
- 230000007246 mechanism Effects 0.000 claims abstract description 12
- 230000010365 information processing Effects 0.000 claims abstract description 9
- 230000000295 complement effect Effects 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000001816 cooling Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 230000006399 behavior Effects 0.000 claims description 3
- 238000012217 deletion Methods 0.000 abstract 1
- 230000037430 deletion Effects 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 5
- 208000035473 Communicable disease Diseases 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种突发性话题传播规模预测方法、系统、处理终端、介质,涉及社交网络信息处理技术领域。计算网络中消息总影响力;利用转发量作边构造“0”节点对用户转发关系网络进行补全,根据用户在转发网络的用户影响力排名分配影响力额度;同时基于用户影响力衰减机制,对突发性话题传播规模进行预测。本发明同时考虑消息和用户影响力的时间衰减机制,融合消息转发影响力和用户转发关系网络,利用用户影响力预测突发话题在下一个阶段的传播规模。本发明创新提出融合消息转发影响力和用户转发关系网络的突发性话题传播规模预测系统,该系统提出的方法可操作性强、数据获取便捷,能有效预测实际存在一定用户关系缺失的突发性话题数据规模。
Description
技术领域
本发明涉及社交网络信息处理技术领域,尤其涉及一种突发性话题传播规模预测方法、系统、处理终端、介质。
背景技术
随着人工智能技术和移动互联网的发展,社交网络上传播的信息已经成为人们浏览互联网的重要内容,社交网络信息丰富、表达快捷、渠道多元、传播急速,基于社交网络的突发性话题传播具有传播速率快、传播影响大、传播范围难以控制等特点,由于突发话题的防治组织系统具有复杂性,对社交网络突发性话题传播规模进行预测,对提前进行风险防控、研究社交网络的舆情传播具有极其重要的意义。
突发性话题传播预测一直是公共安全领域关注的热点,目前学术界对此尚未有高度认同和广泛使用的方法,以往对突发性话题传播的预测大都是基于感染过程或者基于传播特征或者基于单条微博的预测,国内外现有对社交媒体话题传播规模的研究中,主要方法有:基于传染病模型的传播规模预测模型、基于传播特征的传播规模预测模型。
基于传染病模型的传播预测将人群对信息的接受状态分为易感者(S)、感染者(I)和免疫者(R)三种状态,感者代表话题中未传播该信息但有可能传播该信息的用户,感染者代表已发布或者转发该信息的用户,免疫者代表不会传播该信息的用户,该方法通过用户之间的状态转换关系建立微分方程预测话题传播规模。
基于传播特征的传播规模预测。这类方法是基于先验知识,人为选定传播特征的范围例如信息发布者、提及用户等,利用回归、分类等方法建立传播特征与转发规模之间的模型,从而预测下阶段的传播规模。
SIRstsvP(s,v)vv通过上述分析,现有技术存在的问题及缺陷为:
(1)基于传染病模型的传播预测只描述了网络中用户对信息的接受状态一级信息传播的动态变化,对社交个体差异及网络拓扑结构等没有考虑,且模型对初值的设置比较敏感,实际应用中模型的准确率不稳定,不适用于突发性话题传播预测的场景。
(2)基于特征变量的传播规模预测严重依赖于人的先验知识,而不同的突发性话题传播特征和机制不一定相同,在实际使用中存在一定局限性。目前存在的根据传播规模划分等级再进行分类的算法,由于等级划分没有明确标准,在实际中较难进行应用。
解决以上问题及缺陷的难度为:
目前对话题传播的方法没有结合信息传播、网络拓扑结构和个体差异,且无法对一定缺失关系数据进行研究。需要对存在一定缺失的网络进行补全,同时要融合信息传播和用户传播网络,考虑用户个体间差异,对突发性话题传播规模进行预测。
解决以上问题及缺陷的意义为:
构造“0”节点对用户转发关系网络进行补全,考虑消息和用户影响力的时间衰减机制,融合消息转发影响力和用户转发关系网络,有助于提高话题传播规模预测准确率;数据要求维度少,只需要采集话题帖子数据,大大减少了数据采集的时间和资源开销,实现实时预测突发话题的传播规模。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供了一种突发性话题传播规模预测方法、系统、处理终端、介质。具体涉及一种基于用户影响力的突发性话题传播规模预测系统及方法,所述技术方案如下:
根据本发明公开实施例的第一方面,提供一种基于用户影响力的突发性话题传播规模预测方法,应用于信息处理终端,所述基于用户影响力的突发性话题传播规模预测方法包括:
利用消息影响力基于牛顿冷却定律的时间衰减机制,计算网络中消息总影响力;
利用转发量作边构造“0”节点对用户转发关系网络进行补全,根据用户转发网络的用户影响力排名分配影响力额度;
基于用户影响力的时间衰减机制,对突发性话题传播规模进行预测。
优选地,所述基于用户影响力的突发性话题传播规模预测方法具体包括:
步骤一,采集话题相关数据并进行预处理;
步骤二,计算预测时间点的消息总影响力;
步骤三,补全用户关系网络并计算用户影响力排名;
步骤四,预测待预测时间点的话题传播规模。
优选地,所述步骤一具体包括:
根据话题相关组合关键词,从在线社交媒体的公共API接口获取话题相关的发帖数据,采集的字段包括:帖子ID、帖子时间、帖子作者ID、帖子作者粉丝数、是否为原帖、被转发次数、来源帖子ID;对爬取的数据字段进行预处理。
所述对爬取的数据字段进行预处理具体包括:
(1)在数据集内匹配转发帖子的来源帖,根据来源帖子ID匹配帖子ID,新增“来源帖子时间”、“来源帖子作者ID”字段;
(2)处理时间字段,按话题预测需要的单位时间维度进行处理。
所述步骤二具体包括:选择基于牛顿冷却定律的时间衰减函数衡量消息转发衰减因子,t时刻新增消息平均对每个粉丝的总影响力为:
其中,M代表t时刻的消息集合,代表消息i在t时刻的一级转发数,FNi代表消息i用户的粉丝数,ti-t′i代表消息i与上一层转发贴的发帖时间差,β为控制消息随时间衰减速率的参数,代表消息影响力的持续时间。对于在数据集中找不到来源的转发贴,ti-t′i用t时段的平均发帖时间差代替。
所述步骤三具体包括:
利用t时刻的话题数据,将转发用户ID作为源节点,来源贴用户ID作为目标节点构建有向图G;对有向图G的最大连通图中存在用户u的入度和小于被采集数据集中实际转发量的情况,构造虚拟节点“0”节点指向,“0”节点指向用户u节点的边的权重,设为关系网络中未采集到用户u的缺失转发量;
在图G上使用PageRank算法得到每个用户的影响力排名。PageRank值代表每个用户的排名,t时刻转发网络中所有用户的PageRank值加和为1,根据用户的PageRank值分配网络中的消息总影响力,从而得到用户的影响力。
所述步骤四具体包括:
PageRanktPageRankPageRank网络行为中集体层次上的等待时间在统计意义上服从幂律分布,即转发用户消息的粉丝数量会随着时间逐渐衰减,呈现幂律分布,得到t+1时刻新增的话题传播规模:
其中,U代表t时刻的发帖用户集合,PRu为用户u的PageRank值,T为预测时间点与t+1时刻的时间差,α为用户影响力的衰减速率控制参数,FNu为用户u的粉丝数,则t+1时刻话题的规模为:
根据本发明公开实施例的第二方面,提供一种基于用户影响力的突发性话题传播规模预测系统,应用于信息处理终端,所述基于用户影响力的突发性话题传播规模预测系统包括:
数据采集及数据处理模块,用于采集话题相关数据并进行处理;
消息转发影响力计算模块,用于计算预测时间点的消息总影响力;
转发用户关系网络构建模块,用于补全用户关系网络并计算用户影响力排名;
话题传播规模预测模块,用于预测待预测时间点的话题传播规模。
根据本发明公开实施例的第三方面,提供一种社交网络信息处理终端,其特征在于,所述社交网络信息处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的基于用户影响力的突发性话题传播规模预测方法。
根据本发明公开实施例的第四方面,提供一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行所述的基于用户影响力的突发性话题传播规模预测方法,包括下列步骤:
采集话题相关数据并进行处理;
计算预测时间点的消息总影响力;
补全用户关系网络并计算用户影响力排名;
预测待预测时间点的话题传播规模。
本发明公开的实施例提供的技术方案可以包括以下有益效果:
1、本发明基于消息和用户影响力的时间衰减机制,融合消息转发影响力和用户转发关系网络,综合考虑了信息传播、网络拓扑结构和个体差异对传播规模的影响,对社交网络中突发性话题传播规模预测更加准确。
2、本发明考虑了对用户转发关系存在一定缺失的数据集的处理,通过构造“0”节点补全用户转发关系网络,以最小信息损失得到转发关系网络的不同用户的个体影响力差异,提高了方法的适用范围。
3、本发明提出的方法要求的数据维度较少,只需要采集话题帖子数据,不需要用户间的好友关系和历史发帖等,大大减少了数据采集的时间和资源开销,且方法计算速度快,可实现实时预测突发话题的传播规模。
4、可以应用于社交网络广告的推广,有助于掌握最终的传播规模,及时调整策略,也可以使监管部门更准确快速地掌握威胁公共安全的突发事件传播,提前加以引导和管控。
结合实验或试验数据和现有技术对比得到的效果和优点包括:
应用该方法在Twitter两个公共安全领域突发话题上有良好的预测效果,本发明方法的话题规模预测方法较基于SIR的传播规模预测均方根误差均减少了.
当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明实施例提供的基于用户影响力的突发性话题传播规模预测方法流程图。
图2是本发明实施例提供的基于用户影响力的突发性话题传播规模预测原理图。
图3是本发明实施例提供的基于用户影响力的突发性话题传播规模预测系统示意图。
图3中:1、数据采集及数据处理模块;2、消息转发影响力计算模块;3、转发用户关系网络构建模块;4、话题传播规模预测模块。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
如图1所示,本发明实施例提供的基于用户影响力的突发性话题传播规模预测方法包括:
S101,利用消息影响力基于牛顿冷却定律的时间衰减机制,计算网络中消息总影响力;
S102,利用转发量作边构造“0”节点对用户转发关系网络进行补全,根据用户转发网络的用户影响力排名分配影响力额度;
S103,基于用户影响力的时间衰减机制,对突发性话题传播规模进行预测。
本发明可在基于传染病模型(SIR)的话题传播模型和基于图结构演变的消息传播规模预测上应用。
图2中,A、B、C、D代表用户,用户间的箭头代表用户与用户之间的转发关系。代表由用户A发出的消息x1,Nt-1代表t-1时刻消息的规模数量,/>代表用户A发出的消息x1在t-1时刻的消息影响力。在t时刻,用户A发出的消息x1新增了1次转发,传播到了用户F;同时用户B新发了一条消息x2产生了5次转发,但数据集中只采集到3次用户转发关系,构造“0”节点用户补全关系网络,利用PageRank算法计算用户转发关系网络的用户重要度,根据用户重要度分配当前时段消息影响力作为用户影响力,从而预测下一阶段话题传播规模。
如图3所示,本发明公开实施例所提供的基于用户影响力的突发性话题传播规模预测系统,属于社交网络分析领域,具体包括:
数据采集及数据处理模块1,用于采集话题相关数据并进行预处理;
消息转发影响力计算模块2,用于计算预测时间点的消息总影响力;
转发用户关系网络构建模块3,用于补全用户关系网络并计算用户影响力排名;
话题传播规模预测模块4,用于预测待预测时间点的话题传播规模。
其中系统中使用的突发性话题传播规模预测方法,基于消息和用户影响力的时间衰减机制,通过融合消息传播影响力和用户传播关系网络计算用户影响力,从而实现对突发性话题传播规模预测。
所述数据采集及数据处理模块1。根据话题相关组合关键词,从在线社交媒体的公共API接口获取话题相关的发帖数据,采集的字段必须包括:帖子ID、帖子时间、帖子作者ID、帖子作者粉丝数、是否为原帖、被转发次数、来源帖子ID。对爬取的数据字段进行预处理,具体包括:(1)在数据集内匹配转发帖子的来源帖,根据来源帖子ID匹配帖子ID,新增“来源帖子时间”、“来源帖子作者ID”字段。(2)处理时间字段,按话题预测需要的单位时间维度进行处理。例如,话题预测的单位时间为天,则时间字段应处理成天维度。
所述消息转发影响力计算模块2。历史转发的影响力会随着时间衰减,由于突发性话题存在时效性强、短时间内关注度高、受关注度会迅速衰减的特点,选择基于牛顿冷却定律的时间衰减函数衡量消息转发衰减因子,因此,t时刻新增消息平均对每个粉丝的总影响力为:
其中,M代表t时刻的消息集合,代表消息i在t时刻的一级转发数,FNi代表消息i用户的粉丝数,ti-t′i代表消息i与上一层转发贴的发帖时间差,β为控制消息随时间衰减速率的参数,代表消息影响力的持续时间。对于在数据集中找不到来源的转发贴,ti-t′i用t时段的平均发帖时间差代替。
所述转发用户关系网络构建模块3。此模块的主要功能是构建转发用户关系网络并计算转发关系网络中的用户影响力排名。由于PageRank算法是按入度的数量和连入节点的重要性计算排名,实际计算过程中,利用t时刻的话题数据,将转发用户ID作为源节点,来源贴用户ID作为目标节点构建有向图G。对有向图G最大连通图中存在用户u的入度和小于被采集数据集中实际转发量的情况,构造虚拟节点“0”节点指向,“0”节点指向用户u节点的边的权重,设为关系网络中未采集到用户u的缺失转发量。在图G上使用PageRank算法得到每个用户的影响力排名,由于“0”节点没有入度,它所分配到的影响力会非常小,同时因为“0”节点补全了用户转发网络的数量关系,能以最小信息损失得到转发关系网络的用户影响力排名。
所述话题传播规模预测模块4,用于预测话题传播的规模。一方面,PageRank值代表每个用户的排名。而t时刻转发网络中所有用户的PageRank值加和为1,因此可以根据用户的PageRank值分配网络中的消息总影响力,从而得到用户的影响力。另一方面,用户对粉丝的传播影响力会随时间减小,网络行为中集体层次上的等待时间在统计意义上服从幂律分布,可以认为在某个时间段内若某粉丝没有转发关注用户的该条消息,大概率以后也不会转发,于是得到t+1时刻新增的话题传播规模:
其中,U代表t时刻的发帖用户集合,PRu为用户u的PageRank值,T为预测时间点与t+1时刻的时间差,α为用户影响力的衰减速率控制参数,FNu为用户u的粉丝数,则t+1时刻话题的规模为:
下面结合仿真结果对本发明的技术方案作进一步描述。
本发明方法的RMSE | 基于SIR传播预测方法的RMSE | |
突发话题A | 231.6254 | 1701.3365 |
突发话题B | 2937.7938 | 9187.0727 |
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。
Claims (6)
1.一种基于用户影响力的突发性话题传播规模预测方法,其特征在于,应用于信息处理终端,所述基于用户影响力的突发性话题传播规模预测方法包括:
利用消息影响力基于牛顿冷却定律的时间衰减机制,计算网络中消息总影响力;
利用转发量作边构造“0”节点对用户转发关系网络进行补全,根据用户转发网络的用户影响力排名分配影响力额度;
基于用户影响力的时间衰减机制,对突发性话题传播规模进行预测;
所述基于用户影响力的突发性话题传播规模预测方法具体包括:
步骤一,采集话题相关数据并进行预处理;
步骤二,计算预测时间点的消息总影响力;
步骤三,补全用户关系网络并计算用户影响力排名;
步骤四,预测待预测时间点的话题传播规模;
所述步骤二具体包括:选择基于牛顿冷却定律的时间衰减函数衡量消息转发衰减因子,t时刻新增消息平均对每个粉丝的总影响力为:
其中,M代表t时刻的消息集合,代表消息i在t时刻的一级转发数,FNi代表消息i用户的粉丝数,ti-t'i代表消息i与上一层转发贴的发帖时间差,β为控制消息随时间衰减速率的参数,代表消息影响力的持续时间;对于在数据集中找不到来源的转发贴,ti-t'i用t时段的平均发帖时间差代替;
所述步骤三具体包括:
利用t时刻的话题数据,将转发用户ID作为源节点,来源贴用户ID作为目标节点构建有向图G;对有向图G的最大连通图中存在用户u的入度和小于被采集数据集中实际转发量的情况,构造虚拟节点“0”节点指向,“0”节点指向用户u节点的边的权重,设为关系网络中未采集到用户u的缺失转发量;
在图G上使用PageRank算法得到每个用户的影响力排名;PageRank值代表每个用户的排名,t时刻转发网络中所有用户的PageRank值加和为1,根据用户的PageRank值分配网络中的消息总影响力,从而得到用户的影响力。
2.如权利要求1所述的基于用户影响力的突发性话题传播规模预测方法,其特征在于,所述步骤一具体包括:
根据话题相关组合关键词,从在线社交媒体的公共API接口获取话题相关的发帖数据,采集的字段包括:帖子ID、帖子时间、帖子作者ID、帖子作者粉丝数、是否为原帖、被转发次数、来源帖子ID;对爬取的数据字段进行预处理。
3.如权利要求2所述的基于用户影响力的突发性话题传播规模预测方法,其特征在于,所述对爬取的数据字段进行预处理具体包括:
(1)在数据集内匹配转发帖子的来源帖,根据来源帖子ID匹配帖子ID,新增“来源帖子时间”、“来源帖子作者ID”字段;
(2)处理时间字段,按话题预测需要的单位时间维度进行处理。
4.如权利要求1所述的基于用户影响力的突发性话题传播规模预测方法,其特征在于,所述步骤四具体包括:
网络行为中集体层次上的等待时间在统计意义上服从幂律分布,即转发用户消息的粉丝数量会随着时间逐渐衰减,呈现幂律分布,得到t+1时刻新增的话题传播规模:
其中,U代表t时刻的发帖用户集合,PRu为用户u的PageRank值,T为预测时间点与t+1时刻的时间差,α为用户影响力的衰减速率控制参数,FNu为用户u的粉丝数,则t+1时刻话题的规模为:
5.一种社交网络信息处理终端,其特征在于,所述社交网络信息处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~4任意一项所述的基于用户影响力的突发性话题传播规模预测方法。
6.一种计算机可读存储介质,所存储的计算机程序使电子设备执行权利要求1~4任意一项所述的基于用户影响力的突发性话题传播规模预测方法,其特征在于,该基于用户影响力的突发性话题传播规模预测方法包括下列步骤:
采集话题相关数据并进行预处理;
计算预测时间点的消息总影响力;
补全用户关系网络并计算用户影响力排名;
预测待预测时间点的话题传播规模。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011628435.2A CN112712210B (zh) | 2020-12-30 | 2020-12-30 | 突发性话题传播规模预测方法、系统、处理终端、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011628435.2A CN112712210B (zh) | 2020-12-30 | 2020-12-30 | 突发性话题传播规模预测方法、系统、处理终端、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112712210A CN112712210A (zh) | 2021-04-27 |
CN112712210B true CN112712210B (zh) | 2023-07-25 |
Family
ID=75547718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011628435.2A Active CN112712210B (zh) | 2020-12-30 | 2020-12-30 | 突发性话题传播规模预测方法、系统、处理终端、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712210B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592058B (zh) * | 2021-07-05 | 2024-03-12 | 西安邮电大学 | 一种定量预测微博转发广度与深度的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682770A (zh) * | 2016-12-14 | 2017-05-17 | 重庆邮电大学 | 一种基于好友圈子的动态微博转发行为预测系统及方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156030A (zh) * | 2014-09-18 | 2016-11-23 | 华为技术有限公司 | 社交网络中预测信息传播的方法及设备 |
CN109829114B (zh) * | 2019-02-14 | 2023-05-26 | 重庆邮电大学 | 一种基于用户行为的话题流行度预测系统及方法 |
CN110995485B (zh) * | 2019-12-02 | 2022-03-04 | 黑龙江大学 | 一种无拓扑结构的社交消息传播范围预测方法 |
-
2020
- 2020-12-30 CN CN202011628435.2A patent/CN112712210B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682770A (zh) * | 2016-12-14 | 2017-05-17 | 重庆邮电大学 | 一种基于好友圈子的动态微博转发行为预测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112712210A (zh) | 2021-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102121360B1 (ko) | 사용자 신용 점수를 최적화하기 위한 방법 및 장치 | |
Alvisi et al. | Segment identification in water distribution systems | |
CN106651030B (zh) | 一种改进的rbf神经网络热点话题用户参与行为预测方法 | |
WO2019134274A1 (zh) | 兴趣探索方法、存储介质、电子设备及系统 | |
Rubinovitch | The slow server problem: a queue with stalling | |
CN107103100A (zh) | 一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法 | |
CN110297984B (zh) | 基于微博的信息传播动力系统、构建方法、装置及介质 | |
CN112712210B (zh) | 突发性话题传播规模预测方法、系统、处理终端、介质 | |
Xie et al. | Group decision-making in an unconventional emergency situation using agile Delphi approach | |
Mohammad Nezhad et al. | An artificial neural network meta-model for constrained simulation optimization | |
CN102982236B (zh) | 一种通过网络用户建模的观点预测方法 | |
Dashtbali et al. | Optimal control and differential game solutions for social distancing in response to epidemics of infectious diseases on networks | |
Zhang et al. | Analysing rumours spreading considering self-purification mechanism | |
Li et al. | CAAS: a novel collective action-based ant system algorithm for solving TSP problem | |
Yao et al. | Fast controlling of rumors with limited cost in social networks | |
CN115865708B (zh) | 一种基于sir-d模型的复杂社交网络信息处置方法 | |
Xiao et al. | On necessary conditions for scale-freedom in complex networks, with applications to computer communication systems | |
CN110825972B (zh) | 一种基于领域差异化的热点话题关键用户发现方法 | |
CN110084395A (zh) | 网络舆情演化结果的预测方法、装置、服务器及存储介质 | |
CN112396151B (zh) | 谣言事件的分析方法、装置、设备及计算机可读存储介质 | |
CN110215703A (zh) | 游戏应用的选择方法、装置及系统 | |
Hou et al. | Research of micro-blog diffusion effect based on analysis of retweet behavior | |
CN115471036A (zh) | 一种热点事件的群体情绪分析方法、存储介质及设备 | |
Indrawan et al. | Using Bayesian Networks as Retrieval Engines. | |
Zhu et al. | Information spreading in social network through explosive percolation theory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |