CN117764262A - 一种社会媒体网络话题热度评估方法 - Google Patents
一种社会媒体网络话题热度评估方法 Download PDFInfo
- Publication number
- CN117764262A CN117764262A CN202311386159.7A CN202311386159A CN117764262A CN 117764262 A CN117764262 A CN 117764262A CN 202311386159 A CN202311386159 A CN 202311386159A CN 117764262 A CN117764262 A CN 117764262A
- Authority
- CN
- China
- Prior art keywords
- topic
- time
- topics
- articles
- heat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000002688 persistence Effects 0.000 claims abstract description 21
- 230000000694 effects Effects 0.000 claims abstract description 16
- 238000013210 evaluation model Methods 0.000 claims abstract description 9
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000012552 review Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 17
- 238000011156 evaluation Methods 0.000 description 14
- 238000011161 development Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000233805 Phoenix Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种社会媒体网络话题热度评估方法,包括:S1,获得用户粘性;S2,获得该话题活跃度;S3,获得该话题的持久性;S4,获得该话题的话题新鲜度;S5,获得该话题的媒体关注度;S6,根据该话题的用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度和话题热度衰退比例获得该话题的热度和影响力效能评估模型——能量值模型。本发明综合用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度及话题热度衰退比例,构建更加全面合理的舆论影响力效能评估模型,对社会媒体平台中的网络话题的热度进行较好地评估。同时可以准确发现人们所关注的话题,并进行热点话题的筛选。
Description
技术领域
本发明涉及原始话题数据集的获取和话题热度的评估技术领域,具体涉及一种社会媒体网络话题热度评估方法。
背景技术
由于信息技术的高速发展和互联网的普及,人们获取信息的主要方式逐渐发生了改变。社会媒体是当今社会中最重要的信息传播平台之一,它可以反映出公众的关注点和价值取向。网络话题是社会媒体上的一种特殊的信息形式,它通常由一个或多个关键词组成,能够引发网民的讨论和互动。网络话题的热度评估是对网络话题在社会媒体上的影响力和传播范围进行量化和分析的过程,它可以帮助我们了解网络话题的形成机制、传播规律和社会效应。对于媒体和网站管理者而言,通过对社会媒体网络话题热度的评估,可以有效地了解互联网中热点新闻的迁移、互联网用户行为习惯变化以及互联网的舆论导向,便于媒体根据读者喜好和热点风向发布新闻报道,引导和控制网络中舆论的发展。同时便于网站管理者根据舆论导向,对网络内容进行人为干预和管理。对于用户而言,通过对社会媒体网络话题热度的评估,可以更方便快捷地获取最多最全面的内容,帮助用户更准确、更迅速地了解一个事件的来龙去脉、整个发展过程以及各方各面对该事件的理解和看法。对于政府和企业而言,通过对社会媒体网络话题热度的评估,可以及时掌握社会民意、群众观点和市场动态,从而及时调整公共政策和营销策略,增强与公众的沟通和信任,有效提升政府和企业的形象及声誉。因此,研究社会媒体网络话题热度评估方法很有必要。
传统的影响力评估方法主要采用TF-PDF热度评估算法,该算法考虑了媒体对话题关注的影响,但仅仅只有这一影响因素不够全面。尽管在后来的一些评估算法中,对热度评估的方法进行了改进,体现在将用户对话题的关注程度也考虑在内,但是这并不适用于全部领域。
发明内容
本发明旨在提供一种社会媒体网络话题热度评估方法,用于解决以上问题。
本发明的技术方案是:一种社会媒体网络话题热度评估方法,包括:
步骤S1,根据话题的转发数、评论数和点赞数,分析用户行为数据,获得用户粘性;
步骤S2,根据与话题相关的文章数量占所有话题文章的比例,及其在单位时间内的产生的文章数量,获得话题活跃度;
步骤S3,将讨论时间分为单元,根据话题在固定时间内被讨论的单元总数,获得话题持久性;
步骤S4,根据当前时间与话题在社交媒体平台首次发布时间的时间单元差,获得话题新鲜度;
步骤S5,根据话题在媒体上的报道频率,获得媒体关注度;
步骤S6,根据话题的用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度和话题热度衰退比例获得该话题的热度和影响力效能评估模型,即能量值模型。
优选地,S1根据话题的在某段时间的点赞数、转发数和评论数,获得用户粘性:
构建能量值函数为:
式(1)中,j表示话题,Aj,Bj,Cj分别表示话题j在某段时间内的点赞数、转发数和评论数,A,B,C分别为所有话题在该段时间内的点赞数、转发数、评论数,e是自然常数。
优选地,S2根据话题相关的文章数量占所有话题文章的比例,及其在单位时间内的产生的文章数量,获得话题活跃度,包括:
通过话题的相关文章数占所有话题文章的比例及其在单位时间内产生的文章数量来量化能量值,能量值函数为:
其中,Dj表示话题的相关文章数,D表示所有话题的全部文章数,T表示话题持久时间,即话题最后被讨论时间与最初被讨论时间的间隔,与时间片同单位。
优选地,S3将讨论时间分为单元,根据话题在固定时间内被讨论的单元总数,获得话题持久性,包括:
构建能量值函数为:
式中,ne表示话题被报道和讨论的时间单元数,以天为单位,若天数不为0且小时数不足12时,则不足12时的部分按1天计算,n表示整个时间段被切分的时间单元总数。
优选地,S4根据当前时间与话题在社交媒体平台首次发布时间的时间单元差,获得话题的话题新鲜度,包括:
构建能量值函数:
E(话题新鲜度)=(Δt(j)+1)-k(4)
式中,Δt(j)是当前时间与话题首次发布时间的时间单元数差,以天为单位;k为衰退速度,通过对话题的评论数来衡量衰退速度,即当评论数越来越少时,说明话题的热度衰退的越来越多。
优选地,S5根据话题在权威媒体上的报道频率,获得媒体关注度,包括:
构建能量值函数:
式中,ε=0.5,为针对该话题报道数与总报道数的比值,k为衰退速度。
优选地,S6根据该话题的用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度和话题热度衰退比例获得话题的热度和影响力效能评估模型,即能量值模型,包括:
用衰退函数定义话题热度的自然衰退:
D衰退(t)=e-kt(t≥0)(6)
式中,k为衰退速度,e是自然常数,t是时间;
定义用户关注量为I,则有:
其中,Cj表示话题j在某段时间内的评论数,C为所有话题在该段时间内的评论数;
由于用户关注量越大时,说明感兴趣的用户越多,则衰减速度k就会越小,因此k需要满足以下两点:
(1)k是关于I的减函数;
(2)0<k<1
因此,令
则热度衰退比例函数为:
将话题时间间隔设为1天,那么话题j在第d天结束后的热度能量值为E(d),其表示话题j产生的从第1天到第d-1天积累的能量值衰减到第d天的能量值与第d天的能量值之和;
则有:
式中:
Aj:话题j的全部点赞数,A:所有话题的全部点赞数;
Bj:话题j的全部转发数,B:所有话题的全部转发数;
Cj:话题j的全部评论数,C:所有话题的全部评论数;
Dj:话题的相关文章数,D:所有话题的全部文章数;
T:话题持久性,即话题最后被讨论时间与最初被讨论时间的间隔,与时间片同单位;
ne:话题被报道和讨论的时间单元数;
n:整个时间段被切分的时间单元总数;
Δt(j):当前时间与话题首次发布时间的时间单元数差;
ε=0.5。
本发明的有益效果在于:
本发明综合用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度及话题热度衰退比例,构建出一个全面合理的舆论影响力效能评估模型,从而对社会媒体平台中的网络话题的热度进行较好地评估。同时可以准确发现人们所关注和热议的话题,并进行热点话题的筛选,因此可以对网络话题在社会媒体上的影响力和传播范围进行量化和分析,达到对网络内容进行监察的目的。
附图说明
图1为本发明实施例提供的一种社会媒体网络话题热度评估方法流程图;
图2为本发明实施例提供的一种社会媒体网络话题热度评估方法算法流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好的理解本发明并能予以实施,本发明的实施方式不限于此。
本发明针对社会媒体网络话题,提出了一种综合用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度及话题热度衰退比例的热度评估方法,并构建出一个更加全面合理的舆论影响力效能评估模型。该方法和模型用于解决如下问题:人们不可能浏览阅读所有话题,但互联网上确实在每时每刻产生众多的话题,用户们首先希望看到的就是公众关注度较高、更有报道意义的话题,本发明提出的方法和模型,通过在多个维度层面进行分析,并将其量化为不同的指标并构建该指标层面的能量值函数,最终用话题的总能量值得分给每一个话题进行排序,则得分越高的话题就越是目前公众正在密切关注的热点话题。首先,评估话题被关注程度的最直接指标就是用户们对有关该话题文章的点赞数、转发数和评论数,通过用户的行为数据,可以得到该话题的用户粘性。用户们对该话题的文章的点赞数、转发数和评论数越多,说明该话题的用户粘性越高,则该话题就越可能是热点话题。如果一个话题在短时间内产生了大量的文章和报道,并且与该话题相关的文章数量在全部文章数量中的比例持续上升,说明该话题的活跃度上升,当前时间活跃度越高的话题,其热度也就会较大,因此,话题的活跃度也是评估话题热度的指标之一。用户们对于某个话题讨论和关注的时间越长,说明公众对于该话题的兴趣程度越大,也能反映该话题的热度。此外,某些话题有时不会每天都被讨论,可能会出现节点性,则把讨论时间划分为单元,将话题被讨论的时间单元总数作为衡量话题热度的指标。用户们对话题讨论的时间越长,对热度的贡献值也就越大。话题新鲜度指的是一个话题或事件出现的时间是否较为接近当前时刻,即该话题或事件是否是最近一段时间内引起公众关注的。话题新鲜度越高,代表着该话题可能比较具有时效性和新鲜感,引起人们的关注程度会更高。热点话题是具有生命周期的,都会经历从“产生”到“消亡”的过程。随着时间的推移,旧话题会逐渐被新话题代替新话题逐渐产生,因此,如果话题距离当前时刻越远,说明话题越陈旧,那么对用户的影响就越小,其热度值也会越小。与之相反的是,越新的话题会有越高的活跃度和相关文章数,能够吸引用户,可能成为热点话题。对热度评估来说,媒体关注度具有重要的影响。媒体关注度可以直接反映一个事件或话题的社会影响力和受关注程度。媒体报道可以扩大事件或话题的传播范围、增加曝光率,进而引起更多人的讨论和参与,从而提高热度值。热点话题是具有生命周期的,都会经历从“产生”到“消亡”的过程。话题热度通常只会持续一段时间,尤其是针对某些具体事件和时事问题。当过了一段时间后,人们关注的焦点很快会转移到下一个事件或话题,这种热度衰减的现象也会对热度评估造成一定的影响。
用户粘性中的用户是指使用网络社会媒体的用户,用户的参与度是指用户对某个话题的浏览,点赞,评论,转发等行为,这些用户的参与程度可以反映出话题在公众中的受欢迎程度、传播速度、传播范围和影响程度。如果用户喜欢某个话题,他们可能会通过点赞来支持和表达情感。尤其是在争议性话题上,点赞数作为衡量热度的指标很重要。可以看出大多数用户是支持还是反对话题。评论数也是测量话题热度的一个有用的参数。这表示用户更愿意花时间参与讨论和提出观点,并且拥有较大的话语权。当用户感兴趣的内容被分享到他们的个人主页和关注者中时,它就更可能传播和吸引更多的人参与讨论。因此,对于一个热点话题,它的转发数可以反映出社交媒体上的参与度和流行度。参与的人数是度量话题热度的强有力的指标。如果一个热门话题能够吸引大量的用户来分享、评论和点赞,那么它的影响力就会更加明显。
微博热度影响力评估中的话题活跃度是指在特定时间段内,关于一个话题的讨论规模和广度的衡量。通常来说,一个话题的活跃度越高,就代表着这个话题在社交媒体上引起了更多人的关注和讨论。如果与某话题相关的文章数量占总文章数量越多,则说明该话题的影响力更大。当一个话题在短时间内产生了大量相关文章,而另一个话题只产生了几篇文章时,前者比后者更加热门。当一个话题产生的文章数量很多,但分布在相当长的时间段内,则平均到单元时间上的文章数量很少,此话题的热度较产生大量文章数量的其他话题较低。通过对话题活跃度的监测和分析,可以更好地了解用户的舆情态势和需求,从而为品牌营销、舆情管理等领域提供参考依据。因此根据某个该话题相关的文章数量占所有话题文章的比例,及其在单位时间内的产生的文章数量,获得该话题活跃度。
话题热度评估中的话题持久性指的是某一话题持续受到关注和讨论的时间长度。话题的持久性也是衡量该话题热度的重要指标。话题的持久性指的是从话题开始被广泛传播到用户对其关注开始减少的这段时间。一个话题被用户讨论和关注的时间越长,说明用户对该话题越感兴趣。此外,某些话题有时不会每天都被讨论,可能会出现节点性。因此,将讨论时间分为单元,话题所占据的时间单元总数该话题的持久性。单元数越多,对于热度值的贡献就越大,也可能会吸引更多的用户参与进来。通常来说,如果一个话题能够持续受到用户的讨论和分享,那么它的热度评估就会更高。相反,如果一个话题很快就被用户遗忘,那么它的热度评估就会较低。因此,话题持久性是衡量某一话题热度的一个重要因素之一。
话题热度影响力评估中的话题新鲜度指的是一个话题或事件是否是最近一段时间内引起公众关注的。话题新鲜度越高,代表着该话题可能比较具有时效性和新鲜感,引起人们的关注程度会更高。话题在他们的生命周期中会经历产生,发展,顶点,衰退和消亡的过程。当时间流逝时,旧话题会逐渐被新话题所代替,这些旧话题的相关文章数量会变少,而新话题的数量则会增加。随着旧话题淡出人们的记忆,大众更关注新话题的发展。因此,如果话题距离当前时刻越远,那么对用户的影响就越小,其热度值也会越小。与之相反的是,越新的话题会有越高的活跃度和相关文章数,能够吸引用户,可能成为热门话题。
话题热度评估中的“媒体关注度”指的是某一话题或事件在权威媒体(如新闻媒体)上的曝光程度和报道频率。对热度评估来说,媒体关注度具有重要的影响。媒体关注度可以直接反映一个事件或话题的社会影响力和受关注程度。媒体报道可以扩大事件或话题的传播范围、增加曝光率,进而引起更多人的讨论和参与,从而提高热度值。
媒体关注度中的媒体指各种主流媒体,如新浪,新华网,凤凰网,人民日报等等,随着信息时代的高速发展,人们了解信息的方式也从原先的书信报纸,到现在的电视电脑手机,粉丝数量较大的up主、较大的新闻报道网站所发布的东西一般热度都会比较高,并且各个之间也都可以互相转载,并不一定都是原创,普通用户对这些up主发布的东西关注度都会普遍偏高,热度也就会更高。
微博等网络社会媒体上,话题热度通常只会持续一段时间,尤其是针对某些具体事件和时事问题。当过了一段时间后,人们关注的焦点很快会转移到下一个事件或话题。这种热度衰减的现象会对热度评估造成一定的影响。如果没有考虑到话题的时效性,可能导致评估结果偏差较大。因此,在话题热度评估中,需要考虑话题的时效性,及时更新相关算法模型,以更精确地评估话题的热度和影响力。
实施例1
如图1和图2所示,是本发明的流程图和算法流程图。
本发明基于现下主流社交网络媒体平台——微博平台开展方法研究,以下内容针对本发明提供一个实施例,用于显示对本方法的验证。
一、数据采集
该实验采用的数据集来源于从微博各大网站博主下爬取的话题,获取的是微博上2023年4月4日至4月11日这七天内的三个话题的所有相关文本。数据爬取的数据为方法研究所需要的维度,分别有话题的点赞,评论,转发数量,发布来源,作者等等,共计一万多条数据。这三个话题分别是“话题1”,“话题2”和“话题3”。相关数据存储在MySQL数据库中。数据库中的数据格式如图2所示。
二、实验过程
1.计算用户粘性
依据算法描述a中的说明,在采集到数据集后,将每个话题的相关文章作为一个聚类,计算每个话题的全部点赞数、转发数和评论数,得到用户粘性的能量值函数。
2.计算话题活跃度
依据算法描述b中的说明,通过话题的相关文章数占所有话题文章的比例以及单位时间内的文章数来量化能量值,得到话题活跃度的能量值函数。
3.计算话题的持久性
依据算法描述c中的说明,将讨论时间分为单元,根据话题在固定时间内被讨论和被报道的时间单元总数,得到话题的持久性的能量值函数;
4.计算话题的新鲜度
依据算法描述d中的说明,根据当前时间与该话题在社交媒体平台首次发布时间的时间单元差,获得该话题的话题新鲜度的能量值函数。
5.计算话题的媒体关注度
依据算法描述e中的说明,根据该社会话题在权威媒体(如新闻媒体)上的报道频率,即对该话题所报道文章的数量与所有话题的文章数量的比值,获得该话题的媒体关注度的能量值函数;
6.计算基于热度衰退比例函数的话题总热度值
依据算法描述f中的说明,一个话题在某个时刻的热度会受到其他时刻对于当前时刻的影响,越接近于此时刻的影响越大,因此话题的热度有一个自然而然的衰退性的现象,根据用户关注量,计算话题热度的衰退比例函数;
最后,计算该话题的总能量值,得到该话题的当前热度。
以话题1为例,统计的点赞数、转发数、评论数、话题文章数、话题发布时间如表1所示。
表1原始话题数据信息统计
三、实验结果及分析
该算法模型的效果如表2所示。表2列出了采集的三个话题的话题名称、通过算法模型得到的话题热度大小,以及在七天内热度的变化。
表2算法模型的结果
话题 | 第一天 | 第二天 | 第三天 | 第四天 | 第五天 | 第六天 | 第七天 |
话题1 | 13.10 | 10.79 | 9.35 | 8.36 | 7.63 | 7.07 | 6.61 |
话题2 | 3.22 | 2.63 | 2.28 | 2.04 | 1.86 | 1.72 | 1.61 |
话题3 | 38.10 | 55.73 | 54.47 | 50.34 | 46.38 | 43.06 | 40.31 |
由于本发明提出的话题热度评估主要是综合用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度及话题热度衰退比例这几个维度对话题的热度进行评估的。本发明中所实施例中涉及到三个话题,随着时间的持续,话题1和话题2热度出现了下降的趋势,并且热度值较低,说明这两个话题的处在慢慢不被人们所关注的阶段,话题3的热度在前三天属于上升趋势,并且热度值较高,说明话题3在当时处于舆论发酵的阶段,是公众正在密切关注和讨论的话题。三个话题都符合当时时刻所处的话题热度现实状态和趋势,说明本发明中的方法和模型准确评估出了网络话题的热度变化,因此从各话题的全部数据及方法和模型结果来看,本发明提出的热度评估模型和方法有一定的有效性和准确性。
综上所述,本发明提供的一种社会媒体网络话题热度评估方法,包括:针对社交网络中的社会话题,根据某个社会话题的转发数、评论数和点赞数,分析用户行为数据,获得用户粘性;根据与该话题相关的文章数量占所有话题文章的比例,及其在单位时间内的产生的文章数量,获得该话题活跃度;将讨论时间分为单元,根据该话题在固定时间内被讨论的单元总数,获得该话题的持久性;根据当前时间与该话题在社交媒体平台首次发布时间的时间单元差,获得该话题的新鲜度;根据该社会话题在权威媒体(如新闻媒体)上的报道频率,获得该话题的媒体关注度;根据针对该话题的以上特征指标和该话题的热度衰退比例,获得该话题的热度以及影响力效能分析模型——能量值模型。本方法综合用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度及话题热度衰退比例,可以构建出一个更加全面合理的舆论影响力效能评估模型,从而对社会媒体平台中的网络话题的热度进行较好地评估。同时可以准确发现人们所关注和热议的话题,并进行热点话题的筛选,因此可以对网络话题在社会媒体上的影响力和传播范围进行量化和分析,达到对网络内容进行监察的目的。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的流程并不一定是实施本发明所必须的。
Claims (7)
1.一种社会媒体网络话题热度评估方法,其特征在于,包括:
步骤S1,根据话题的转发数、评论数和点赞数,分析用户行为数据,获得用户粘性;
步骤S2,根据与话题相关的文章数量占所有话题文章的比例,及其在单位时间内的产生的文章数量,获得话题活跃度;
步骤S3,将讨论时间分为单元,根据话题在固定时间内被讨论的单元总数,获得话题持久性;
步骤S4,根据当前时间与话题在社交媒体平台首次发布时间的时间单元差,获得话题新鲜度;
步骤S5,根据话题在媒体上的报道频率,获得媒体关注度;
步骤S6,根据话题的用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度和话题热度衰退比例获得该话题的热度和影响力效能评估模型,即能量值模型。
2.根据权利要求1所述的一种社会媒体网络话题热度评估方法,其特征在于,S1根据话题的在某段时间的点赞数、转发数和评论数,获得用户粘性:
构建能量值函数为:
式(1)中,j表示话题,Aj,Bj,Cj分别表示话题j在某段时间内的点赞数、转发数和评论数,A,B,C分别为所有话题在该段时间内的点赞数、转发数、评论数,e是自然常数。
3.根据权利要求1所述的一种社会媒体网络话题热度评估方法,其特征在于,S2根据话题相关的文章数量占所有话题文章的比例,及其在单位时间内的产生的文章数量,获得话题活跃度,包括:
通过话题的相关文章数占所有话题文章的比例及其在单位时间内产生的文章数量来量化能量值,能量值函数为:
其中,Dj表示话题的相关文章数,D表示所有话题的全部文章数,T表示话题持久时间,即话题最后被讨论时间与最初被讨论时间的间隔,与时间片同单位。
4.根据权利要求1所述的一种社会媒体网络话题热度评估方法,其特征在于,S3将讨论时间分为单元,根据话题在固定时间内被讨论的单元总数,获得话题持久性,包括:
构建能量值函数为:
式中,ne表示话题被报道和讨论的时间单元数,以天为单位,若天数不为0且小时数不足12时,则不足12时的部分按1天计算,n表示整个时间段被切分的时间单元总数。
5.根据权利要求1所述的一种社会媒体网络话题热度评估方法,其特征在于,S4根据当前时间与话题在社交媒体平台首次发布时间的时间单元差,获得话题的话题新鲜度,包括:
构建能量值函数:
E(话题新鲜度)=(Δt(j)+1)-k(4)
式中,Δt(j)是当前时间与话题首次发布时间的时间单元数差,以天为单位;k为衰退速度,通过对话题的评论数来衡量衰退速度,即当评论数越来越少时,说明话题的热度衰退的越来越多。
6.根据权利要求1所述的一种社会媒体网络话题热度评估方法,其特征在于,S5根据话题在权威媒体上的报道频率,获得媒体关注度,包括:
构建能量值函数:
式中,ε=0.5,为针对该话题报道数与总报道数的比值,k为衰退速度。
7.根据权利要求1所述的一种社会媒体网络话题热度评估方法,其特征在于,S6根据该话题的用户粘性、话题活跃度、话题持久性、话题新鲜度、媒体关注度和话题热度衰退比例获得话题的热度和影响力效能评估模型,即能量值模型,包括:
用衰退函数定义话题热度的自然衰退:
D衰退(t)=e-kt(t≥0)(6)
式中,k为衰退速度,e是自然常数,t是时间;
定义用户关注量为I,则有:
其中,Cj表示话题j在某段时间内的评论数,C为所有话题在该段时间内的评论数;
由于用户关注量越大时,说明感兴趣的用户越多,则衰减速度k就会越小,因此k需要满足以下两点:
(1)k是关于I的减函数;
(2)0<k<1
因此,令
则热度衰退比例函数为:
将话题时间间隔设为1天,那么话题j在第d天结束后的热度能量值为E(d),其表示话题j产生的从第1天到第d-1天积累的能量值衰减到第d天的能量值与第d天的能量值之和;
则有:
式中:
Aj:话题j的全部点赞数,A:所有话题的全部点赞数;
Bj:话题j的全部转发数,B:所有话题的全部转发数;
Cj:话题j的全部评论数,C:所有话题的全部评论数;
Dj:话题的相关文章数,D:所有话题的全部文章数;
T:话题持久性,即话题最后被讨论时间与最初被讨论时间的间隔,与时间片同单位;
ne:话题被报道和讨论的时间单元数;
n:整个时间段被切分的时间单元总数;
Δt(j):当前时间与话题首次发布时间的时间单元数差;
ε=0.5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311386159.7A CN117764262A (zh) | 2023-10-24 | 2023-10-24 | 一种社会媒体网络话题热度评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311386159.7A CN117764262A (zh) | 2023-10-24 | 2023-10-24 | 一种社会媒体网络话题热度评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117764262A true CN117764262A (zh) | 2024-03-26 |
Family
ID=90320610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311386159.7A Pending CN117764262A (zh) | 2023-10-24 | 2023-10-24 | 一种社会媒体网络话题热度评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117764262A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118377971A (zh) * | 2024-06-24 | 2024-07-23 | 长沙识达科技有限公司 | 基于大数据分析的企业热点话题智能化监测系统 |
-
2023
- 2023-10-24 CN CN202311386159.7A patent/CN117764262A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118377971A (zh) * | 2024-06-24 | 2024-07-23 | 长沙识达科技有限公司 | 基于大数据分析的企业热点话题智能化监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Munger | All the news that’s fit to click: The economics of clickbait media | |
Baylis et al. | Weather impacts expressed sentiment | |
Guo et al. | Analyzing patterns of user content generation in online social networks | |
Senanayake et al. | The pagerank-index: Going beyond citation counts in quantifying scientific impact of researchers | |
US9703877B2 (en) | Computer-based evaluation tool for selecting personalized content for users | |
Patil et al. | Detecting experts on Quora: by their activity, quality of answers, linguistic characteristics and temporal behaviors | |
He et al. | Predicting the popularity of web 2.0 items based on user comments | |
Zhu et al. | A novel click model and its applications to online advertising | |
KR101616064B1 (ko) | 소셜 네트워크용 애드히트 광고 모델 | |
Shmueli et al. | Care to comment? Recommendations for commenting on news stories | |
Armentano et al. | Topology-based recommendation of users in micro-blogging communities | |
De Choudhury et al. | Can blog communication dynamics be correlated with stock market activity? | |
US9183562B2 (en) | Method and system for determining touchpoint attribution | |
CN104834731B (zh) | 一种自媒体信息的推荐方法及装置 | |
Han et al. | Collecting, organizing, and sharing pins in pinterest: interest-driven or social-driven? | |
Currie et al. | Management education journals' rank and tier by active scholars | |
US20130091141A1 (en) | Content quality and user engagement in social platforms | |
US8799297B2 (en) | Evaluating supply of electronic content relating to keywords | |
Kar et al. | How to differentiate propagators of information and misinformation–Insights from social media analytics based on bio-inspired computing | |
US20160012454A1 (en) | Database systems for measuring impact on the internet | |
Pálovics et al. | Temporal influence over the Last. fm social network | |
CN117764262A (zh) | 一种社会媒体网络话题热度评估方法 | |
CN109190040B (zh) | 基于协同演化的个性化推荐方法及装置 | |
France et al. | Characterizing viral videos: Methodology and applications | |
Zhu | Measurement and analysis of an online content voting network: a case study of Digg |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |