CN109840319B - 确定对象实体的方法、系统及计算机设备和存储介质 - Google Patents
确定对象实体的方法、系统及计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109840319B CN109840319B CN201711192489.7A CN201711192489A CN109840319B CN 109840319 B CN109840319 B CN 109840319B CN 201711192489 A CN201711192489 A CN 201711192489A CN 109840319 B CN109840319 B CN 109840319B
- Authority
- CN
- China
- Prior art keywords
- object entity
- information
- entity
- specific event
- propagation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种确定对象实体的方法、系统及计算机设备和存储介质。其中,该方法包括:获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。本申请解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
Description
技术领域
本申请涉及互联网领域,具体而言,涉及一种确定对象实体的方法、系统及计算机设备和存储介质。
背景技术
网络舆情是指在互联网上流行的对社会问题不同看法的网络舆论,是社会舆论的一种表现形式,是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。随着互联网技术的快速发展,网络舆情形成的速度越来越快。网络舆情中既包含理性的言论,也会存在偏激言论甚至谣言,对网络舆情进行监控预警是预防衍生群体突发事件发生的重要措施。意见领袖在信息传播中充当了重要的角色,通过引导意见领袖来控制网络舆情向着有利的方向发展,可以达到事半功倍的效果。监控及引导网络舆情意见领袖的言论对于突发事件应急管理具有重要的意义。
舆情分析就是根据特定问题的需要,对针对这个问题的舆情进行深层次的思维加工和分析研究,得到相关结论的过程。在舆情分析中,鉴别出意见领袖以及它们的传播能量是非常重要的。有了这些信息后,可以更好地分析时间的扩散原因,影响人群,潜在发展,以及在未来类似时间中如何更好地影响意见领袖,从而影响时间的扩散。
以微博为例,目前,对于一个事件的意见领袖的鉴定,传统的鉴定方法主要考虑以下四个因素:是否为已认证用户、该已认证用户的粉丝数量、该已认证用户关于该事件发布的微博被转发的数量、该已认证用户关于该事件发布的微博被评论的数量。由于传统的鉴定方法仅考虑用户关于特定事件发布的微博及该微博的转发量、评论量等因素,并没有考虑用户与特定事件的关联程度以及其发布的微博产生的后续影响情况,可能导致确定的用户对特定事件的影响力不准确,这将会直接影响到鉴定出的意见领袖不准确,从而影响舆情分析结果。
针对上述现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种确定对象实体的方法、系统及计算机设备和存储介质,以至少解决现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
根据本发明实施例的一个方面,提供了一种确定对象实体的方法,包括:获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
根据本发明实施例的另一方面,还提供了一种确定对象实体的方法,包括:显示对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;显示影响力值超过阈值的至少一个对象实体的信息,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
根据本发明实施例的另一方面,还提供了一种确定对象实体的方法,包括:显示影响力值超过阈值的至少一个对象实体的特征信息,并显示与对象实体关联的关联对象的节点信息,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;显示对象实体的内容针对特定事件的传播路径;其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
根据本发明实施例的另一方面,还提供了一种确定对象实体的方法,包括:显示对象实体针对特定事件的特征信息,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;显示影响力值超过阈值的至少一个对象实体的信息、与对象实体关联的关联对象的节点信息或对象实体的内容针对特定事件的传播路径,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一项的确定对象实体的方法。
根据本发明实施例的另一方面,还提供了一种计算机设备,包括:处理器,处理器用于运行程序,其中,程序运行时执行上述任意一项的确定对象实体的方法。
根据本发明实施例的另一方面,还提供了一种确定对象实体的系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取对象实体针对特定事件的特征信息,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
在本发明实施例中,通过获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种确定对象实体的方法流程图;
图2是根据本申请实施例的一种可选的确定对象实体的方法流程图;
图3是根据本申请实施例的一种可选的确定对象实体的方法流程图;
图4是根据本申请实施例的一种确定对象实体的方法流程图;
图5是根据本申请实施例的一种可选的显示用户特征信息的界面示意图;
图6是根据本申请实施例的一种可选的确定对象实体的方法流程图;
图7是根据本申请实施例的一种可选的确定对象实体的方法流程图;
图8是根据本申请实施例的一种可选的显示关键用户的参与详情信息的界面示意图;
图9是根据本申请实施例的一种确定对象实体的装置示意图;
图10是根据本申请实施例的一种确定对象实体的装置示意图;
图11是根据本申请实施例的一种确定对象实体的方法流程图;以及
图12是根据本申请实施例的一种可选的计算机设备的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
舆情:是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及政治、社会、道德等方面的取向产生和持有的社会态度。即较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和。
网络舆情:是指以网络为载体,以事件为核心,是广大网民情感、态度、意见、观点的表达,传播与互动,以及后续影响力的集合。主要包括六大要素:网络、事件、网民、情感、传播互动和影响力。
舆情分析:根据特定问题的需要,对针对这个问题的舆情进行深层次的思维加工和分析研究,得到相关结论的过程。
意见领袖:是指社交媒体中拥有很多粉丝且有影响力的用户,在大众传播效果的形成过程中起着重要的中介或过滤的作用,由他们将信息扩散给受众,形成信息传递的两级传播。
对象实体:可以是在不同的数据源中用于表征网络用户身份的为一个账号或用户标识等,例如,可以是在公共信息中的电话号码或身份证号码信息,也可以是在各种社交平台(例如,微博)上注册的账号ID,例如,微博用户的ID账号。
实施例1
根据本申请实施例,提供了一种确定对象实体的方法实施例,该方法实施例可以应用但不限于新浪微博、腾讯微博、博客、BBS论坛、人人网等任意一种社交媒体平台中用于确定意见领袖的应用场景,可选地,还可以应用于各种各样的互联网舆情监测平台中,例如,百度舆情、新浪舆情等。
随着互联网的快速发展,网络媒体作为一种新的信息传播形式,网民可以通过网络来自由地表达观点、传播思想,使得互联网已经成为思想文化信息的集散地和社会舆论的放大器,其影响力使得任何部门、机构都不容忽视。由于意见领袖拥有大量的粉丝,当其将经过自己加工的信息传播给其他人,可以大大加快传播速度、扩大影响。因而,对于各种社交媒体平台来说,准确地确定出意见领袖,有助于得到更加准确的舆情分析结果,以便进行倾向性的有效引导,以及对网络舆论进行有效控制。
作为一种可选的实施例,图1是根据本申请实施例的一种可选的确定对象实体的方法流程图,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。如图1所示,包括如下步骤:
步骤S102,获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息。
作为一种可选的实施例,上述对象实体可以是在不同的数据源中用于表征网络用户身份的为一个账号或用户标识等,可选地,如果在公共信息中,对象实体可以是电话号码或身份证号码信息等,如果在各种社交平台(例如,微博)中,对象实体可以是社交平台上注册的账号ID,例如,微博用户的ID账号。
需要说明的是,上述对象实体可以用于表征互联网上的任意一个网络用户,作为一种可选的实施例,对象实体可以是在某一应用平台(包括但不限于微博、论坛、社区等社交媒体平台)上能够发布信息(包括但不限于发布原创内容、转发内容以及评论内容)的用户,可以是注册用户,也可以是非注册用户(例如,以游客身份存在的用户),只要可以在该社交媒体平台上能够发布信息即可。
可选地,上述特定事件可以是发生的在一定空间或时间内具有一定影响力的网络事件、人物或话题,包括但不限于自然灾害事件、生成安全事故、群体性时间、公共卫生事件、经济民生事件、明星事件等。一种可选的实施例中,可以是某些企业或商家通过网络进行宣传的产品或服务等。上述特征信息可以是为了研究网络用户关于某一事件的影响或反映而考虑的该网络用户的信息,包括但不限于如下至少之一:对象实体的身份信息、对象实体提交至应用平台(包括但不限于微博、论坛、社区等社交媒体平台)的原创内容,以及原创内容的转发信息。
作为一种可选的实施方案,上述步骤S102可以获取当前或任一预定时间段内的至少一个用户(即对象实体)针对某一特定事件的特征信息。
以微博为例,上述对象实体可以是微博用户,上述对象实体的身份信息可以包括:该微博用户在该微博注册时填写的档案信息(例如,昵称、性别、年龄、头像、身份、个性签名等信息);上述原创内容可以包括该注册用户在微博上发布的微博、对其他微博发表的评论、回复、点赞等信息;上述转发信息可以该微博用户发布的信息被其他微博用户转发的次数、转发者的用户身份、转发者发布的评论、点赞等信息。可选地,如果微博用户发布的信息被多次转发后,上述转发信息可以包括该注册用户发布的信息被多次转发的信息,例如,微博用户A发布的了一篇微博X,微博用户B、C分别对该微博X进行了转发,其中,微博用户B的转发的该微博X又被微博用户D、E进行了转发,则微博用户A提交至应用平台的原创内容(即微博X)的转发信息会包含所有该原创内容(即微博X)被转发的信息。
步骤S104,计算特定事件与对应的特征信息之间的相似度。
需要说明的是,由于对象实体对特定事件的影响力不仅要考虑该对象实体本身具有的特征信息(包括但不限于该对象实体的身份信息、该对象实体提交至应用平台的原创内容,以及原创内容的转发信息),还要考虑该对象实体的上述特征信息与特定时间的相关度,作为一种可选的实施例,可以计算该特定事件的事件信息与该对象实体的特征信息之间的相似度,利用相似度来代表对象实体的特征信息与特定事件的关联度。
仍以上述微博为例,如果当前研究的是用户(即上述对象实体)对“科技新闻(即上述特定事件)”的影响力,即使微博用户A在微博上发布的原创内容最多、且其原创内容被转发的数量也最多,但是微博用户A的身份是普通网络用户;而微博用户B虽然在微博上发布的原创内容很少,且其原创内容被转发的数量也不多,但是由于微博用户B的身份为某权威结构(例如,中央新闻),则微博用户B对“科技新闻”的影响力可能比微博用户A的影响力更大。
一种可选的实施例中,在计算特定事件与对应的特征信息之间的相似度的情况下,可以提取特定事件的事件信息,可选地,该事件信息可以是特定事件的关键字或关键词,也可以是特定事件的全部内容,在获取到每个对象实体针对特定事件的至少一个特征信息后,可以计算每个特征信息与特定事件的事件信息的相似度。
步骤S106,基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度。
需要说明的是,上述对象实体针对特定事件的重要度可以用于表征上述对象实体对特定事件传播影响的重要性,在获取到每个对象实体针对特定事件的特征信息(包括但不限于对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息),以及特征信息与该特定事件之间的相似度后,可以根据每个对象实体针对特定事件的每个特征信息及每个特征信息与特定事件的相似度,来确定每个对象实体对特定事件传播影响的重要性(即对象实体针对该特定事件的重要度)。
步骤S108,根据对象实体的重要度,确定对象实体的影响力值。
需要说明的是,上述影响力值可以用于表征对象实体对特定事件传播的影响程度,在获取到每个对象实体对特定事件的重要度后,可以根据每个对象实体对特定事件的重要度确定每个对象实体对特定事件传播的影响力(即上述影响力值)。容易注意的是,上述对象实体的针对特定事件的影响力值可以作为确定该特定事件的关键用户(即对该特定事件传播影响力较大的意见领袖)的依据,可选地,作为关键用户(意见领袖)的对象实体可以是一个,也可以是多个,当作为关键用户(意见领袖)的对象实体为一个的情况下,可以将影响力值最大的对象实体作为特定事件的意见领袖,当作为关键用户(意见领袖)的对象实体为多个的情况下,可以将影响力值大于阈值的对象实体作为该特定事件的意见领袖。
由上可知,在本申请上述实施例中,在获取到每个对象实体针对某一特定事件的一个或多个特征信息后,可以计算对象实体的每个特征信息与该特定事件之间的相似度,并根据获取到的每个对象实体针对该特定事件的特征信息以及对应的特征信息与当前事件之间的相似度,获取每个对象实体针对该特定事件的重要度,最后根据每个对象实体针对该特定事件的重要度,确定每个对象实体针对该特定事件的影响力值。
容易注意到是,由于在确定每个对象实体针对某一事件的重要度时不仅考虑了每个对象实体针对该特定事件的特征信息,还考虑了每个对象实体针对该特定事件的特征信息与该特定事件之间的相似度,可以更加准确地确定对象实体针对该特定事件的影响力值。
通过本申请上述实施例公开的方案,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
作为一种可选的实施例,为了从多个对象实体中更加准确地鉴定出特定事件的意见领袖(即对特定事件的传播影响较大的关键用户),考虑的对象实体针对该特定事件的特征信息可以至少包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息。
基于上述实施例,一种可选的实施中,如图2所示,基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度,可以包括如下步骤:
步骤S202,获取特征信息的权重和相似度的权重;
步骤S204,基于特征信息、计算得到的相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度。
需要说明的是,不同的特征信息对不同类型的特定事件影响情况不同,因而,在根据对象实体的特征信息和对应的特征信息与特定事件之间的相似度来确定对象实体针对该特定事件的重要度的情况下,可以对不同的特征信息设置不同的权重,针对不同特征信息与该特定事件的相似度也设定不同的权重,以便根据不同权重下的特征信息以及对应的特征信息与特定事件之间的相似度来确定对象实体针对该特定事件的重要度。可选地,可以根据预先设定的每个特征信息的权重和每个特征信息与特定事件的事件信息的相似度的权重,计算每个对象实体在特定事件中的重要度。
可选地,如图2所示,上述步骤S204,基于特征信息、计算得到的相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度,可以包括如下步骤:
步骤S2041,计算特征信息的权重和特征信息的乘积,得到第一数据;
步骤S2043,计算相似度的权重和相似度的乘积,得到第二数据;
步骤S2045,对第一数据和第二数据进行求和,得到对象实体针对特定事件的重要度。
容易注意的是,上述每个对象实体的每个特征信息的权重以及对应的特征信息与特定事件之间的相似度的权重,可以是针对不同的事件预先设置的权重值,也可以是通过机器学习得到的针对特定事件的每个特征信息的权重值。
仍以“微博”为例,在特定事件的类型为“科技新闻”的情况下,与微博数量较多的微博用户相比,一些权威结构(例如,“中央新闻”)发布的信息,可能传播影响要更大一些,因而,可以设置“用户身份”这个特征信息的权重值高一点。在特定事件的类型为“产品营销”的情况下,相关微博数量越多,可能越有助于产品的推广,因而,可以设置“对象实体提交至应用平台的原创内容”和“原创内容的转发信息”这两个特征信息的权重值高一点。
基于上述实施例,一种可选的实施例中,以微博为例,假设获取到的每个用户的特征信息包括如下8个:
①Sv,用于表征是否为已认证用户;
②Sf,用于表征微博用户的粉丝量(可选地,可以是正态化的值);
③Sz,用于表征微博用户关于某一特定事件的微博的被转发量(可选地,可以是正态化后的值);
④Sp,用于表征微博用户的关于该特定事件发布的微博的评论量(可选地,可以是正态化后的值);
⑤Sb,用于表征该特定事件和用户(即上述对象实体)背景信息的相似度。
可选地,用户背景信息可以基于微博用户注册时填写的档案信息得到。通过比较特定事件的微博文本和用户关于自己的介绍信息而计算出的值。
一种可选的实施例中,可以将微博文本和用户的介绍信息进行分词,利用余弦相似度的计算方法计算微博文本和用户的介绍信息的相似度。
⑥Sw,用于表征该特定事件和用户近期所发微博内容的相似度,通过比较该特定事件的微博文本和用户最近一段时间内所发微博内容而计算得到的值。相似度越高,说明该用户在该特定事件领域具有较高的权威。
⑦Sn,用于表征用户的粉丝看到该用户的微博信息后,粉丝自己发布微博的数量。
通过比较粉丝的微博内容和该用户的微博内容,可以计算出粉丝的微博是否和用户的微博在谈论同一个时间,进而得出总的粉丝发布的和该特定事件相关的微博的数量(可选地,可以是正态化后的值)。
⑧Sq,用于表征用户是否权威结构(例如,政府部门、行业管理部门等)。
根据上述8个因素,可以计算出每个对象实体针对该特定事件的传播影响的一个综合的分数(用于表征每个对象实体在该特定事件下的重要度),该分数越高,表明该对象实体是意见领袖的可能性越大。
每个对象实体在特定事件下的重要度可以表示为:
Sol=w1*Sv+w2*Sf+w3*Sz+w4*Sp+w5*Sb+w6*Sw+w7*Sn+w8*Sq,其中,
w1、w2、w3、w4、w5、w6、w7、w8分别表示上述8个因素的权重。可选地,可以通过机器学习,训练得到每个权重值的最优值。
基于上述任意一种可选的实施例,在确定针对某一事件的意见领袖后,为了得到舆情分析结果,还需要确定意见领袖的传播能量,因而,一种可选的实施例中,在确定对象实体的影响力值之后,如图3所示,上述方法还可以包括如下步骤:
步骤S302,获取对象实体对应的传播因素;
步骤S304,获取传播因素的传播能量值;
步骤S306,根据传播因素的传播能量值,获取对象实体针对特定事件的传播结果。
通过上述步骤S302值S306公开的方案,在确定每个对象实体对特定事件的影响力值后,还需要进一步了解该对象实体对该特定事件的传播影响(或传播结果),在考虑每个对象实体对该特定事件的传播结果的情况下,首先获取每个对象实体对当前事件进行传播的一个或多个传播因素(包括但不限于该对象实体发布的关于当前事件的原创内容被转发的数量、原创内容被评论的数量,以及与该对象实体关联的其他对象在看到该对象实体的发布的原创内容后自己发布的原创内容的数量等),然后获取每个传播因素的传播能量值,根据每个对象的传播因素以及对应的传播能量值,计算得到每个对象实体针对该特定事件的传播结果。
一种可选的实施例中,针对一个特定事件,考虑的对象实体的传播因素可以包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
可选地,基于上述实施例,作为一种可选的实施方案,获取传播因素的传播能量值,可以包括如下至少之一:
在传播因素为对象实体的转发信息的数量的情况下,传播能量值为基于对象实体的转发信息的数量,计算得到的转发平均值;
在传播因素为评论的数量的情况下,传播能量值为基于对象实体的评论的数量,计算得到的评论平均值;
在传播因素为关联对象发布原创内容的数量的情况下,传播能量值为基于关联对象发布原创内容的数量,计算得到的关联对象发布原创内容的频率。
需要说明的是,在通过上述步骤S3041至S3045公开的方案,计算得到每个对象实体针对特定事件的上述三个传播因素的传播能量值后,可以根据每个对象实体的上述三个传播因素的传播能量值,获取每个对象实体针对特定事件的传播结果,作为一种可选的实施方式,如图3所示,上述步骤S306,根据传播因素的传播能量值,获取对象实体针对特定事件的传播结果,可以包括如下步骤:
步骤S3061,计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;
步骤S3063,对乘积值进行求和,得到对象实体针对特定事件的重要度。
具体地,在上述步骤中,可以将对象实体的每个传播因素的能量值与对应传播因素的权重值相乘,将每个对象实体所有传播因素的能量值与对应传播因素的权重值乘积之和,作为每个对象实体针对特定事件的重要度。
需要说明的是,由于有些与对象实体(例如,某一微博用户)关联的对象(例如,该微博用户的粉丝)虽然受到了对象实体(即该微博用户)的影响,但是没有通过上述三种数据(即上述三个传播因素)反映出来,即这些与对象实体关联的对象没有对该对象实体发布的原创内容进行转发或评论,也没有基于这个对象实体发布的原创内容(例如,意见领袖发布的微博)来发布一个新的相关的微博来表达自己的看法,因而,无法通过上述三种数据(即上述三个传播因素)计算出这部分传播量,因而,作为一种可选的实施方案,这部分传播量可以通过对象实体针对特定事件的重要度来确定。
因而,作为一种可选的实施方式,可以通过如下公式计算得到对象实体针对特定事件的传播结果S_total:
S_total=fa*S_Nz+fb*S_Np+fc*S_Nn+fa*Sol,
其中,S_Nz用于表征对象实体发布的原创内容被关联的对象转发的数量,S_Np用于表征对象实体发布的原创内容被关联的对象评论的数量,S_Nn表征用于表征对象实体发布的原创内容被关联的对象看到后关联对象发布的原创内容的数量,Sol用于表征对象实体针对特定事件的重要度,fa用于表征S_Nz的权重,fb用于表征S_Np的权重,fc用于表征S_Nn的权重,fd用于表征Sol的权重。
可选地,上述对象实体的传播因素S_Nz(即转发量,简单转发对象实体发布的信息)和S_Np(即评论量,在对象实体的发布信息下的评论)可以直接由此发布信息的附属数据确定。
可选地,在确定对象实体发布的原创内容被关联的对象看到后关联对象发布的原创内容的数量(即上述S_Nn)时,可以将关联对象发布的原创内容与该对象实体发布的原创内容进行比对,来确定关联对象发布的内容是否是在看到该对象实体发布的原创内容后发布的信息,以微博为例,可以通过比较粉丝(即关联对象)的微博内容和意见领袖(即对象实体)的微博内容,计算出粉丝的微博和意见领袖发布的微博是否在谈论同一个事件,进而得出总的粉丝发布的与特定事件相关的微博数量(即上述S_Nn)。
需要说明的是,S_Nn获取的方法和上述Sn的计算方法可以是一样的,不过此处计算的是正态化后的值。
作为一种可选的实施例,上述fa、fb、fc和fd这个四个权重中可以通过各种机器学习算法进行机器学习得到的训练数据确定,其中,机器学习算法包括但不限于线性回归分析算法。
基于上述任意一种可选的实施例,在确定对象实体的影响力值之后,上述方法还可以包括:获取预定时间段内影响力值超过阈值的对象实体。
可选地,可以将影响力值超过阈值的对象实体作为上述特定事件的关键用户,该关键用户是指对该特定事件传播影响力较大的意见领袖。由于针对某一特定事件的意见领袖可能是随时间发生变化的,因而,基于上述实施例,在对某一特定事件进行舆情分析的时候,获取任意一预定时间段内的意见领袖。
实施例2
根据本申请实施例,还提供了一种确定对象实体的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图4是根据本申请实施例的一种可选的确定对象实体的方法流程图,如图4所示,包括如下步骤:
步骤S402,显示对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;
步骤S404,显示影响力值超过阈值的至少一个对象实体的信息,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
通过上述步骤S402至S404公开的方案,在显示至少一个对象实体针对特定事件的特征信息后,可以根据确定的每个对象实体的影响力值,显示影响力值超过阈值的一个或多个对象实体的信息。
作为一种可选的实施例,可以在应用平台(包括但不限于微博、论坛、社区等社交媒体平台)上的某一特定页面中显示至少一个用户(即对象实体)针对某一特定事件的特征信息,显示的特性信息包括但不限于对象实体的身份信息、对象实体提交至应用平台(包括但不限于微博、论坛、社区等社交媒体平台)的原创内容,以及原创内容的转发信息等。在页面(即上述特定页面)中显示针对某一特定事件影响的至少一个对象实体的特征信息后,还可以在当前页面(即上述特定页面)或另一个页面(例如,重新创建的一个页面或该特定页面的浮窗)中显示影响力值超过阈值的一个或多个对象实体的信息。
可选地,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息。
需要说明的是,每个对象实体的影响力值可以根据每个对象实体针对该特定事件的重要度确定,其中,每个对象实体针对该特定事件的重要度可以根据每个对象实体针对特定事件的特征信息(包括但不限于对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息),以及特征信息与该特定事件之间的相似度来确定。
一种可选的实施例中,在上述特定页面或另一页面中可以显示预定时间内获取到的影响力值超过阈值的至少一个对象实体的信息。
一种可选的实施例中,图5是根据本申请实施例的一种可选的显示用户特征信息的界面示意图,如图5所示,在选择一个事件类型“科技新闻”后,点击“最近三个月”,可以看到最近三个月发表关于“科技新闻”的微博的至少一个用户的特征信息,例如,图5中所示的昵称A的用户、昵称B的用户、昵称C的用户、昵称D的用户、昵称E的用户和昵称F的用户,每个用户的特征信息至少包括:每个用户的昵称、粉丝数、发表与“科技新闻”相关的微博的发帖数、转发与“科技新闻”相关的微博的转发数、以及针对与“科技新闻”相关的微博的评论数和点赞数,针对每个用户发表的微博,还会显示该微博的情感类型(例如,“正面”或“负面”等情感标签),被粉丝或其他微博用户转发的数量、评论的数量或点赞的数量。
此外,还需要说明的是,在特定页面中显示的每个用户可以是普通用户,也可以是关键用户(即影响力值超过阈值的对象实体),也就是说,关键用户(即意见领袖)的数量不可以不止一个,可以将在当前事件中重要度排名靠前的多个用户(即对象实体)都作为该特定事件的关键用户。例如,图5中所示的6个用户(即昵称A的用户、昵称B的用户、昵称C的用户、昵称D的用户、昵称E的用户和昵称F的用户)可以是针对当前事件“科技新闻”中重要度排名前六的用户。
由上可知,在本申请上述实施例中,在显示至少一个对象实体的特征信息后,可以根据确定的每个对象实体的影响力值,显示显示影响力值超过阈值的至少一个对象实体的信息,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
容易注意到是,由于在确定每个对象实体针对某一事件的重要度时不仅考虑了每个对象实体针对该特定事件的特征信息,还考虑了每个对象实体针对该特定事件的特征信息与该特定事件之间的相似度,可以更加准确地确定对象实体针对该特定事件的影响力值。
通过本申请上述实施例公开的方案,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
作为一种可选的实施例,如图6所示,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,可以包括如下步骤:
步骤S602,获取特征信息的权重和相似度的权重;
步骤S604,基于特征信息、相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度。
可选地,上述步骤S604,基于特征信息、相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度,可以包括如下步骤:
步骤S6041,计算特征信息的权重和特征信息的乘积,得到第一数据;
步骤S6043,计算相似度的权重和相似度的乘积,得到第二数据;
步骤S6045,对第一数据和第二数据进行求和,得到对象实体针对特定事件的重要度。
需要说明的是,在根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度的时候,可以通过实施例1中提供的计算每个对象实体在特定事件下的重要度的公式来计算,此处不再赘述。
作为一种可选的实施例显示影响力值超过阈值的至少一个对象实体的信息之后,如图7所示,上述方法还可以包括如下步骤:
步骤S702,显示与对象实体关联的关联对象的节点信息;
步骤S704,显示对象实体的内容针对特定事件的传播路径,其中,根据对象实体对应的传播因素的传播能量值,获取传播结果。
具体地,在上述步骤中,为了进一步直观地看到每个对象实体的传播效果,可以显示影响力值超过阈值的对象实体的信息后,进一步显示与该对象实体关联的关联对象,可选地,可以以节点来代表每一个关联对象,通过节点之间的连线表征传播路径,从而得到每个对象实体针对该特定事件的传播效果。
可选地,上述传播因素包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
一种可选的实施例中,点击图5所示的界面中显示的任意一个用户,可以在另一个页面中显示该用户的特征信息以及传播影响,例如,点击图5所示的界面中昵称B的用户为关键用户后,点击昵称B的用户后,可以进一步查看用户B的参与详情信息。图8是根据本申请实施例的一种可选的显示关键用户的参与详情信息的界面示意图,如图8所示,该界面上可以显示关键用户(例如,昵称B的用户)的昵称、粉丝数、发帖数等用户身份,以及该关键用户发表的所有微博的时间轴,可选地,还可以显示该关键用户发表的微博被其他用户转发的传播效果图,点击传播效果图中的任意一个节点,可以查看该节点的用户的详情信息,例如,图8所示的昵称E的用户。
容易注意的是,用于表征关键用户的传播影响的传播效果图的显示方式包括但不限于图8所示的效果,例如,每个节点的大小可以不同,节点的大小用于表征该节点所代表的用户的传播能量(例如,该用户在当前事件中的重要度或传播结果),另外,用于连接节点与节点之间的轴线的粗细可以不同,用于表征上一传播节点对下一传播节点的传播能量。作为一种可选的实施方式,图8中用于显示用户发布信息的时间轴上所显示的发布信息可以是经过一定过滤条件筛选后显示的,以便可以更加有效地查看该用户发布的信息。
在一种可选的实施例中,在显示对象实体的内容针对特定事件的传播路径之前,上述方法还可以包括如下步骤:步骤S703,获取传播因素的传播能量值,该步骤包括如下至少之一:
在传播因素为对象实体的转发信息的数量的情况下,传播能量值为基于对象实体的转发信息的数量,计算得到的转发平均值;
在传播因素为评论的数量的情况下,传播能量值为基于对象实体的评论的数量,计算得到的评论平均值;
在传播因素为关联对象发布原创内容的数量的情况下,传播能量值为基于关联对象发布原创内容的数量,计算得到的关联对象发布原创内容的频率。
在一种可选的实施例中,根据对象实体对应的传播因素的传播能量值,获取传播结果,可以包括如下步骤:
步骤S7041,计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;
步骤S7043,对乘积值进行求和,得到对象实体针对特定事件的重要度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的确定对象实体的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例3
根据本申请实施例,还提供了一种用于实现上述实施例1中确定对象实体的方法的装置实施例,图9是根据本申请实施例的一种确定对象实体的装置示意图,如图9所示,该装置包括:第一获取单元901、计算单元903、第二获取单元905和确定单元907。
其中,第一获取单元901,用于获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;
计算单元903,用于计算特定事件与对应的特征信息之间的相似度;
第二获取单元905,用于基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;
确定单元907,用于根据对象实体的重要度,确定对象实体的影响力值。
此处需要说明的是,上述第一获取单元901、计算单元903、第二获取单元905和确定单元907对应于实施例1中的步骤S102至S108,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
由上可知,在本申请上述实施例中,通过第一获取单元901获取到每个对象实体针对某一特定事件的一个或多个特征信息,通过计算单元903计算对象实体的每个特征信息与该特定事件之间的相似度,并通过第二获取单元905基于每个对象实体针对该特定事件的特征信息以及对应的特征信息与当前事件之间的相似度,获取每个对象实体针对该特定事件的重要度,最后通过确定单元907根据每个对象实体针对该特定事件的重要度,确定每个对象实体针对该特定事件的影响力值。
容易注意到是,由于在确定每个对象实体针对某一事件的重要度时不仅考虑了每个对象实体针对该特定事件的特征信息,还考虑了每个对象实体针对该特定事件的特征信息与该特定事件之间的相似度,可以更加准确地确定对象实体针对该特定事件的影响力值。
通过本申请上述实施例公开的方案,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
在一种可选的实施例中,上述第二获取单元905包括:第一获取模块,用于获取特征信息的权重和相似度的权重;第一计算模块,用于基于特征信息、计算得到的相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度。。
此处需要说明的是,上述第一获取模块和第一计算模块对应于实施例1中的步骤S202至S204,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一种可选的实施例中,上述第一计算模块包括:第一子计算模块,用于计算特征信息的权重和特征信息的乘积,得到第一数据;第二子计算模块,用于计算相似度的权重和相似度的乘积,得到第二数据;第三子计算模块,用于对第一数据和第二数据进行求和,得到对象实体针对特定事件的重要度。
此处需要说明的是,上述第一子计算模块、第二子计算模块和第三子计算模块对应于实施例1中的步骤S2041至S2045,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
基于上述任意一种可选的装置实施例,一种可选的实施例中,上述装置还包括:第三获取单元,用于获取对象实体对应的传播因素;第四获取单元,用于获取传播因素的传播能量值;第五获取单元,用于根据传播因素的传播能量值,获取对象实体针对特定事件的传播结果。
此处需要说明的是,上述第三获取单元、第四获取单元和第五获取单元对应于实施例1中的步骤S302至S306,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一种可选的实施例中,上述传播因素包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
在一种可选的实施例中,在传播因素为对象实体的转发信息的数量的情况下,传播能量值为基于对象实体的转发信息的数量,计算得到的转发平均值;在传播因素为评论的数量的情况下,传播能量值为基于对象实体的评论的数量,计算得到的评论平均值;在传播因素为关联对象发布原创内容的数量的情况下,传播能量值为基于关联对象发布原创内容的数量,计算得到的关联对象发布原创内容的频率。
在一种可选的实施例中,上述第五获取单元包括:第二计算模块,用于计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;第三计算模块,用于对乘积值进行求和,得到对象实体针对特定事件的重要度。
此处需要说明的是,上述第二计算模块和第三计算模块对应于实施例1中的步骤S3061至S3063,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
实施例4
根据本申请实施例,还提供了一种用于实现上述实施例2中确定对象实体的方法的装置实施例,图10是根据本申请实施例的一种确定对象实体的装置示意图,如图10所示,该装置包括:第一显示单元101和第二显示单元103。
其中,第一显示单元101,用于显示对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;第二显示单元103,用于显示影响力值超过阈值的至少一个对象实体的信息,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
此处需要说明的是,上述第一显示单元101和第二显示单元103对应于实施例2中的步骤S402至S404,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
由上可知,在本申请上述实施例中,通过第一显示单元101显示至少一个对象实体的特征信息,并在确定每个对象实体的影响力值后,通过第二显示单元103显示影响力值超过阈值的至少一个对象实体的信息,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
容易注意到是,由于在确定每个对象实体针对某一事件的重要度时不仅考虑了每个对象实体针对该特定事件的特征信息,还考虑了每个对象实体针对该特定事件的特征信息与该特定事件之间的相似度,可以更加准确地确定对象实体针对该特定事件的影响力值。
通过本申请上述实施例公开的方案,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
在一种可选的实施例中,上述第二显示单元103还用于显示预定时间内获取到的影响力值超过阈值的至少一个对象实体的信息。
在一种可选的实施例中,上述第二显示单元103包括:第二获取模块,用于获取特征信息的权重和相似度的权重;第四计算模块,用于基于特征信息、相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度。
此处需要说明的是,上述第二获取模块和第四计算模块对应于实施例2中的步骤S602至S604,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一种可选的实施例中,上述第四计算模块包括:第四子计算模块,用于计算特征信息的权重和特征信息的乘积,得到第一数据;第五子计算模块,用于计算相似度的权重和相似度的乘积,得到第二数据;第六子计算模块,用于对第一数据和第二数据进行求和,得到对象实体针对特定事件的重要度。
此处需要说明的是,上述第四子计算模块、第五子计算模块和第六子计算模块对应于实施例2中的步骤S6041至S6045,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一种可选的实施例中,上述装置还包括:第三显示单元,用于显示与对象实体关联的关联对象的节点信息;第四显示单元,用于显示对象实体的内容针对特定事件的传播路径,其中,根据对象实体对应的传播因素的传播能量值,获取传播结果。
此处需要说明的是,上述第三显示单元和第四显示单元对应于实施例2中的步骤S702至S704,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
可选地,上述传播因素包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
在一种可选的实施例中,上述装置还包括:第六获取单元,用于获取传播因素的传播能量值,可选地,上述第六获取单元还用于在传播因素为对象实体的转发信息的数量的情况下,传播能量值为基于对象实体的转发信息的数量,计算得到的转发平均值;在传播因素为评论的数量的情况下,传播能量值为基于对象实体的评论的数量,计算得到的评论平均值;在传播因素为关联对象发布原创内容的数量的情况下,传播能量值为基于关联对象发布原创内容的数量,计算得到的关联对象发布原创内容的频率。
此处需要说明的是,上述第六获取单元对应于实施例2中的步骤S703,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在一种可选的实施例中,上述第四显示单元包括:第五计算模块,用于计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;第六计算模块,用于对乘积值进行求和,得到对象实体针对特定事件的重要度。
此处需要说明的是,上述第五计算模块和第六计算模块对应于实施例2中的步骤S7041至S7043,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
实施例5
根据本申请实施例,还提供了一种确定对象实体的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图11是根据本申请实施例的一种确定对象实体的方法流程图,如图11所示,包括如下步骤:
步骤S112,:显示影响力值超过阈值的至少一个对象实体的特征信息,并显示与对象实体关联的关联对象的节点信息,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;
步骤S114,显示对象实体的内容针对特定事件的传播路径;
其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
作为一种可选的实施例,在根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值后,可以显示针对某一特定事件影响的至少一个对象实体的特征信息(包括但不限于如下至少之一:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息),以及与超过阈值的对象实关联的关联对象的节点信息或对象实体的内容针对该特定事件的传播路径。
一种可选的实施例中,可以在应用平台(包括但不限于微博、论坛、社区等社交媒体平台)上的某一特定页面中显示至少一个用户(即对象实体)针对某一特定事件的特征信息,显示的特性信息包括但不限于对象实体的身份信息、对象实体提交至应用平台(包括但不限于微博、论坛、社区等社交媒体平台)的原创内容,以及原创内容的转发信息等。在页面(即上述特定页面)中显示针对某一特定事件影响的至少一个对象实体的特征信息(包括但不限于如下至少之一:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息)后,还可以在当前页面(即上述特定页面)或另一个页面(例如,重新创建的一个页面或该特定页面的浮窗)中显示影响力值超过阈值的对象实体的信息,以及与超过阈值的对象实体(例如,图8所示的用户B)关联的关联对象的节点信息或对象实体的内容针对该特定事件的传播路径(例如,图8中所示的用户B的传播效果图,每个节点表征一个关联对象,节点之间的连线表征传播路径)。
由上可知,在本申请上述实施例中,在根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值后,可以显示影响力值超过阈值的对象实体的特征信息(包括但不限于如下至少之一:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息),以及该影响力值超过阈值的对象实体关联的关联对象的节点信息或对象实体的内容针对特定事件的传播路径。
容易注意到是,由于在确定每个对象实体针对某一事件的重要度时不仅考虑了每个对象实体针对该特定事件的特征信息,还考虑了每个对象实体针对该特定事件的特征信息与该特定事件之间的相似度,可以更加准确地确定对象实体针对该特定事件的影响力值。
通过本申请上述实施例公开的方案,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
可选地,在显示影响力值超过阈值的至少一个对象实体的信息之后,上述方法还可以包括:根据对象实体对应的传播因素的传播能量值,获取传播路径。
作为一种可选的实施例,上述传播因素可以包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
实施例6
本申请的实施例可以提供一种计算机设备,该计算机设备可以是计算机设备群中的任意一个计算机设备。可选地,在本实施例中,上述计算机设备也可以替换为计算机设备等终端设备。
可选地,在本实施例中,上述计算机设备可以位于计算机网络的多个网络设备中的至少一个访问设备。
图12是根据本申请实施例的一种可选的计算机设备的硬件结构框图。如图12所示,计算机设备12可以包括一个或多个(图中仅示出一个)处理器121(处理器121可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器123、以及用于通信功能的传输装置125。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图12所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机设备12还可包括比图12中所示更多或者更少的组件,或者具有与图12所示不同的配置。
应当注意到的是上述一个或多个处理器121和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机设备12中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
处理器121可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
存储器123可用于存储应用软件的软件程序以及模块,如本申请实施例中的确定对象实体的方法对应的程序指令/数据存储装置,处理器121通过运行存储在存储器123内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的确定对象实体的方法。存储器123可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器123可进一步包括相对于处理器121远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备12。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置125用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机设备12的通信供应商提供的无线网络。在一个实例中,传输装置125包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置125可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机设备12的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图12所示的计算机设备12可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图12仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备12中的部件的类型。
此处需要说明的是,在一些实施例中,上述图12所示的计算机设备具有触摸显示器(也被称为“触摸屏”或“触摸显示屏”)。在一些实施例中,上述图12所示的计算机设备具有图像用户界面(GUI),用户可以通过触摸触敏表面上的手指接触和/或手势来与GUI进行人机交互,此处的人机交互功能可选的包括如下交互:创建网页、绘图、文字处理、制作电子文档、游戏、视频会议、即时通信、收发电子邮件、通话界面、播放数字视频、播放数字音乐和/或网络浏览等、用于执行上述人机交互功能的可执行指令被配置/存储在一个或多个处理器可执行的计算机程序产品或可读存储介质中。
在本实施例中,上述计算机设备12可以执行应用程序的确定对象实体的方法中以下步骤的程序代码:获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
可选的,上述处理器还可以执行如下步骤的程序代码:获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
可选的,上述处理器还可以执行如下步骤的程序代码:获取特征信息的权重和相似度的权重;基于特征信息、计算得到的相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度。
可选的,上述处理器还可以执行如下步骤的程序代码:计算特征信息的权重和特征信息的乘积,得到第一数据;计算相似度的权重和相似度的乘积,得到第二数据;对第一数据和第二数据进行求和,得到对象实体针对特定事件的重要度。
可选的,上述处理器还可以执行如下步骤的程序代码:获取对象实体对应的传播因素;获取传播因素的传播能量值;根据传播因素的传播能量值,获取对象实体针对特定事件的传播结果。
可选的,上述传播因素包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
可选的,上述处理器还可以执行如下步骤的程序代码:在传播因素为对象实体的转发信息的数量的情况下,传播能量值为基于对象实体的转发信息的数量,计算得到的转发平均值;在传播因素为评论的数量的情况下,传播能量值为基于对象实体的评论的数量,计算得到的评论平均值;在传播因素为关联对象发布原创内容的数量的情况下,传播能量值为基于关联对象发布原创内容的数量,计算得到的关联对象发布原创内容的频率。
可选的,上述处理器还可以执行如下步骤的程序代码:计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;对乘积值进行求和,得到对象实体针对特定事件的重要度。
可选的,上述处理器还可以执行如下步骤的程序代码:显示预定时间内获取到的影响力值超过阈值的至少一个对象实体的信息。
本领域普通技术人员可以理解,图12所示的结构仅为示意,计算机设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图12其并不对上述电子装置的结构造成限定。例如,计算机设备12还可包括比图12中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图12所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例7
本申请的实施例还提供了一种存储介质。可选的,在本实施例中,上述存储介质可以用于保存上述实施例所提供的确定对象实体的方法所执行的程序代码,其中,在程序运行时控制存储介质所在设备执行实施例中任意一项的可选的或优选的确定对象实体的方法。
可选的,在本实施例中,上述存储介质可以位于计算机网络中移动终端群中的任意一个移动终端中,或者位于移动终端群中的任意一个移动终端中。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取对象实体针对特定事件的特征信息,其中,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取特征信息的权重和相似度的权重;基于特征信息、计算得到的相似度,以及特征信息的权重和相似度的权重进行加权和计算,得到对象实体针对特定事件的重要度。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:计算特征信息的权重和特征信息的乘积,得到第一数据;计算相似度的权重和相似度的乘积,得到第二数据;对第一数据和第二数据进行求和,得到对象实体针对特定事件的重要度。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取对象实体对应的传播因素;获取传播因素的传播能量值;根据传播因素的传播能量值,获取对象实体针对特定事件的传播结果。
可选的,上述传播因素包括:对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,关联对象为与对象实体关联的对象。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在传播因素为对象实体的转发信息的数量的情况下,传播能量值为基于对象实体的转发信息的数量,计算得到的转发平均值;在传播因素为评论的数量的情况下,传播能量值为基于对象实体的评论的数量,计算得到的评论平均值;在传播因素为关联对象发布原创内容的数量的情况下,传播能量值为基于关联对象发布原创内容的数量,计算得到的关联对象发布原创内容的频率。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;对乘积值进行求和,得到对象实体针对特定事件的重要度。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取预定时间段内影响力值超过阈值的对象实体。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:显示对象实体针对特定事件的特征信息;显示影响力值超过阈值的至少一个对象实体的信息,其中,根据对象实体的特征信息,以及特定事件与对应的特征信息之间的相似度,获取对象实体针对特定事件的重要度,并根据对象实体的重要度,确定对象实体的影响力值。
可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:显示预定时间内获取到的影响力值超过阈值的至少一个对象实体的信息。
实施例8
本申请的实施例还提供了一种确定对象实体的系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取对象实体针对特定事件的特征信息,特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及原创内容的转发信息;计算特定事件与对应的特征信息之间的相似度;基于对象实体的特征信息和计算得到的相似度,获取对象实体针对特定事件的重要度;根据对象实体的重要度,确定对象实体的影响力值。
由上可知,在本申请上述实施例中,在获取到每个对象实体针对某一特定事件的一个或多个特征信息后,可以计算对象实体的每个特征信息与该特定事件之间的相似度,并根据获取到的每个对象实体针对该特定事件的特征信息以及对应的特征信息与当前事件之间的相似度,获取每个对象实体针对该特定事件的重要度,最后根据每个对象实体针对该特定事件的重要度,确定每个对象实体针对该特定事件的影响力值。
容易注意到是,由于在确定每个对象实体针对某一事件的重要度时不仅考虑了每个对象实体针对该特定事件的特征信息,还考虑了每个对象实体针对该特定事件的特征信息与该特定事件之间的相似度,可以更加准确地确定对象实体针对该特定事件的影响力值。
通过本申请上述实施例公开的方案,达到了根据用户针对特定事件的特征信息和对应的特征信息与特定事件之间的相似度来确定用户对该特定事件的影响力的目的,从而实现了提高意见领袖鉴定的准确性以便提高舆情分析结果的技术效果,进而解决了现有的舆情分析中用于确定用户对事件的影响力的方案由于考虑因素有限导致结果不准确的技术问题。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (22)
1.一种确定对象实体的方法,其特征在于,包括:
获取对象实体针对特定事件的特征信息,所述特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及所述原创内容的转发信息;
计算所述特定事件的事件信息与对应的特征信息之间的相似度,其中,所述事件信息至少包括所述特定事件的关键字或关键词;
基于所述对象实体的特征信息和计算得到的相似度,获取所述对象实体针对所述特定事件的重要度;
根据所述对象实体的重要度,确定所述对象实体的影响力值。
2.根据权利要求1所述的方法,其特征在于,基于所述对象实体的特征信息和计算得到的所述相似度,获取所述对象实体针对所述特定事件的重要度,包括:
获取所述特征信息的权重和所述相似度的权重;
基于所述特征信息、所述计算得到的相似度,以及所述特征信息的权重和所述相似度的权重进行加权和计算,得到所述对象实体针对所述特定事件的重要度。
3.根据权利要求2所述的方法,其特征在于,基于所述特征信息、所述计算得到的相似度,以及所述特征信息的权重和所述相似度的权重进行加权和计算,得到所述对象实体针对所述特定事件的重要度,包括:
计算所述特征信息的权重和所述特征信息的乘积,得到第一数据;
计算所述相似度的权重和所述相似度的乘积,得到第二数据;
对所述第一数据和所述第二数据进行求和,得到所述对象实体针对所述特定事件的重要度。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,在确定所述对象实体的影响力值之后,所述方法还包括:
获取所述对象实体对应的传播因素;
获取所述传播因素的传播能量值;
根据所述传播因素的传播能量值,获取所述对象实体针对所述特定事件的传播结果。
5.根据权利要求4所述的方法,其特征在于,所述传播因素包括:所述对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,所述关联对象为与所述对象实体关联的对象。
6.根据权利要求5所述的方法,其特征在于,获取所述传播因素的传播能量值,包括:
在所述传播因素为所述对象实体的转发信息的数量的情况下,所述传播能量值为基于所述对象实体的转发信息的数量,计算得到的转发平均值;
在所述传播因素为所述评论的数量的情况下,所述传播能量值为基于所述对象实体的评论的数量,计算得到的评论平均值;
在所述传播因素为所述关联对象发布原创内容的数量的情况下,所述传播能量值为基于所述关联对象发布原创内容的数量,计算得到的所述关联对象发布原创内容的频率。
7.根据权利要求6所述的方法,其特征在于,根据所述传播因素的传播能量值,获取所述对象实体针对所述特定事件的传播结果,包括:
计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;
对乘积值进行求和,得到所述对象实体针对所述特定事件的重要度。
8.根据权利要求1所述的方法,其特征在于,在确定所述对象实体的影响力值之后,所述方法还包括:获取预定时间段内影响力值超过阈值的对象实体。
9.一种确定对象实体的方法,其特征在于,包括:
显示对象实体针对特定事件的特征信息,所述特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及所述原创内容的转发信息;
显示影响力值超过阈值的至少一个对象实体的信息,其中,根据所述对象实体的特征信息,以及所述特定事件的事件信息与对应的特征信息之间的相似度,获取所述对象实体针对所述特定事件的重要度,并根据所述对象实体的重要度,确定所述对象实体的影响力值,所述事件信息至少包括所述特定事件的关键字或关键词。
10.根据权利要求9所述的方法,其特征在于,显示预定时间内获取到的影响力值超过阈值的至少一个对象实体的信息。
11.根据权利要求10所述的方法,其特征在于,根据所述对象实体的特征信息,以及所述特定事件与对应的特征信息之间的相似度,获取所述对象实体针对所述特定事件的重要度,包括:
获取所述特征信息的权重和所述相似度的权重;
基于所述特征信息、所述相似度,以及所述特征信息的权重和所述相似度的权重进行加权和计算,得到所述对象实体针对所述特定事件的重要度。
12.根据权利要求11所述的方法,其特征在于,基于所述特征信息、所述相似度,以及所述特征信息的权重和所述相似度的权重进行加权和计算,得到所述对象实体针对所述特定事件的重要度,包括:
计算所述特征信息的权重和所述特征信息的乘积,得到第一数据;
计算所述相似度的权重和所述相似度的乘积,得到第二数据;
对所述第一数据和所述第二数据进行求和,得到所述对象实体针对所述特定事件的重要度。
13.根据权利要求9所述的方法,其特征在于,在显示影响力值超过阈值的至少一个对象实体的信息之后,所述方法还包括:
显示与所述对象实体关联的关联对象的节点信息;
显示所述对象实体的内容针对所述特定事件的传播路径,其中,根据所述对象实体对应的传播因素的传播能量值,获取所述传播路径。
14.根据权利要求13所述的方法,其特征在于,所述传播因素包括:所述对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,所述关联对象为与所述对象实体关联的对象。
15.根据权利要求14所述的方法,其特征在于,在显示所述对象实体的内容针对所述特定事件的传播路径之前,所述方法还包括:
获取所述传播因素的传播能量值,该步骤包括:
在所述传播因素为所述对象实体的转发信息的数量的情况下,所述传播能量值为基于所述对象实体的转发信息的数量,计算得到的转发平均值;
在所述传播因素为所述评论的数量的情况下,所述传播能量值为基于所述对象实体的评论的数量,计算得到的评论平均值;
在所述传播因素为所述关联对象发布原创内容的数量的情况下,所述传播能量值为基于所述关联对象发布原创内容的数量,计算得到的所述关联对象发布原创内容的频率。
16.根据权利要求15所述的方法,其特征在于,根据所述对象实体对应的传播因素的传播能量值,获取所述传播路径,包括:
计算任意一个传播因素和对应的权重的乘积,得到至少一个乘积值;
对乘积值进行求和,得到所述对象实体针对所述特定事件的重要度。
17.一种确定对象实体的方法,其特征在于,包括:
显示影响力值超过阈值的至少一个对象实体的特征信息,并显示与所述对象实体关联的关联对象的节点信息,所述特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及所述原创内容的转发信息;
显示所述对象实体的内容针对特定事件的传播路径;
其中,根据所述对象实体的特征信息,以及所述特定事件的事件信息与对应的特征信息之间的相似度,获取所述对象实体针对所述特定事件的重要度,并根据所述对象实体的重要度,确定所述对象实体的影响力值,所述事件信息至少包括所述特定事件的关键字或关键词。
18.根据权利要求17所述的方法,其特征在于,在显示影响力值超过阈值的至少一个对象实体的信息之后,所述方法还包括:
根据所述对象实体对应的传播因素的传播能量值,获取所述传播路径。
19.根据权利要求18所述的方法,其特征在于,所述传播因素包括:所述对象实体的转发信息的数量、评论的数量和关联对象发布原创内容的数量,其中,所述关联对象为与所述对象实体关联的对象。
20.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述的确定对象实体的方法。
21.一种计算机设备,包括:处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至8中任意一项所述的确定对象实体的方法。
22.一种确定对象实体的系统,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获取对象实体针对特定事件的特征信息,所述特征信息包括:对象实体的身份信息、对象实体提交至应用平台的原创内容,以及所述原创内容的转发信息;
计算所述特定事件的事件信息与对应的特征信息之间的相似度,其中,所述事件信息至少包括所述特定事件的关键字或关键词;
基于所述对象实体的特征信息和计算得到的相似度,获取所述对象实体针对所述特定事件的重要度;
根据所述对象实体的重要度,确定所述对象实体的影响力值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711192489.7A CN109840319B (zh) | 2017-11-24 | 2017-11-24 | 确定对象实体的方法、系统及计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711192489.7A CN109840319B (zh) | 2017-11-24 | 2017-11-24 | 确定对象实体的方法、系统及计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109840319A CN109840319A (zh) | 2019-06-04 |
CN109840319B true CN109840319B (zh) | 2023-04-18 |
Family
ID=66877273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711192489.7A Active CN109840319B (zh) | 2017-11-24 | 2017-11-24 | 确定对象实体的方法、系统及计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109840319B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110704289A (zh) * | 2019-09-25 | 2020-01-17 | 数熙科技(北京)有限公司 | 监控kol账户的方法、装置以及存储介质 |
CN111198971B (zh) * | 2020-01-15 | 2023-06-06 | 北京百度网讯科技有限公司 | 搜索方法、搜索装置和电子设备 |
CN111371953A (zh) * | 2020-03-10 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 标记数据处理方法、设备及存储介质 |
CN112202889B (zh) * | 2020-09-30 | 2023-05-23 | 深圳前海微众银行股份有限公司 | 信息的推送方法、装置和存储介质 |
CN114040518A (zh) * | 2021-11-26 | 2022-02-11 | 中国银行股份有限公司 | 网络节点展示方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776667A (zh) * | 2015-11-18 | 2017-05-31 | 财团法人资讯工业策进会 | 社群文章影响力预测方法以及社群文章影响力预测装置 |
CN106980692A (zh) * | 2016-05-30 | 2017-07-25 | 国家计算机网络与信息安全管理中心 | 一种基于微博特定事件的影响力计算方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130238370A1 (en) * | 2012-03-06 | 2013-09-12 | Immersonal, Inc. | Event planning and management system |
-
2017
- 2017-11-24 CN CN201711192489.7A patent/CN109840319B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776667A (zh) * | 2015-11-18 | 2017-05-31 | 财团法人资讯工业策进会 | 社群文章影响力预测方法以及社群文章影响力预测装置 |
CN106980692A (zh) * | 2016-05-30 | 2017-07-25 | 国家计算机网络与信息安全管理中心 | 一种基于微博特定事件的影响力计算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109840319A (zh) | 2019-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840319B (zh) | 确定对象实体的方法、系统及计算机设备和存储介质 | |
Kwon et al. | Social network influence on online behavioral choices: Exploring group formation on social network sites | |
Kim | What drives you to check in on Facebook? Motivations, privacy concerns, and mobile phone involvement for location-based information sharing | |
Calvin et al. | # bully: Uses of hashtags in posts about bullying on Twitter | |
Ackland | Web social science: Concepts, data and tools for social scientists in the digital age | |
US9959548B2 (en) | Method and system for generating social signal vocabularies | |
US9424319B2 (en) | Social media based content selection system | |
US10747771B2 (en) | Method and apparatus for determining hot event | |
Tang et al. | Ranking user influence in healthcare social media | |
Tang | All I get is an emoji: Dating on lesbian mobile phone app Butterfly | |
CN106126582A (zh) | 推荐方法及装置 | |
JP6393686B2 (ja) | Pymkの使用およびコンテンツを価値モデルに基づいて判定するための方法およびシステム | |
JP6729590B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Xiong et al. | Understanding user-to-User interaction on government microblogs: An exponential random graph model with the homophily and emotional effect | |
US11010687B2 (en) | Detecting abusive language using character N-gram features | |
Gill et al. | Chatting in a mobile chamber: effects of instant messenger use on tolerance toward political misinformation among South Koreans | |
US9418391B2 (en) | System for influencer scoring and methods thereof | |
WO2014118614A1 (en) | Social rewards | |
CN107634897A (zh) | 群推荐方法和装置 | |
WO2015131306A1 (en) | Dynamics of tie strength from social interaction | |
Frey et al. | Mobile recommendations based on interest prediction from consumer's installed apps–insights from a large-scale field study | |
CN111557014A (zh) | 提供多个个人资料的方法及系统 | |
Cui et al. | Personalized microblog recommendation using sentimental features | |
US20150371162A1 (en) | System and method for identifying enterprise risks emanating from social networks | |
Ma et al. | “Hello, Fellow Villager!”: Perceptions and Impact of Displaying Users’ Locations on Weibo |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |