CN106354733B - 一种微博用户影响力计算方法及装置 - Google Patents

一种微博用户影响力计算方法及装置 Download PDF

Info

Publication number
CN106354733B
CN106354733B CN201510423499.1A CN201510423499A CN106354733B CN 106354733 B CN106354733 B CN 106354733B CN 201510423499 A CN201510423499 A CN 201510423499A CN 106354733 B CN106354733 B CN 106354733B
Authority
CN
China
Prior art keywords
microblog
influence
user
calculating
propagation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510423499.1A
Other languages
English (en)
Other versions
CN106354733A (zh
Inventor
李光瑞
钱岭
徐萌
吴斌
刘金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongchang (suzhou) Software Technology Co Ltd
China Mobile Communications Group Co Ltd
Original Assignee
Zhongchang (suzhou) Software Technology Co Ltd
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongchang (suzhou) Software Technology Co Ltd, China Mobile Communications Group Co Ltd filed Critical Zhongchang (suzhou) Software Technology Co Ltd
Priority to CN201510423499.1A priority Critical patent/CN106354733B/zh
Publication of CN106354733A publication Critical patent/CN106354733A/zh
Application granted granted Critical
Publication of CN106354733B publication Critical patent/CN106354733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种微博用户影响力计算方法,包括:为微博用户构建传播模型;根据传播模型和加权佩奇排名(PageRank)算法计算微博用户的影响力;根据微博用户的影响力计算微博用户的影响力真实性系数;根据微博用户的影响力真实性系数计算微博用户的最终影响力。本发明还同时公开了一种微博用户影响力计算装置。

Description

一种微博用户影响力计算方法及装置
技术领域
本发明涉及社交关系网络技术,尤其涉及一种微博用户影响力计算方法及装置。
背景技术
随着互联网的发展,微博应用越来越广泛。微博平台上用户与用户相互之间的关系构成了一个巨大的社交关系网络,其中,每个微博用户为所述社交关系网络中的节点,点名关系、评论关系和转发关系为所述社交关系网络中的边。这里,评论关系和转发关系是微博用户使用率最高的微博功能;一方面,微博用户习惯于评论和转发自己关注的微博用户发布的相关微博;另一方面,微博用户会不断发现新的微博用户发布的微博并进行评论和转发。
现有技术中,计算微博用户影响力时主要使用数据挖掘领域中的图算法;这里,所谓微博用户影响力为量化计算微博用户之间的影响关系。需要说明的是,当数据量较大时,计算微博用户影响力还需要使用并行的图挖掘算法。具体地,计算所述微博用户影响力的步骤如下:
首先,根据微博用户之间的关系构建社交关系网络图,社交关系网络图一般为有向图。这里,每个微博用户作为所述社交关系网络图中的每个节点,且每个微博用户都有一条有向边指向他所关注的微博用户。其中,所述有向边代表微博用户的影响力对他所关注的微博用户的影响力有一定的支持作用。当一个微博用户有很多影响力较大的粉丝时,毫无疑问所述微博用户也具有较大的影响力,因此,所述社交关系网络图符合实际原理。
其次,在构建好的社交关系网络图中运行图排序算法,以对社交关系网络图中的节点重要性进行分析,所述节点重要性即为微博用户影响力。当数据量较大时,需要运行并行图排序算法在分布式系统中进行计算。计算出来的表征节点重要性的数值即为微博用户影响力大小在数值上的体现,这里,进行排序可以计算出微博用户影响力的相对排名。
目前,比较流行的图排序算法主要有佩奇排名(PageRank,PR)算法,PageRank算法是谷歌(Google)创始人之一拉里·佩奇(Larry Page)早期构建搜索引擎原型系统时提出的链接分析方法,许多早期的搜索引擎都采用了PageRank算法以识别网页的权威性。PageRank算法不仅考虑了网页的入链数量,还考虑了网页入链的质量。PageRank算法主要基于两个假设:第一,当一个网页在网络中被其他网页链接的次数越多,则所述网页的重要性越高。第二,指向网页的入链质量有所不同。具体地,质量高的入链会给所述网页带来更高的权重,因此,指向网页的入链质量越高,所述网页的重要程度也越高。
在计算微博用户影响力时,PageRank算法也完全适用,即,微博用户的关注者越多,微博用户影响力越大。此外,微博用户的关注者中影响力高的关注者越多,微博用户影响力越大。在PageRank算法的初始阶段,每个网页被赋予相同的权值。根据社交关系网络的连接关系,每一轮PageRank值的计算都会更新节点的权值。在更新过程中,每个网页将当前的PageRank值平均分配给网页包含的出链上,同时每个网页页面得到其入链传入的全部权值。如此迭代重复上述过程,当整个社交关系网络中的权值基本稳定,PageRank算法停止。此时,每个节点的权值就是网页页面最终的PageRank值。
尤其地,计算微博用户影响力通常使用加权PageRank算法,加权PageRank算法使用微博用户之间的联系紧密度对社交关系网络图中的边进行加权,这里,微博用户之间的联系紧密度主要根据微博用户之间的相互转发和评论的频率进行衡量;将所述社交关系网络图中的每条边加权之后得到加权有向图,然后运行加权PageRank算法。在加权PageRank算法中,在每一次迭代时,各个节点不是将自己的PR值平均传给自己的邻居节点,而是根据边的权值比例来分配PR值,即所述边的权值占节点所有向外的边权值之和的比例。加权PageRank算法体现了微博用户之间交往的差异性,使得计算得出的微博用户影响力更加接近于现实中的微博用户影响力。
现有技术中的微博用户影响力计算方法的缺陷和不足,具体表现为如下几点:首先,现有技术中的微博用户影响力算法仅利用微博用户和微博用户之间的交往关系,并没有考虑到微博的作用;这里,微博是信息传播的主要媒介,因此对微博用户影响力有很大的促进作用。利用微博和微博用户的相互作用关系计算得到的微博用户影响力比仅使用微博用户和微博用户之间的交往关系计算得到的微博用户影响力更符合实际情况。
其次,现有技术中的微博用户影响力算法只是单纯的计算微博用户的表象影响力,并没有考虑到虚假用户对计算结果的干扰。众所周知,微博用户中充斥着大量的虚假用户,一般将虚假用户分别命名为水军用户和僵尸用户,水军用户雇佣大批僵尸用户转发和评论自己的微博,造成水军用户影响力很大的假象。这种现象会导致计算结果被假象干扰,从而导致计算出的微博用户影响力不是微博用户的真实影响力。
发明内容
有鉴于此,本发明实施例期望提供一种微博用户影响力计算方法及装置,不仅能使计算得到的微博用户影响力更加科学合理,而且能使计算得到的所述微博用户的最终影响力更加接近微博用户的真实影响力。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种微博用户影响力计算方法,包括:
为微博用户构建传播模型;
根据所述传播模型和加权佩奇排名PageRank算法计算所述微博用户的影响力;
根据所述微博用户的影响力计算所述微博用户的影响力真实性系数;
根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。
上述方案中,所述传播模型包括:用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型。
上述方案中,所述根据所述传播模型和加权PageRank算法计算所述微博用户的影响力包括:
根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力,根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力,根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力。
上述方案中,所述根据所述微博用户的影响力计算所述微博用户的影响力真实性系数包括:
根据所述微博用户的第一影响力和所述微博用户的第二影响力分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名;
根据所述微博用户的第一影响力排名和所述微博用户的第二影响力排名计算所述微博用户的影响力真实性系数,其中,所述微博用户的影响力真实性系数为1与所述微博用户的第一影响力排名减去所述微博用户的第二影响力排名再除以微博用户数目之后的平方再相减。
上述方案中,所述微博用户的最终影响力为所述微博用户的第三影响力与所述微博用户的影响力真实性系数的乘积。
上述方案中,所述根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力包括:
所述加权PageRank算法根据所有第一加权因子计算所述微博用户的第一影响力,其中,每个所述第一加权因子为其他每个微博用户点名所述微博用户的次数和评论所述微博用户发布的微博的次数之和与所述其他每个微博用户点名和评论的总次数相除;
所述根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力包括:
所述加权PageRank算法根据所有第二加权因子计算所述微博用户的第二影响力,其中,每个所述第二加权因子为所述其他每个微博用户转发和评论所述微博用户发布的微博的次数之和与所述其他每个微博用户转发和评论的总次数相除;
所述根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力包括:
所述加权PageRank算法根据所述所有第一加权因子和所述所有第二加权因子计算所述微博用户的第三影响力。
本发明实施例还提供了一种微博用户影响力计算装置,包括:
传播模型构建模块,用于为微博用户构建传播模型;
影响力计算模块,用于根据所述传播模型和加权PageRank算法计算所述微博用户的影响力;
影响力真实性系数计算模块,用于根据所述微博用户的影响力计算所述微博用户的影响力真实性系数;
最终影响力计算模块,用于根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。
上述方案中,所述传播模型构建模块为所述微博用户构建的所述传播模型包括:用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型。
上述方案中,所述影响力计算模块包括:
第一影响力计算单元,用于根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力;
第二影响力计算单元,用于根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力;
第三影响力计算单元,用于根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力。
上述方案中,所述影响力真实性系数计算模块包括:
影响力排名计算单元,用于根据所述微博用户的第一影响力和所述微博用户的第二影响力分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名;
影响力真实性系数计算单元,用于根据所述微博用户的第一影响力排名和所述微博用户的第二影响力排名计算所述微博用户的影响力真实性系数,其中,所述微博用户的影响力真实性系数为1与所述微博用户的第一影响力排名减去所述微博用户的第二影响力排名再除以微博用户数目之后的平方再相减。
本发明实施例所提供的微博用户影响力计算方法及装置,由微博用户影响力计算装置为微博用户构建传播模型;所述微博用户影响力计算装置先根据所述传播模型和加权PageRank算法计算所述微博用户的影响力;再根据所述微博用户的影响力计算所述微博用户的影响力真实性系数;之后,根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。由于本发明实施例基于传播模型计算所述微博用户的最终影响力,这样,不但综合考虑了微博用户之间的交往关系和微博在信息传播中的重要作用;而且,利用微博和微博用户的相互支持作用使得计算出的微博用户影响力更加科学、全面、合理;同时,本发明实施例根据用户至用户传播模型、用户至微博传播模型计算所述微博用户的影响力真实性系数,使得微博用户影响力得到修正,从而在一定程度上排除了虚假用户对微博用户影响力的干扰;消除了僵尸用户和水军用户的影响,进而使得计算得到的所述微博用户的最终影响力更加接近真实的微博用户影响力。
附图说明
图1为本发明实施例1提供的微博用户影响力计算方法的实现流程示意图;
图2为本发明实施例1提供的用户关系网络图;
图3为本发明实施例1提供的微博用户影响力计算方法的另一实现流程示意图;
图4为本发明实施例2提供的微博用户影响力计算装置的组成结构示意图。
具体实施方式
本发明实施例中,由微博用户影响力计算装置为微博用户构建传播模型;所述微博用户影响力计算装置先根据所述传播模型和加权PageRank算法计算所述微博用户的影响力;再根据所述微博用户的影响力计算所述微博用户的影响力真实性系数;之后,根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。
下面结合附图及具体实施例对本发明再做进一步详细的说明。
实施例1
图1为本发明实施例1提供的微博用户影响力计算方法的实现流程示意图,如图1所示,所述方法包括:
步骤110:为微博用户构建传播模型。
在步骤110中,所述传播模型包括:用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型。
具体地,微博用户影响力计算装置分别为微博用户构建用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型。所述分别构建用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型包括:
构建用户关系网络图,根据所述用户关系网络图构建所述用户至用户传播模型;
构建用户至微博关系网络图,根据所述用户至微博关系网络图构建所述用户至微博传播模型;
根据所述用户关系网络图和所述用户至微博关系网络图构建用户至微博至用户网络超图,根据所述用户至微博至用户网络超图构建所述用户至微博至用户传播模型。
如图2所示,所述微博用户影响力计算装置根据所述用户关系网络图,以构建所述用户至用户传播模型。具体地,图2中的节点A、B、C、D、E、F、G、H分别代表微博用户,图2中的有向边代表一个微博用户对另一个微博用户的点名和评论,其中,所述有向边的值为第一加权因子。
另外,所述微博用户影响力计算装置根据所述用户至微博关系网络图,以构建所述用户至微博传播模型。例如,在用户至微博关系网络图中,微博用户j与微博用户j发布的微博v各自代表两种不同类型的节点,微博用户j节点与微博用户j发布的微博v节点之间生成有向边v→j。当微博用户节点i评论或者转发微博节点v会生成有向边i→v,其中,所述有向边的值为第二加权因子。微博至用户边v→j的权重均记为1,以便微博用户j发布的微博生成的影响力快速被反馈给j。在用户至微博关系网络图中,微博用户和微博根据边的方向和权重不断传播权重,直到形成稳定的微博关系网络结构。
最后,所述微博用户影响力计算装置根据微博用户之间的互粉关系和微博用户与微博的转发评论关系,将所述用户关系网络图和所述用户至微博关系网络图融合为一个网络超图,即用户至微博至用户网络超图。其中,所述用户至微博至用户网络超图既包括微博用户至微博用户之间的有向边,也包括微博用户至微博、微博至微博用户之间的有向边。
步骤120:根据所述传播模型和加权PageRank算法计算所述微博用户的影响力。
如图3所示,所述根据所述传播模型和加权PageRank算法计算所述微博用户的影响力包括:
根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力,根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力,根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力。
进一步地,所述根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力包括:
所述加权PageRank算法根据所有第一加权因子计算所述微博用户的第一影响力,其中,每个所述第一加权因子为其他每个微博用户点名所述微博用户的次数和评论所述微博用户发布的微博的次数之和与所述其他每个微博用户点名和评论的总次数相除。
这里,每个所述第一加权因子的计算过程举例如下:假设微博用户i在微博应用中采用点名(@)和评论的方式对微博用户j点名和评论所述微博用户j发布的微博的次数为Aij;同时,微博用户i所有点名和评论总次数为A,则微博用户i和微博用户j有向边的第一加权因子为
需要说明的是,所述微博用户的第一影响力的取值范围为0到1之间的小数。
所述根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力包括:
所述加权PageRank算法根据所有第二加权因子计算所述微博用户的第二影响力,其中,每个所述第二加权因子为所述其他每个微博用户转发和评论所述微博用户发布的微博的次数之和与所述其他每个微博用户转发和评论的总次数相除。
这里,每个所述第二加权因子的计算过程举例如下:假设微博用户i至微博用户j发布的微博v的有向边为i→v,微博用户i所有的转发和评论的总次数为,微博用户i对于所述微博用户j发布的微博v的转发和评论次数之和为Siv,则有向边i→v的第二加权因子为
需要说明的是,所述微博用户的第二影响力的取值范围为0到1之间的小数。
所述根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力包括:
所述加权PageRank算法根据所述所有第一加权因子和所述所有第二加权因子计算所述微博用户的第三影响力。
需要说明的是,所述微博用户的第三影响力的取值范围为0到1之间的小数。
步骤130:根据所述微博用户的影响力计算所述微博用户的影响力真实性系数。
如图3所示,所述根据所述微博用户的影响力计算所述微博用户的影响力真实性系数包括:
根据所述微博用户的第一影响力和所述微博用户的第二影响力分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名;
根据所述微博用户的第一影响力排名和所述微博用户的第二影响力排名计算所述微博用户的影响力真实性系数,其中,所述微博用户的影响力真实性系数为1与所述微博用户的第一影响力排名减去所述微博用户的第二影响力排名再除以微博用户数目之后的平方再相减。
例如,所述微博用户影响力计算装置根据所述微博用户j的第一影响力计算得到微博用户j的第一影响力排名为UUj,根据所述微博用户j的第二影响力计算得到微博用户j的第二影响力排名为UVj,则所述微博用户影响力计算装置计算得到的所述微博用户j的影响力真实性系数为:
其中,N为微博应用中的所有微博用户节点个数,所述Tj的取值范围为0到1之间的小数。
需要说明的是,所述微博用户的影响力真实性系数量化反映了所述微博用户的第一影响力和所述微博用户的第二影响力之间的差别。所述差别越大,则所述微博用户的第一影响力和所述微博用户的第二影响力的可信度越低,因此所述微博用户的影响力真实性系数越小。这里,所述微博用户的影响力真实性系数使得微博用户的影响力得到正确的修正。
步骤140:根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。
如图3所示,根据所述微博用户的第三影响力和所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。
这里,所述微博用户的最终影响力为所述微博用户的第三影响力与所述微博用户的影响力真实性系数的乘积。
例如,微博用户j的第三影响力值为PRj,所述微博用户影响力计算装置使用所述微博用户j的影响力真实性系数Tj加权后,得到微博用户j的最终影响力为:
至此,微博用户影响力计算的过程就完成了。
本发明实施例1提供的微博用户影响力计算方法并没有直接根据用户至用户模型、用户至微博模型进行所述微博用户影响力的计算。一方面,因为微博应用中存在大量的僵尸用户,这些僵尸用户并不活跃,只是通过关注其他微博用户使得其他微博用户的影响力得到提高,因此仅根据微博用户关系衡量微博用户影响力会导致计算结果不准确。另一方面,用户至微博模型中隐藏着大量的水军用户,水军用户大量转发其他微博用户发布的微博内容,但是水军用户很少发布微博,这样将给微博用户的真实影响力的计算带来偏差。本发明实施例1提供的微博用户影响力计算装置分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名,分析所述微博用户的第一影响力排名和所述微博用户的第二影响力排名的偏差量,以衡量微博用户影响力真实性。如果所述微博用户的第一影响力排名和所述微博用户的第二影响力排名较一致,则所述微博用户的第一影响力排名和所述微博用户的第二影响力排名较真实。如果所述微博用户的第一影响力排名和所述微博用户的第二影响力排名不一致,则所述微博用户的第一影响力排名和所述微博用户的第二影响力排名偏差较大,导致微博影响力的计算结果不真实。因此,微博用户影响力计算装置设定衡量微博用户影响力真实性的影响力真实性系数。
所述微博用户的影响力真实性系数反映了所述微博用户的第一影响力和所述微博用户的第二影响力之间的差别,差别越大,则微博用户的影响力可信度越低,因此所述微博用户的影响力真实性系数越小。随后,微博用户影响力计算装置根据所述用户至微博至用户传播模型计算微博用户的最终影响力。所述用户至微博至用户传播模型综合考虑了微博用户与微博用户之间的关系、微博用户和微博之间的关系,并使用所述微博用户的影响力真实性系数为影响力加权来得到微博用户的最终影响力。可以看出,本发明实施例1提供的微博用户影响力计算方法在一定程度上消除了僵尸用户和水军用户对微博用户影响力计算结果的偏差。
需要说明的是,本发明实施例1提供的微博用户影响力计算方法基于分布式文件系统(HDFS,Hadoop Distributed File System)和并行框架(HAMA BSP,HAMA BulkSynchronous Parallel)对大规模的关系网络图进行计算,从而可以处理海量的微博数据,突破了微博数据规模的限制。
实施例2
图4为本发明实施例2提供的微博用户影响力计算装置的实现流程示意图,如图4所示,所述装置包括:
传播模型构建模块210,用于为微博用户构建传播模型。
具体地,所述传播模型构建模块210为所述微博用户构建的所述传播模型包括:用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型。
影响力计算模块220,用于根据所述传播模型和加权PageRank算法计算所述微博用户的影响力。
具体地,所述影响力计算模块220包括:
第一影响力计算单元,用于根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力;
第二影响力计算单元,用于根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力;
第三影响力计算单元,用于根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力。
影响力真实性系数计算模块230,用于根据所述微博用户的影响力计算所述微博用户的影响力真实性系数。
具体地,所述影响力真实性系数计算模块230包括:
影响力排名计算单元,用于根据所述微博用户的第一影响力和所述微博用户的第二影响力分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名;
影响力真实性系数计算单元,用于根据所述微博用户的第一影响力排名和所述微博用户的第二影响力排名计算所述微博用户的影响力真实性系数,其中,所述微博用户的影响力真实性系数为1与所述微博用户的第一影响力排名减去所述微博用户的第二影响力排名再除以微博用户数目之后的平方再相减。
最终影响力计算模块240,用于根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力。
具体地,所述最终影响力计算模块240计算得到的所述微博用户的最终影响力为所述微博用户的第三影响力与所述微博用户的影响力真实性系数的乘积。
在实际应用中,所述传播模型构建模块210、所述影响力计算模块220、所述影响力真实性系数计算模块230、所述最终影响力计算模块240、第一影响力计算单元、第二影响力计算单元、第三影响力计算单元、影响力排名计算单元和影响力真实性系数计算单元均可由位于任意计算机设备中的中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)、微处理器(MPU)、或可编程逻辑阵列(FPGA,FieldProgrammable Gate Array)实现。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (6)

1.一种微博用户影响力计算方法,其特征在于,所述方法包括:
为微博用户构建传播模型;
根据所述传播模型和加权佩奇排名PageRank算法计算所述微博用户的影响力;
根据所述微博用户的影响力计算所述微博用户的影响力真实性系数;
根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力;
其中,所述传播模型包括:用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型;
所述根据所述传播模型和加权PageRank算法计算所述微博用户的影响力包括:根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力,根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力,根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力。
2.根据权利要求1所述的方法,其特征在于,所述根据所述微博用户的影响力计算所述微博用户的影响力真实性系数包括:
根据所述微博用户的第一影响力和所述微博用户的第二影响力分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名;
根据所述微博用户的第一影响力排名和所述微博用户的第二影响力排名计算所述微博用户的影响力真实性系数,其中,所述微博用户的影响力真实性系数为1与所述微博用户的第一影响力排名减去所述微博用户的第二影响力排名再除以微博用户数目之后的平方再相减。
3.根据权利要求1所述的方法,其特征在于,所述微博用户的最终影响力为所述微博用户的第三影响力与所述微博用户的影响力真实性系数的乘积。
4.根据权利要求1、2或3所述的方法,其特征在于,所述根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力包括:
所述加权PageRank算法根据所有第一加权因子计算所述微博用户的第一影响力,其中,每个所述第一加权因子为其他每个微博用户点名所述微博用户的次数和评论所述微博用户发布的微博的次数之和与所述其他每个微博用户点名和评论的总次数相除;
所述根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力包括:
所述加权PageRank算法根据所有第二加权因子计算所述微博用户的第二影响力,其中,每个所述第二加权因子为所述其他每个微博用户转发和评论所述微博用户发布的微博的次数之和与所述其他每个微博用户转发和评论的总次数相除;
所述根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力包括:
所述加权PageRank算法根据所述所有第一加权因子和所述所有第二加权因子计算所述微博用户的第三影响力。
5.一种微博用户影响力计算装置,其特征在于,所述装置包括:
传播模型构建模块,用于为微博用户构建传播模型;
影响力计算模块,用于根据所述传播模型和加权PageRank算法计算所述微博用户的影响力;
影响力真实性系数计算模块,用于根据所述微博用户的影响力计算所述微博用户的影响力真实性系数;
最终影响力计算模块,用于根据所述微博用户的影响力真实性系数计算所述微博用户的最终影响力;
其中,所述传播模型构建模块为所述微博用户构建的所述传播模型包括:用户至用户传播模型、用户至微博传播模型和用户至微博至用户传播模型;
所述影响力计算模块包括:
第一影响力计算单元,用于根据所述用户至用户传播模型和所述加权PageRank算法计算所述微博用户的第一影响力;
第二影响力计算单元,用于根据所述用户至微博传播模型和所述加权PageRank算法计算所述微博用户的第二影响力;
第三影响力计算单元,用于根据所述用户至微博至用户传播模型和所述加权PageRank算法计算所述微博用户的第三影响力。
6.根据权利要求5所述的装置,其特征在于,所述影响力真实性系数计算模块包括:
影响力排名计算单元,用于根据所述微博用户的第一影响力和所述微博用户的第二影响力分别计算所述微博用户的第一影响力排名和所述微博用户的第二影响力排名;
影响力真实性系数计算单元,用于根据所述微博用户的第一影响力排名和所述微博用户的第二影响力排名计算所述微博用户的影响力真实性系数,其中,所述微博用户的影响力真实性系数为1与所述微博用户的第一影响力排名减去所述微博用户的第二影响力排名再除以微博用户数目之后的平方再相减。
CN201510423499.1A 2015-07-17 2015-07-17 一种微博用户影响力计算方法及装置 Active CN106354733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510423499.1A CN106354733B (zh) 2015-07-17 2015-07-17 一种微博用户影响力计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510423499.1A CN106354733B (zh) 2015-07-17 2015-07-17 一种微博用户影响力计算方法及装置

Publications (2)

Publication Number Publication Date
CN106354733A CN106354733A (zh) 2017-01-25
CN106354733B true CN106354733B (zh) 2019-12-06

Family

ID=57842419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510423499.1A Active CN106354733B (zh) 2015-07-17 2015-07-17 一种微博用户影响力计算方法及装置

Country Status (1)

Country Link
CN (1) CN106354733B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203622B (zh) * 2017-05-25 2020-11-06 广州市细行信息技术有限公司 一种评估准确的网络用户影响力评估系统
CN112528167B (zh) * 2020-12-21 2022-03-11 广州迅捷微风信息科技有限公司 一种基于社交媒体挖掘用户影响力的方法及电子装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9773091B2 (en) * 2011-10-31 2017-09-26 The Scripps Research Institute Systems and methods for genomic annotation and distributed variant interpretation
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
CN104123352A (zh) * 2014-07-10 2014-10-29 西安理工大学 面向微博的话题层次用户影响力度量方法

Also Published As

Publication number Publication date
CN106354733A (zh) 2017-01-25

Similar Documents

Publication Publication Date Title
WO2019114423A1 (zh) 对模型预测值进行融合的方法、装置和设备
US20200026759A1 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
Nastić et al. A combined geometric INAR (p) model based on negative binomial thinning
CN102262681A (zh) 一种博客信息传播中识别关键博客集的方法
CN104166726B (zh) 一种面向微博文本流的突发关键词检测方法
JP6661754B2 (ja) コンテンツ配信方法および装置
US20170091689A1 (en) Continuously variable resolution of resource allocation
US11651198B2 (en) Data processing method and apparatus for neural network
CN106354733B (zh) 一种微博用户影响力计算方法及装置
US20100205075A1 (en) Large-scale item affinity determination using a map reduce platform
CN103631901A (zh) 一种基于用户信任网络最大生成树的谣言控制方法
Garcia-Alfaro et al. Data Privacy Management, Autonomous Spontaneous Security, and Security Assurance: 9th International Workshop, DPM 2014, 7th International Workshop, SETOP 2014, and 3rd International Workshop, QASA 2014, Wroclaw, Poland, September 10-11, 2014. Revised Selected Papers
CN114493786A (zh) 一种信息推荐方法及装置
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
US10726367B2 (en) Resource allocation forecasting
CN107220702B (zh) 一种低计算能力处理设备的计算机视觉处理方法及装置
CN110019531A (zh) 一种获取相似对象集合的方法和装置
Valdez-Martínez et al. Communication Times Reconstruction in a Telecontrolled Client–Server Scheme: An Approach by Kalman Filter Applied to a Proprietary Real-Time Operating System and TCP/IP Protocol
Mandavilli et al. Detection of natural disaster affected areas using R
Kalam et al. 5g traffic forecasting using federated learning
Lee et al. An efficient parallel graph clustering technique using Pregel
CN110958565A (zh) 计算信号距离的方法、装置、计算机设备和存储介质
CN109902831A (zh) 业务决策处理方法以及装置
CN109858812B (zh) 基于区块链的人力资源管理方法、装置、介质及电子设备
US11275782B2 (en) Digital systems and methods for a consolidated transfer matrix

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant