CN104281669A - 社交网络用户影响数值的评估方法和装置 - Google Patents

社交网络用户影响数值的评估方法和装置 Download PDF

Info

Publication number
CN104281669A
CN104281669A CN201410508554.2A CN201410508554A CN104281669A CN 104281669 A CN104281669 A CN 104281669A CN 201410508554 A CN201410508554 A CN 201410508554A CN 104281669 A CN104281669 A CN 104281669A
Authority
CN
China
Prior art keywords
user
identified
interest topic
social message
represent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410508554.2A
Other languages
English (en)
Other versions
CN104281669B (zh
Inventor
鲍亮
王焱楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201410508554.2A priority Critical patent/CN104281669B/zh
Publication of CN104281669A publication Critical patent/CN104281669A/zh
Application granted granted Critical
Publication of CN104281669B publication Critical patent/CN104281669B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明涉及一种社交网络用户影响数值的评估方法和装置,其中方法包括:获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度,构建用户网络;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。

Description

社交网络用户影响数值的评估方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种社交网络用户影响数值的评估方法和装置。
背景技术
目前,随着网络技术的发展,微博成为当前十分流行的一种社交网络交互系统,微博的注册用户数量已经达到亿万级别。微博用户往往通过短小精悍的文本来描述新闻、事件及表达自己的观点。其中,微博用户影响数值是评估发布消息的用户的影响数值或其权威性或受关注程度等的关键参数,用户的影响数值越大,用户所受到的关注程度越高,对网络的干涉和影响作用也就越大。
现有技术中,微博用户影响数值的评估方法主要包括:对微博用户的多个操作行为进行统计分析,得到多个操作行为的数量,操作行为指的是微博消息的发布、关注和转发等,为多个操作行为设置相对应的权值,根据评估公式,计算微博用户的影响数值。然而,根据上述方法难以获取微博用户在特定主题下的影响数值,难以对特定主题的微博消息的传播进行有效的控制。
发明内容
本发明提供一种社交网络用户影响数值的评估方法和装置,用于解决现有技术中难以获取微博用户在特定主题下的影响数值的问题。
本发明的第一个方面是提供一种社交网络用户影响数值的评估方法,包括:
获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。
本发明的另一个方面提供一种社交网络用户影响数值的评估装置,包括:
获取模块,用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
确定模块,用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
所述确定模块,还用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
构建模块,用于根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
计算模块,用于针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。
本发明中,通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度;根据每个待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而能够根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。
附图说明
图1为本发明提供的社交网络用户影响数值的评估方法一个实施例的流程图;
图2为用户网络的示意图;
图3为本发明提供的社交网络用户影响数值的评估装置一个实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明提供的社交网络用户影响数值的评估方法一个实施例的流程图,如图1所示,包括:
101、获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息。
本发明提供的社交网络用户影响数值的评估方法的执行主体可以为社交网络用户影响数值的评估装置,社交网络用户影响数值的评估装置具体为位于社交网络中服务器上的软件工具。
由于社交网络中的用户数量极大,用户消息的数量也极大,社交网络用户影响数值的评估装置难以获取社交网络中所有用户所发布的社交消息,而社交网络中影响数值较大的用户一般为粉丝数、被关注数或社交消息发送次数较多的用户。因此,社交网络用户影响数值的评估装置可以根据用户的粉丝数、被关注数或者社交消息发送次数等来选择待识别的用户。例如,社交网络用户影响数值的评估装置可以选择粉丝数大于预设粉丝数的用户作为待识别的用户,或者,选择被关注数大于预设被关注数的用户作为待识别的用户。
其中,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息。社交消息具体可以为微博消息、微信消息、QQ消息等通过社交软件所发表的消息中的任意一种或多种。
102、对于每个待识别的用户,根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
其中,预设的兴趣主题可以有多个,例如:财经、政治、体育、科学或地理等等,与预设的兴趣主题对应的字或词也可以有多个,例如,与财经对应的字或词可以为:金融、经济、价格、成本或收益等等。
具体地,对于每个待识别的用户,社交网络用户影响数值的评估装置可以采用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)的吉布斯采样(Gibbs Sampler)方法,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
此处以微博消息为例进行说明,采用LDA Gibbs Sampler方法确定微博消息所属的兴趣主题以及微博消息属于对应兴趣主题的概率的过程具体可以为:
第1步,设置迭代参数iteration=100,α=0.5,β=0.1。
第2步,统计待识别用户的所有微博消息中出现的不同字的个数,记个数为V,对所有的字建立索引docs,docs[t]表示索引中数字t对应的字。
第3步,设置全局变量nm和nk为零;表示第m条微博中与第k个兴趣主题对应的不同字的个数;表示t对应的字在微博消息中出现的次数;nm表示第m条微博的总字数;nk表示对应第k个兴趣主题的各个字在微博消息中出现的总次数。
第4步,对第m条微博消息中的第n个字,随机选取第n个字的兴趣主题zm,n=k,对相应的(t为第n个字对应的索引数字)、nm、nk分别加1。
第5步,进行100次的主题采样,一次主题采样是对待识别用户的所有微博消息中的每个字进行采样,对第m条微博消息中第n个字的采样如下:t为第n个字对应的索引数字,相应的nm、nk分别减1;初始化每个主题k对应的pk(主题k的采样值)
p k = n k t + β ( n k + V * β ) * ( n m k + α ) / ( n m + k * α ) ; 累计计算pk p k = Σ i = 1 k p i ,
记所有pk的总和为p;记u等于[0,1]之间的随机数乘以p;从第一个兴趣主题开始遍历兴趣主题k对应的pk是否大于u,若大于,则第m条微博的第n个字的采样兴趣主题为k,记新的采样兴趣主题k=k,并且对分别加1。
第6步,对待识别用户的所有微博消息和所有兴趣主题,根据以下公式
v m , k = n m k + α n m + α ,
得到每个微博消息属于每个兴趣主题的概率分布vm,k
103、对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度。
具体地,步骤103具体可以包括:对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,获取待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;根据待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及待识别的用户所发布的社交消息的数量,确定待识别的用户对待识别兴趣主题的关注度。待识别的用户对待识别兴趣主题的关注度,也就是待识别的用户关注待识别兴趣主题的概率。
104、根据每个待识别的用户对待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值。
具体地,社交网络用户影响数值的评估装置具体可以根据待识别的用户对待识别兴趣主题的关注度,确定关注待识别兴趣主题的用户,根据关注待识别兴趣主题的用户构建待识别兴趣主题对应的用户网络。例如,用户网络具体可以如图2所示,图2中用户之间的连接关系指的是用户之间的关注关系。
105、针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值。
其中,步骤105具体可以包括:针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的有效粉丝数;针对用户网络中的每个用户,获取每个用户所发布的社交消息中属于待识别兴趣主题的待识别社交消息,根据每个用户的有效粉丝数以及发布待识别社交消息的各个用户之间的距离,计算每个用户在待识别兴趣主题下的影响数值。
具体地,可以采用
计算每个用户在待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在待识别兴趣主题下的有效粉丝数,集合APi表示在用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。
与用户i存在关注路径的用户集合,指的是关注过用户i、关注过用户i的粉丝、或者通过多个用户间接关注过用户i的用户集合。例如,若用户j关注了用户A、用户A关注了用户B、用户B关注了用户C、用户C关注了用户i,则用户j、用户A和用户B为间接关注过用户i的用户,用户j、用户A和用户B为与用户i存在关注路径的用户;用户j、用户A、用户B、用户C和用户i组成的集合为用户i到用户j的关注路径上的所有用户集合。用户j的绝对粉丝数指的是微博主页等上看到的用户j的粉丝数。
具体地,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息;
对应的,可以采用
inf u i , d = [ Σ tw j ∈ T i , d ( Σ u x ∈ Ret ( tw j ) EF x | dist ( u x , start ( tw j ) ) | | Ret ( tw j ) | ) ] | T i , d | , 计算每个用户在待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于待识别兴趣主题d的待识别社交消息的总数。
本实施例中,通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度;根据每个待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而能够根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图3为本发明提供的社交网络用户影响数值的评估装置一个实施例的结构示意图,如图3所示,包括:
获取模块31,用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息。
其中,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息。社交消息具体可以为微博消息、微信消息、QQ消息等通过社交软件所发表的消息中的任意一种或多种。
确定模块32,用于对于每个待识别的用户,根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
具体地,对于每个待识别的用户,确定模块32具体可以根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题;根据社交消息中与各个兴趣主题对应的不同字的个数以及字的出现次数,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率。
确定模块32,还用于对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度。
其中,确定模块32具体用于,对于每个待识别的用户,根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,获取待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;根据待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及待识别的用户所发布的社交消息的数量,确定待识别的用户对待识别兴趣主题的关注度。
构建模块33,用于每个根据待识别的用户对待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值。
计算模块34,用于针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值。
进一步地,计算模块34具体用于,针对用户网络中的每个用户,根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的有效粉丝数;针对用户网络中的每个用户,获取每个用户所发布的社交消息中属于待识别兴趣主题的待识别社交消息,根据每个用户的有效粉丝数以及发布待识别社交消息的各个用户之间的距离,计算每个用户在待识别兴趣主题下的影响数值。
更进一步地,计算模块34具体用于,采用
计算每个用户在待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在待识别兴趣主题下的有效粉丝数,集合APi表示在用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。
再进一步地,每个待识别的用户所发布的社交消息包括:每个待识别的用户原创发布的社交消息,以及每个待识别的用户转发的社交消息;
对应的,计算模块34具体用于,采用
inf u i , d = [ Σ tw j ∈ T i , d ( Σ u x ∈ Ret ( tw j ) EF x | dist ( u x , start ( tw j ) ) | | Ret ( tw j ) | ) ] | T i , d | , 计算每个用户在待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于待识别兴趣主题d的待识别社交消息的总数。
本实施例中,通过获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;根据待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定社交消息所属的兴趣主题以及社交消息属于对应兴趣主题的概率;根据待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定待识别的用户对待识别兴趣主题的关注度;根据每个待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,用户网络对应一个待识别兴趣主题,且用户网络中包括的每个用户对用户网络所对应的待识别兴趣主题的关注度大于预设阈值;根据每个用户对待识别兴趣主题的关注度,以及用户网络中各个用户之间的关注关系,计算每个用户在待识别兴趣主题下的影响数值,从而能够根据用户在待识别兴趣主题下的影响数值,对待识别兴趣主题的社交消息的传播进行有效的控制。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种社交网络用户影响数值的评估方法,其特征在于,包括:
获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。
2.根据权利要求1所述的方法,其特征在于,所述针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值,包括:
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
针对所述用户网络中的每个用户,获取每个所述用户所发布的社交消息中属于所述待识别兴趣主题的待识别社交消息,根据每个所述用户的有效粉丝数以及发布所述待识别社交消息的各个用户之间的距离,计算每个所述用户在所述待识别兴趣主题下的影响数值。
3.根据权利要求2所述的方法,其特征在于,采用
计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在所述待识别兴趣主题下的有效粉丝数,集合APi表示在所述用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对所述待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。
4.根据权利要求2或3所述的方法,其特征在于,所述每个待识别的用户所发布的社交消息包括:所述每个待识别的用户原创发布的社交消息,以及所述每个待识别的用户转发的社交消息;
采用
inf u i , d = [ Σ tw j ∈ T i , d ( Σ u x ∈ Ret ( tw j ) EF x | dist ( u x , start ( tw j ) ) | | Ret ( tw j ) | ) ] | T i , d | , 计算每个所述用户在所述待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于所述待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发所述待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发所述待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示所述待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与所述待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于所述待识别兴趣主题d的待识别社交消息的总数。
5.根据权利要求1所述的方法,其特征在于,所述对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度,包括:
对于每个待识别的用户,根据所述待识别的用户所发布的所述社交消息属于对应兴趣主题的概率,获取所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;
根据所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及所述待识别的用户所发布的社交消息的数量,确定所述待识别的用户对待识别兴趣主题的关注度。
6.一种社交网络用户影响数值的评估装置,其特征在于,包括:
获取模块,用于获取社交网络中待识别的用户以及每个待识别的用户所发布的社交消息;
确定模块,用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息中每个字或词,查询字或词与兴趣主题的对应关系,确定所述社交消息所属的兴趣主题以及所述社交消息属于对应兴趣主题的概率;
所述确定模块,还用于对于每个待识别的用户,根据所述待识别的用户所发布的社交消息属于对应兴趣主题的概率,确定所述待识别的用户对待识别兴趣主题的关注度;
构建模块,用于根据每个所述待识别的用户对所述待识别兴趣主题的关注度,构建用户网络,所述用户网络对应一个待识别兴趣主题,且所述用户网络中包括的每个用户对所述用户网络所对应的待识别兴趣主题的关注度大于预设阈值;
计算模块,用于针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的影响数值。
7.根据权利要求6所述的装置,其特征在于,所述计算模块具体用于,
针对所述用户网络中的每个用户,根据每个所述用户对所述待识别兴趣主题的关注度,以及所述用户网络中各个用户之间的关注关系,计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
针对所述用户网络中的每个用户,获取每个所述用户所发布的社交消息中属于所述待识别兴趣主题的待识别社交消息,根据每个所述用户的有效粉丝数以及发布所述待识别社交消息的各个用户之间的距离,计算每个所述用户在所述待识别兴趣主题下的影响数值。
8.根据权利要求7所述的装置,其特征在于,所述计算模块具体用于,采用
计算每个所述用户在所述待识别兴趣主题下的有效粉丝数;
其中,EFi表示用户i在所述待识别兴趣主题下的有效粉丝数,集合APi表示在所述用户网络中,与用户i存在关注路径的用户集合,集合Pij表示用户i到用户j的关注路径上的所有用户集合,Ak表示用户k对所述待识别兴趣主题的关注度,Fj表示用户j的绝对粉丝数。
9.根据权利要求7或8所述的装置,其特征在于,所述每个待识别的用户所发布的社交消息包括:所述每个待识别的用户原创发布的社交消息,以及所述每个待识别的用户转发的社交消息;
所述计算模块具体用于,采用
inf u i , d = [ Σ tw j ∈ T i , d ( Σ u x ∈ Ret ( tw j ) EF x | dist ( u x , start ( tw j ) ) | | Ret ( tw j ) | ) ] | T i , d | , 计算每个所述用户在所述待识别兴趣主题下的影响数值;
其中,表示用户i在待识别兴趣主题d下的影响数值,Ti,d表示用户i所发布的社交信息中属于所述待识别兴趣主题d的待识别社交消息,twj表示待识别社交消息j,Ret(twj)表示转发所述待识别社交消息j的用户集合,ux表示用户x,|Ret(twj)|表示转发所述待识别社交消息j的用户的个数,EFx表示用户x的有效粉丝数,start(twj)表示所述待识别社交消息j的原创用户,dist(ux,start(twj))表示用户x与所述待识别社交消息j的原创用户的距离,|Ti,d|表示用户i所发布的社交消息中属于所述待识别兴趣主题d的待识别社交消息的总数。
10.根据权利要求6所述的装置,其特征在于,所述确定模块具体用于,
对于每个待识别的用户,根据所述待识别的用户所发布的所述社交消息属于对应兴趣主题的概率,获取所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和;
根据所述待识别的用户所发布的社交消息属于待识别兴趣主题的概率的和,以及所述待识别的用户所发布的社交消息的数量,确定所述待识别的用户对待识别兴趣主题的关注度。
CN201410508554.2A 2014-09-28 2014-09-28 社交网络用户影响数值的评估方法和装置 Active CN104281669B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410508554.2A CN104281669B (zh) 2014-09-28 2014-09-28 社交网络用户影响数值的评估方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410508554.2A CN104281669B (zh) 2014-09-28 2014-09-28 社交网络用户影响数值的评估方法和装置

Publications (2)

Publication Number Publication Date
CN104281669A true CN104281669A (zh) 2015-01-14
CN104281669B CN104281669B (zh) 2017-09-22

Family

ID=52256542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410508554.2A Active CN104281669B (zh) 2014-09-28 2014-09-28 社交网络用户影响数值的评估方法和装置

Country Status (1)

Country Link
CN (1) CN104281669B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913322A (zh) * 2016-04-07 2016-08-31 合肥学院 一种基于用户社交圈的信息传播评估方法及装置
CN106446146A (zh) * 2016-09-21 2017-02-22 中国国防科技信息中心 一种微博中事件持续关注者的识别模型建立及识别方法
CN106933949A (zh) * 2017-01-20 2017-07-07 浙江大学 一种控制社交网络中影响力爆发的规划方法
CN107729455A (zh) * 2017-09-25 2018-02-23 山东科技大学 一种基于多维特征分析的社交网络意见领袖排序算法
CN110580317A (zh) * 2019-08-29 2019-12-17 武汉赛可锐信息技术有限公司 社交信息分析方法、装置、终端设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214212A (zh) * 2011-05-20 2011-10-12 西北工业大学 基于多重链接的微博网络节点权重排序方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214212A (zh) * 2011-05-20 2011-10-12 西北工业大学 基于多重链接的微博网络节点权重排序方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J.WENG等: ""Twitterrank:finding topic-sensitive influential twitterers"", 《IN PROCEEDINGS OF THE THIRD ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 *
熊小兵: ""微博网络传播行为中的关键问题研究"", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913322A (zh) * 2016-04-07 2016-08-31 合肥学院 一种基于用户社交圈的信息传播评估方法及装置
CN106446146A (zh) * 2016-09-21 2017-02-22 中国国防科技信息中心 一种微博中事件持续关注者的识别模型建立及识别方法
CN106446146B (zh) * 2016-09-21 2019-05-17 中国国防科技信息中心 一种微博中事件持续关注者的识别模型建立及识别方法
CN106933949A (zh) * 2017-01-20 2017-07-07 浙江大学 一种控制社交网络中影响力爆发的规划方法
CN107729455A (zh) * 2017-09-25 2018-02-23 山东科技大学 一种基于多维特征分析的社交网络意见领袖排序算法
CN110580317A (zh) * 2019-08-29 2019-12-17 武汉赛可锐信息技术有限公司 社交信息分析方法、装置、终端设备及存储介质
CN110580317B (zh) * 2019-08-29 2022-02-22 武汉赛可锐信息技术有限公司 社交信息分析方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN104281669B (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
Dong et al. Event-triggered robust distributed state estimation for sensor networks with state-dependent noises
CN104281669A (zh) 社交网络用户影响数值的评估方法和装置
Andrae et al. Assessment of stochastic and deterministic models of 6304 quasar lightcurves from SDSS Stripe 82
CN109190024A (zh) 信息推荐方法、装置、计算机设备及存储介质
CN107103049A (zh) 一种推荐方法及网络设备
Ding et al. Accelerated life test sampling plans for the Weibull distribution under type I progressive interval censoring with random removals
US9792377B2 (en) Sentiment trent visualization relating to an event occuring in a particular geographic region
Afanasyeva et al. Limit theorems for semi-Markov queues and their applications
Cheng et al. Randomly weighted sums of dependent subexponential random variables with applications to risk theory
CN104239335A (zh) 特定用户信息获取方法及装置
Raza et al. EWMA and DEWMA control charts for Poisson‐Exponential distribution: conditional median approach for censored data
Filus et al. A method for multivariate probability distributions construction via parameter dependence
Huang et al. Can financial crisis be detected? Laplacian energy measure
Matsuki et al. China's regional convergence in panels with multiple structural breaks
Yao First hitting time of uncertain random renewal reward process and its application in insurance risk process
Yusuf et al. Stochastic modelling and analysis of a repairable 2-out-of-4 system
CN104156492A (zh) 搜索内容的提示方法和装置
Ten Veldhuis et al. Automatic classification of municipal call data to support quantitative risk analysis of urban drainage systems
Jin et al. Modified tests for change points in variance in the possible presence of mean breaks
CN113837527A (zh) 企业评级方法、装置、设备以及存储介质
Faria et al. Comparison of EM and SEM algorithms in Poisson regression models: a simulation study
Chang Variable selection via regression trees in the presence of irrelevant variables
CN105589950A (zh) 事件属性语句确定及基于事件属性语句预警方法和装置
Ghosh et al. Inference for a hidden truncated (both-sided) bivariate Pareto (II) distribution
Quintela‐del‐Río On bandwidth selection for nonparametric estimation in flood frequency analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant