CN103309957B - 一种引入列维飞行的社交网络专家定位方法 - Google Patents

一种引入列维飞行的社交网络专家定位方法 Download PDF

Info

Publication number
CN103309957B
CN103309957B CN201310202741.3A CN201310202741A CN103309957B CN 103309957 B CN103309957 B CN 103309957B CN 201310202741 A CN201310202741 A CN 201310202741A CN 103309957 B CN103309957 B CN 103309957B
Authority
CN
China
Prior art keywords
user
blog article
relation
social networks
vermicelli
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310202741.3A
Other languages
English (en)
Other versions
CN103309957A (zh
Inventor
贺樑
吴奔斌
徐晓枫
罗念
陈昊
李明耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN201310202741.3A priority Critical patent/CN103309957B/zh
Publication of CN103309957A publication Critical patent/CN103309957A/zh
Application granted granted Critical
Publication of CN103309957B publication Critical patent/CN103309957B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种引入列维飞行的社交网络专家定位方法,包括步骤:a.根据社交网络中用户与用户、用户与博文和博文与博文之间的相互关系构建用户博文行为关系图;b.根据用户的社交网络关系获得该用户的社交网络中心性值;c.根据微博博文在指定天数内的被转发量来获得博文的热度趋势值;d.在用户博文行为关系图的基础上,引入列维飞行因子的同时结合用户社交网络中心性和博文热度趋势值进行用户和博文的专业性权值迭代计算过程,直到稳定。本发明是根据社交网络中用户与博文之间的相互行为关系来进行专家用户的定位方法,其有的优点包括:更准确把握用户与用户、用户与博文、博文与博文之间的相互关系,更有效地衡量微博博文的内容质量,更准确地评价用户在社交网络中的专业性权重,更高效便捷。

Description

一种引入列维飞行的社交网络专家定位方法
技术领域
本发明涉及用于社交网络进行专家用户搜索的领域,具体来说就是一种在社交网络中找出专家型用户的用户定位方法。
背景技术
基于专家定位的用户影响力研究普遍存在于社会科学、传播学、市场营销和政治科学领域的研究中,研究专家定位模式可以帮助我们更好地理解为什么某些新趋势或新创新可以被人们更快地接受,也可以帮助理解我们该如何帮助广告商和市场营销人员来设计更好的营销与推广策略。
在社交网络专家定位系统中,传统的专家定位方法主要分为三种。第一种方法是基于PageRank思想的定位方法,主要分析了社交网络中用户之间的社交网络关系以及用户的统计数据,却没有考虑用户微博博文的转发关系;第二种方法是基于用户行为权值的定位方法,这种方法主要研究了用户之间的关注/被关注关系及博文的转发关系,但是这种方法没有考虑用户转发兴起所引起的信息传播机制所产生的影响力扩散效应,存在一定不合理性。第三种方法则是基于PageRank思想与用户行为权值的评价方法,对于社交网络中的用户来说,其所在的社交网络关系及其发布博文、转发博文的行为都应该作为专家定位方法的考量因素,但是传统的这种方法中一般认为用户的初始专业性权值是相同的,这是不合理的,因为一个用户在社交网络中越处于中心位置就越能促进信息的传播,而且用户的专家影响力也并非只能传播给其粉丝用户而消失,而这也是传统方法中所存在的不足之处。
发明内容
本发明的目的是针对现有技术中忽略视频时长与观看时间的技术缺陷而提供一种引入列维飞行模式的社交网络专家定位方法,能够在考虑了用户与用户、用户与博文及博文与博文之间的行为关系的基础上,还分析了用户所处社交网络的中心性因素及博文的热度趋势因素,而且通过列维飞行模式的引入,使得存在博文转发关系而却没有关注关系的用户也被考虑了进来,扩大了用户的影响范围。
本发明解决其技术问题所采用的技术方案是:
一种引入列维飞行的社交网络专家定位方法,该方法包括如下步骤:
a)确定社交网络中用户与用户、用户与博文及博文与博文之间的相互关系;具体包括:
I)确定社交网络中用户之间的关系,即用户之间的关注或被关注关系;
II)确定社交网络中用户与博文之间的关系,即用户与博文的发布或被发布关系;
III)确定社交网络中博文与博文之间的关系,即博文对博文的转发或被转发关系,包括博文之间的一跳转发和二跳转发关系;
IV)根据上述所有关系,确定用户博文行为关系图,作为步骤d)中计算用户专业性权值的拓扑关系图。
b)基于用户之间的社交网络关系,计算微博用户的社交网络中心性值;具体包括:
I)根据第j个用户与其粉丝用户之间的关注或被关注关系,获得其粉丝用户中与该用户存在相互关注关系的粉丝数目fj
II)根据该用户的粉丝用户与这些粉丝用户的粉丝用户之间的关注或被关注关系,获得该用户的粉丝用户的粉丝用户中与该用户之粉丝用户存在相互关注关系的粉丝数目sj
III)通过以下公式计算第j个用户的社交网络中心性值SNCj,其中M为用户总数;
SNC j = ( f j + s j ) / ( max 0 < g &le; M { f g + s g } ) .
c)基于转发博文与原创博文之间的关系,计算博文热度趋势值;具体包括:
I)根据指定时间D天内的原创博文转发关系,计算该原创博文在第t天的被转发次数|Vi,t|;
II)计算该指定时间内的该原创博文的每天被转发次数的期望值μi,t和方差值σi,t
III)根据以下公式计算第i篇博文热度趋势值Trend(i),其中N为博文总数;
T r e n d ( i ) = &Sigma; t = 1 D ( ( | V i , t | - &mu; i , t ) / &sigma; i , t ) D , ( 0 < i &le; N , 0 < t &le; D ) .
d)确定用户和博文的最终专业性权值,并根据用户的专业性权值从大到小进行排序,同时取其中前10%的用户作为专家;具体包括:
I)确定用户博文行为关系图中的边权值aij
II)根据用户博文行为关系图来生成用户与博文之间的邻接矩阵A;
III)确定用户和博文的最终专业性权值,并根据用户的专业性权值从大到小进行排序,并同时取其中前10%的用户作为专家;其中步骤III)包括:
ⅰ)根据如下公式分别计算用户和博文在第k次迭代中的专业性权值其中d是列维飞行模式跳转概率;
r j k = d * Ar j k - 1 + ( 1 - d ) / | V |
ⅱ)根据该博文的博文热度趋势值Trend(i)调整博文的专业性权值
ⅲ)对用户和博文的专业性权值进行归一化计算。
本发明应用于社交网络的专家定位系统中;首先通过对社交网络中用户与用户、用户与博文、博文与博文之间的关注或被关注、发布或被发布、转发或被转发关系的分析来构建用户博文行为关系图,然后计算用户在社交网络中中心性值的同时也计算博文的热度趋势值,通过用户与博文之间的相互迭代计算方法,最后得到稳定的用户专业性权值排序,并取用户总数的前10%用户作为专家型用户。
本发明在社交网络中进行专家定位计算时,考虑到了用户所处的社交网络的位置,较为合理地衡量了一个用户在社交网络中初始的专家影响力扩散能力,越靠近社交网络中心的用户,相互关注的粉丝用户越多,信息通过其传播的可能性更大。
本发明在社交网络中进行专家定位计算时,考虑到了微博博文的热度趋势值,一篇博文的热度趋势不仅代表了一篇博文的受欢迎程度,还代表了该博文的生命力与延续力,与博文之间的转发或被转发关系一起能更好地反应博文内容的质量。
本发明在社交网络中进行专家定位计算时,通过引入列维飞行模式计算来考虑到了不存在社交关系的用户之间也存在的博文转发或被转发关系,相较于随机游走模式的计算,覆盖的用户将更加全面。
本发明通过分析用户的关注或被关注、用户与博文的发布或被发布、博文与博文之间的转发与被转发关系来更准确把握用户与博文之间的互动关系,通过引入社交网络中心性值来更准确地描述用户的初始专业性值,通过引入博文的热度趋势值进而更有效地衡量微博博文的内容质量,最后利用列维飞行模式的迭代计算可以更准确地评价用户在社交网络中的专业性权重,更高效便捷。
附图说明
图1为本发明流程示意图;
图2为本发明实施例示意图。
具体实施方式
本发明根据用户所处社交网络的中心性来确定用户初始的专家影响力权值,更合理地表现一个用户在社交网络中对粉丝用户产生影响的专家能力;根据微博博文的热度趋势来调节博文的专业性权值,用于反映一篇博文的延续力与生命力,更合理地衡量一篇博文的质量;根据社交网络中用户行为特征,采用列维飞行因子来进行用户专业性权值的计算,更完善地覆盖了一些不存在社交网络关系却进行博文转发的用户。本领域技术人员可以参考图1示出的流程。以下详细叙述本发明:
(1):分析社交网络中用户与用户、用户与博文和博文与博文之间的关注/被关注、发布/被发布和转发/被转发关系,并根据这些关系构建用户博文行为模式图;
(2):根据用户与博文之间的特征关系,设定用户博文行为模式图中结点之间的边权值;
(3):根据用户所处社交网络中与其粉丝之间相互关注的关系,记为fj,以及用户的粉丝用户与他们的粉丝之间的相互关注关系,记为sj,来计算用户的社交网络中心性值SNC:
SNC j = ( f j + s j ) / ( max 0 < g &le; M { f g + s g } ) ;
(4):通过如下公式计算博文在D天内的热度趋势值Trend,
T r e n d ( i ) = &Sigma; t = 1 D ( ( | V i , t | - &mu; i , t ) / &sigma; i , t ) D , ( 0 < i &le; N , 0 < t &le; D ) ;
(5):生成邻接矩阵A,并根据如下公式计算用户与博文的专业性权值,其中d是列维飞行跳转概率,|V|是图中用户结点与博文结点的总数:
r j k = d * Ar j k - 1 + ( 1 - d ) / | V | ;
(6):对用户与博文的专业性权值进行归一化计算;
(7):将用户按照专业性权值从大到小排序,若此次排序与上一次排序的序列相一致,则至(8),否则就重复执行(5)和(6);
(8):将用户专业性权值最大的前10%用户作为专家型用户进行输出。
实施例
假设用户博文行为模式图关系如图2所示,其中边权值分别赋为:发布0.8,被发布0.23,转发0.52,关注是0.2除以关注的用户数:
1)、首先计算用户的社交网络中心性。A与其粉丝的相互关注数为1,A的粉丝与A的粉丝的粉丝进行相互关注的数目为0,B与其粉丝的相互关注数为1,B的粉丝与B的粉丝的粉丝之间相互关注的用户数为0,C与其粉丝的相互关注数为0,C的粉丝与C的粉丝的粉丝之间相互关注数为2,同理,D和E与其粉丝的相互关注数都为1,D/E的粉丝与D/E的粉丝的粉丝之间相互关注的用户数为0。所以s+f的最大值为2。所以根据公式进行计算得到中心性SNC分布为:A-0.5,B-0.5,C-1.0,D-0.5,E-0.5,故C更靠近该社交网络的中心位置。
2)、计算博文的热度趋势值。假设图2中为2天内的博文转发情况,则D=2,原创博文1的被转发次数为4,而博文2-5都不是原创博文,所以转发次数计为0。假设博文1第一天被转发2次,第二天被转发2次,故平均值μi=(2+2)/4=1,方差故原创博文1的热度趋势值
3)、通过用户行为关系权值构建用户博文矩阵,并初始化用户结点的专家性权值为该用户的SNC值,然后通过公式计算图中每个结点的专家性权值:计算完成一次,对于原创博文结点对应的r值进行trend调整,即r=r*trend,然后得到结点专家性权值的一个从大到小的排列,假如第一次排列为ABDEC,第二次迭代计算后排列为ABCED,则表示结果未稳定收敛,当下一次迭代计算后排列依然跟上一次的排列次序相同,即若第三次迭代结果排序后依然为ABCED,则算法收敛并结束,输出前10%的用户,在此为前1个用户作为专家型用户,即排在最前面的用户A。

Claims (3)

1.一种引入列维飞行的社交网络专家定位方法,其特征在于,包括如下步骤:
a)确定社交网络中用户与用户、用户与博文及博文与博文之间的相互关系;
b)基于用户之间的社交网络关系,计算微博用户的社交网络中心性值;
c)基于转发博文与原创博文之间的关系,计算博文热度趋势值;具体包括:
I)根据指定时间D天内的原创博文转发关系,计算该原创博文在第t天的被转发次数|Vi,t|;
II)根据D天内的原创博文转发关系,计算该指定时间内的该原创博文的每天被转发次数的期望值μi,t和方差值σi,t
III)根据以下公式计算第i篇博文热度趋势值Trend(i),其中N为博文总数;
T r e n d ( i ) = &Sigma; t = 1 D ( ( | V i , t | - &mu; i , t ) / &sigma; i , t ) D , 0 < i &le; N , 0 < t &le; D ;
d)对社交网络中的用户确定其所拥有的专业性权值;最大的前10%的用户作为专家;其中:具体包括:
I)确定用户博文行为关系图中的边权值aij
II)根据用户博文行为关系图来生成用户与博文之间的邻接矩阵A;初始化用户结点的专家性权值为该用户的社交网络中心性值;
III)确定用户和博文的最终专业性权值,并根据用户的专业性权值从大到小进行排序,并同时取其中前10%的用户作为专家;具体包括:
ⅰ)根据如下公式分别计算用户和博文在第k次迭代中的专业性权值其中d是列维飞行模式跳转概率;
r j k = d * Ar j k - 1 + ( 1 - d ) / | V |
式中:|V|是图中用户结点与博文结点的总数;
ii)根据该博文的博文热度趋势值Trend(i)调整博文的专业性权值
iii)对用户和博文的专业性权值进行归一化计算。
2.根据权利要求1所述的社交网络专家定位方法,其特征在于,所述步骤a)包括:
I)确定社交网络中用户之间的关系,即用户之间的关注或被关注关系;
II)确定社交网络中用户与博文之间的关系,即用户与博文的发布或被发布关系;
III)确定社交网络中博文与博文之间的关系,即博文对博文的转发或被转发关系,包括博文之间的一跳转发和二跳转发关系;
IV)根据上述所有关系,确定用户博文行为关系图,作为步骤d)中计算用户专业性权值的拓扑关系图。
3.根据权利要求1所述的社交网络专家定位方法,其特征在于,所述步骤b)包括:
I)根据第j个用户与其粉丝用户之间的关注或被关注关系,获得其粉丝用户中与该用户存在相互关注关系的粉丝数目fj
II)根据该用户的粉丝用户与这些粉丝用户的粉丝用户之间的关注或被关注关系,获得该用户的粉丝用户的粉丝用户中与该用户之粉丝用户存在相互关注关系的粉丝数目sj
III)通过以下公式计算第j个用户的社交网络中心性值SNCj,其中M为用户总数;
SNC j = ( f j + s j ) / ( m a x 0 < g &le; M { f g + s g } ) .
CN201310202741.3A 2013-05-28 2013-05-28 一种引入列维飞行的社交网络专家定位方法 Active CN103309957B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310202741.3A CN103309957B (zh) 2013-05-28 2013-05-28 一种引入列维飞行的社交网络专家定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310202741.3A CN103309957B (zh) 2013-05-28 2013-05-28 一种引入列维飞行的社交网络专家定位方法

Publications (2)

Publication Number Publication Date
CN103309957A CN103309957A (zh) 2013-09-18
CN103309957B true CN103309957B (zh) 2016-12-28

Family

ID=49135175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310202741.3A Active CN103309957B (zh) 2013-05-28 2013-05-28 一种引入列维飞行的社交网络专家定位方法

Country Status (1)

Country Link
CN (1) CN103309957B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699679B (zh) * 2013-12-04 2019-03-26 腾讯科技(北京)有限公司 一种确定社交网络平台中用户属性的方法和系统
CN104092567B (zh) * 2014-06-26 2017-10-27 华为技术有限公司 确定用户的影响力排序的方法与装置
US10013464B2 (en) 2015-05-04 2018-07-03 International Business Machines Corporation Locating and ranking individuals using social media analytics
CN107292750B (zh) * 2016-04-01 2020-08-18 株式会社理光 社交网络的信息收集方法及信息收集装置
CN109472027A (zh) * 2018-10-31 2019-03-15 北京邮电大学 一种基于博文相似性的社交机器人检测系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314489A (zh) * 2011-08-15 2012-01-11 哈尔滨工业大学 网络论坛中舆论领袖分析方法
CN102663101A (zh) * 2012-04-13 2012-09-12 北京交通大学 一种基于新浪微博的用户等级排序算法
CN102880657A (zh) * 2012-08-31 2013-01-16 电子科技大学 基于搜索者的专家推荐方法
CN102945279A (zh) * 2012-11-14 2013-02-27 清华大学 微博用户影响力的评估方法及装置
CN103024017A (zh) * 2012-12-04 2013-04-03 武汉大学 一种社交网络重要目标及社区群体识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314489A (zh) * 2011-08-15 2012-01-11 哈尔滨工业大学 网络论坛中舆论领袖分析方法
CN102663101A (zh) * 2012-04-13 2012-09-12 北京交通大学 一种基于新浪微博的用户等级排序算法
CN102880657A (zh) * 2012-08-31 2013-01-16 电子科技大学 基于搜索者的专家推荐方法
CN102945279A (zh) * 2012-11-14 2013-02-27 清华大学 微博用户影响力的评估方法及装置
CN103024017A (zh) * 2012-12-04 2013-04-03 武汉大学 一种社交网络重要目标及社区群体识别方法

Also Published As

Publication number Publication date
CN103309957A (zh) 2013-09-18

Similar Documents

Publication Publication Date Title
CN103309957B (zh) 一种引入列维飞行的社交网络专家定位方法
Li et al. The productive performance of intercropping
Liu et al. Leveraging local h-index to identify and rank influential spreaders in networks
CN104134159B (zh) 一种基于随机模型预测信息最大化传播范围的方法
CN103365902B (zh) 互联网新闻的评估方法和装置
CN105046514B (zh) 一种推广信息的处理方法、装置和系统
CN103064917B (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN104657488B (zh) 一种基于引用传播网络的作者影响力计算方法
Engel et al. Conservation payments under uncertainty
CN106294334A (zh) 一种微博舆情指标体系的计算方法及装置
CN104123352A (zh) 面向微博的话题层次用户影响力度量方法
CN104899267A (zh) 一种社交网站账号相似度的综合数据挖掘方法
CN106355506A (zh) 一种在线社会网络中影响力最大化初始节点选取方法
CN104299151A (zh) 网络广告流量分配系统和方法
WO2014173237A1 (zh) 一种推荐的方法及服务器
CN106875205A (zh) 一种对象选择方法和装置
CN106354783A (zh) 一种基于信任关系隐含相似度的社会化推荐方法
Ding et al. TLQP: Early-stage transportation lock-down and quarantine problem
CN103116811A (zh) 一种基于价值传递的专利价值评估方法
Shindo Changes in the nitrogen balance in agricultural land in Japan and 12 other Asian Countries based on a nitrogen-flow model
CN104766020A (zh) 商务数据匿名发布中的极小信息损失控制方法
CN107480227A (zh) 一种基于大数据的信息推送方法
CN104317881A (zh) 一种基于用户话题权威性的微博重排序方法
Manolopoulou et al. Phylogeographic ancestral inference using the coalescent model on haplotype trees
CN106326610A (zh) 一种基于设计网络的设计变更传播预测方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant