CN104298767A - 一种微博网络中用户影响力度量的方法 - Google Patents

一种微博网络中用户影响力度量的方法 Download PDF

Info

Publication number
CN104298767A
CN104298767A CN201410594290.7A CN201410594290A CN104298767A CN 104298767 A CN104298767 A CN 104298767A CN 201410594290 A CN201410594290 A CN 201410594290A CN 104298767 A CN104298767 A CN 104298767A
Authority
CN
China
Prior art keywords
user
microblogging
influence power
microblog
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410594290.7A
Other languages
English (en)
Other versions
CN104298767B (zh
Inventor
桂小林
赵建强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201410594290.7A priority Critical patent/CN104298767B/zh
Publication of CN104298767A publication Critical patent/CN104298767A/zh
Application granted granted Critical
Publication of CN104298767B publication Critical patent/CN104298767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种微博网络中用户影响力度量的方法,包括以下步骤:1)编写获取微博用户信息及所发布微博内容的程序,再通过微博平台提供的API接口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户所发微博被阅读、转发及评论的数量信息;2)得到用户的微博影响力It(u)值;3)获取用户的信息传播影响力Id(u)值;4)根据用户的微博影响力It(u)值及用户的信息传播影响力Id(u)值得用户的影响力初始权值W(u);5)根据用户的影响力初始权值W(u)迭代计算用户的影响力值I(u),以用户的影响力值I(u)度量用户在微博网络中的影响力。本发明能够更加准确的发现和识别微博网络中的影响力个体。

Description

一种微博网络中用户影响力度量的方法
技术领域
本发明属于网络数据挖掘技术与社交网络研究领域,涉及一种用户影响力度量的方法,具体涉及一种微博网络中用户影响力度量的方法。
背景技术
微博服务目前已经成为最受欢迎的社交网络工具之一。截止2013年2月,微博服务站点twitter注册用户数超过5亿,月活跃用户达到2亿,截止2013年12月,最大的中文微博平台新浪微博注册用户数超过5亿,月度活跃用户数达到1.291亿。数以亿计的活跃用户来自不同的社会文化背景,遍布全球,每时每刻都在这个平台上发布和传播各类政策、商业、文化、教育等社会生活相关的信息,这些信息包含着用户的各种观点、情绪、态度和状态等,并且能在短时间内传播到大范围的人群。
随着社交网络服务的快速普及,人们越来越习惯通过网络进行交流、参与公众话题、市场营销等。所以研究和理解微博平台中的消息传播机制,识别具有话题影响力的用户变得非常重要。比如市场营销中,企业希望通过少数几个甚至一个具有影响力的用户来最大化的提升品牌和产品的推广效果。谣言控制中,政府或企业希望能快速定位信息传播中有影响力的用户并进行信息的有效阻断。但是,如何快速发现和识别这些影响力个体,是一个困难并且具有挑战性的研究。
发明内容
本发明的目的在于克服已有影响力个体识别方法的不足,提供了一种微博网络中用户影响力度量的方法,该方法可以有效度量微博网络中用户的影响力。
为达到上述目的,本发明所述的微博网络中用户影响力度量的方法,其特征在于,包括以下步骤:
1)编写获取微博用户信息及用户所发布微博的程序,通过微博平台提供的API接口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户在微博网络中的关注关系及粉丝关系,并提取用户所发微博被阅读、转发及评论的数量信息;
2)根据用户u所发微博被阅读、转发及评论的数量信息计算得到用户u的微博影响力值It(u);
3)在微博粉丝关系网络中,计算得到用户u的信息传播影响力值Id(u);
4)将步骤2)得到的用户u的微博影响力值It(u)及步骤3)得到的用户u的信息传播影响力值Id(u)相加作为用户u的影响力初始权值W(u);
5)根据步骤4)得到的用户u的影响力初始权值W(u)迭代计算用户u的影响力值I(u),然后以用户u的影响力值I(u)作为用户u在微博网络中影响力的度量。
步骤2)中所述用户u的微博影响力值其中,Rr(x)为微博X的转发数量与阅读数量的比值,Cr(x)为微博X的评论数量与阅读数量的比值,Tweets(u)是用户u发布的原始微博的集合,当阅读数量为零,则Rr(x)及Cr(x)均为0。
步骤3)中用户u的信息传播影响力值Id(u)=D(u)+B(u)+C(u),其中,D(u)为用户u在微博粉丝关系网络中的度中心度,B(u)为介中心度,C(u)是接近中心度,所述微博粉丝关系网络通过步骤1)得到的用户关系信息抽取粉丝关系形成。
步骤5)中所述用户u的影响力值 I ( u ) = Σ v ∈ Followers ( u ) ( I ( v ) * W ( v ) ) / | Followers ( v ) | + min ( W ( i ) ) i ∈ U , 其中,Followers(v)表示用户v关注的用户集合,Followers(u)为用户u关注的用户集合,U为微博网络中所有用户的集合。
本发明具有以下有益效果:
本发明所述的微博网络中用户影响力度量的方法在度量用户影响力时,先获取用户的微博影响力以及用户的信息传播影响力,再根据用户的微博影响力以及用户的信息传播影响力得到用户的影响力初始权值,然后根据所述用户的影响力初始权值得到用户的影响力值,最后通过用户的影响力值来度量用户在微博网络中的影响力,从而能够更加准确的发现和识别微博网络中的影响力个体以及个体在微博网络中的影响力,识别的准确率和召回率好。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步详细描述:
参考图1,本发明所述的微博网络中用户影响力度量的方法包括以下步骤:
1)编写获取微博用户信息及用户所发布微博的程序,通过微博平台提供的API接口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户在微博网络中的关注关系及粉丝关系,并提取用户所发微博被阅读、转发及评论的数量信息;
微博网络中用户是通过关注其他用户来获取信息的,关注的用户就是被关注用户的粉丝,这种关注和被关注关系就形成了微博网络中的关注关系网络和粉丝关系网络。
用户对某个微博阅读后可以进行转发、评论和收藏等操作,转发操作会引起微博的二次传播,评论操作发表用户对此微博的观点,评论的同时可以选择是否同时转发,收藏操作只是对微博进行记录,不发表观点,也不引起二次传播。
2)根据用户u所发微博被阅读、转发及评论的数量信息得到用户u的微博影响力It(u)值;
需要说明的是,步骤2)中所述用户u的微博影响力值其中,Rr(x)为微博X的转发数量与阅读数量的比值,Cr(x)为微博X的评论数量与阅读数量的比值,Tweets(u)是用户u发布的原始微博的集合,当阅读数量为零,则Rr(x)及Cr(x)均为0。
微博本身所包含的信息和观点越有用,越有价值,其被转发、评论、支持和复制的可能性就越高,用户的交互也就越频繁。反过来,如果某个微博带来了更多的转发、评论、支持和复制等行为,那么这个微博的影响力就越大,也就是微博用户的影响力越大。微博的转发行为直接表明读者支持微博所包含的观点并愿意与自己的粉丝分享,传播观点。评论行为是读者对微博所包含观点、情绪等发表自己的看法,并不一定是支持,但有明确意愿与自己的粉丝进一步讨论和传播这个观点。一条微博被转发和评论的越多,其传播就越快,话题持续时间就越久,被阅读的机会就越多,影响力自然就越大。
3)在微博粉丝关系网络中,计算得到用户u的信息传播影响力Id(u)值;
需要说明的是,步骤3)中用户u的信息传播影响力值Id(u)=D(u)+B(u)+C(u),其中,D(u)为用户u在微博粉丝关系网络中的度中心度,D(u)在“Freeman L C.Centrality in social networks conceptualclarification[J].Social Networks,1979,1(3):215-239”中给出了定义和计算方法;B(u)为介中心度,其在“Freeman,Linton.A set measures ofcentrality based upon betweenness[J].Sociometry,1977,40:35-41”中给出了定义和计算方法,C(u)是接近中心度(出度),C(u)在“Sabidussi,G.Thecentrality index of graph[J].Psychometriks,1966,31:581-603”给出了定义和计算方法,所述微博粉丝关系网络通过步骤1)得到的用户关系信息抽取粉丝关系形成。
其中,在用户粉丝关系网络中,用户的度中心度越大,表明用户发布的微博信息将会有更高的概率被阅读到,快速传播的可能性就越大。如果用户的介中心度越大,表明用户对消息传播的掌控能力就越强,将会有更大的机会将消息放大,更快传播消息,也更容易将信息截断。接近中心度越大,表明用户可以依赖较少或不依赖其他节点就能将信息快速传播到整个网络,消息传播的速度更快,范围更广。
4)将步骤2)得到的用户u的微博影响力It(u)值及步骤3)得到的用户u的信息传播影响力Id(u)值相加,得用户u的影响力初始权值W(u);
5)根据步骤4)得到的用户u的影响力初始权值W(u)迭代计算用户u的影响力值I(u),然后以用户u的影响力值作为用户u在微博网络中的影响力的度量。
需要说明的是,步骤5)中所述用户u的影响力值 I ( u ) = Σ v ∈ Followers ( u ) ( I ( v ) * W ( v ) ) / | Followers ( v ) | + min ( W ( i ) ) i ∈ U , 其中,Followers(v)表示用户v关注的用户集合,Followers(u)为用户u关注的用户集合,U为微博网络中所有用户的集合。

Claims (4)

1.一种微博网络中用户影响力度量的方法,其特征在于,包括以下步骤:
1)编写获取微博用户信息及用户所发布微博的程序,通过微博平台提供的API接口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户在微博网络中的关注关系及粉丝关系,并提取用户所发微博被阅读、转发及评论的数量信息;
2)根据用户u所发微博被阅读、转发及评论的数量信息计算得到用户u的微博影响力值It(u);
3)在微博粉丝关系网络中,计算得到用户u的信息传播影响力值Id(u);
4)将步骤2)得到的用户u的微博影响力值It(u)及步骤3)得到的用户u的信息传播影响力值Id(u)相加作为用户u的影响力初始权值W(u);
5)根据步骤4)得到的用户u的影响力初始权值W(u)迭代计算用户u的影响力值I(u),然后以用户u的影响力值I(u)作为用户u在微博网络中影响力的度量。
2.根据权利要求1所述的微博网络中用户影响力度量的方法,其特征在于,步骤2)中所述用户u的微博影响力值其中,Rr(x)为微博X的转发数量与阅读数量的比值,Cr(x)为微博X的评论数量与阅读数量的比值,Tweets(u)是用户u发布的原始微博的集合,当阅读数量为零,则Rr(x)及Cr(x)均为0。
3.根据权利要求1所述的微博网络中用户影响力度量的方法,其特征在于,步骤3)中用户u的信息传播影响力值Id(u)=D(u)+B(u)+C(u),其中,D(u)为用户u在微博粉丝关系网络中的度中心度,B(u)为介中心度,C(u)是接近中心度,所述微博粉丝关系网络通过步骤1)得到的用户关系信息抽取粉丝关系形成。
4.根据权利要求1所述的微博网络中用户影响力度量的方法,其特征在于,步骤5)中所述用户u的影响力值 I ( u ) = Σ v ∈ Followers ( u ) ( I ( v ) * W ( v ) ) / | Followers ( v ) | + min ( W ( i ) i ∈ U ) , 其中,Followers(v)表示用户v关注的用户集合,Followers(u)为用户u关注的用户集合,U为微博网络中所有用户的集合。
CN201410594290.7A 2014-10-29 2014-10-29 一种微博网络中用户影响力度量的方法 Active CN104298767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410594290.7A CN104298767B (zh) 2014-10-29 2014-10-29 一种微博网络中用户影响力度量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410594290.7A CN104298767B (zh) 2014-10-29 2014-10-29 一种微博网络中用户影响力度量的方法

Publications (2)

Publication Number Publication Date
CN104298767A true CN104298767A (zh) 2015-01-21
CN104298767B CN104298767B (zh) 2017-10-20

Family

ID=52318492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410594290.7A Active CN104298767B (zh) 2014-10-29 2014-10-29 一种微博网络中用户影响力度量的方法

Country Status (1)

Country Link
CN (1) CN104298767B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205146A (zh) * 2015-09-18 2015-12-30 国家计算机网络与信息安全管理中心 一种计算微博用户影响力的方法
CN105704142A (zh) * 2016-03-18 2016-06-22 中国石油大学(华东) 一种存在hub节点的微博网络中恶意url防御方法和防御装置
CN105740421A (zh) * 2015-09-11 2016-07-06 深圳市博尔芯电子科技有限公司 一种针对微博用户的查找最大影响力的实现方法
CN106022849A (zh) * 2016-07-11 2016-10-12 互动派科技股份有限公司 一种新媒体价值与效果评估方法和系统
CN106874428A (zh) * 2017-01-23 2017-06-20 北京航空航天大学 社交网络中影响力的提升方法和装置
CN107451689A (zh) * 2017-07-25 2017-12-08 中国联合网络通信集团有限公司 基于微博的话题趋势预测方法及装置
CN107491550A (zh) * 2017-08-30 2017-12-19 合肥工业大学 基于分形维模型的微博用户影响力度量方法
CN108268534A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 传播影响力计算方法及装置
CN108280121A (zh) * 2017-12-06 2018-07-13 上海师范大学 一种基于k-核分解获取社交网络意见领袖的方法
CN109063010A (zh) * 2018-07-11 2018-12-21 成都爱为贝思科技有限公司 一种基于PageRank的意见领袖挖掘方法
CN110717085A (zh) * 2019-10-12 2020-01-21 浙江工商大学 一种基于虚拟品牌社区的意见领袖识别方法
CN112487264A (zh) * 2020-11-27 2021-03-12 上海蜜度信息技术有限公司 基于社交媒体内容的关键用户挖掘方法、系统及装置
CN113807733A (zh) * 2021-09-28 2021-12-17 杭州网易云音乐科技有限公司 一种用户影响力评价方法、装置、介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102945279A (zh) * 2012-11-14 2013-02-27 清华大学 微博用户影响力的评估方法及装置
US20130268479A1 (en) * 2012-04-06 2013-10-10 Myspace Llc System and method for presenting and managing social media
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130268479A1 (en) * 2012-04-06 2013-10-10 Myspace Llc System and method for presenting and managing social media
CN102945279A (zh) * 2012-11-14 2013-02-27 清华大学 微博用户影响力的评估方法及装置
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
何静,郭进利: "基于改进PageRank算法的微博用户影响力研究", 《项目成果》 *
王琛,陈庶樵: "一种改进的微博用户影响力评价算法", 《信息工程大学学报》 *
胡建华: "微博用户行为与影响力分析系统的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740421A (zh) * 2015-09-11 2016-07-06 深圳市博尔芯电子科技有限公司 一种针对微博用户的查找最大影响力的实现方法
CN105205146A (zh) * 2015-09-18 2015-12-30 国家计算机网络与信息安全管理中心 一种计算微博用户影响力的方法
CN105205146B (zh) * 2015-09-18 2018-10-30 国家计算机网络与信息安全管理中心 一种计算微博用户影响力的方法
CN105704142A (zh) * 2016-03-18 2016-06-22 中国石油大学(华东) 一种存在hub节点的微博网络中恶意url防御方法和防御装置
CN106022849A (zh) * 2016-07-11 2016-10-12 互动派科技股份有限公司 一种新媒体价值与效果评估方法和系统
CN108268534A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 传播影响力计算方法及装置
CN106874428B (zh) * 2017-01-23 2021-05-07 北京航空航天大学 选择信息传播的关键节点的方法和装置
CN106874428A (zh) * 2017-01-23 2017-06-20 北京航空航天大学 社交网络中影响力的提升方法和装置
CN107451689A (zh) * 2017-07-25 2017-12-08 中国联合网络通信集团有限公司 基于微博的话题趋势预测方法及装置
CN107491550A (zh) * 2017-08-30 2017-12-19 合肥工业大学 基于分形维模型的微博用户影响力度量方法
CN108280121A (zh) * 2017-12-06 2018-07-13 上海师范大学 一种基于k-核分解获取社交网络意见领袖的方法
CN108280121B (zh) * 2017-12-06 2021-10-22 上海师范大学 一种基于k-核分解获取社交网络意见领袖的方法
CN109063010A (zh) * 2018-07-11 2018-12-21 成都爱为贝思科技有限公司 一种基于PageRank的意见领袖挖掘方法
CN109063010B (zh) * 2018-07-11 2022-01-28 成都爱为贝思科技有限公司 一种基于PageRank的意见领袖挖掘方法
CN110717085A (zh) * 2019-10-12 2020-01-21 浙江工商大学 一种基于虚拟品牌社区的意见领袖识别方法
CN110717085B (zh) * 2019-10-12 2021-08-06 浙江工商大学 一种基于虚拟品牌社区的意见领袖识别方法
CN112487264A (zh) * 2020-11-27 2021-03-12 上海蜜度信息技术有限公司 基于社交媒体内容的关键用户挖掘方法、系统及装置
CN112487264B (zh) * 2020-11-27 2024-05-10 上海蜜度信息技术有限公司 基于社交媒体内容的关键用户挖掘方法、系统及装置
CN113807733A (zh) * 2021-09-28 2021-12-17 杭州网易云音乐科技有限公司 一种用户影响力评价方法、装置、介质和电子设备

Also Published As

Publication number Publication date
CN104298767B (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN104298767A (zh) 一种微博网络中用户影响力度量的方法
CN106886518B (zh) 一种微博账号分类的方法
Dunn et al. Associations between exposure to and expression of negative opinions about human papillomavirus vaccines on social media: an observational study
US9542503B2 (en) Estimation of closeness of topics based on graph analytics
CN104915392B (zh) 一种微博转发行为预测方法及装置
Cheng et al. An epidemic model of rumor diffusion in online social networks
CN103795613B (zh) 一种在线社交网络中朋友关系预测的方法
CN104834695A (zh) 基于用户兴趣度和地理位置的活动推荐方法
CN104281882A (zh) 基于用户特征的预测社交网络信息流行度的方法及系统
CN104765751B (zh) 应用推荐方法及装置
CN103795612A (zh) 即时通讯中的垃圾和违法信息检测方法
Zhao et al. Empirical analysis of the evolution of follower network: A case study on douban
CN104537096A (zh) 一种基于微博消息传播树的微博消息影响力度量方法
CN103179198A (zh) 基于多关系网络的话题影响力个体挖掘方法
CN104765729A (zh) 一种跨平台微博社区账户匹配方法
CN106294334A (zh) 一种微博舆情指标体系的计算方法及装置
Finarelli et al. Potential pitfalls of reconstructing deep time evolutionary history with only extant data, a case study using the Canidae (Mammalia, Carnivora)
CN103631862B (zh) 基于微博的事件特征演化挖掘方法及系统
CN104133897A (zh) 一种基于话题影响力的微博话题溯源方法
CN104850647A (zh) 一种微博团体的发现方法及装置
CN106227743B (zh) 广告目标群体触达比率评估方法及装置
Rani et al. A survey of tools for social network analysis
CN102664744A (zh) 网络消息通信中群发推荐的方法
US20170004531A1 (en) Advertisement selection using information retrieval systems
CN104063456A (zh) 基于向量查询的自媒体传播图谱分析方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant