CN103886105A - 一种基于社交网络用户行为的用户影响力分析方法 - Google Patents

一种基于社交网络用户行为的用户影响力分析方法 Download PDF

Info

Publication number
CN103886105A
CN103886105A CN201410146306.8A CN201410146306A CN103886105A CN 103886105 A CN103886105 A CN 103886105A CN 201410146306 A CN201410146306 A CN 201410146306A CN 103886105 A CN103886105 A CN 103886105A
Authority
CN
China
Prior art keywords
user
influence power
represent
customer relationship
influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410146306.8A
Other languages
English (en)
Other versions
CN103886105B (zh
Inventor
姜伟
高梦迪
张建标
赖英旭
李健
庄俊玺
张世翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201410146306.8A priority Critical patent/CN103886105B/zh
Publication of CN103886105A publication Critical patent/CN103886105A/zh
Application granted granted Critical
Publication of CN103886105B publication Critical patent/CN103886105B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于社交网络用户行为的用户影响力分析方法,涉及信息技术领域。本发明可以通过社交网络的数据集,从用户关系和用户活动两个方法,综合分析出影响力强的用户。针对于现有的基于社交网络分析影响力的方法,与基于PageRank的模型相比,本发明涉及更多数据关系,并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本发明对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本发明类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。

Description

一种基于社交网络用户行为的用户影响力分析方法
技术领域
本发明涉及信息技术领域,特别是涉及一种基于社交网络用户行为的用户影响力分析方法。
背景技术
随着互联网的发展,用户已经从一个被动的通过浏览器从各大网站获取信息阅读信息的浏览者,转向了可以主动参与到互联网的发展之中的编辑者,使用者和传播者。在web2.0时代,用户拥有更多的话语权和主动权,可以直接参与和发布内容,极大加强了用户间的交流性。社交网络作为这个时代一个突出的产物,其具有用户规模大,话题种类多,信息传递迅速和影响范围广等特点。社交网络的迅速发展已经成为了一个新型了信息载体和转播媒介,对于日常工作和生活产生的影响也越来越大。在信息传播的过程中,意见领袖作为一种重要力量,在社会舆论的形成过程中发挥着不可忽视的作用,局部意见在意见领袖的引导下演化为舆论,影响力直接渗透到现实社会。
为了识别出社交网路中的意见领袖,需要分析社交网路中用户的影响力,找出影响力强的用户。现有的基于社交网络分析影响力的方法分为三大类。第一类是基于PageRank网页排名算法。基于PageRank的算法,多为对社交网络中的某一个因素,套用PageRank的思想,计算出用户影响力。其不足是所用的因素比较单一,没有针对内容分析。第二类基于影响力扩散模型(IDM),IDM模型主要是针对话题,根据帖子上下文词语出现的频率关系,得到话题的影响力。通过计算用户所有话题得到用户的影响力。这种方法的不足是用户之间的联系不太紧密。第三类是传统的基于用户行为模型。该模型通过统计用户的各种行为,例如跟随、转推、提及,来计算用户的影响力。这种方法比较简单,但是各种行为的归一化系数不好确定。
发明内容
本发明提供了一种基于社交网络用户行为的用户影响力分析方法。这个方法可以通过社交网络的数据集,从用户关系和用户活动两种方法,综合分析出影响力强的用户,包括如下步骤:
步骤1:统计分析相关数据信息
在社交网络中,数据量非常庞大,为了从庞大的数据量中分析用户影响力首先需要统计以下信息。第一,统计分析社交网络中用户之间的关注和被关注关系。第二,统计分析用户之间的评论数目和评论内容。
步骤2:用户关系影响力计算
用户关系影响力是实现过程借鉴了PageRank网页排名算法的思想,以用户之间的关注情况类比PageRank中的链接情况。通过公式(1)计算出用户关系影响力。由于用户关系影响力算法是一收敛算法,所以其结果只与用户之间相互关注的关系有关,与用户初始值无关。
R ( i ) = Σ j ∈ B ( i ) R ( j ) L ( j ) - - - ( 1 )
公式中R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集。
步骤3:用户活动影响力计算
针对于社交网络,如果用户A对用户B发表了某些评论,那么说明用户B的言论影响到了用户A,从而用户A可以将B言论中影响到他的部分继续影响其他用户,所以用户B应该获得用户A的一部分影响力。具体用户B获得用户A多少的影响力取决于三点。第一点,用户A受到过多少用户言论的影响。第二点,用户A在受到所有言论的影响中B占有多大的比重。第三点,用户A受到用户B言论影响的程度。针对以上三点,用户活动影响力可以通过公式(2)表示
A k + 1 ( i ) = Σ j ∈ B ( i ) A k ( j ) * L ( i ) Σ L * c ( j ) c ( i ) * d - - - ( 2 )
在公式(2)中Ak+1(i)表示经过k+1次衰减传递后i用户得到的影响力。B(i)表示关注i用户的用户集。
Figure BDA0000490126910000023
表示j用户评论i用户的数目在j用评论所有用户数目的比重。
Figure BDA0000490126910000031
表示j用户对i用户的评论中,j用户和i用户同时出现的关键词数比i用于发表内容的关键词数。d表示一个影响力衰减因子,为了使该公式与初值有关,要保证影响力的传递是递减的,
Figure BDA0000490126910000032
可以保证一定的递减性,但是也有可能存在为1的情况,所以加入了衰减因子d,其可以设为小于1的固定值。由于该公式的逐步递减并且趋于0,所以当Ak+1(i)的值小于首次计算活动影响力初值的百分之一时,其值可以忽略不计,所以k值有限。
步骤4:用户影响力计算
公式(2)中计算出的第k次用户活动影响力,是由于k-1次用户活动影响力再传递一次产生的结果。所以通过累加第3步中所有用户活动影响力的结果,计算得到用户的影响力。该过程可以通过公式(3)表示。
A ( i ) = Σ k = 1 n A k ( i ) - - - ( 3 )
在公式(3)中A(i)表示i用户最终的影响力。Ak(i)表示i用户经过第k次衰减传递后的影响力。
本发明与现有技术相比,具有以下明显的优势和有益效果:
针对于现有的基于社交网络分析影响力的方法,本发明具有一定的优势。与基于PageRank的模型相比,本发明涉及更多数据关系。并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本发明对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本发明类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。
附图说明
图1用户影响力流程图;
图2用户关系影响力传递示例;
图3用户活动影响力传递示例。
具体实施方式
以下结合说明书附图和具体实施方式对本发明的方法做进一步详细说明。
步骤1:用户关系影响力计算
如图2所示,将所有用户的关系影响力初值设置为1。用户A关注了用户C和用户D。用户A将自己的用户关系影响力平分给用户C和用户D。用户B关注了用户C和另外两个用户。用户B将自己的用户关系影响力平分给用户D和两外两个用户。用户C的用户关系影响力是0.83,分别从用户A和用户B处得来。用户D的用户关系影响力是0.5,从用户A处得来。
步骤2:用户活动影响力计算
如图3所示,用户A通过用户关系影响计算得来的影响力是4,他在一定时间段内评论过用户C和用户D。其中用户C评论了2条,用户D评论了6条,即用户C占用户A所有评论的四分之一,用户D站用户A所有评论的四分之三。所以用户活动影响力传递时,将用户A四分之一的影响力传递给了用户C,将用户A四分之三的影响力传递给了用户D。用户B同理,将三分之二的影响力传递给了用户C,三分之一的影响力分别传给了另外两个用户。用户C从用户A处得到了1的影响力,从用户B处得到了2的影响力。考虑到影响力的衰减效果,用户C发表的内容有6个关键词语。用户A评论用户C这条内容时,只涉及了其中的2个关键词语。用户B评论用户C这条内容时,涉及了3个关键词语。所以用户C实际得到的影响力为用户A的1*1/6加上用户B的2*3/6。为了确保递减性,此时还要乘以递减因子(此例中为0.8)。
步骤3:用户影响力计算
由于每次计算用户都会得到由其他用户传递过来的影响力,而这些影响力并没有参与上一次的传递运算。所以此过程需要循环算下去,直到传递的影响力小于首次计算活动影响力初值的百分之一(由于递减性趋于0的性质,可以在有限计算次数时可达到该值)。通过500次迭代用户活动影响力,最终得到用户行为影响力。
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种基于社交网络用户行为的用户影响力分析方法,其特征在于包括如下步骤:
步骤1:统计分析社交网络中用户之间的关注和被关注关系及评论数目和评论内容;
步骤2:设置用户关系影响力初值为1,通过计算N次用户关系影响力,直到用户关系影响力趋于平稳,两次相邻计算的结果差小于结果值的百分之一,用户关系影响力计算方法如下:
R ( i ) = Σ j ∈ B ( i ) R ( j ) L ( j )
R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集;
步骤3:统计和分析用户之间的评论条数及内容,并设用户活动影响力初值为用户关系影响力结果,计算N次用户活动影响力,直到某次的计算结果小于首次计算活动影响力初值的百分之一,用户活动影响力计算方法如下:
A k + 1 ( i ) = Σ j ∈ B ( i ) A k ( j ) * L ( i ) Σ L * c ( j ) c ( i ) * d
Ak+1(i)表示经过k+1次衰减传递后i用户得到的影响力,B(i)表示关注i用户的用户集,
Figure FDA0000490126900000013
表示j用户评论i用户的数目在j用评论所有用户数目的比重,表示j用户对i用户的评论中,j用户和i用户同时出现的关键词数比i用于发表内容的关键词数,d表示一个影响力衰减因子,为了使该公式与初值有关,要保证影响力的传递是递减的,可以保证一定的递减性,但是也有可能存在
Figure FDA0000490126900000016
为1的情况,所以加入了衰减因子d,其可以设为小于1的固定值;
步骤4:累加所有活动影响力,得到最终的用户影响力,计算方法如下:
A ( i ) = Σ k = 1 n A k ( i )
A(i)表示i用户最终的影响力,Ak(i)表示i用户经过第k次衰减传递后的影响力,通过公式(2)和公式(3)可以计算出用户活动的影响力。
CN201410146306.8A 2014-04-11 2014-04-11 一种基于社交网络用户行为的用户影响力分析方法 Expired - Fee Related CN103886105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410146306.8A CN103886105B (zh) 2014-04-11 2014-04-11 一种基于社交网络用户行为的用户影响力分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410146306.8A CN103886105B (zh) 2014-04-11 2014-04-11 一种基于社交网络用户行为的用户影响力分析方法

Publications (2)

Publication Number Publication Date
CN103886105A true CN103886105A (zh) 2014-06-25
CN103886105B CN103886105B (zh) 2017-05-17

Family

ID=50954997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410146306.8A Expired - Fee Related CN103886105B (zh) 2014-04-11 2014-04-11 一种基于社交网络用户行为的用户影响力分析方法

Country Status (1)

Country Link
CN (1) CN103886105B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105306540A (zh) * 2015-09-24 2016-02-03 华东师范大学 一种获得社交网络中影响力最大的前k个节点的方法
WO2016015444A1 (zh) * 2014-07-31 2016-02-04 华为技术有限公司 一种目标用户的确定方法、设备和网络服务器
CN105404943A (zh) * 2015-12-08 2016-03-16 南京邮电大学 一种面向移动社交环境的用户行为预测方法
CN106126607A (zh) * 2016-06-21 2016-11-16 重庆邮电大学 一种面向社交网络的用户关系分析方法
CN106611339A (zh) * 2015-10-21 2017-05-03 阿里巴巴集团控股有限公司 种子用户筛选方法、产品的用户影响力评价方法及装置
WO2017118426A1 (zh) * 2016-01-07 2017-07-13 腾讯科技(深圳)有限公司 社交平台的用户影响力估算方法、装置及计算机存储介质
CN107145612A (zh) * 2017-06-23 2017-09-08 北京邮电大学 一种主题相关的影响力用户发现和追踪方法
CN108512765A (zh) * 2017-02-28 2018-09-07 中国科学院声学研究所 一种基于网络节点分布式Pagerank的网络内容扩散方法
CN109146700A (zh) * 2018-08-14 2019-01-04 西华大学 一种针对社交网络领袖的影响力特征提取方法
CN110020375A (zh) * 2017-12-28 2019-07-16 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法
US10411945B2 (en) * 2015-06-09 2019-09-10 Tencent Technology (Shenzhen) Company Limited Time-distributed and real-time processing in information recommendation system, method and apparatus
CN110830306A (zh) * 2019-11-20 2020-02-21 北京百分点信息科技有限公司 确定网络用户影响力的方法、装置、存储介质及电子设备
CN111309936A (zh) * 2019-12-27 2020-06-19 上海大学 一种电影用户画像的构建方法
CN111353905A (zh) * 2020-02-28 2020-06-30 中国科学院自动化研究所 针对网络社区的网民用户个体影响力测量和估算系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070027741A1 (en) * 2005-07-27 2007-02-01 International Business Machines Corporation System, service, and method for predicting sales from online public discussions
WO2008073633A2 (en) * 2006-11-06 2008-06-19 Promethean Ventures, Llc System and method of using movie taste for compatibility matching
CN102262681A (zh) * 2011-08-19 2011-11-30 南京大学 一种博客信息传播中识别关键博客集的方法
CN102385636A (zh) * 2011-12-22 2012-03-21 陈伟 一种智能搜索方法和装置
US20120166291A1 (en) * 2010-12-23 2012-06-28 Yahoo! Inc. Bid generation for sponsored search
CN102651012A (zh) * 2012-03-09 2012-08-29 华中科技大学 互联网新闻文本之间的转载关系识别方法
CN103077190A (zh) * 2012-12-20 2013-05-01 人民搜索网络股份公司 基于排序学习技术的热门事件排名方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070027741A1 (en) * 2005-07-27 2007-02-01 International Business Machines Corporation System, service, and method for predicting sales from online public discussions
WO2008073633A2 (en) * 2006-11-06 2008-06-19 Promethean Ventures, Llc System and method of using movie taste for compatibility matching
US20120166291A1 (en) * 2010-12-23 2012-06-28 Yahoo! Inc. Bid generation for sponsored search
CN102262681A (zh) * 2011-08-19 2011-11-30 南京大学 一种博客信息传播中识别关键博客集的方法
CN102385636A (zh) * 2011-12-22 2012-03-21 陈伟 一种智能搜索方法和装置
CN102651012A (zh) * 2012-03-09 2012-08-29 华中科技大学 互联网新闻文本之间的转载关系识别方法
CN103077190A (zh) * 2012-12-20 2013-05-01 人民搜索网络股份公司 基于排序学习技术的热门事件排名方法

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016015444A1 (zh) * 2014-07-31 2016-02-04 华为技术有限公司 一种目标用户的确定方法、设备和网络服务器
US10411945B2 (en) * 2015-06-09 2019-09-10 Tencent Technology (Shenzhen) Company Limited Time-distributed and real-time processing in information recommendation system, method and apparatus
CN105306540A (zh) * 2015-09-24 2016-02-03 华东师范大学 一种获得社交网络中影响力最大的前k个节点的方法
CN106611339B (zh) * 2015-10-21 2020-12-29 创新先进技术有限公司 种子用户筛选方法、产品的用户影响力评价方法及装置
CN106611339A (zh) * 2015-10-21 2017-05-03 阿里巴巴集团控股有限公司 种子用户筛选方法、产品的用户影响力评价方法及装置
CN105404943A (zh) * 2015-12-08 2016-03-16 南京邮电大学 一种面向移动社交环境的用户行为预测方法
CN106952166A (zh) * 2016-01-07 2017-07-14 腾讯科技(深圳)有限公司 一种社交平台的用户影响力估算方法及装置
WO2017118426A1 (zh) * 2016-01-07 2017-07-13 腾讯科技(深圳)有限公司 社交平台的用户影响力估算方法、装置及计算机存储介质
CN106126607A (zh) * 2016-06-21 2016-11-16 重庆邮电大学 一种面向社交网络的用户关系分析方法
CN106126607B (zh) * 2016-06-21 2019-12-31 重庆邮电大学 一种面向社交网络的用户关系分析方法
CN108512765A (zh) * 2017-02-28 2018-09-07 中国科学院声学研究所 一种基于网络节点分布式Pagerank的网络内容扩散方法
CN108512765B (zh) * 2017-02-28 2020-06-16 中国科学院声学研究所 一种基于网络节点分布式Pagerank的网络内容扩散方法
CN107145612A (zh) * 2017-06-23 2017-09-08 北京邮电大学 一种主题相关的影响力用户发现和追踪方法
CN107145612B (zh) * 2017-06-23 2020-11-10 北京邮电大学 一种主题相关的影响力用户发现和追踪方法
CN110020375A (zh) * 2017-12-28 2019-07-16 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法
CN110020375B (zh) * 2017-12-28 2023-06-27 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法
CN109146700A (zh) * 2018-08-14 2019-01-04 西华大学 一种针对社交网络领袖的影响力特征提取方法
CN109146700B (zh) * 2018-08-14 2021-11-02 西华大学 一种针对社交网络领袖的影响力特征提取方法
CN110830306A (zh) * 2019-11-20 2020-02-21 北京百分点信息科技有限公司 确定网络用户影响力的方法、装置、存储介质及电子设备
CN110830306B (zh) * 2019-11-20 2022-03-29 北京百分点科技集团股份有限公司 确定网络用户影响力的方法、装置、存储介质及电子设备
CN111309936A (zh) * 2019-12-27 2020-06-19 上海大学 一种电影用户画像的构建方法
CN111353905A (zh) * 2020-02-28 2020-06-30 中国科学院自动化研究所 针对网络社区的网民用户个体影响力测量和估算系统
CN111353905B (zh) * 2020-02-28 2023-08-22 中国科学院自动化研究所 针对网络社区的网民用户个体影响力测量和估算系统

Also Published As

Publication number Publication date
CN103886105B (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
CN103886105A (zh) 一种基于社交网络用户行为的用户影响力分析方法
CN102708153B (zh) 自适应在线社交网络热点话题发展趋势预测方法及系统
CN102262681B (zh) 一种博客信息传播中识别关键博客集的方法
CN103064917A (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN102750320B (zh) 一种网络视频实时关注度的计算方法、装置和系统
CN104166726B (zh) 一种面向微博文本流的突发关键词检测方法
KR20140131327A (ko) 소셜 미디어 데이터 분석 시스템 및 방법
CN105095433A (zh) 实体推荐方法及装置
CN104462383A (zh) 一种基于用户多种行为反馈的电影推荐方法
CN103218412B (zh) 舆情信息处理方法与装置
CN105608200A (zh) 一种网络舆论趋势预测分析方法
Li et al. Novel user influence measurement based on user interaction in microblog
Wang et al. Public opinion information dissemination in mobile social networks–taking Sina Weibo as an example
CN102663047A (zh) 移动阅读中的社交关系挖掘方法及装置
CN110069713B (zh) 一种基于用户上下文感知的个性化推荐方法
Jiang et al. Predicting the evolution of hot topics: A solution based on the online opinion dynamics model in social network
CN112085087A (zh) 业务规则生成的方法、装置、计算机设备及存储介质
Lu et al. Identification of key nodes in microblog networks
Song et al. Recommending hashtags to forthcoming tweets in microblogging
WO2021262316A1 (en) Pattern-based classification
CN111625439B (zh) 基于用户行为的日志数据分析app用户粘性的方法
Sarigiannidis et al. A novel lexicon-based approach in determining sentiment in financial data using learning automata
CN103810167B (zh) 获取信息的方法和装置
Baosong et al. Prediction models for network multi-source dissemination of information based on multivariate chaotic time series
Bai et al. Text Sentiment Analysis of Hotel Online Reviews

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170517

Termination date: 20200411