CN103886105B - 一种基于社交网络用户行为的用户影响力分析方法 - Google Patents
一种基于社交网络用户行为的用户影响力分析方法 Download PDFInfo
- Publication number
- CN103886105B CN103886105B CN201410146306.8A CN201410146306A CN103886105B CN 103886105 B CN103886105 B CN 103886105B CN 201410146306 A CN201410146306 A CN 201410146306A CN 103886105 B CN103886105 B CN 103886105B
- Authority
- CN
- China
- Prior art keywords
- user
- influence power
- influence
- social network
- customer relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 11
- 230000006399 behavior Effects 0.000 title abstract 4
- 230000000694 effects Effects 0.000 claims abstract description 20
- 230000005540 biological transmission Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000012552 review Methods 0.000 claims description 2
- 238000000205 computational method Methods 0.000 claims 3
- 238000000151 deposition Methods 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 17
- 238000009792 diffusion process Methods 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003012 network analysis Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于社交网络用户行为的用户影响力分析方法,涉及信息技术领域。本发明可以通过社交网络的数据集,从用户关系和用户活动两个方法,综合分析出影响力强的用户。针对于现有的基于社交网络分析影响力的方法,与基于PageRank的模型相比,本发明涉及更多数据关系,并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本发明对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本发明类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。
Description
技术领域
本发明涉及信息技术领域,特别是涉及一种基于社交网络用户行为的用户影响力分析方法。
背景技术
随着互联网的发展,用户已经从一个被动的通过浏览器从各大网站获取信息阅读信息的浏览者,转向了可以主动参与到互联网的发展之中的编辑者,使用者和传播者。在web2.0时代,用户拥有更多的话语权和主动权,可以直接参与和发布内容,极大加强了用户间的交流性。社交网络作为这个时代一个突出的产物,其具有用户规模大,话题种类多,信息传递迅速和影响范围广等特点。社交网络的迅速发展已经成为了一个新型了信息载体和转播媒介,对于日常工作和生活产生的影响也越来越大。在信息传播的过程中,意见领袖作为一种重要力量,在社会舆论的形成过程中发挥着不可忽视的作用,局部意见在意见领袖的引导下演化为舆论,影响力直接渗透到现实社会。
为了识别出社交网路中的意见领袖,需要分析社交网路中用户的影响力,找出影响力强的用户。现有的基于社交网络分析影响力的方法分为三大类。第一类是基于PageRank网页排名算法。基于PageRank的算法,多为对社交网络中的某一个因素,套用PageRank的思想,计算出用户影响力。其不足是所用的因素比较单一,没有针对内容分析。第二类基于影响力扩散模型(IDM),IDM模型主要是针对话题,根据帖子上下文词语出现的频率关系,得到话题的影响力。通过计算用户所有话题得到用户的影响力。这种方法的不足是用户之间的联系不太紧密。第三类是传统的基于用户行为模型。该模型通过统计用户的各种行为,例如跟随、转推、提及,来计算用户的影响力。这种方法比较简单,但是各种行为的归一化系数不好确定。
发明内容
本发明提供了一种基于社交网络用户行为的用户影响力分析方法。这个方法可以通过社交网络的数据集,从用户关系和用户活动两种方法,综合分析出影响力强的用户,包括如下步骤:
步骤1:统计分析相关数据信息
在社交网络中,数据量非常庞大,为了从庞大的数据量中分析用户影响力首先需要统计以下信息。第一,统计分析社交网络中用户之间的关注和被关注关系。第二,统计分析用户之间的评论数目和评论内容。
步骤2:用户关系影响力计算
用户关系影响力是实现过程借鉴了PageRank网页排名算法的思想,以用户之间的关注情况类比PageRank中的链接情况。通过公式(1)计算出用户关系影响力。由于用户关系影响力算法是一收敛算法,所以其结果只与用户之间相互关注的关系有关,与用户初始值无关。
公式中R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集。
步骤3:用户活动影响力计算
针对于社交网络,如果用户A对用户B发表了某些评论,那么说明用户B的言论影响到了用户A,从而用户A可以将B言论中影响到他的部分继续影响其他用户,所以用户B应该获得用户A的一部分影响力。具体用户B获得用户A多少的影响力取决于三点。第一点,用户A受到过多少用户言论的影响。第二点,用户A在受到所有言论的影响中B占有多大的比重。第三点,用户A受到用户B言论影响的程度。针对以上三点,用户活动影响力可以通过公式(2)表示
在公式(2)中Ak+1(i)表示经过k+1次衰减传递后i用户得到的影响力。B(i)表示关注i用户的用户集。表示j用户评论i用户的数目在j用评论所有用户数目的比重。表示j用户对i用户的评论中,j用户和i用户同时出现的关键词数比i用于发表内容的关键词数。d表示一个影响力衰减因子,为了使该公式与初值有关,要保证影响力的传递是递减的,可以保证一定的递减性,但是也有可能存在为1的情况,所以加入了衰减因子d,其可以设为小于1的固定值。由于该公式的逐步递减并且趋于0,所以当Ak+1(i)的值小于首次计算活动影响力初值的百分之一时,其值可以忽略不计,所以k值有限。
步骤4:用户影响力计算
公式(2)中计算出的第k次用户活动影响力,是由于k-1次用户活动影响力再传递一次产生的结果。所以通过累加第3步中所有用户活动影响力的结果,计算得到用户的影响力。该过程可以通过公式(3)表示。
在公式(3)中A(i)表示i用户最终的影响力。Ak(i)表示i用户经过第k次衰减传递后的影响力。
本发明与现有技术相比,具有以下明显的优势和有益效果:
针对于现有的基于社交网络分析影响力的方法,本发明具有一定的优势。与基于PageRank的模型相比,本发明涉及更多数据关系。并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本发明对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本发明类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。
附图说明
图1用户影响力流程图;
图2用户关系影响力传递示例;
图3用户活动影响力传递示例。
具体实施方式
以下结合说明书附图和具体实施方式对本发明的方法做进一步详细说明。
步骤1:用户关系影响力计算
如图2所示,将所有用户的关系影响力初值设置为1。用户A关注了用户C和用户D。用户A将自己的用户关系影响力平分给用户C和用户D。用户B关注了用户C和另外两个用户。用户B将自己的用户关系影响力平分给用户D和两外两个用户。用户C的用户关系影响力是0.83,分别从用户A和用户B处得来。用户D的用户关系影响力是0.5,从用户A处得来。
步骤2:用户活动影响力计算
如图3所示,用户A通过用户关系影响计算得来的影响力是4,他在一定时间段内评论过用户C和用户D。其中用户C评论了2条,用户D评论了6条,即用户C占用户A所有评论的四分之一,用户D站用户A所有评论的四分之三。所以用户活动影响力传递时,将用户A四分之一的影响力传递给了用户C,将用户A四分之三的影响力传递给了用户D。用户B同理,将三分之二的影响力传递给了用户C,三分之一的影响力分别传给了另外两个用户。用户C从用户A处得到了1的影响力,从用户B处得到了2的影响力。考虑到影响力的衰减效果,用户C发表的内容有6个关键词语。用户A评论用户C这条内容时,只涉及了其中的2个关键词语。用户B评论用户C这条内容时,涉及了3个关键词语。所以用户C实际得到的影响力为用户A的1*1/6加上用户B的2*3/6。为了确保递减性,此时还要乘以递减因子(此例中为0.8)。
步骤3:用户影响力计算
由于每次计算用户都会得到由其他用户传递过来的影响力,而这些影响力并没有参与上一次的传递运算。所以此过程需要循环算下去,直到传递的影响力小于首次计算活动影响力初值的百分之一(由于递减性趋于0的性质,可以在有限计算次数时可达到该值)。通过500次迭代用户活动影响力,最终得到用户行为影响力。
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。
Claims (1)
1.一种基于社交网络用户行为的用户影响力分析方法,其特征在于包括如下步骤:
步骤1:统计分析社交网络中用户之间的关注和被关注关系及评论数目和评论内容;
步骤2:设置用户关系影响力初值为1,通过计算N次用户关系影响力,直到用户关系影响力趋于平稳,两次相邻计算的结果差小于结果值的百分之一,用户关系影响力计算方法如下:
R(i)表示i用户的用户关系影响力,R(j)表示j用户的影响力,L(j)表示j用户的关注数目,B(i)表示关注i用户的用户集;
步骤3:统计和分析用户之间的评论条数及内容,并设用户活动影响力初值为用户关系影响力结果,计算N次用户活动影响力,直到某次的计算结果小于首次计算活动影响力初值的百分之一,用户活动影响力计算方法如下:
Ak+1(i)表示经过k+1次衰减传递后i用户得到的影响力,B(i)表示关注i用户的用户集,表示j用户评论i用户的数目在j用评论所有用户数目的比重,表示j用户对i用户的评论中j用户和i用户同时出现的关键词数比重,d表示一个影响力衰减因子,为了使该公式与初值有关,要保证影响力的传递是递减的,可以保证一定的递减性,但是也有可能存在为1的情况,所以加入了衰减因子d,其可以设为小于1的固定值;
步骤4:累加所有活动影响力,得到最终的用户影响力,计算方法如下:
A(i)表示i用户最终的影响力,Ak(i)表示i用户经过第k次衰减传递后的影响力,通过公式(2)和公式(3)可以计算出用户活动的影响力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410146306.8A CN103886105B (zh) | 2014-04-11 | 2014-04-11 | 一种基于社交网络用户行为的用户影响力分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410146306.8A CN103886105B (zh) | 2014-04-11 | 2014-04-11 | 一种基于社交网络用户行为的用户影响力分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103886105A CN103886105A (zh) | 2014-06-25 |
CN103886105B true CN103886105B (zh) | 2017-05-17 |
Family
ID=50954997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410146306.8A Expired - Fee Related CN103886105B (zh) | 2014-04-11 | 2014-04-11 | 一种基于社交网络用户行为的用户影响力分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103886105B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335409B (zh) * | 2014-07-31 | 2019-02-01 | 华为技术有限公司 | 一种目标用户的确定方法、设备和网络服务器 |
CN104967679B (zh) * | 2015-06-09 | 2017-07-21 | 深圳市腾讯计算机系统有限公司 | 信息推荐系统、方法及装置 |
CN105306540A (zh) * | 2015-09-24 | 2016-02-03 | 华东师范大学 | 一种获得社交网络中影响力最大的前k个节点的方法 |
CN106611339B (zh) * | 2015-10-21 | 2020-12-29 | 创新先进技术有限公司 | 种子用户筛选方法、产品的用户影响力评价方法及装置 |
CN105404943A (zh) * | 2015-12-08 | 2016-03-16 | 南京邮电大学 | 一种面向移动社交环境的用户行为预测方法 |
CN106952166B (zh) * | 2016-01-07 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 一种社交平台的用户影响力估算方法及装置 |
CN106126607B (zh) * | 2016-06-21 | 2019-12-31 | 重庆邮电大学 | 一种面向社交网络的用户关系分析方法 |
CN108512765B (zh) * | 2017-02-28 | 2020-06-16 | 中国科学院声学研究所 | 一种基于网络节点分布式Pagerank的网络内容扩散方法 |
CN107145612B (zh) * | 2017-06-23 | 2020-11-10 | 北京邮电大学 | 一种主题相关的影响力用户发现和追踪方法 |
CN110020375B (zh) * | 2017-12-28 | 2023-06-27 | 沈阳新松机器人自动化股份有限公司 | 一种社交网络用户影响力的评估方法 |
CN109146700B (zh) * | 2018-08-14 | 2021-11-02 | 西华大学 | 一种针对社交网络领袖的影响力特征提取方法 |
CN110830306B (zh) * | 2019-11-20 | 2022-03-29 | 北京百分点科技集团股份有限公司 | 确定网络用户影响力的方法、装置、存储介质及电子设备 |
CN111309936A (zh) * | 2019-12-27 | 2020-06-19 | 上海大学 | 一种电影用户画像的构建方法 |
CN111353905B (zh) * | 2020-02-28 | 2023-08-22 | 中国科学院自动化研究所 | 针对网络社区的网民用户个体影响力测量和估算系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008073633A2 (en) * | 2006-11-06 | 2008-06-19 | Promethean Ventures, Llc | System and method of using movie taste for compatibility matching |
CN102262681A (zh) * | 2011-08-19 | 2011-11-30 | 南京大学 | 一种博客信息传播中识别关键博客集的方法 |
CN102385636A (zh) * | 2011-12-22 | 2012-03-21 | 陈伟 | 一种智能搜索方法和装置 |
CN102651012A (zh) * | 2012-03-09 | 2012-08-29 | 华中科技大学 | 互联网新闻文本之间的转载关系识别方法 |
CN103077190A (zh) * | 2012-12-20 | 2013-05-01 | 人民搜索网络股份公司 | 基于排序学习技术的热门事件排名方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725346B2 (en) * | 2005-07-27 | 2010-05-25 | International Business Machines Corporation | Method and computer program product for predicting sales from online public discussions |
US20120166291A1 (en) * | 2010-12-23 | 2012-06-28 | Yahoo! Inc. | Bid generation for sponsored search |
-
2014
- 2014-04-11 CN CN201410146306.8A patent/CN103886105B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008073633A2 (en) * | 2006-11-06 | 2008-06-19 | Promethean Ventures, Llc | System and method of using movie taste for compatibility matching |
CN102262681A (zh) * | 2011-08-19 | 2011-11-30 | 南京大学 | 一种博客信息传播中识别关键博客集的方法 |
CN102385636A (zh) * | 2011-12-22 | 2012-03-21 | 陈伟 | 一种智能搜索方法和装置 |
CN102651012A (zh) * | 2012-03-09 | 2012-08-29 | 华中科技大学 | 互联网新闻文本之间的转载关系识别方法 |
CN103077190A (zh) * | 2012-12-20 | 2013-05-01 | 人民搜索网络股份公司 | 基于排序学习技术的热门事件排名方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103886105A (zh) | 2014-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103886105B (zh) | 一种基于社交网络用户行为的用户影响力分析方法 | |
CN111931242B (zh) | 一种数据共享方法以及应用其的计算机设备及可读存储介质 | |
Bornmann et al. | BRICS countries and scientific excellence: A bibliometric analysis of most frequently cited papers | |
CN102663047B (zh) | 移动阅读中的社交关系挖掘方法及装置 | |
CN103064917B (zh) | 一种面向微博的特定倾向的高影响力用户群发现方法 | |
CN103559407B (zh) | 一种用于度量有向加权图中节点亲密度的推荐系统及方法 | |
Ruan et al. | Trust management framework for internet of things | |
CN102262681B (zh) | 一种博客信息传播中识别关键博客集的方法 | |
CN103136267B (zh) | 一种基于社区的专家挖掘方法与装置 | |
CN103426042A (zh) | 社交网络的分组方法及系统 | |
CN109727152B (zh) | 一种基于时变阻尼运动的在线社交网络信息传播构建方法 | |
CN109508416A (zh) | 基于评论数量的微博舆情事件热度与发展趋势预测方法 | |
CN106909618A (zh) | 一种健康类自媒体上的文章传播综合影响力的计算方法 | |
CN102708153A (zh) | 自适应在线社交网络热点话题发现预测方法及系统 | |
Kamal et al. | Emotion classification and crowd source sensing; a lexicon based approach | |
CN108363752A (zh) | 基于微博传播规模预测的用户社会影响力分析方法 | |
Ruan et al. | Exploring trust propagation behaviors in online communities | |
Borkotokey et al. | A solution concept for network games: The role of multilateral interactions | |
CN107809370A (zh) | 用户推荐方法及装置 | |
Peng et al. | Continuous Hesitant Fuzzy Aggregation Operators and Their Application to Decision Making under Interval‐Valued Hesitant Fuzzy Setting | |
Lu et al. | Identification of key nodes in microblog networks | |
Jackson et al. | Search in the formation of large networks: How random are socially generated networks? | |
Zygmunt | Role identification of social networkers | |
Zhang et al. | Federated model decomposition with private vocabulary for text classification | |
Ma et al. | Finding influential users of web event in social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170517 Termination date: 20200411 |