CN108182640A - 一种基于用户行为传播模型求解影响力最大化问题的方法 - Google Patents
一种基于用户行为传播模型求解影响力最大化问题的方法 Download PDFInfo
- Publication number
- CN108182640A CN108182640A CN201711473788.8A CN201711473788A CN108182640A CN 108182640 A CN108182640 A CN 108182640A CN 201711473788 A CN201711473788 A CN 201711473788A CN 108182640 A CN108182640 A CN 108182640A
- Authority
- CN
- China
- Prior art keywords
- user
- influence
- node
- propagation model
- user behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000003542 behavioural effect Effects 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000006854 communication Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000005303 weighing Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/20—Software design
- G06F8/22—Procedural
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于用户行为传播模型求解影响力最大化问题的方法,所述方法通过社交网络的用户行为计算用户个体影响力,并基于个体影响力计算影响传播概率,通过影响传播概率计算特定社交圈中被影响用户的最大化范围。本发明方法基于用户行为传播模型求解影响力最大化问题相比基于网络拓扑结构的传播模型在社交网络方面更能得到更为可观的影响节点集合,影响力越大的节点影响其相邻节点的能力理应越大,其成功的概率也相应更大,而基于时间分布用户活跃度的PageRank方法求解用户个体影响力能有效地淘汰“僵尸”节点,相比基于网络拓扑结构的PageRank方法求解的影响力更具有时效性和准确性,能更好地提高活跃用户的排名,降低非活跃用户的排名。
Description
技术领域
本发明涉及用户行为分析挖掘技术领域,具体涉及一种一种基于用户行为传播模型求解影响力最大化问题的方法。
背景技术
社交网络作为现在主流的在线交流平台,已经渗透到各行各业人的生活工作中,其由用户信息、用户行为、用户关系等产生的数据潜藏着不可估量的价值。随着社会网络的迅速发展,其规模越来越大,节点数目众多,节点间关系错综复杂,行为数据庞大社交网络作为现在主流的在线交流平台,已经渗透到各行各业人的生活工作中,其由用户信息、用户行为、用户关系等产生的数据潜藏着不可估量的价值。随着社会网络的迅速发展,其规模越来越大,节点数目众多,节点间关系错综复杂,行为数据庞大。
PageRank算法是Google网页排名的经典算法,主要将网页排名的过程比作投票的过程,一个网页链接到另一个网页就表示这个网页给另一个网页投票,一般票数越多,排名越靠前。而网页之间的关系和社交网络中用户之间的关系其实极为相似,从图论的角度看,社交关系网络和Web网络是有着相似的拓扑结构的,只是在社交网络中的用户是生活中的有意识个体,不同的用户会有自己不同的行为习惯,且会由此产生大量数据,而网页基本都是挂着,数据相对来说比较单一。若是直接应用PageRank算法计算社交网络用户影响力,便只考虑了用户之间的关注关系,忽略了用户自身行为的一些因素,并不能客观地体现用户的真实影响力。影响力最大化问题是基于给定的影响传播模型,找到k个初始活跃节点,使最终社会网络的影响力传播范围达到最大。而一般的传播模型是基于社交网络拓扑结构的传播模型,用户节点间连接的权重只是满足简单的概率函数,然而实际网络中,不同节点对信息传播的贡献是不同的,意见领袖或是类似权威用户相对于一般用户应具有较大影响概率,更能促进影响传播。
从广义上讲,社交网络是针对互联网网民群体的一种应用服务,其核心价值在于人和人的社交关系,通过研究用户间的关系,对现实网络加以定量分析和计算,可以识别有影响力的用户,支撑企业的市场经营决策管理。通过研究用户个体影响力,可以挖掘意见领袖,借以控制舆论或谣言的发展倾向等。一些典型的传播模型,比如独立级联模型、线性阈值模型、加权级联模型等一般都是基于社交网络拓扑结构的传播模型,用户节点间连接的权重只是满足简单的概率函数,如加权级联模型的影响权重满足节点入度的倒数关系,彼此间都被以相同的影响力对待。然而实际网络中,不同节点对信息传播的贡献是不同的,意见领袖或是类似权威用户相对于一般用户应具有较大影响概率,更能促进影响传播。
发明内容
本发明要解决的技术问题是:本发明针对以上问题,提供一种一种基于用户行为传播模型求解影响力最大化问题的方法。
本发明基于用户之间的关注关系及其活跃度,并由此通过PageRank方法计算用户个体影响力,以基于用户影响力的传播模型求解社交网络影响力最大化问题。通过基于时间分布用户活跃度计算用户影响力可提高排名的时效性和准确性,提高有活跃度高的用户排名,降低活跃度低的用户排名。由此求解影响力最大化问题可以得到更为可观的影响范围。
本发明所采用的技术方案为:
一种基于用户行为传播模型求解影响力最大化问题的方法,所述方法通过社交网络的用户行为计算用户个体影响力,并基于个体影响力计算影响传播概率,通过影响传播概率计算特定社交圈中被影响用户的最大化范围。
所述个体影响力根据时效权重因子确定。
所述时效权重因子根据固定区域大量用户的行为习惯,得到不同时间段的用户发布内容影响权重。
所述影响传播概率的计算过程如下:
将影响力大的用户的影响值与将被影响节点相邻的活跃节点的影响值之和的比例,作为将被影响节点的影响传播概率。
所述方法实现步骤包括:
1)调用社交网络的API,从一个种子节点出发,以广度优先搜索策略,获取一定量的用户节点及其关注关系拓扑结构,并调用相关API获取用户节点集合的推文发布情况;
2)根据用户的行为习惯,对不同时间分布的推文引入相应的时效权重因子;
3)对同一用户不同时间的推文分别加以相应的时效权重因子,以此计算用户基于时间分布的活跃度;
4)分别通过传统的PageRank方法计算用户个体影响力和基于时间分布活跃度的PageRank方法计算用户个体影响力。
所述方法内容还包括:
每个时间段发布的推文的时效权重因子,通过用户访问该社交网络的时间分布来计算,进而得到时效权重分布。
所述户访问该社交网络的时间分布,根据用户发布推文的时间分布近似地估算。
从数据集中,只能得到用户发布推文的时间分布,但是用户发布推文的时间分布可以用来近似地估算用户访问Twitter网站的时间分布,进而得到时效权重分布。
被影响用户的最大化范围确定过程如下:
1)构建社交网络图G(V,E),其中V为节点的集合,E为边的集合;
2)选择集合S∈V作为种子集合初始化影响传播过程;
3)假设节点u处于活跃状态,节点v处于非活跃状态,定义节点u对节点v的影响概率Puv为节点u 的影响值占节点v所有邻接活跃节点影响值之合的比例;
这样便可使越具影响力的用户成功影响非活跃状态的邻接节点的概率相对越大;
4)经过R轮模拟,当V中的节点都不再具备影响能力,得到最大化范围S。
所述方法内容还包括:
通过将所述方法基于的用户行为传播模型与加权级联模型及线性阈值模型在同等关系网络中进行对比实验分析,验证所述方法的有效性。
本发明的有益效果为:
本发明方法基于用户行为传播模型求解影响力最大化问题相比基于网络拓扑结构的传播模型在社交网络方面更能得到更为可观的影响节点集合,影响力越大的节点影响其相邻节点的能力理应越大,其成功的概率也相应更大,而基于时间分布用户活跃度的PageRank方法求解用户个体影响力能有效地淘汰“僵尸”节点,相比基于网络拓扑结构的PageRank方法求解的影响力更具有时效性和准确性,能更好地提高活跃用户的排名,降低非活跃用户的排名。
具体实施方式
下面根据具体实施方式对本发明进一步说明:
(1)以Twitter为研究对象,调用其API,从一个种子节点出发,以广度优先搜索策略,获取一定量的用户节点及其关注关系拓扑结构,并调用相关API获取用户节点集合的推文发布情况。
(2)根据用户的行为习惯,对不同时间分布的推文引入相应的时效权重因子。要估算每个时间段发布的推文的时效权重,可以通过用户访问twitter网站的时间分布来计算,从数据集中,只能得到用户发布推文的时间分布,但是我们认为用户发布推文的时间分布可以用来近似地估算用户访问Twitter网站的时间分布,进而得到时效权重分布。
(3)由于用户访问社交网站的时间分高峰期和非高峰期,习惯在用户访问量高峰期活跃的用户,其间发布的推文更容易被关注,所以对同一用户不同时间的推文分别加以相应的时效权重因子,以此计算用户基于时间分布的活跃度。
(4)分别通过传统的PageRank方法计算用户个体影响力和基于时间分布活跃度的PageRank方法计算用户个体影响力;
(5)构建社交网络图G(V,E),其中V为节点的集合,E为边的集合;
选择集合S∈V作为种子集合初始化影响传播过程;
假设节点u处于活跃状态,节点v处于非活跃状态,定义节点u对节点v的影响概率Puv为节点u 的影响值占节点v所有邻接活跃节点影响值之合的比例;
这样便可使越具影响力的用户成功影响非活跃状态的邻接节点的概率相对越大;
经过R轮模拟,当V中的节点都不再具备影响能力,得到最大化范围S;
(6)将上述传播模型与加权级联模型及线性阈值模型等在同等关系网络中进行对比实验分析,本发明基于用户行为传播模型求解影响力最大化问题相比基于网络拓扑结构的传播模型在社交网络方面更能得到更为可观的影响节点集合。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (9)
1.一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述方法通过社交网络的用户行为计算用户个体影响力,并基于个体影响力计算影响传播概率,通过影响传播概率计算特定社交圈中被影响用户的最大化范围。
2.根据权利要求1所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述个体影响力根据时效权重因子确定。
3.根据权利要求1或2所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述时效权重因子根据固定区域用户的行为习惯,得到不同时间段的用户发布内容影响权重。
4.根据权利要求3所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述影响传播概率的计算过程如下:
将影响力大的用户的影响值与将被影响节点相邻的活跃节点的影响值之和的比例,作为将被影响节点的影响传播概率。
5.根据权利要求4所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述方法实现步骤包括:
1)调用社交网络的API,从一个种子节点出发,以广度优先搜索策略,获取一定量的用户节点及其关注关系拓扑结构,并调用相关API获取用户节点集合的推文发布情况;
2)根据用户的行为习惯,对不同时间分布的推文引入相应的时效权重因子;
3)对同一用户不同时间的推文分别加以相应的时效权重因子,以此计算用户基于时间分布的活跃度;
4)分别通过传统的PageRank方法计算用户个体影响力和基于时间分布活跃度的PageRank方法计算用户个体影响力。
6.根据权利要求5所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述方法内容还包括:
每个时间段发布的推文的时效权重因子,通过用户访问该社交网络的时间分布来计算,进而得到时效权重分布。
7.根据权利要求6所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述户访问该社交网络的时间分布,根据用户发布推文的时间分布近似地估算。
8.根据权利要求7所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,被影响用户的最大化范围确定过程如下:
1)构建社交网络图G(V,E),其中V为节点的集合,E为边的集合;
2)选择集合S∈V作为种子集合初始化影响传播过程;
3)假设节点u处于活跃状态,节点v处于非活跃状态,定义节点u对节点v的影响概率Puv为节点u 的影响值占节点v所有邻接活跃节点影响值之合的比例;
4)经过R轮模拟,当V中的节点都不再具备影响能力,得到最大化范围S。
9.根据权利要求8所述的一种基于用户行为传播模型求解影响力最大化问题的方法,其特征在于,所述方法内容还包括:
通过将所述方法基于的用户行为传播模型与加权级联模型及线性阈值模型在同等关系网络中进行对比实验分析,验证所述方法的有效性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711473788.8A CN108182640A (zh) | 2017-12-29 | 2017-12-29 | 一种基于用户行为传播模型求解影响力最大化问题的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711473788.8A CN108182640A (zh) | 2017-12-29 | 2017-12-29 | 一种基于用户行为传播模型求解影响力最大化问题的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108182640A true CN108182640A (zh) | 2018-06-19 |
Family
ID=62549035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711473788.8A Pending CN108182640A (zh) | 2017-12-29 | 2017-12-29 | 一种基于用户行为传播模型求解影响力最大化问题的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182640A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960979A (zh) * | 2018-06-20 | 2018-12-07 | 淮阴工学院 | 一种线上产品推销选取初始用户的方法 |
CN109410078A (zh) * | 2018-09-12 | 2019-03-01 | 河南理工大学 | 一种适用于面向文件共享的移动社交网络的信息传播预测方法 |
CN110738421A (zh) * | 2019-10-17 | 2020-01-31 | 西南大学 | 一种基于传播最短路径的多层网络用户影响力度量方法 |
CN111342991A (zh) * | 2020-01-10 | 2020-06-26 | 西安电子科技大学 | 基于跨社交网络的信息传播方法 |
CN112511411A (zh) * | 2020-12-07 | 2021-03-16 | 郁剑 | 一种5g背景下新媒体影像的视觉传播方法 |
CN112929445A (zh) * | 2021-02-20 | 2021-06-08 | 山东英信计算机技术有限公司 | 一种面向推荐系统的链路预测方法、系统及介质 |
CN115270008A (zh) * | 2022-09-29 | 2022-11-01 | 西南财经大学 | 最大影响力博主找寻方法及系统、存储介质及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617279A (zh) * | 2013-12-09 | 2014-03-05 | 南京邮电大学 | 基于Pagerank方法的微博信息传播影响力评估模型的实现方法 |
CN105005918A (zh) * | 2015-07-24 | 2015-10-28 | 金鹃传媒科技股份有限公司 | 一种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评估方法 |
CN106991160A (zh) * | 2017-03-30 | 2017-07-28 | 武汉大学 | 一种基于用户影响力以及内容的微博传播预测方法 |
-
2017
- 2017-12-29 CN CN201711473788.8A patent/CN108182640A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617279A (zh) * | 2013-12-09 | 2014-03-05 | 南京邮电大学 | 基于Pagerank方法的微博信息传播影响力评估模型的实现方法 |
CN105005918A (zh) * | 2015-07-24 | 2015-10-28 | 金鹃传媒科技股份有限公司 | 一种基于用户行为数据和潜在用户影响力分析的在线广告推送方法及其推送评估方法 |
CN106991160A (zh) * | 2017-03-30 | 2017-07-28 | 武汉大学 | 一种基于用户影响力以及内容的微博传播预测方法 |
Non-Patent Citations (2)
Title |
---|
宫秀文等: "基于PageRank的社交网络影响最大化传播模型与算法研究", 《计算机科学》 * |
张晓双等: "社交网络用户影响力分析ABP算法研究与应用", 《计算机工程与科学》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108960979A (zh) * | 2018-06-20 | 2018-12-07 | 淮阴工学院 | 一种线上产品推销选取初始用户的方法 |
CN108960979B (zh) * | 2018-06-20 | 2021-08-31 | 淮阴工学院 | 一种线上产品推销选取初始用户的方法 |
CN109410078A (zh) * | 2018-09-12 | 2019-03-01 | 河南理工大学 | 一种适用于面向文件共享的移动社交网络的信息传播预测方法 |
CN109410078B (zh) * | 2018-09-12 | 2021-09-28 | 河南理工大学 | 一种适用于面向文件共享的移动社交网络的信息传播预测方法 |
CN110738421A (zh) * | 2019-10-17 | 2020-01-31 | 西南大学 | 一种基于传播最短路径的多层网络用户影响力度量方法 |
CN110738421B (zh) * | 2019-10-17 | 2023-08-22 | 西南大学 | 一种基于传播最短路径的多层网络用户影响力度量方法 |
CN111342991A (zh) * | 2020-01-10 | 2020-06-26 | 西安电子科技大学 | 基于跨社交网络的信息传播方法 |
CN111342991B (zh) * | 2020-01-10 | 2022-03-04 | 西安电子科技大学 | 基于跨社交网络的信息传播方法 |
CN112511411A (zh) * | 2020-12-07 | 2021-03-16 | 郁剑 | 一种5g背景下新媒体影像的视觉传播方法 |
CN112929445A (zh) * | 2021-02-20 | 2021-06-08 | 山东英信计算机技术有限公司 | 一种面向推荐系统的链路预测方法、系统及介质 |
CN112929445B (zh) * | 2021-02-20 | 2022-06-07 | 山东英信计算机技术有限公司 | 一种面向推荐系统的链路预测方法、系统及介质 |
CN115270008A (zh) * | 2022-09-29 | 2022-11-01 | 西南财经大学 | 最大影响力博主找寻方法及系统、存储介质及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182640A (zh) | 一种基于用户行为传播模型求解影响力最大化问题的方法 | |
Kumar et al. | Identifying influential nodes in Social Networks: Neighborhood Coreness based voting approach | |
Wang et al. | On studying the impact of uncertainty on behavior diffusion in social networks | |
RU2607621C2 (ru) | Способ, система и машиночитаемый носитель данных для группирования в социальных сетях | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
Tian et al. | R2Trust, a reputation and risk based trust management framework for large-scale, fully decentralized overlay networks | |
CN103995907A (zh) | 一种访问用户的确定方法 | |
CN107895038A (zh) | 一种链路预测关系推荐方法及装置 | |
CN106021376A (zh) | 用于处理用户信息的方法和设备 | |
Traag et al. | Exponential ranking: taking into account negative links | |
CN109829337A (zh) | 一种社会网络隐私保护的方法、系统及设备 | |
He et al. | Price of anarchy for the n-player competitive cascade game with submodular activation functions | |
Deng et al. | The coevolutionary ultimatum game on different network topologies | |
Liao et al. | Devrank: Mining influential developers in github | |
Huang et al. | Collaboration in participant-centric federated learning: A game-theoretical perspective | |
Wellman et al. | Analyzing incentives for protocol compliance in complex domains: A case study of introduction-based routing | |
Ullah et al. | Identification of influential nodes based on temporal-aware modeling of multi-hop neighbor interactions for influence spread maximization | |
US8914505B2 (en) | Methods and apparatus for tuning a network for optimal performance | |
CN106454958A (zh) | 一种网络资源分配方法及装置 | |
CN109816544B (zh) | 基于接触概率的信息传播模型实现方法及装置 | |
US20190197633A1 (en) | Social media account filtering method and apparatus | |
Mariani et al. | Network-based ranking in social systems: three challenges | |
DeLegge et al. | Is this the end for Facebook? A mathematical analysis | |
Shi et al. | Instability in stable marriage problem: Matching unequally numbered men and women | |
Schall et al. | Dynamic context-sensitive pagerank for expertise mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200818 Address after: 250100 Room 3110, S01 Building, Tidal Building, 1036 Tidal Road, Jinan High-tech Zone, Shandong Province Applicant after: Shandong Aicheng Network Information Technology Co.,Ltd. Address before: 250100 Ji'nan science and technology zone, Shandong high tide Road, No. 1036 wave of science and Technology Park, building S06 Applicant before: SHANDONG INSPUR CLOUD SERVICE INFORMATION TECHNOLOGY Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180619 |
|
RJ01 | Rejection of invention patent application after publication |