CN109410078B - 一种适用于面向文件共享的移动社交网络的信息传播预测方法 - Google Patents

一种适用于面向文件共享的移动社交网络的信息传播预测方法 Download PDF

Info

Publication number
CN109410078B
CN109410078B CN201811059532.7A CN201811059532A CN109410078B CN 109410078 B CN109410078 B CN 109410078B CN 201811059532 A CN201811059532 A CN 201811059532A CN 109410078 B CN109410078 B CN 109410078B
Authority
CN
China
Prior art keywords
node
nodes
factor
degree
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811059532.7A
Other languages
English (en)
Other versions
CN109410078A (zh
Inventor
张霄宏
钱凯
史爱静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Technology
Original Assignee
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Technology filed Critical Henan University of Technology
Priority to CN201811059532.7A priority Critical patent/CN109410078B/zh
Publication of CN109410078A publication Critical patent/CN109410078A/zh
Application granted granted Critical
Publication of CN109410078B publication Critical patent/CN109410078B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种适用于面向文件共享的移动社交网络的信息传播预测方法,给出了如何有效确定种子节点的方法,使得种子节点的选取更加合理、有效;同时给出了一种简化网络结构的方法,在不影响整体传播的基础之上,剔除那些对信息传播没有影响的节点,提高传播的效率。并通过该模型构建节点影响力计算和经典节点权威值计算的桥梁,进而研究了大规模社交网络上的信息传播最大化策略,为大规模社交网络中的信息传播预测和计算提供了一种高效解决方法。

Description

一种适用于面向文件共享的移动社交网络的信息传播预测 方法
技术领域
本发明涉及一种移动社交网络的信息传播预测方法,属于互联网应用领域。
背景技术
在社交网络中越是影响力大的人对信息的传播越是有大的贡献,所以对于信息的传播而言如何去确定最有影响力的人尤为重要,从社交网络选取一组较小的最有影响力的节点进行传播使得最终在网络中影响最大。这个问题也被称为影响力最大化问题(influence maximization),它在诸多领域如推荐系统的开发、病毒式市场营销、寻找有影响力的twitter用户等方面有着明显的应用。Kempe等人首次给出了作为离散优化问题的影响最大化系统性的研究。他们从社交网络分析,交互式粒子系统和市场营销的早期工作中提取出了两个非常经典的基础模型:线性阈值模型(Linear Threshold,LT)和独立级联模型(Independent Cascade,IC)。此后许多研究者基于这两中模型进行了不断的改进,各种不同的算法也被提了出来。
目前有关信息传播的经典模型主要包括传染病模型、线性阈值模型、独立级联模型、分类或回归模型及基于他们的各种改进模型等,但目前已有方法都是基于IC模型设计的,并不能很好的适用LT模型。且对种子节点的选取主要是从如何去选的角度出发,对于选取好的的种子节点其实并未进行处理。但是,通过某种算法选取的种子节点可能会存在这种可能:种子节点有聚集的现象,即种子节点之间不是较均匀分布在网络中,它们中一部分存在相连的边使得它们聚集在一起。
附图说明
图1为G1拓扑结构。
图2为Ga的拓扑结构。
图3为第一轮传播结束后各节点的状态。
图4为第二轮传播结束后各节点的状态。
发明内容
为了解决现有技术存在的这些问题,本发明提出了一种适用于面向文件共享的移动社交网络的信息传播预测方法,包括以下步骤:
(1)信息收集:从社交网络中收集数据,分布式存储到由若干台服务器;
(2)信息预处理:从本地读取数据,从每条数据中抽取发消息用户和收消息用户;根据从所有数据中抽取出来的发消息用户和收消息用户,构建社交网络图Ga;其中,所有不重复的发消息用户和收消息用户在图中以顶点存在,每对发消息用户和收消息用户在图中以边的形式存在;
(3)种子节点选择:
步骤1:读取社交网络图Ga存储在服务器的节点信息和边信息,结合图信息,根据factordegree(i)=degreeout(i)/(degreeout(i)+degreein(i)),为每个节点计算度因子,其中factordegree为度因子,vi为节点;
步骤2:计算每个节点的Pagerank值,该值可通过PageRank算法获得;
步骤3:根据Factorseed(i)=factordegree(i)*rank(factordegree(i))计算每个节点的种子因子,其中Factorsee为种子因子,rank(factordegree(i))表示vi的度因子在所有节点度因子的重要程度;
步骤4:对所有节点的种子因子进行降序排列,选择排名前n的节点作为种子节点
(4)非激活节点剔除:vi邻居节点对vi的影响力记作inf(i),vi的活跃性记作act(i),vi和vj之间的紧密性记作close(i,j),且inf(i)=∑j∈N(i)(act(i)*close(i,j)),
步骤1:每台服务器对于存储在本地的节点,计算该节点参与信息传播的频率,将此频率作为该节点的活跃性;
步骤2:每台服务器对于存储在本地的边,计算每条边相关联的2个节点所代表的2个用户之间的紧密性;
步骤3:每台服务器计算存储在本地节点的影响力inf。
步骤4:每台服务器检查存储在本地的各个节点的影响力,如果影响力的值小于预定义值-θ,将该节点以及该节点对应的边从社交网络图Ga中剔除。
(5)文件传播规模预测:记(4)中剔除了相应节点后的图为Ga且Ga=(Va,Ea),记种子节点存储在seeds中,文件传播规模预测的具体步骤如下:
步骤1.令newNodes
Figure BDA0001796576170000021
i←0,设置ξ的值;
步骤2.将种子节点存入curNodes;
步骤3.将种子节点加入activeNodes;
步骤4.由主服务器检查条件(|newNodes|/|va|>ξ)是否满足。如果满足,执行步骤6;否则执行步骤5;
步骤5.主服务器检查条件(newNodes==Φ)是否满足。如果满足且i=0,执行步骤6;否则,执行步骤10;
步骤6.将curNodes中的节点分发给从服务器,之后将curNodes清空;
步骤7.每个从服务器对收到的节点做如下计算:
步骤7-1.一次从收到的节点中选择一个节点;
步骤7-2.计算选出的这个节点的邻居节点;
步骤7-3.剔除邻居节点中处于非激活状态的节点;
步骤7-4.根据式(3)计算当前节点的影响力;
步骤7-5.如果当前节点的影响力大于预定义的阈值θ,将当前节点标记为激活状态,加入newNodes-slave;
步骤8.每个从服务器将newNode发给主服务器,之后置newNodes为Φ;
步骤9.主服务器收到每个节点发送的newNodes,将newNodes中的节点加入curNodes和activeNodes;令i=i+1,执行步骤4。
步骤10.计算activeNodes中节点数,将其作为文件的传播规模。
进一步地,在(3)种子节点选择中,具体包括以下步骤:
步骤1:读取社交网络图Ga存储在服务器的节点信息和边信息,结合图信息,根据factordegree(i)=degreeout(i)/(degreeout(i)+degreein(i)),为每个节点计算度因子,其中factordegree为度因子,vi为节点;
步骤2:计算每个节点的Pagerank值,该值可通过PageRank算法获得;
步骤3:根据Factorseed(i)=factordegree(i)*rank(factordegree(i))计算每个节点的种子因子,其中Factorsee为种子因子,rank(factordegree(i))表示vi的度因子在所有节点度因子的重要程度;
步骤4:对所有节点的种子因子进行降序排列,选择排名前n的节点作为种子节点。
进一步地,在(4)非激活节点剔除中,具体包括以下步骤:
vi邻居节点对vi的影响力记作inf(i),vi的活跃性记作act(i),vi和vj之间的紧密性记作close(i,j),且inf(i)=∑j∈N(i)(act(i)*close(i,j)),
步骤1:每台服务器对于存储在本地的节点,计算该节点参与信息传播的频率,将此频率作为该节点的活跃性;
步骤2:每台服务器对于存储在本地的边,计算每条边相关联的2个节点所代表的2个用户之间的紧密性;
步骤3:每台服务器计算存储在本地的节点的影响力inf。
步骤4:每台服务器检查存储在本地的各个节点的影响力,如果影响力的值小于预定义值-θ,将该节点以及该节点对应的边从社交网络图Ga中剔除。
进一步地,在(5)文件传播规模预测中,具体包括以下步骤:
记(4)中剔除了相应节点后的图为Ga且Ga=(Va,Ea),记种子节点存储在seeds中,文件传播规模预测的具体步骤如下:
步骤1.令newNodes
Figure BDA0001796576170000031
i←0,设置ξ的值;
步骤2.将种子节点存入curNodes;
步骤3.将种子节点加入activeNodes;
步骤4.由主服务器检查条件(|newNodes|/|va|>ξ)是否满足。如果满足,执行步骤6;否则执行步骤5;
步骤5.主服务器检查条件(newNodes==Φ)是否满足。如果满足且i=0,执行步骤6;否则,执行步骤10;
步骤6.将curNodes中的节点分发给从服务器,之后将curNodes清空;
步骤7.每个从服务器对收到的节点做如下计算:
步骤7-1.一次从收到的节点中选择一个节点;
步骤7-2.计算选出的这个节点的邻居节点;
步骤7-3.剔除邻居节点中处于非激活状态的节点;
步骤7-4.根据式(3)计算当前节点的影响力;
步骤7-5.如果当前节点的影响力大于预定义的阈值θ,将当前节点标记
为激活状态,加入newNodes;
步骤8.每个从服务器将newNode发给主服务器,之后置newNodes为Φ;
步骤9.主服务器收到每个节点发送的newNodes,将newNodes中的节点加入curNodes和activeNodes,令i=i+1,返回步骤4;
步骤10.计算activeNodes中节点数,将其作为文件的传播规模。
本发明给出了如何有效确定种子节点的方法,使得种子节点的选取更加合理、有效;同时给出了一种简化网络结构的方法,在不影响整体传播的基础之上,剔除那些对信息传播没有影响的节点,提高传播的效率。并通过该模型构建节点影响力计算和经典节点权威值计算的桥梁,进而研究了大规模社交网络上的信息传播最大化策略,为大规模社交网络中的信息传播预测和计算提供了一种高效解决方法。
具体实施方式
文件的传播规模决定文件是否会成为流行文件。本发明在线性阈值模型的基础上提出了一种文件传播规模预测方法。本发明与其它基于线性阈值模型的方法有以下不同:1,引入了种子因子,根据种子因子大小决定一个节点能否成为种子节点;2,引入了节点过滤机制,将传播过程中不会被激活的节点从后续的预测过程中剔除,以此提高预测效率;3,对选出的种子节点做进一步处理,将其中有互相连接的种子节点只取其一,避免了网络中种子节点选取出现聚集现象。
(1)信息收集
从社交网络中收集数据,分布式存储到由若干台服务器。这些服务器中,只有一台是主服务器,其它的为从服务器。
(2)信息预处理
分别从从服务器在主服务器的控制下从本地读取数据,从每条数据中抽取出发消息用户和收消息用户;根据从所有数据中抽取出来的发消息用户和收消息用户,构建社交网络图。其中,所有不重复的发消息用户和收消息用户在图中以顶点存在,每对发消息用户和收消息用户在图中以边的形式存在。生成的社交网络图分布式存储在前述的多台从服务器上。
(3)种子节点选择
在线性阈值模型中,选择合适的节点作为种子开始文件传播至关重要。选择精良的种子不仅能扩大文件的传播规模,而且可以加速文件的传播过程。为便于描述种子节点的选择过程,本发明引入了度因子和种子因子的概念。
定义1度因子描述节点的度属性对种子选择的影响。度因子记作factordegree。以节点vi为例,vi的度因子记作factordegree(vi),由下式计算:
factordegree(i)=degreeout(i)/(degreeout(i)+degreein(i)) (1)
定义2种子因子描述一个节点适合作为种子的程度,记作factorseed。以节点vi为例,其种子因子记为factorseed(i),由下式计算:
Factorseed(i)=factordegree(i)*rank(factordegree(i)) (2)
在(2)式中,rank(factordegree(i))表示vi的度因子在所有节点度因子的重要程度。本发明将所有节点度因子的Pagerank值作为该节点的rank值。
基于以上两个定义,本发明通过如下五步选择种子节点:
步骤1:每台从服务器在主服务器的控制下读取社交网络图存储在该服务器的节点信息和边信息,结合在从服务器上存储的图信息,根据式(1),为每个节点计算度因子
步骤2:在步骤1的基础上,在主服务器的控制下各个从服务器共同计算每个节点的PageRank值,该值可通过PageRank算法获得。
步骤3:根据步骤(1)和步骤(2)的结果,在主服务器的控制下所有从服务器同时按照式(2)计算每个节点的种子因子
步骤4:在主服务器的控制下所有从服务器对所有节点的种子因子进行降序排列,选择排名前n的节点作为种子节点
(4)非激活节点剔除
在线性阈值模型中,如果来自邻居节点的影响力超过了预先定义的阈值,该节点就会变为激活状态。此处,将影响力记作Inf.具体来讲,来自vi的邻居节点的影响力记作inf(i)。为了计算影响力,本发明引入了活跃性和紧密性两个概念。
定义3活跃性描述节点参与文件传播的热情,记作act。vi的活跃性记作act(i),其值由参与信息传播的频率决定,即vi参与文件传播的天数与本月总天数之比值,Act(i)=x/d。举例:若vi在3月份有5天都向好友传播了文件,则act(i)=5/31。
定义4紧密性描述节点间联系的紧密程度,记作close。close(i,j)表示vi和vj之间的紧密性,其值由vi向vj共享文件的频繁程度决定。如果vi在3月份共发起50次文件共享活动,其中向vj发起了20次文件共享活动,则close(i,j)=20/50。如果vj在该月只发起了5次文件共享活动,且都是向vi发起的,则close(j,i)=5/5。
在活跃性和紧密性的基础上,入边邻居节点对vi的影响力inf(i)可由式(3)定义。N(i)表示由指向vi的邻居节点构成的集合。
Inf(i)=∑j∈N(i)(act(i)*close(i,j)) (3)
在线性阈值模型中,如果来自邻居节点的影响力没有达到预定义的阈值,那么该节点将不会变为激活状态。本发明认为,所有不可能变为激活状态的节点将不会参与文件的传播。为了提高效率,本发明将所有不会变为激活状态的节点从社交网络图中剔除。但这并不意味着图中保留的各个节点都会变为激活状态。这些节点仍然有可能处于非激活状态。
具体步骤如下:
步骤1.每台服务器对于存储在本地的节点,计算该节点参与信息传播的频率,将此频率作为该节点的活跃性。在计算过程中,本地服务器根据需要从其它相关联服务器上请求获取节点信息;同时,如果收到从本服务器获取节点信息的请求,应该向提出请求的服务器传送所需的数据。
步骤2.每台服务器对于存储在本地的边,计算每条边相关联的2个节点所代表的2个用户之间的紧密性。此紧密性由此2个用户之间信息共享的频率决定。在计算过程中,本地服务器根据需要从其它相关联服务器上请求获取边信息;同时,如果收到从本服务器获取边信息的请求,应该向提出请求的服务器传送所需的数据。
步骤3.每台服务器根据式(3)计算存储在本地的节点的影响力。
步骤4.每台服务器检查存储在本地的各个节点的影响力,如果影响力的值小于预定义的值-θ,将该节点以及该节点对应的边从社交网络图中剔除。
(5)文件传播规模预测
以(4)中剔除了部分节点之后的社交网络图Ga为基础,以(3)中选择出来的种子节点为基础进行文件传播规模预测。记(4)中剔除了相应节点后的图为Ga且Ga=(Va,Ea),记种子节点存储在seeds中,文件传播规模预测的具体步骤如下:
步骤1.令newNodes
Figure BDA0001796576170000051
i←0,设置ξ的值;
步骤2.将种子节点存入curNodes;
步骤3.将种子节点加入activeNodes;
步骤4.由主服务器检查条件(|newNodes|/|va|>ξ)是否满足。如果满足,执行步骤6;否则执行步骤5;
步骤5.主服务器检查条件(newNodes==Φ)是否满足。如果满足且i=0,执行步骤6;否则,执行步骤10;
步骤6.将curNodes中的节点分发给从服务器,之后将curNodes清空;
步骤7.每个从服务器对收到的节点做如下计算:
步骤7-1.一次从收到的节点中选择一个节点
步骤7-2.计算选出的这个节点的邻居节点
步骤7-3.剔除邻居节点中处于非激活状态的节点
步骤7-4.根据式(3)计算当前节点的影响力
步骤7-5.如果当前节点的影响力大于预定义的阈值θ,将当前节点标记为激活状态,加入newNodes;
步骤8.每个从服务器将newNode发给主服务器,之后置newNodes为Φ;
步骤9.主服务器汇总每个节点发送的newNodes,将newNodes中的节点加入curNodes和activeNodes,令i=i+,回到步骤4;
步骤10.计算activeNodes中节点数,将其作为文件的传播规模。
以图1所示包含11个节点的网络为例,说明信息传播规模的预测过程。此处,用有向图G1表示该网络。G1=(V1,E1),V1是顶点集合且V1={v1,v2,v3,v4,v5,v6,v7,v8,v9,v10},E1是边集合且E1={(v1,v2),(v2,v3),(v3,v4),(v5,v2),(v5,v8),(v5,v9),(v6,v1),(v6,v5),(v7,v6),(v8,v7),(v10,v7)}
第一步计算各节点的活跃度。
节点活跃度描述节点参与文件传播的热情。以vi为例,vi的活跃度记作act(i),其值为vi参与文件传播的天数与本月总天数的比值。此处,假设各节点在3月份参与文件共享活动的天数并以此为基础计算各节点的活跃度,结果如表1所示。
表1各节点活跃度
Figure BDA0001796576170000061
Figure BDA0001796576170000062
Figure BDA0001796576170000063
第二步计算各节点之间的紧密性。
假设各节点发起的共享文件的活动如矩阵A所示。在该矩阵中,ai,j表示节点i向节点j发起的文件共享活动数,
Figure BDA0001796576170000064
按照这种方式,计算各节点间的紧密性,计算结果如矩阵C所示。矩阵的第i行,第j列元素表示close(i,j)。
第三步计算各节点的影响力
根据式(3)计算各个节点的影响力。
第四步节点剔除
设节点的激活阈值θ为0.25。如果节点的影响力小于θ,则认为该节点在信息传播过程中不会被激活。为了提高预测效率,将该节点从网络中剔除,记剔除节点后的网络为Ga,其拓扑结构如图2所示。
第五步种子节点选取
(1)根据式(1)计算Ga各节点的度因子,结果如下:
Factordegree(1)=2/3
Factordegree(2)=0
Factordegree(5)=2/3
Factordegree(6)=2/3
Factordegree(7)=1/3
Factordegree(8)=1
(2)计算各个节点的PageRank值分别为(迭代15次,阻尼因子0.15):
rank(1)=0.437
rank(2)=0.521
rank(5)=0.437
rank(6)=0.677
rank(7)=0.620
rank(8)=0.336
(3)根据式(2)计算各节点的种子因子分别为:
Factorseed(1)=0.291
Factorseed(2)=0
Factorseed(5)=0.291
Factorseed(6)=0.451
Factorseed(7)=0.207
Factorseed(8)=0.336。
此处假设选取一个种子点,则取种子因子最大的作为种子节点,由上可知为节点6应作为种子节点。
第六步预测文件传播规模
(1)令newNodes
Figure BDA0001796576170000071
ξ←0.0002
(2)将v6节点存入curNodes;
(3)将v6节点加入activeNodes;
(4)主服务器在检查条件-(|newNodes|/|va|>ξ)。由于该条件不满足,应该执行(5);
(5)主服务器检查条件(newNodes==Φ)是否满足。由于该条件满足,执行步骤(6),开始第一轮传播。
(6)将curNodes中的节点分发给从服务器,之后将curNodes清空。此时,v6被分发给所有从服务器;
(7)收到v6的从服务器做如下计算:
a)一次从收到的节点中选择一个节点。由于只收到了v6,所以选择v6
b)计算此节点的出边邻居节点,选定为非激活状态的出边邻居。此时,v1和v5为选定节点。
c)对于每个选定的节点,根据式(3)计算其所有激活的入边邻居对它的影响力并求和;如果此影响力之和大于预定义的阈值θ,将当前节点标记为激活状态,加入newNodes-slave。对于v1,只有v6是激活状态的入边邻居,其的影响力为Inf(1)=0.52×0.5=0.26;同理,对于v5有,Inf(5)=0.52×0.5=0.26。由于Inf(1)和Inf(5)都大于激活阈值,故将v1,v5置为激活状态,加入newNodes。
(8)每个从服务器将newNodes发给主服务器,之后置newNodes为Φ;
(9)主服务器收到每个节点发送的newNodes进行汇总,即newNides={v1,v5},则将newNodes中的节点加入curNodes和activeNodes,第一轮传播结束。图3展示了第一轮传播结束后各节点的状态。
(10)检查(|newNodes|/|va|>ξ)是否满足。由于条件满足,开始第二轮传播。
(11)第二轮传播:
curNodes={v1,v5}。v1的出边邻居有v2和v7,v5的出边邻居有v2和v8,且这三个节点都是非激活节点。根据式(3)求得:Inf(2)=0.339,Inf(7)=0.087,Inf(8)=0.408,故v2和v8被激活,并作为newNodes发给主服务器。主服务器将newNodes中的节点加入curNodes和activeNodes,开始第三轮传播。图4展示了第二轮传播结束后各节点的状态。
(12)第三轮传播:
curNodes={v2,v8}。此时,只有v8有未激活节点-v7。根据式(3)计算v7的影响力,有Inf(7)=0.187。因此,本轮传播没有节点被激活,发送给主服务器的curNodes为空。结束传播。
第七步计算传播规模。
activeNodes中节点数,将其作为文件的传播规模。由于activeNodes={v1,v2,v5,v6,v8},传播规模为5。

Claims (1)

1.一种适用于面向文件共享的移动社交网络的信息传播预测方法,其特征在于,包括以下步骤:
(1)信息收集:从社交网络中收集数据,分布式存储到由若干台服务器;
(2)信息预处理:从本地读取数据,从每条数据中抽取发消息用户和收消息用户;根据从所有数据中抽取出来的发消息用户和收消息用户,构建社交网络图Ga;其中,所有不重复的发消息用户和收消息用户在图中以顶点存在,每对发消息用户和收消息用户在图中以边的形式存在;
(3)种子节点选择:
步骤1:读取社交网络图Ga存储在服务器的节点信息和边信息,结合图信息,根据factordegree(i)=degreeout(i)/(degreeout(i)+degreein(i)),为每个节点计算度因子,其中factordegree为度因子,vi为节点;
步骤2:计算每个节点的Pagerank值,该值可通过PageRank算法获得;
步骤3:根据Factorseed(i)=factordegree(i)*rank(factordegree(i))计算每个节点的种子因子,其中Factorseed为种子因子,rank(factordegree(i))表示vi的度因子在所有节点度因子的重要程度;
步骤4:对所有节点的种子因子进行降序排列,选择排名前n的节点作为种子节点;
(4)非激活节点剔除:vi邻居节点对vi的影响力记作inf(i),vi的活跃性记作act(i),vi和vj之间的紧密性记作close(i,j),且inf(i)=∑j∈N(i)(act(i)*close(i,j)),
步骤1:每台服务器对于存储在本地的节点,计算该节点参与信息传播的频率,将此频率作为该节点的活跃性;
步骤2:每台服务器对于存储在本地的边,计算每条边相关联的2个节点所代表的2个用户之间的紧密性;
步骤3:每台服务器计算存储在本地节点的影响力inf;
步骤4:每台服务器检查存储在本地的各个节点的影响力,如果影响力的值小于预定义值θ,将该节点以及该节点对应的边从社交网络图Ga中剔除;
(5)文件传播规模预测:记(4)中剔除了相应节点后的图为Ga且Ga=(Va,Ea),记种子节点存储在seeds中,文件传播规模预测的具体步骤如下:
步骤1.令
Figure FDA0003157355870000011
i←0,设置ξ的值;
步骤2.将种子节点存入curNodes;
步骤3.将种子节点加入activeNodes;
步骤4.由主服务器检查条件(|newNodes|/|Va|>ξ)是否满足;如果满足,执行步骤6;否则执行步骤5;
步骤5.主服务器检查条件(newNodes==Φ)是否满足;如果满足且i=0,执行步骤6;否则,执行步骤10;
步骤6.将curNodes中的节点分发给从服务器,之后将curNodes清空;
步骤7.每个从服务器对收到的节点做如下计算:
步骤7-1.一次从收到的节点中选择一个节点;
步骤7-2.计算选出的这个节点的邻居节点;
步骤7-3.剔除邻居节点中处于非激活状态的节点;
步骤7-4.根据式(3)计算当前节点的影响力;
步骤7-5.如果当前节点的影响力大于预定义的阈值θ,将当前节点标记为激活状态,加入newNodes-slave;
步骤8.每个从服务器将newNodes发给主服务器,之后置newNodes为Φ;
步骤9.主服务器收到每个节点发送的newNodes,将newNodes中的节点加入curNodes和activeNodes;令i=i+1,执行步骤4;
步骤10.计算activeNodes中节点数,将其作为文件的传播规模。
CN201811059532.7A 2018-09-12 2018-09-12 一种适用于面向文件共享的移动社交网络的信息传播预测方法 Active CN109410078B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811059532.7A CN109410078B (zh) 2018-09-12 2018-09-12 一种适用于面向文件共享的移动社交网络的信息传播预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811059532.7A CN109410078B (zh) 2018-09-12 2018-09-12 一种适用于面向文件共享的移动社交网络的信息传播预测方法

Publications (2)

Publication Number Publication Date
CN109410078A CN109410078A (zh) 2019-03-01
CN109410078B true CN109410078B (zh) 2021-09-28

Family

ID=65464151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811059532.7A Active CN109410078B (zh) 2018-09-12 2018-09-12 一种适用于面向文件共享的移动社交网络的信息传播预测方法

Country Status (1)

Country Link
CN (1) CN109410078B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815197A (zh) * 2020-07-24 2020-10-23 上海风秩科技有限公司 影响力指标计算方法、装置、设备及存储介质
CN112990987B (zh) * 2021-05-11 2021-08-27 腾讯科技(深圳)有限公司 信息推广方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064917A (zh) * 2012-12-20 2013-04-24 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN104050245A (zh) * 2014-06-04 2014-09-17 江苏大学 一种基于活跃度的社交网络影响力最大化方法
CN104598605A (zh) * 2015-01-30 2015-05-06 福州大学 一种社交网络中的用户影响力评估方法
CN105162752A (zh) * 2015-06-17 2015-12-16 河南理工大学 一种网络威胁传播路径预测方法
CN107123055A (zh) * 2017-03-03 2017-09-01 华南理工大学 一种基于PageRank的社交大数据信息最大化方法
CN108182640A (zh) * 2017-12-29 2018-06-19 山东浪潮云服务信息科技有限公司 一种基于用户行为传播模型求解影响力最大化问题的方法
CN108491449A (zh) * 2018-02-25 2018-09-04 河南理工大学 一种基于近邻特征传播标签的社区发现方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180018709A1 (en) * 2016-05-31 2018-01-18 Ramot At Tel-Aviv University Ltd. Information spread in social networks through scheduling seeding methods

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064917A (zh) * 2012-12-20 2013-04-24 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN104050245A (zh) * 2014-06-04 2014-09-17 江苏大学 一种基于活跃度的社交网络影响力最大化方法
CN104598605A (zh) * 2015-01-30 2015-05-06 福州大学 一种社交网络中的用户影响力评估方法
CN105162752A (zh) * 2015-06-17 2015-12-16 河南理工大学 一种网络威胁传播路径预测方法
CN107123055A (zh) * 2017-03-03 2017-09-01 华南理工大学 一种基于PageRank的社交大数据信息最大化方法
CN108182640A (zh) * 2017-12-29 2018-06-19 山东浪潮云服务信息科技有限公司 一种基于用户行为传播模型求解影响力最大化问题的方法
CN108491449A (zh) * 2018-02-25 2018-09-04 河南理工大学 一种基于近邻特征传播标签的社区发现方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
A scheduling method based on task pushing in MapReduce;Zhang Xiaohong 等;《Journal of Central South University (Science and Technology)》;20160726;第47卷(第7期);第2334-40页 *
Device-to-Device移动社交网络多维度用户影响力分析方法;张霄宏 等;《小型微型计算机系统》;20180731;第39卷(第7期);第1441-1445页 *
Opinion formation driven by PageRank node influence on directed networks;Eom, Young-Ho 等;《PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS》;20151015;第436卷;第707-715页 *
The Importance of Seed Nodes in Spreading Information in Social Networks: A Case Study;Sarkar, Amitrajit 等;《2017 9TH INTERNATIONAL CONFERENCE ON COMMUNICATION SYSTEMS AND NETWORKS (COMSNETS)》;20171231;第395-396页 *
基于阈值的社会网络影响力最大化算法;陈浩;《中国优秀硕士学位论文全文数据库 信息科技辑》;中国学术期刊(光盘版)电子杂志社;20150315(第3期);第I139-226页 *
社交网络影响力最大化的多目标优化方法研究;李隆;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;中国学术期刊(光盘版)电子杂志社;20170215(第2期);第J152-2496页 *
社交网络舆情传播与控制研究;于淼;《中国博士学位论文全文数据库 信息科技辑》;中国学术期刊(光盘版)电子杂志社;20171215(第12期);第I141-7页 *

Also Published As

Publication number Publication date
CN109410078A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
Li et al. Getreal: Towards realistic selection of influence maximization strategies in competitive networks
Gill et al. Bio-inspired algorithms for big data analytics: a survey, taxonomy, and open challenges
CN109410078B (zh) 一种适用于面向文件共享的移动社交网络的信息传播预测方法
Fragkos et al. Artificial intelligent multi-access edge computing servers management
Swathy et al. Game theoretical approach for load balancing using SGMLB model in cloud environment
Mahabadi et al. SLPA-based parallel overlapping community detection approach in large complex social networks
CN102902674B (zh) 服务群组分类方法和系统
CN116933866A (zh) 针对数据异质性的个性化联邦学习方法、系统及存储介质
Babel et al. Strategic peer selection using transaction value and latency
CN110213209B (zh) 一种推送信息点击的作弊检测方法、装置及存储介质
CN111292062B (zh) 基于网络嵌入的众包垃圾工人检测方法、系统及存储介质
CN110867224B (zh) 用于大规模脑病历分割的多粒度Spark超信任模糊方法
Fan et al. The probabilistic maximum coverage problem in social networks
CN112837078A (zh) 一种基于集群的用户异常行为检测方法
Briceño et al. Robust resource allocation in a massive multiplayer online gaming environment
CN112866358B (zh) 一种物联网服务重调度的方法、系统及装置
Baalamurugan et al. Analysis of Cloud Storage Issues in Distributed Cloud Data Centres by Parameter Improved Particle Swarm Optimization (PIPSO) Algorithm
Li et al. A unified task recommendation strategy for realistic mobile crowdsourcing system
CN113836444B (zh) 一种线性时间好友推荐方法、系统、终端以及存储介质
Raamakirtinan et al. Identifying influential spreaders in complex networks based on weighted mixed degree decomposition method
Mehta Agglomerative clustering enhanced GA for optimal seed selection in online social networks
Dokeroglu et al. A self-adaptive and stagnation-aware breakout local search algorithm on the grid for the Steiner tree problem with revenue, budget and hop constraints
Thakare et al. Skiplpa: An efficient label propagation algorithm for community detection in sparse network
Fatima et al. MODM: multi-objective diffusion model for dynamic social networks using evolutionary algorithm
CN113138977A (zh) 交易转化分析方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant