CN103412872A - 一种基于有限节点驱动的微博社会网络信息推荐方法 - Google Patents

一种基于有限节点驱动的微博社会网络信息推荐方法 Download PDF

Info

Publication number
CN103412872A
CN103412872A CN2013102852143A CN201310285214A CN103412872A CN 103412872 A CN103412872 A CN 103412872A CN 2013102852143 A CN2013102852143 A CN 2013102852143A CN 201310285214 A CN201310285214 A CN 201310285214A CN 103412872 A CN103412872 A CN 103412872A
Authority
CN
China
Prior art keywords
node
topic
information
network
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102852143A
Other languages
English (en)
Other versions
CN103412872B (zh
Inventor
杜友田
苏畅
管晓宏
吴陈鹤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201310285214.3A priority Critical patent/CN103412872B/zh
Publication of CN103412872A publication Critical patent/CN103412872A/zh
Application granted granted Critical
Publication of CN103412872B publication Critical patent/CN103412872B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于有限节点驱动的微博社会网络信息推荐方法,可以求得近似最优的驱动节点集合,使得推荐信息通过这些驱动节点集合驱动后,能够在微博网络中传播能达到近似最大的广度。其中,本发明综合考虑用户间的连接结构、用户对话题的兴趣分布以及用户的转发行为来选择近似最优的驱动用户节点的集合,通过该驱动节点集合进行发布的推荐信息或话题的信息传播广度近似最大。

Description

一种基于有限节点驱动的微博社会网络信息推荐方法
技术领域
本发明属于在线社会网络技术领域,涉及一种基于有限节点驱动的微博社会网络信息推荐方法。
背景技术
近年来,微博、博客和论坛等新型网络应用服务的出现深刻改变了人们的信息交流方式,成为了人们获取、传播信息的重要平台。由此形成的在线社会网络(Online Social Networks,OSN)已经成为了当前研究的热点。微博是在线社会网络的典型代表之一,已成为一种重要的信息交流平台和公共话题传播平台。
在线社会网络研究主要涉及网络结构和用户行为分析、信息传播建模以及内容推荐等。目前,内容推荐研究侧重于通过分析用户关注的内容将符合用户兴趣的内容直接推荐至用户,在电子商务系统和视频分享网站等领域得到广泛应用。采用的技术主要是协同过滤,即通过对用户的显式输入或隐式输入的历史数据收集并统计,预测与此用户兴趣相似的用户,并将相似用户感兴趣的对象或信息推荐给此用户。
基于协同过滤的内容推荐研究主要考虑了内容的匹配程度。实际上,对于微博社会网络来说内容推荐还有另外一种类型:将内容推荐至多个用户节点,基于这些驱动节点及其粉丝的关注和转发来实现信息传播并将内容推荐至更多的用户。该问题的核心是:如何确定多个驱动用户节点,使得由这些节点联合驱动时话题的传播广度最大。信息传播受用户兴趣度、用户粉丝数、用户的转发行为等多种因素影响。以往研究表明,由于用户对话题存在不同喜好,同一节点对不同话题的传播能力有很大差异。此外,信息内容对相关用户的提及率也是影响该信息传播速度、规模以及范围的重要因素。
发明内容
本发明解决的问题在于提供一种基于有限节点驱动的微博社会网络信息推荐方法,使得推荐信息在微博网络中传播能达到近似最大的广度。
本发明是通过以下技术方案来实现:
一种基于有限节点驱动的微博社会网络信息推荐方法,包括以下操作:
1)在微博社会网络中,构建以用户节点为顶点,顶点之间的边包括关注边和转发边的双边双权值网络,其中关注边和转发边分别有各自的权重;
按照下式计算微博社会网络中节点的影响力IR,并选取C个影响力最大的节点构成候选节点集QC
IR ( q v ) = d N + ( 1 - d ) [ Σ q u ∈ B v , f t u , f w uv , f + Σ q u ∈ B v , r t u , r w uv , r ]
其中,d为跳变概率,N为网络中的用户节点数,Bv,f和Bv,r分别为节点qv关注和转发过的节点集;
t u , f = α · IR ( q u ) OD f ( q u ) , t u , r = ( 1 - α ) · IR ( q u ) OD r ( q u )
ODf(qu)表示从节点qu发出的关注边数目,ODr(qu)表示从节点qu发出的转发边数目,α表示调节两类边的重要程度;wuv,f为关注边权值,wuv,r为转发边权值,等于节点qu转发节点qv话题的概率;
wuv,f=Iv, w uv , r = M uv , r M v
Iv为节点qv对所推荐的信息或话题的兴趣度,Mv是节点qv的发帖总数,Muv,r是节点qv转发节点qu的帖子数量;
2)对于候选节点集QC中的单个节点q,q∈QC,建立由q作为单一驱动节点时的推荐话题转发网络,并基于该网络计算单个节点驱动时的推荐信息或话题传播广度的期望值;
3)计算候选节点集QC中个节点n个节点联合驱动下信息传播的广度的期望值,n<C,选取使得信息传播广度最大的n个用户节点,以所选择的n个用户节点作为驱动节点进行推荐信息或话题的传播。
所述的兴趣度Iv通过LDA算法计算用户节点qv历史发帖内容和推荐信息的相似度,以所计算的结果作为qv对推荐话题的兴趣度。
所述在步骤2)中,在构建推荐话题转发网络时以网络拓扑结构和用户转发行为基础进行构建,并用动态贝叶斯网络推理方法进行推理,从而计算以单个节点q为信息传播的驱动节点时,网络中的所有节点参与推荐信息或话题传播的概率,在所构建的网络中当某用户节点接收推荐信息或话题时,则该用户节点被激活并以概率p转发该信息或话题,通过计算网络中被激活用户的概率和数量来计算单个节点驱动时的信息传播广度的期望值。
所述在构建的推荐话题转发网络中,每个节点qi对应一个二值随机变量Xi,其中Xi=1表示转发,Xi=0表示不转发;用户的转发行为用条件概率Pr(Xi|F(Xi))表示,其中F(Xi)为推荐信息或话题被节点qi转发过的用户节点状态;获知各节点转发信息的条件概率后,推理出每个节点转发信息的概率Pr(Xi)。
所构建的推荐话题转发网络为动态贝叶斯网络,包括初始网B0和转移网B,变量集
Figure BDA00003479511400031
表示t时刻的随机变量集,
令初始网B0中的
Figure BDA00003479511400032
其它变量均为0;在t时刻
Figure BDA00003479511400033
上的联合概率分布Pr(Xt)为:
Pr ( X t ) = &Sigma; pa ( X i t ) Pr ( pa ( X i t ) ) &CenterDot; &Pi; i = 1 N Pr ( X i t | pa ( X i t ) )
其中,
Figure BDA00003479511400035
表示在动态贝叶斯网络中
Figure BDA00003479511400036
的父节点,随着t的增大,
Figure BDA00003479511400037
将收敛于Pr(Xi);选取预定义阈值δ,使得时停止计算;
Figure BDA00003479511400041
为节点转发推荐信息的条件概率Pr(Xi|pa(Xi)),在计算过程中不随t的变化而变化,则用户节点qi转发推荐话题的概率为
Pr ( X i t ) = &Sigma; X j t &NotEqual; X i t Pr ( X 1 t , X 2 t , . . . , X n t )
并对条件概率进行如下分解:
Pr ( X i t | pa ( X i t ) ) = &Sigma; X j t - 1 &Element; pa ( X i t ) &theta; i j &CenterDot; Pr ( X i t | X j t - 1 )
其中,
Figure BDA00003479511400044
为需要学习的参数,对于所有节点qi选取
Figure BDA00003479511400045
其中表示
Figure BDA00003479511400047
的个数,
Figure BDA00003479511400048
不受时间t影响,其中Xj∈F(Xi);而Pr(Xi|Xj)按下式进行计算:
Pr ( X i | X j ) = M ji , r M i
其中Mji,r为节点qi转发qj的帖子数,Mi为节点qi发表的帖子数。
所述在进行步骤3)的计算时,采用贪婪策略:先选择候选节点集QC中对推荐话题传播广度最大的节点,通过该节点与其它节点之间的连接强度,选出第二个节点,使得两者联合传播广度最大;以此类推,最终得到n个节点。
所述在进行步骤3)的计算时,n个节点联合驱动下信息传播的广度的期望值的计算为:
任意两个节点qu和qv之间的连接强度定义为:
w ( q u , q v ) = o uv k u - 1 + k v - 1 - o uv
其中,ku、kv为qu、qv的粉丝数目,ouv为qu、qv的公共粉丝数;而驱动节点集Q与单一驱动节点qv之间的连接强度为:
w ( Q , q v ) = 1 | Q | &Sigma; q u &Element; Q w ( q u , q v ) - - - ( 10 )
其中|Q|为Q包含的节点数;
当一个节点接收到推荐信息或话题时,认为其被激活,且其接收到推荐信息或话题的概率为激活概率;通过激活期望AE来度量单一节点qv的传播能力,即
E a ( q v ) = 1 N &Sigma; k = 1 N p k v
其中,
Figure BDA00003479511400052
为当qv为驱动节点时节点qk的激活概率;
则节点集Q的联合激活期望JAE为:
E a ( Q ) = &Sigma; k = 1 N p k Q / N ;
其中
Figure BDA00003479511400054
为给定点集Q时qk的激活概率;
多个节点联合驱动话题传播的能力与各单节点的驱动能力的连接强度呈线性关系:
Ea(Q)=Aw(Q′,qv)+BEa(qv)+b+ε    (12)
其中Q′为给定的驱动点集,Q={Q′,qv},A、B、b为待估参数,待估参数根据实际数据利用最小二乘算法进行估计,ε为随机噪声。
进一步,基于贪婪算法的策略,依次选择驱动节点,最终得到次优解:
a)初始化
Figure BDA00003479511400055
选择QC中驱动能力最大的节点qp∈QC放入QP,同时将它从候选节点集QC中删除,即QP←QP∪qp,QC←QC\qp
b)根据公式(10),计算点集QP与QC中各节点的连接强度,并选取使得公式(12)最大化的节点qp∈QC放入QP,即QP←QP∪qp,QC←QC\qp
重复步骤b),直到QP包含n个驱动节点。
与现有技术相比,本发明具有以下有益的技术效果:
本发明提供的基于有限节点驱动的微博社会网络信息推荐方法,可以求得近似最优的驱动节点集合,使得推荐信息通过这些驱动节点集合驱动后,能够在微博网络中传播能达到近似最大的广度。其中,本发明综合考虑用户间的连接结构、用户对话题的兴趣分布以及用户的转发行为来选择近似最优的驱动用户节点的集合,通过该驱动节点集合进行发布的推荐信息或话题的信息传播广度近似最大。
进一步,本发明除了综合考虑了微博社会网络中用户的连接关系、用户转发行为和对话题的兴趣度等要素,设计合适的网络数学模型之外,还提出了改进的PageRank算法,并基于改进的PageRank算法并结合动态贝叶斯网络推理计算,准确地度量信息传播广度,在此基础上选取信息传播能力最强的驱动节点集合。
附图说明
图1为双边双权值网络的示意图;
图2为信息转发网络的示意图;
图3为动态贝叶斯网络的示意图;其中1~7均为用户节点;
图4为联合激活期望的示意图;其中x坐标为连接强度,y坐标为单节点驱动的激活期望值;z坐标为多节点联合驱动的激活期望值。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
本发明提供的基于有限节点驱动的微博社会网络信息推荐方法,可以求得近似最优的驱动节点集合,使得推荐信息在微博网络中传播能达到近似最大的广度。该方法综合考虑了微博社会网络中用户的连接关系、用户转发行为和对话题的兴趣度等要素,设计了合适的网络数学模型,并提出了改进的PageRank算法,进一步结合动态贝叶斯网络推理计算,准确地度量信息传播广度,在此基础上选取信息传播能力最强的驱动节点集合。
一种基于有限节点驱动的微博社会网络信息推荐方法,包括以下操作:
1)首先计算所有节点的影响力,选取C个影响力最大的节点构成候选节点集QC
2)其次,候选节点集QC的节点影响力粗略地反映该节点对话题的传播能力,但是还不够精确。因此,构建信息转发网络,准确计算以QC中的单个节点为信息传播的驱动节点时,网络中的所有节点参与推荐信息传播的概率,并基于得到的概率来计算单个节点驱动时的信息传播广度的期望值。
3)最后,计算n(n<C)个节点联合驱动下信息传播的广度的期望值,选取使得信息传播广度最大的n个驱动节点作为近似最优的信息推荐节点。
下面对各个步骤进行详细的说明。
步骤1,基于修正PageRank的节点影响力计算
在微博社会网络中,构建以用户节点为顶点,顶点之间的边包括关注边和转发边的双边双权值网络,其中关注边和转发边分别有各自的权重;计算微博社会网络中节点的影响力,并选取C个影响力最大的节点构成候选节点集QC
PageRank算法是用于计算网页权威度的方法,该算法也常用于计算在线社会网络中节点的权威度。因为微博社会网络中,节点发布的话题主要依靠其朋友的关注和转发进行传播,具有类似于网页连接的特点:被大量节点或高影响力节点进行关注(或话题转发)的用户节点具有较高的影响力。
但PageRank算法只考虑了网络结构,而没有考虑用户节点的转发行为以及对话题的兴趣分布。本发明提出一种修正的PageRank算法(本发明称为InfluentialRank,简称IR算法)并用于节点影响力的计算。在话题的传播中,节点影响力与话题兴趣度、粉丝数量及粉丝对话题的转发概率等多个要素相关。
图1是基于这些要素构建的双边双权值网络,其中顶点为用户,边包括关注关系(follow)与转发关系(retweet),两种边都有各自的权重,分别对应于兴趣度和转发率。
在图1所示的双边双权值网络中,qu,qv,qm和qn为用户节点;从qu指向qv的实线边表示qv是qu的粉丝;从qu指向qv的虚线边表示qv转发过qu的帖子。qv的影响力IR(qv)与其粉丝的关注边和转发边都有关系,其粉丝的关注边和转发边都会从自身节点上分配到一定比例的影响力,并传递给qv
令每条关注边分配到的影响力tu,f相同,每条转发边分配到的影响力tu,r相同,即:
t u , f = &alpha; &CenterDot; IR ( q u ) OD f ( q u ) , t u , r = ( 1 - &alpha; ) &CenterDot; IR ( q u ) OD r ( q u ) - - - ( 1 )
其中,ODf(qu)表示从qu发出的关注边数目,ODr(qu)表示从qu发出的转发边数目,α用来调节两类边的重要程度;
关注边权值wuv,f,用qv对推荐话题的兴趣度Iv来度量;
转发边权值wuv,r,其值等于qu转发qv话题的概率,即:
wuv,f=Iv, w uv , r = M uv , r M v - - - ( 2 )
其中Mv是节点qv的发帖总数,Muv,r是节点qv转发qu的帖子数量。节点对话题的兴趣度Iv采用LDA(Latent Dirichlet Allocation)算法计算。通过LDA计算用户历史发帖内容和推荐信息的相似度,可作为用户对话题的兴趣度。
在图1的网络构建基础上,InfluentialRank算法用下式表示:
IR ( q v ) = d N + ( 1 - d ) [ &Sigma; q u &Element; B v , f t u , f w uv , f + &Sigma; q u &Element; B v , r t u , r w uv , r ] - - - ( 3 )
其中,跳变概率d取经验值0.15,N为网络中的用户节点数,Bv,f和Bv,r分别为节点qv关注和转发过的节点集。
最后,根据式(3)选取C个影响力最大的节点构成QC
步骤2,对于候选节点集QC中的单个节点q,q∈QC,建立由q作为单一驱动节点时的推荐话题转发网络,并基于该网络计算单个节点驱动时的推荐信息或话题传播广度的期望值;
对于步骤1求得的用户节点q∈QC,建立由q作为单一驱动节点时的话题转发网络,并基于该网络计算话题传播广度。在构建推荐话题转发网络时以网络拓扑结构和用户转发行为基础进行构建,并用动态贝叶斯网络推理方法进行推理,从而计算以单个节点q为信息传播的驱动节点时,网络中的所有节点参与推荐信息或话题传播的概率,在所构建的网络中当某用户节点接收(即关注)推荐信息或话题时,则该用户节点被激活并以概率p(p可能为0)转发该信息或话题,通过计算网络中被激活用户的概率和数量来计算单个节点驱动时的信息传播广度的期望值。
图2是基于转发关系构建的网络,为了使该图清晰,关注关系被省略掉。在该网络中,每个节点qi对应一个二值随机变量Xi,其中Xi=1表示转发,Xi=0表示不转发。于是用户的转发行为可以用条件概率Pr(Xi|F(Xi))表示,其中F(Xi)为帖子被节点qi转发过的用户节点状态。该转发网络是一个有向有环概率图(Directed Cyclic Graph,简称DCG)。若已知各节点转发信息的条件概率,则可以推理出每个节点转发信息的概率Pr(Xi)。
有向有环概率图的推理较为复杂,不能直接采用贝叶斯网络推理的算法进行计算,通常采用迭代的近似算法进行计算。本发明将该概率图转化为动态贝叶斯网络(DBN),每一次迭代计算对应到DBN的一个时间片,如图3所示。
动态贝叶斯网络包括初始网B0和转移网B,变量集
Figure BDA00003479511400091
表示t时刻的随机变量集。此步骤计算在单一用户节点驱动下的话题传播情况,故可令初始网B0中的
Figure BDA00003479511400101
其它变量均为0。在t时刻上的联合概率分布Pr(Xt)为:
Pr ( X t ) = &Sigma; pa ( X i t ) Pr ( pa ( X i t ) ) &CenterDot; &Pi; i = 1 N Pr ( X i t | pa ( X i t ) ) - - - ( 4 )
其中,
Figure BDA00003479511400104
表示在动态贝叶斯网络中
Figure BDA00003479511400105
的父节点,即图2中节点qi对其帖子进行过转发行为的用户节点。随着t的增大,
Figure BDA00003479511400106
将收敛于Pr(Xi)。这里选取预定义阈值δ,使得时停止计算。
Figure BDA00003479511400108
即为节点转发信息的条件概率Pr(Xi|pa(Xi)),在计算过程中不随t的变化而变化。用户节点qi转发话题的概率为
Pr ( X i t ) = &Sigma; X j t &NotEqual; X i t Pr ( X 1 t , X 2 t , . . . , X n t ) - - - ( 5 )
实际上,由于节点数目较大,直接根据式(4)和(5)计算难以进行。式(4)中,条件概率表
Figure BDA000034795114001010
随着
Figure BDA000034795114001011
数目的增多呈指数增加,致使计算复杂度很高。因此对条件概率进行如下分解:
Pr ( X i t | pa ( X i t ) ) = &Sigma; X j t - 1 &Element; pa ( X i t ) &theta; i j &CenterDot; Pr ( X i t | X j t - 1 ) - - - ( 6 )
其中,为需要学习的参数。简化计算,对于所有节点qi选取
Figure BDA000034795114001014
其中
Figure BDA000034795114001015
表示
Figure BDA000034795114001016
的个数。不受时间t影响,即等于Pr(Xi|Xj),其中Xj∈F(Xi)。由(6)可知,只需知道qi转发qj话题的概率Pr(Xi|Xj)即可。该概率可按下式进行计算:
Pr ( X i | X j ) = M ji , r M i - - - ( 7 )
其中Mji,r为节点qi转发qj的帖子数,Mi为节点qi发表的帖子数,一旦节点qi转发了目标帖,则认为其粉丝均接收到了该帖子信息。也就是说,qi的粉丝qk接收到该信息的概率为Pr(Xi=1)。若qk为已经接收到推荐信息的节点集QF中节点的公共粉丝,则其接收到该信息的概率可近似为:
p k = max i : q i &Element; Q F { Pr ( X i = 1 ) } - - - ( 8 )
步骤3:计算候选节点集QC中个节点n个节点联合驱动下信息传播的广度的期望值,n<C,选取使得信息传播广度最大的n个用户节点,以所选择的n个用户节点作为驱动节点进行推荐信息或话题的传播,使推荐信息或话题传播广度最大化。
优选的该环节采用贪婪策略:先选择传播广度最大的节点,通过该节点与其它节点之间的连接强度,选出第二个节点,使得两者联合传播广度最大;以此类推,最终得到c个节点。由于采用贪婪策略,故得到的节点可能不是全局最优解,但计算效率高,且大多情况下完全满足需要。
具体的,由于各个驱动节点引起的信息传播范围可能有交叠,所以多个节点联合驱动时话题的传播广度通常不等于多个单节点驱动时的传播广度之和。研究表明,多个节点联合驱动话题传播的能力与各单节点的驱动能力以及它们之间的连接强度近似呈线性关系。这里,任意两个节点qu和qv之间的连接强度定义为:
w ( q u , q v ) = o uv k u - 1 + k v - 1 - o uv - - - ( 9 )
其中,ku、kv为qu、qv的出度(即粉丝数目),ouv为qu、qv的公共粉丝数。进一步,扩展定义一个驱动节点集Q与单一驱动节点qv之间的连接强度为:
w ( Q , q v ) = 1 | Q | &Sigma; q u &Element; Q w ( q u , q v ) - - - ( 10 )
其中|Q|为Q包含的节点数。
当一个节点接收到目标主题时,认为其被激活,且其接收到目标主题的概率为激活概率。为此引入激活期望(activation expectation,AE)来度量单一节点qv的传播能力,即
E a ( q v ) = 1 N &Sigma; k = 1 N p k v - - - ( 11 )
其中,
Figure BDA00003479511400122
为当qv为驱动节点时,节点qk的激活概率,由式(8)计算得到。
相似地,可以得到节点集Q的联合激活期望(joint activationexpectation,JAE):
Figure BDA00003479511400123
其中
Figure BDA00003479511400124
为给定点集Q时,qk的激活概率。
如图4所示,多个节点联合驱动话题传播的能力与各单节点的驱动能力以及它们之间的连接强度呈线性关系,具体可以表示为:
Ea(Q)=Aw(Q′,qv)+BEa(qv)+b+ε    (12)
其中Q′为给定的驱动点集,Q={Q′,qv},A、B、b为待估参数,待估参数根据实际数据利用最小二乘算法进行估计,ε为随机噪声。
为了提高计算效率,本发明基于贪婪算法的策略,依次选择驱动节点,最终得到次优解:
1)初始化
Figure BDA00003479511400125
选择QC中驱动能力最大的节点qp∈QC放入QP,同时将它从候选节点集QC中删除,即QP←QP∪qp,QC←QC\qp
2)根据公式(10),计算点集QP与QC中各节点的连接强度,并选取使得公式(12)最大化的节点qp∈QC放入QP,即QP←QP∪qp,QC←QC\qp
重复第2)步,直到QP包含n个驱动节点。
从而以所选择的n个用户节点作为驱动节点进行推荐信息或话题的传播,使得推荐信息或话题在微博网络中传播能达到近似最大的广度。

Claims (8)

1.一种基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,包括以下操作:
1)在微博社会网络中,构建以用户节点为顶点,顶点之间的边包括关注边和转发边的双边双权值网络,其中关注边和转发边分别有各自的权重;
按照下式计算微博社会网络中节点的影响力IR,并选取C个影响力最大的节点构成候选节点集QC
IR ( q v ) = d N + ( 1 - d ) [ &Sigma; q u &Element; B v , f t u , f w uv , f + &Sigma; q u &Element; B v , r t u , r w uv , r ]
其中,d为跳变概率,N为网络中的用户节点数,Bv,f和Bv,r分别为节点qv关注和转发过的节点集;
t u , f = &alpha; &CenterDot; IR ( q u ) OD f ( q u ) , t u , r = ( 1 - &alpha; ) &CenterDot; IR ( q u ) OD r ( q u )
ODf(qu)表示从节点qu发出的关注边数目,ODr(qu)表示从节点qu发出的转发边数目,α表示调节两类边的重要程度;wuv,f为关注边权值,wuv,r为转发边权值,等于节点qu转发节点qv话题的概率;
wuv,f=Iv, w uv , r = M uv , r M v
Iv为节点qv对所推荐的信息或话题的兴趣度,Mv是节点qv的发帖总数,Muv,r是节点qv转发节点qu的帖子数量;
2)对于候选节点集QC中的单个节点q,q∈QC,建立由q作为单一驱动节点时的推荐话题转发网络,并基于该网络计算单个节点驱动时的推荐信息或话题传播广度的期望值;
3)计算候选节点集QC中个节点n个节点联合驱动下信息传播的广度的期望值,n<C,选取使得信息传播广度最大的n个用户节点,以所选择的n个用户节点作为驱动节点进行推荐信息或话题的传播。
2.如权利要求1所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,所述的兴趣度Iv通过LDA算法计算用户节点qv历史发帖内容和推荐信息的相似度,以所计算的结果作为qv对推荐话题的兴趣度。
3.如权利要求1所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,在步骤2)中,在构建推荐话题转发网络时以网络拓扑结构和用户转发行为基础进行构建,并用动态贝叶斯网络推理方法进行推理,从而计算以单个节点q为信息传播的驱动节点时,网络中的所有节点参与推荐信息或话题传播的概率,在所构建的网络中当某用户节点接收推荐信息或话题时,则该用户节点被激活并以概率p转发该信息或话题,通过计算网络中被激活用户的概率和数量来计算单个节点驱动时的信息传播广度的期望值。
4.如权利要求3所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,在构建的推荐话题转发网络中,每个节点qi对应一个二值随机变量Xi,其中Xi=1表示转发,Xi=0表示不转发;用户的转发行为用条件概率Pr(Xi|F(Xi))表示,其中F(Xi)为推荐信息或话题被节点qi转发过的用户节点状态;获知各节点转发信息的条件概率后,推理出每个节点转发信息的概率Pr(Xi)。
5.如权利要求4所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,所构建的推荐话题转发网络为动态贝叶斯网络,包括初始网B0和转移网B,变量集表示t时刻的随机变量集,
令初始网B0中的其它变量均为0;在t时刻上的联合概率分布Pr(Xt)为:
Pr ( X t ) = &Sigma; pa ( X i t ) Pr ( pa ( X i t ) ) &CenterDot; &Pi; i = 1 N Pr ( X i t | pa ( X i t ) )
其中,表示在动态贝叶斯网络中
Figure FDA00003479511300032
的父节点,随着t的增大,
Figure FDA00003479511300033
将收敛于Pr(Xi);选取预定义阈值δ,使得
Figure FDA00003479511300034
时停止计算;
为节点转发推荐信息的条件概率Pr(Xi|pa(Xi)),在计算过程中不随t的变化而变化,则用户节点qi转发推荐话题的概率为
Pr ( X i t ) = &Sigma; X j t &NotEqual; X i t Pr ( X 1 t , X 2 t , . . . , X n t )
并对条件概率进行如下分解:
Pr ( X i t | pa ( X i t ) ) = &Sigma; X j t - 1 &Element; pa ( X i t ) &theta; i j &CenterDot; Pr ( X i t | X j t - 1 )
其中,
Figure FDA00003479511300038
为需要学习的参数,对于所有节点qi选取
Figure FDA00003479511300039
其中
Figure FDA000034795113000310
表示
Figure FDA000034795113000311
的个数,
Figure FDA000034795113000312
不受时间t影响,其中Xj∈F(Xi);而Pr(Xi|Xj)按下式进行计算:
Pr ( X i | X j ) = M ji , r M i
其中Mji,r为节点qi转发qj的帖子数,Mi为节点qi发表的帖子数。
6.如权利要求1所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,在进行步骤3)的计算时,采用贪婪策略:先选择候选节点集QC中对推荐话题传播广度最大的节点,通过该节点与其它节点之间的连接强度,选出第二个节点,使得两者联合传播广度最大;以此类推,最终得到n个节点。
7.如权利要求1所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,在进行步骤3)的计算时,n个节点联合驱动下信息传播的广度的期望值的计算为:
任意两个节点qu和qv之间的连接强度定义为:
w ( q u , q v ) = o uv k u - 1 + k v - 1 - o uv
其中,ku、kv为qu、qv的粉丝数目,ouv为qu、qv的公共粉丝数;而驱动节点集Q与单一驱动节点qv之间的连接强度为:
w ( Q , q v ) = 1 | Q | &Sigma; q u &Element; Q w ( q u , q v ) - - - ( 10 )
其中|Q|为Q包含的节点数;
当一个节点接收到推荐信息或话题时,认为其被激活,且其接收到推荐信息或话题的概率为激活概率;通过激活期望AE来度量单一节点qv的传播能力,即
E a ( q v ) = 1 N &Sigma; k = 1 N p k v
其中,
Figure FDA00003479511300043
为当qv为驱动节点时节点qk的激活概率;
则节点集Q的联合激活期望JAE为:
E a ( Q ) = &Sigma; k = 1 N p k Q / N ;
其中
Figure FDA00003479511300045
为给定点集Q时qk的激活概率;
多个节点联合驱动话题传播的能力与各单节点的驱动能力的连接强度呈线性关系:
Ea(Q)=Aw(Q′,qv)+BEa(qv)+b+ε    (12)
其中Q′为给定的驱动点集,Q={Q′,qv},A、B、b为待估参数,待估参数根据实际数据利用最小二乘算法进行估计,ε为随机噪声。
8.如权利要求7所述的基于有限节点驱动的微博社会网络信息推荐方法,其特征在于,基于贪婪算法的策略,依次选择驱动节点,最终得到次优解:
a)初始化
Figure FDA00003479511300046
选择QC中驱动能力最大的节点qp∈QC放入QP,同时将它从候选节点集QC中删除,即QP←QP∪qp,QC←QC\qp
b)根据公式(10),计算点集QP与QC中各节点的连接强度,并选取使得公式(12)最大化的节点qp∈QC放入QP,即QP←QP∪qp,QC←QC\qp
重复步骤b),直到QP包含n个驱动节点。
CN201310285214.3A 2013-07-08 2013-07-08 一种基于有限节点驱动的微博社会网络信息推荐方法 Expired - Fee Related CN103412872B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310285214.3A CN103412872B (zh) 2013-07-08 2013-07-08 一种基于有限节点驱动的微博社会网络信息推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310285214.3A CN103412872B (zh) 2013-07-08 2013-07-08 一种基于有限节点驱动的微博社会网络信息推荐方法

Publications (2)

Publication Number Publication Date
CN103412872A true CN103412872A (zh) 2013-11-27
CN103412872B CN103412872B (zh) 2017-04-26

Family

ID=49605884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310285214.3A Expired - Fee Related CN103412872B (zh) 2013-07-08 2013-07-08 一种基于有限节点驱动的微博社会网络信息推荐方法

Country Status (1)

Country Link
CN (1) CN103412872B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
CN103617289A (zh) * 2013-12-12 2014-03-05 北京交通大学长三角研究院 基于用户特征及网络关系的微博推荐方法
CN103970863A (zh) * 2014-05-08 2014-08-06 清华大学 基于lda主题模型的微博用户兴趣的挖掘方法及系统
CN105306540A (zh) * 2015-09-24 2016-02-03 华东师范大学 一种获得社交网络中影响力最大的前k个节点的方法
CN105574191A (zh) * 2015-12-26 2016-05-11 中国人民解放军信息工程大学 在线社会网络多源点信息溯源系统及其方法
WO2016124116A1 (zh) * 2015-02-04 2016-08-11 阿里巴巴集团控股有限公司 信息传播方法和装置
CN105989154A (zh) * 2015-03-03 2016-10-05 华为技术有限公司 相似性度量的方法及设备
CN105989005A (zh) * 2015-01-27 2016-10-05 中国移动通信集团公司 一种信息的推送方法及装置
CN106407364A (zh) * 2016-09-08 2017-02-15 北京百度网讯科技有限公司 一种基于人工智能的信息推荐方法和装置
CN106600071A (zh) * 2016-12-20 2017-04-26 西南石油大学 一种基于主题的微博转发预测方法与系统
CN106599245A (zh) * 2016-12-20 2017-04-26 西南石油大学 基于微博用户关系进行微博转发预测的方法和系统
CN106600069A (zh) * 2016-12-20 2017-04-26 西南石油大学 基于微博主题标签进行微博转发预测的方法和系统
CN106777162A (zh) * 2016-12-20 2017-05-31 西南石油大学 一种高精度微博转发预测方法
CN106777157A (zh) * 2016-12-20 2017-05-31 西南石油大学 一种基于主题的类引力模型微博预测方法与系统
CN107193916A (zh) * 2017-05-15 2017-09-22 中国人民解放军国防科学技术大学 一种个性化多样化查询推荐方法及系统
CN107273396A (zh) * 2017-03-06 2017-10-20 扬州大学 一种社交网络信息传播检测节点的选择方法
CN107809363A (zh) * 2016-08-30 2018-03-16 腾讯科技(深圳)有限公司 一种网络信息传播控制方法和装置
CN108549632A (zh) * 2018-04-03 2018-09-18 重庆邮电大学 一种基于情感分析的社交网络影响力传播模型构建方法
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN110020146A (zh) * 2017-11-27 2019-07-16 香港城市大学深圳研究院 信息投放方法和装置
CN110119476A (zh) * 2019-04-26 2019-08-13 广州美术学院 一种账号自动推荐方法、装置、终端设备及存储介质
CN110489669A (zh) * 2018-05-11 2019-11-22 中移(苏州)软件技术有限公司 一种信息推送方法及装置
CN113704630A (zh) * 2021-10-27 2021-11-26 武汉卓尔数字传媒科技有限公司 一种信息推送方法、装置、可读存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007213322A (ja) * 2006-02-09 2007-08-23 Brother Ind Ltd 情報配信システム、情報配信方法、ノード装置、及びノード処理プログラム
CN101887441A (zh) * 2009-05-15 2010-11-17 华为技术有限公司 一种社会网络建立方法和系统及网络社区挖掘方法和系统
CN103020221A (zh) * 2012-12-12 2013-04-03 中国科学院自动化研究所 一种基于多模态自适应社会关系强度挖掘的社会搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007213322A (ja) * 2006-02-09 2007-08-23 Brother Ind Ltd 情報配信システム、情報配信方法、ノード装置、及びノード処理プログラム
CN101887441A (zh) * 2009-05-15 2010-11-17 华为技术有限公司 一种社会网络建立方法和系统及网络社区挖掘方法和系统
CN103020221A (zh) * 2012-12-12 2013-04-03 中国科学院自动化研究所 一种基于多模态自适应社会关系强度挖掘的社会搜索方法

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
CN103617289A (zh) * 2013-12-12 2014-03-05 北京交通大学长三角研究院 基于用户特征及网络关系的微博推荐方法
CN103617289B (zh) * 2013-12-12 2017-09-19 北京交通大学长三角研究院 基于用户特征及网络关系的微博推荐方法
CN103970863A (zh) * 2014-05-08 2014-08-06 清华大学 基于lda主题模型的微博用户兴趣的挖掘方法及系统
CN103970863B (zh) * 2014-05-08 2017-12-19 清华大学 基于lda主题模型的微博用户兴趣的挖掘方法及系统
CN105989005A (zh) * 2015-01-27 2016-10-05 中国移动通信集团公司 一种信息的推送方法及装置
CN105989005B (zh) * 2015-01-27 2019-06-21 中国移动通信集团公司 一种信息的推送方法及装置
WO2016124116A1 (zh) * 2015-02-04 2016-08-11 阿里巴巴集团控股有限公司 信息传播方法和装置
CN105989154B (zh) * 2015-03-03 2020-07-14 华为技术有限公司 相似性度量的方法及设备
CN105989154A (zh) * 2015-03-03 2016-10-05 华为技术有限公司 相似性度量的方法及设备
US10579703B2 (en) 2015-03-03 2020-03-03 Huawei Technologies Co., Ltd. Similarity measurement method and device
CN105306540A (zh) * 2015-09-24 2016-02-03 华东师范大学 一种获得社交网络中影响力最大的前k个节点的方法
CN105574191A (zh) * 2015-12-26 2016-05-11 中国人民解放军信息工程大学 在线社会网络多源点信息溯源系统及其方法
CN105574191B (zh) * 2015-12-26 2018-10-23 中国人民解放军信息工程大学 在线社会网络多源点信息溯源系统及其方法
CN107809363A (zh) * 2016-08-30 2018-03-16 腾讯科技(深圳)有限公司 一种网络信息传播控制方法和装置
CN106407364A (zh) * 2016-09-08 2017-02-15 北京百度网讯科技有限公司 一种基于人工智能的信息推荐方法和装置
CN106599245A (zh) * 2016-12-20 2017-04-26 西南石油大学 基于微博用户关系进行微博转发预测的方法和系统
CN106600069B (zh) * 2016-12-20 2020-08-18 西南石油大学 基于微博主题标签进行微博转发预测的方法和系统
CN106777157A (zh) * 2016-12-20 2017-05-31 西南石油大学 一种基于主题的类引力模型微博预测方法与系统
CN106777162A (zh) * 2016-12-20 2017-05-31 西南石油大学 一种高精度微博转发预测方法
CN106600069A (zh) * 2016-12-20 2017-04-26 西南石油大学 基于微博主题标签进行微博转发预测的方法和系统
CN106600071A (zh) * 2016-12-20 2017-04-26 西南石油大学 一种基于主题的微博转发预测方法与系统
CN107273396A (zh) * 2017-03-06 2017-10-20 扬州大学 一种社交网络信息传播检测节点的选择方法
CN107193916B (zh) * 2017-05-15 2020-06-26 中国人民解放军国防科学技术大学 一种个性化多样化查询推荐方法及系统
CN107193916A (zh) * 2017-05-15 2017-09-22 中国人民解放军国防科学技术大学 一种个性化多样化查询推荐方法及系统
CN110020146A (zh) * 2017-11-27 2019-07-16 香港城市大学深圳研究院 信息投放方法和装置
CN110020146B (zh) * 2017-11-27 2021-03-02 香港城市大学深圳研究院 信息投放方法和装置
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN108564479B (zh) * 2017-12-20 2022-02-11 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN108549632A (zh) * 2018-04-03 2018-09-18 重庆邮电大学 一种基于情感分析的社交网络影响力传播模型构建方法
CN108549632B (zh) * 2018-04-03 2022-02-11 重庆邮电大学 一种基于情感分析的社交网络影响力传播模型构建方法
CN110489669A (zh) * 2018-05-11 2019-11-22 中移(苏州)软件技术有限公司 一种信息推送方法及装置
CN110489669B (zh) * 2018-05-11 2021-11-30 中移(苏州)软件技术有限公司 一种信息推送方法及装置
CN110119476A (zh) * 2019-04-26 2019-08-13 广州美术学院 一种账号自动推荐方法、装置、终端设备及存储介质
CN113704630A (zh) * 2021-10-27 2021-11-26 武汉卓尔数字传媒科技有限公司 一种信息推送方法、装置、可读存储介质和电子设备

Also Published As

Publication number Publication date
CN103412872B (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN103412872A (zh) 一种基于有限节点驱动的微博社会网络信息推荐方法
Liang et al. Distributed Nash equilibrium seeking for aggregative games with coupled constraints
Arslan et al. Autonomous vehicle-target assignment: A game-theoretical formulation
Chen et al. Indirect reciprocity game modelling for cooperation stimulation in cognitive networks
Cai et al. A fuzzy adaptive chaotic ant swarm optimization for economic dispatch
Lin et al. Friend-as-learner: Socially-driven trustworthy and efficient wireless federated edge learning
González-Sánchez et al. A survey of static and dynamic potential games
CN102262681A (zh) 一种博客信息传播中识别关键博客集的方法
CN107657034A (zh) 一种社交信息增强的事件社交网络推荐算法
CN110825948A (zh) 基于促谣-辟谣消息和表示学习的谣言传播控制方法
CN104376083A (zh) 一种基于关注关系和多用户行为的图推荐方法
Atzeni et al. Day-ahead bidding strategies for demand-side expected cost minimization
CN103198432B (zh) 在线社会网络中网络群体的检测方法及系统
Li et al. Evolutionary game-based trust strategy adjustment among nodes in wireless sensor networks
CN104820945A (zh) 基于社团结构挖掘算法的在线社会网络信息传播最大化方法
CN104009993A (zh) 一种基于模糊过滤的信任评估方法
Hayat et al. A signaling game-based approach for Data-as-a-Service provisioning in IoT-Cloud
Liu et al. Product line design considering competition by bilevel optimization of a Stackelberg–Nash game
Nambi et al. Toward the development of a techno-social smart grid
Yu et al. Collaborative group embedding and decision aggregation based on attentive influence of individual members: A group recommendation perspective
Lin et al. Heterogeneous differential-private federated learning: Trading privacy for utility truthfully
Guo et al. Influence maximization algorithm based on group trust and local topology structure
Wiȩcek et al. Stochastic state dependent population games in wireless communication
Ma et al. Reputation and pricing dynamics in online markets
CN104967643A (zh) 一种获取转移数据的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170426

Termination date: 20190708