CN102117325A - 动态社会网络用户行为的预测方法 - Google Patents

动态社会网络用户行为的预测方法 Download PDF

Info

Publication number
CN102117325A
CN102117325A CN2011100458957A CN201110045895A CN102117325A CN 102117325 A CN102117325 A CN 102117325A CN 2011100458957 A CN2011100458957 A CN 2011100458957A CN 201110045895 A CN201110045895 A CN 201110045895A CN 102117325 A CN102117325 A CN 102117325A
Authority
CN
China
Prior art keywords
mrow
msubsup
msub
munderover
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100458957A
Other languages
English (en)
Inventor
唐杰
谭宸浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN2011100458957A priority Critical patent/CN102117325A/zh
Publication of CN102117325A publication Critical patent/CN102117325A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于计算机概率图模型的动态社会网络用户行为的预测方法,该方法包括:S1:从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进行客观地统计分析;S2:采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形式化定义;S3:根据步骤S2中的定义建立动态抗噪音因子图模型;S4:对所述动态抗噪音因子图模型进行学习,从给定的历史记录里估计一系列参数的值θ;S5:根据所述θ预测用户行为得到预测结果。本发明从微观层面对社会网络中用户动态行为进行建模和准确预测。

Description

动态社会网络用户行为的预测方法
技术领域
本发明涉及互联网技术领域,特别涉及一种动态社会网络用户行为的预测方法。
背景技术
随着互联网的普及和Web 2.0时代的来临,许多大规模的在线社会网络都取得了巨大的成功,比如Facebook,MySpace,Ning和Twitter。其中,Facebook已经有了4亿的活跃用户,如果当作一个国家的话,已经成为世界上第三大的国家。越来越多的关注使得社会网络的研究成为了一个非常热门的研究课题。来自各个学科的研究者都对社会网络表现出浓厚的兴趣。这些学科包括数学,生物,物理,计算机和社会学等等。过去很多研究都集中在社会网络的宏观层面,比如图中节点度的分布,图的直径,聚类因子,群组结构和小世界效应。然而,这些方法并没有为动态社会网络微观层面的研究提供太多的帮助。
对动态社会网络中的用户行为建模与预测是重要的问题,不仅需要通过各种计算机技术手段分析用户行为的特点,还要通过先进的技术对用户行为进行准确的建模和预测。准确地预测用户的行为可以帮助很多应用。宏观层面,可以预测社会网络中完成某行为的用户比例。这对于民意调查和企业的市场分析是至关重要的。微观层面,可以预测单个用户将来的行为,从而了解每个用户行为乃至心理的变化过程,推动用户分析进入更加深入的阶段。另外,用户动态行为建模直接的应用还有预测好友关系,从而预测社会网络的变化趋势。总之,研究社会网络中的用户行为是社会网络研究的重要环节。
社会网络中用户的动态行为会受到各种各样复杂而微妙的因素所影响。这是社会学中公认的事实。比如,过去的社会学研究关注了朋友间的强弱联系如何影响人们的行为。Granovetter等分析了社会网络中的弱联系对于人们行为的影响,并发现弱联系在找工作的过程中起了非常重要的作用。而Krackhardt等分析了强联系对于人们的影响,主要分析的是在社团演化的过程中强联系所起到的作用。除了朋友行为所带来的影响,用户自己的属性和历史记录也会影响到将来的行为。
社会网络相关的研究已经取得了一些成果,目前的相关工作可以主要按以下三个方面划分:动态社会网络分析,社会影响力分析和群组行为分析。在动态社会网络分析研究方面,Sarkar和Moore提出了一个隐空间模型来分析社会网络的动态变化。Yang等提出了一个动态随机块模型来分析群组以及群组在动态社会网络中的变化模式。Scripps等的研究更加深入,探讨了属性变化对于动态社会网络分析的影响。该研究的焦点集中在属性和朋友关系的影响上,主要贡献包括:他们研究了不同的预处理决定和不同的网络力量(如选择和影响)如何影响动态社会网络的建模,并通过实验验证一些建模过程中假设的正确性,进一步地,研究了边和属性在动态网络中的相互影响;在社会影响力分析研究方面,又可以分为两个方面:定性分析和定量分析。定性分析的主要工作集中在验证社会影响确实存在,并结合社会学的理论去分析在线的社会网络是否具有类似的性质,如:Anagnostopoulos等试图验证和理解社会影响力,将社会网络中用户行为趋同的现象归结为三个原因(即共性、环境因素和影响)。而定量分析则试图分析社会影响的强弱,分析社会网络中不同用户之间影响的差异性,如:Tang等提出了Topical Affinity Propagation(TAP)模型来衡量社会网络中话题级别的社会影响力,希望能发现不同人之间在不同话题上不同的影响力。又如,Goyal等提出模型来计算用户影响的概率,希望通过用户的历史行为来学习影响发生的概率,并提出用户影响概率和行为影响概率的概念;在群组行为分析研究方面,其基于的想法是如果用户加入群组是经过认真考虑的,群组行为可以带来深入而长久的变化。这样一个群组中的成员将反映社会中更广泛的范式。关于群组行为分析的研究集中在群组成员与其他群组成员关系的强弱,以及一个更好的将个人和其所在群组,家庭,社会网络联系起来的方法。研究成果包括:Shi等研究了用户参加群组行为的模型。在线的论坛代表了一种重要的社会媒体。Tang和Liu采用关系学习的方法来解决数据样例间的相关性,利用网络中部分标注过的用户,来预测其他用户的群组信息。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何从微观层面对社会网络中用户动态行为进行建模和预测,并能够使其满足社会网络复杂性和处理大规模数据的需求。
(二)技术方案
一种动态社会网络用户行为的预测方法,包括以下步骤:
S1:从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进行概率统计分析;
S2:采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形式化定义动态社会网络中用户行为的建模问题,具体包括:
用户行为定义为用户vi在t时刻的行为,用一个三元组来表示:(y,vi,t)即为
Figure BDA0000047862090000031
y为用户行为,定义Yt为所有用户t时刻行为的集合,将所有用户的全部行为定义成行为的历史记录Y={(y,vi,t)}i,t
动态属性矩阵Xt定义为N×d的矩阵,N表示用户数,d表示属性个数,表示的是t时刻网络中全部用户属性的矩阵,其中每一行xi表示的是用户vi的全部属性,而每一列表示属性的全部值,元素xij表示的是用户vi的第j个属性;
属性加强网络定义为Gt=(Vt,Et,Xt,Yt),其中Vt是t时刻用户的集合,而Et是t时刻边的集合,边表示用户间的好友关系;
S3:根据步骤S2中的建模建立动态抗噪音因子图模型,给定连续T时刻的属性加强网络G={Gt=(Vt,Et,Xt,Yt)},t∈{1,...,T},V=V1∪V2∪...∪VT,|V|=N,定义G中历史记录Y的联合分布:
p ( Y | G ) = Π t = 1 T Π i = 1 N f ( y i t | z i t ) f ( z i t | z ~ v i t - 1 ) f ( z i t | z ~ v i t , x i t )
其中~vi表示的是vi在社会网络中的邻居,
Figure BDA0000047862090000042
表示t时刻用户vi的隐行为状态,
Figure BDA0000047862090000043
表示t时刻vi与其朋友之间的隐行为状态,
Figure BDA0000047862090000044
为vi的朋友历史行为的记录,
Figure BDA0000047862090000045
表示t时刻包括用户vi全部属性的属性向量;
动态抗噪音因子图模型包括三类因子函数:
行为偏差因子
Figure BDA0000047862090000046
表示t时刻在用户vi的隐行为状态
Figure BDA0000047862090000047
的条件下得到行为
Figure BDA0000047862090000048
的概率,公式如下:
f ( y i t | z i t ) = 1 2 π δ 2 exp { - ( y i t - z i t ) 2 2 δ 2 }
其中δ是用来调整用户行为噪音权重的变量,
所述隐行为状态为:对于每个用户在t时刻的行为定义一个连续的状态
Figure BDA00000478620900000411
这个状态相对
Figure BDA00000478620900000412
而言可能有个偏差,这个状态用来描述用户内心真实的想完成这个行为的程度;
社会影响因子
Figure BDA00000478620900000413
反映了用户朋友对于用户vi在t时刻行为的影响,公式如下:
f ( z i t | z ~ v i t - 1 ) = 1 Q 1 exp { Σ j = 1 N λ ji m ji t - 1 g ji ( z i t , z j t - 1 ) }
其中
Figure BDA00000478620900000415
是定义在两个用户的隐行为状态
Figure BDA00000478620900000417
上的函数,当且仅当
Figure BDA00000478620900000418
时,λji表示用户vj对用户vi的影响值,Q1为归一化因子,说明在t-1时刻的社会网络中,用户vi和vj之间有边;
网络相关因子
Figure BDA00000478620900000420
表示用户t时刻行为间的网络相关性,公式如下:
f ( z i t | z ~ v i t , x i ) = 1 Q 2 exp { ( Σ j = 1 N β ij m ij t h ij ( z i t , z j t ) } + Σ k = 1 d a k h k ( z i t , x ik t ) ) }
其中,因子函数
Figure BDA0000047862090000052
表示用户vi和用户vj在t时刻行为趋于一致,
Figure BDA0000047862090000053
用于衡量在t时刻用户vi和其第k个属性
Figure BDA0000047862090000054
的关系,d表示属性的个数,βij和αk分别是
Figure BDA0000047862090000055
Figure BDA0000047862090000056
的权重,Q2为归一化因子;
由行为偏差因子和用户行为相关性推出动态抗噪音因子图模型期望最大化的目标函数为:
p ( Y | G ) = 1 Q exp { Σ t = 1 T Σ i = 1 N ( y i t - z i t ) 2 2 δ 2 + Σ t = 1 T Σ i = 1 N Σ j = 1 N λ ji m ji t - 1 g ( z i t , z j t - 1 )
+ Σ t = 1 T Σ i = 1 N Σ j = 1 N β ij m ij t h ij ( z i t , z j t ) + Σ t = 1 T Σ i = 1 N Σ k = 1 d α k h k ( z i t , x ik t ) }
其中
Figure BDA0000047862090000059
为归一化因子;
S4:对所述动态抗噪音因子图模型进行学习,从所述历史记录Y里估计参数的值θ=({qi}{αk}{βij}{λji}),使得目标函数最大化,其中,qi是归一化因子,αk和βij分别是所述步骤S3中
Figure BDA00000478620900000510
Figure BDA00000478620900000511
的权重;
S5:根据所述θ预测用户行为。
其中,所述步骤S4中从所述历史记录Y里估计参数的值θ=({qi}{αk}{βij}{λji})具体步骤包括:
S4.1:输入迭代H的个数和学习率η;
S4.2:初始化归一化因子q,权重α,β和λ,其中,q是qi构成的向量,α是αk构成的向量,β是由βij构成矩阵,λ是由λji构成的矩阵;
S4.3:如果q已收敛则转到S4.8,否则转到S4.4;
S4.4:固定q使用梯度下降的方法更新α,β和λ;
S4.5:对于计数器i从1增加到H,进行以下操作:
-计算梯度
Figure BDA0000047862090000061
Figure BDA0000047862090000062
Figure BDA0000047862090000063
-更新logαk log α k + η × ▿ log α k ;
-更新logβij log β ij + η × ▿ log β ij ;
-更新logλji log λ ji + η × ▿ log λ ji ;
S4.6:固定α,β和λ求解q;
S4.7:输出学习后的参数θ=({qi}{αk}{βij}{λji})。
其中,步骤S4中从所述历史记录Y里估计参数的值θ=({qi}{αk}{βij}{λji})具体步骤包括:
S5.1:输入迭代H的个数和学习率η;
S5.2:初始化归一化因子z,权重α,β和λ,其中,α是αk构成的向量,β是由βij构成矩阵,λ是由λji构成的矩阵,q表示Q或qi
S5.3:如果q已收敛则转到S5.9,否则转到S5.4;
S5.4:主服务器广播q;
S5.5:固定q使用梯度下降的方法更新α,β和λ;
S5.6:对于计数器i从1增加到H,进行以下操作:
-主服务器广播α,β和λ;
-分别计算梯度
Figure BDA0000047862090000067
Figure BDA0000047862090000068
Figure BDA0000047862090000069
-从服务器发回该计算结果;
-主服务器简化该计算结果;
-主服务器更新α,β和λ;
S5.7:固定α,β和λ来求解z;
S5.8:输出学习后的参数θ=({qi}{αk}{βij}{λji})。
其中,步骤S5具体包括:
计算隐状态
Figure BDA00000478620900000610
然后利用这个隐行为状态来估计
Figure BDA00000478620900000611
计算
Figure BDA00000478620900000612
的公式如下:
z i T + 1 = Σ k = 1 d α k x ik + Σ j = 1 N λ ji m T z j T Σ K = 1 d α k + Σ j = 1 N λ ji m ji T
根据用户各自的隐行为状态
Figure BDA0000047862090000071
来预测用户的行为
Figure BDA0000047862090000072
y i T + 1 = 0 if | z i T + 1 - z &OverBar; + | < = | z i T + 1 - z &OverBar; - | 1 otherwise .
其中
Figure BDA0000047862090000074
Figure BDA0000047862090000075
分别表示对应行为y=1和y=0在训练集中的隐行为状态的平均值,具体的计算方法如下:
z &OverBar; - = &Sigma; t = 1 T &Sigma; i = 1 N z i t I ( y i t = 0 ) &Sigma; t = 1 T &Sigma; i = 1 N I ( y i t = 0 )
z &OverBar; + = &Sigma; t = 1 T &Sigma; i = 1 N z i t I ( y i t = 1 ) &Sigma; t = 1 T &Sigma; i = 1 N I ( y i t = 1 )
其中,I为示性函数,示性函数
Figure BDA0000047862090000078
表示用户表现了隐行为状态,
Figure BDA0000047862090000079
表示用户没有表现出隐行为状态。
(三)有益效果
本发明公开了一种基于计算机概率图模型的动态社会网络用户行为的预测方法及技术方案,该技术方案采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形式化定义,同时设计了动态抗噪音因子图模型,成功地将各种通过技术手段分析获得的影响因素(因子)纳入到统一的模型中。本发明在三个不同的真实数据集上进行实验,采用了三种不同的评价方法来证明本发明所提出模型的优越性,且在三个数据集上都能够较好地预测动态社会网络中的用户行为。实验结果表明本发明所设计的模型可以有效地描述社会网络中用户的动态行为如何变化,所设计的并行算法高效且动态用户行为预测准确。
附图说明
图1是本发明实施例的一种动态社会网络用户行为的预测方法流程图;
图2“社会影响力”因素对用户行为的影响曲线图;
图3“用户行为的时间相关性”因素对用户行为的影响曲线图;
图4“用户行为的网络相关性”因素对用户行为的影响曲线图;
图5动态抗噪音因子图模型的图表示;
图6本发明的方法中动态抗噪音因子图模型的并行学习算法设计图;
图7不同方法行为预测的效果比较(%);
图8不同因子函数的贡献分析;
图9隐行为状态的示例;
图10三个数据集上的效率比较(5台电脑,每个四核);
图11加速比结果比较;
图12在Twitter上关于“Haiti Earthquake”的行为轨迹。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
针对“如何从微观层面对社会网络中用户动态行为进行建模和预测,如何设计高效模型学习算法并能够使其满足社会网络复杂性和处理大规模数据的需求”这样的科学技术问题,本发明公开了一种基于计算机概率图模型的动态社会网络用户行为的预测方法及技术方案,该技术方案采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形式化定义,同时设计了动态抗噪音因子图模型,成功地将各种通过技术手段分析获得的影响因素(因子)纳入到统一的模型中。本发明的核心和重点是通过先进的计算机技术手段模拟人为的思维,推理及分析过程,预测人类在虚拟社会网络中的用户行为。具体流程如图1所示:包括:
步骤S101,从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进行概率统计分析。
社会网络是动态变化的,不同的时间段,会有新的用户加入,同时也会产生新的好友关系。而用户行为可以是任意的用户行为,比如用户加入某个群组,或者用户评论某个事件。由此,为用户行为建模时,可能会影响用户行为的因素包括:社会影响、用户行为的时间相关性和用户行为的网络相关性。
为了验证以上对于社会网络用户动态行为影响因素的假设,本发明在三个真实的社会网络中进行了数据分析。这三个社会网络的数据来自Twitter,Flickr和Arnetminer。图2中显示了社会影响力的分析结果,表明当用户的朋友完成某一行为的比例提高时,用户自己在下一时刻完成该行为的比例也提高了。其中x轴表示的是用户朋友在t-1时刻完成该行为的比例,而y轴表示的是用户自己在t时刻完成该行为的比例。图3显示了用户行为的时间相关性,说明用户行为中存在着显著的时间相关性,即:如果用户上一时刻完成过某行为,当前时刻完成该行为的比例显著提高。其中x轴代表不同的时刻,“dependent”表示的是当用户在上一时刻完成过某一行为,他当前时刻完成该行为的比例;“average”则表示的是用户中平均完成该行为的比例。图4显示了同一时刻用户行为的网络相关性,可以看到:在同一时刻,朋友倾向于完成相同的事情。其中x轴表示的同样是不同的时刻。“friend”表示的是同一时刻,两个朋友完成相同行为的比例,而“random”表示的是该时刻随机两个人完成同一行为的比例。
步骤S102,形式化定义动态社会网络中用户行为的建模与预测问题。
传统的定义中,一个静态的社会网络可以用G=(V,E)表示。其中V是|V|=N个用户的集合,而是用户之间有向边或者无向边的集合。本发明将动态社会网络中用户行为的建模与预测问题定义为:动态社会网络建模给定T个连续时刻的属性加强网络,{Gt=(Vt,Et,Xt,Yt)},其中t∈{1,...,T},以及T+1时刻的网络结构、VT、ET和XT。动态社会网络中用户行为建模问题的目标是:
f:({G1,...,GT},VT+1,ET+1,XT+1)→YT+1
表示从T时刻的用户行为,预测T+1时刻的用户行为。
其中,步骤S102具体包括:
用户行为定义为:用户vi在t时刻的一个行为y,用一个三元组来表示:(y,vi,t)(或者简单地用
Figure BDA0000047862090000101
表示)。定义Yt为所有用户t时刻行为的集合。进一步地,将所有用户的全部行为定义成行为的历史记录Y={(y,vi,t)}i,t
动态属性矩阵定义为:定义Xt为一个N×d的矩阵,N表示用户数,d表示属性个数,表示的是t时刻网络中全部用户属性的矩阵。其中每一行xi表示的是用户vi的全部属性,而每一列表示一个属性的全部值,一个元素xij表示的是用户vi的第j个属性。用户属性包括:年龄、性别和职业等,指的是用户自身的特点。每个用户对于行为的选择与自己的偏好是密不可分,而这种偏好往往会体现在用户自己的属性当中。
属性加强网络定义为:一个属性加强网络可以记为Gt=(Vt,Et,Xt,Yt),其中Vt是t时刻用户的集合,而Et是t时刻边的集合,边表示用户间的好友关系。
步骤S103,设计动态抗噪音因子图模型。
基于步骤S101中对数据分析的结果,本发明综合考虑多个因素提出动态抗噪音因子图模型:给定连续T时刻的属性加强网络G={Gt=(Vt,Et,Xt,Yt)},t∈{1,...,T},V=V1∪V2∪...∪VT,|V|=N,可以定义G中全部行为集合Y的联合分布:
p ( Y | G ) = &Pi; t = 1 T &Pi; i = 1 N f ( y i t | z i t ) f ( z i t | z ~ v i t - 1 ) f ( z i t | z ~ v i t , x i t )
其中~vi表示的是vi在社会网络中的邻居(是对用户之间所有社会关系的抽象,包含朋友关系)。
其中,步骤S103中设计动态抗噪音因子图模型所要考虑的因素包括:
(1)用户t时刻的行为会被他朋友的历史行为所影响(time<t);
(2)用户t时刻的行为经常与他自己之前的行为相关;
(3)朋友在同一时刻t的行为会表现出一定程度的相关性;
(4)二值的变量
Figure BDA0000047862090000111
只是近似地考虑的用户的行为,不能表示用户对于该行为真实的想法,及其偏好的程度。同时直接对用户的二值行为集合Y进行建模,将不可避免地引入过多的噪音。因此,本发明引入一个连续变量来考虑用户行为的噪音。
图5给出了动态抗噪音因子图模型的图表示。每个圆表示的是一个用户的隐行为状态。隐行为状态的定义为:对于每个用户在t时刻的行为
Figure BDA0000047862090000112
定义一个连续的状态
Figure BDA0000047862090000113
Figure BDA0000047862090000114
在t时刻的取值在区间[0,1]上是连续的。这个状态相对
Figure BDA0000047862090000115
而言可能有个偏差,这个状态用来描述用户内心真实的想完成这个行为的程度。
该隐行为状态是用来描述内心对完成该动作的真实偏好。而该隐行为状态与该用户的用户行为
Figure BDA0000047862090000116
联系起来,表示用户行为的噪音。同时决定隐行为状态的还有用户vi的全部属性,即一个属性向量
Figure BDA0000047862090000117
以及vi的朋友历史行为的记录
Figure BDA0000047862090000118
最后,同一时刻,t时刻vi与其朋友之间的隐行为状态
Figure BDA0000047862090000119
也会互相关联,组成一个马尔科夫随机场。g(.)所代表的因子函数描述的是历史行为对于用户的影响,因子函数hi(.)则描述的是用户vi的属性与隐行为状态之间的关系。而hij(.)这个因子函数描述的是用户行为的网络相关性。
其中,步骤S103的动态抗噪音因子图模型中有三类因子函数,分别与(1)~(3)因素中提到的基本想法一一对应:
(1)行为偏差因子:表示的是用户在t时刻的用户vi的隐行为状态
Figure BDA00000478620900001111
得到行为
Figure BDA00000478620900001112
的概率;
对于行为偏差因子
Figure BDA00000478620900001113
描述的是用户行为与隐行为状态之间的噪音。隐行为状态要可以容忍一定的噪音,同时不能与用户行为有太大的差距。因此采用高斯函数来进行定义:
f ( y i t | z i t ) = 1 2 &pi; &delta; 2 exp { - ( y i t - z i t ) 2 2 &delta; 2 }
其中δ是用来调整用户行为噪音权重的变量。它的值可以利用一个类似于EM的算法来进行学习,或者直接根据经验来设定。如果只是考虑二值行为的话,可以直接使用Bernoulli分布来定义行为偏差因子。但是为了适应更一般化的用户行为,本文采用了高斯函数。
(2)社会影响因子:
Figure BDA0000047862090000121
反映了用户朋友对于用户vi在t时刻行为的影响;
对于社会影响因子
Figure BDA0000047862090000122
首先定义一个二值的N×N的矩阵Mt-1来描述t-1时刻的社会网络,其中
Figure BDA0000047862090000123
说明在t-1时刻的社会网络中,用户vi和vj之间有边(即eij∈E),而说明vi和vj无关。给定这些条件后,社会影响因子定义如下:
f ( z i t | z ~ v i t - 1 ) = 1 Q 1 exp { &Sigma; j = 1 N &lambda; ij m ji t - 1 g ji ( z i t , z j t - 1 ) }
其中
Figure BDA0000047862090000126
是定义在两个用户的隐行为状态
Figure BDA0000047862090000127
Figure BDA0000047862090000128
上的函数;λji(当且仅当
Figure BDA0000047862090000129
)表示的是用户vj对用户vi的影响值。一般来说,影响值λji越大,用户vj在t-1时刻的行为就更可能使得vi在t时刻产生类似的行为。当j=i,这个影响表示的是自己对自己的“影响”,即用户行为的时间相关性。而Q1是一个归一化因子。
(3)网络相关因子:
Figure BDA00000478620900001210
表示了用户t时刻行为间的网络相关性。
用户行为的网络相关因子函数可以自然而然地用马尔科夫随机场来定义。因此,根据马尔科夫随机场的基本理论,本发明按照下面的方式定义用户行为相关性。
f ( z i t | z ~ v i t , x i ) = 1 Q 2 exp { ( &Sigma; j = 1 N &beta; ij m ij t h ij ( z i t , z j t ) } + &Sigma; k = 1 d a k h k ( z i t , x ik t ) ) }
其中,这个因子函数用来表示用户vi和用户vj在t时刻行为趋于一致。而
Figure BDA00000478620900001214
是用来衡量在t时刻用户vi和他的第k个属性
Figure BDA00000478620900001215
的关系;d表示的是属性的个数。βij和αk分别是这两个函数的权重。同样地,Q2也是一个归一化因子。
其中,步骤S103包含动态抗噪音因子图模型希望最大化的目标函数为:
p ( Y | G ) = 1 Q exp { &Sigma; t = 1 T &Sigma; i = 1 N ( y i t - z i t ) 2 2 &delta; 2 + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &lambda; ji m ji t - 1 g ( z i t , z j t - 1 )
+ &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &beta; ij m ij t h ij ( z i t , z j t ) + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; k = 1 d &alpha; k h k ( z i t , x ik t ) }
其中
Figure BDA0000047862090000133
为归一化因子。该最大化的目标函数是由行为偏差因子
Figure BDA0000047862090000134
和用户行为相关性
Figure BDA0000047862090000135
联合起来推导而得到的。
步骤S104:动态抗噪音因子图模型的学习。
动态抗噪音因子图模型的学习是要从给定的历史记录Y里估计一系列参数的值θ=({qi}{αk}{βij}{λji}),使得目标函数最大化。其中,qi是归一化因子,αk和βij分别是所述步骤S103中
Figure BDA0000047862090000136
Figure BDA0000047862090000137
的权重,λji表示用户vj对用户vi的影响值。这里采用对最大似然函数取log的方法:O(θ)=logpθ(Y |G)。模型学习的目标可以简写成:θ=arg max O(θ)。为求解归一化因子Q,考虑到以下因子函数g(.)和h(.):
g ji ( z i t , z j t - 1 ) = - ( z i t - z j t - 1 ) 2
h ij ( z i t , z j t ) = - ( z i t - z j t - 1 ) 2
h k ( z i t , x ik t ) = - ( z i t - x ik t ) 2
于是目标函数O(θ)可以重新写成:
O ( &theta; ) = - log Q - { &Sigma; t = 1 T &Sigma; i = 1 N ( y i t - z i t ) 2 2 &delta; 2 + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &lambda; ji m ji t - 1 ( z i t , z j t - 1 ) 2
+ &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &beta; ij m ij t h ij ( z i t , z j t ) 2 + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; k = 1 d &alpha; k h k ( z i t , x ik t ) 2 }
其中
Q = C &Integral; y &Integral; z exp { - &Sigma; t = 1 T &Sigma; i = 1 N ( y i t - z i t ) 2 2 &delta; 2 - &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &lambda; ji m ji t - 1 ( z i t , z j t - 1 ) 2
- &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &beta; ij m ij t h ij ( z i t - z j t ) 2 + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; k = 1 d &alpha; k ( z i t - x ik t ) 2 } dzdy
这里是一个常量。
其中,步骤S104中动态抗噪音因子图模型学习算法的具体步骤为:
S401:输入迭代H的个数和学习率η;
S402:初始化归一化因子q,权重α,β和λ,其中,q是qi构成
的向量,α是αk构成的向量,β是由βij构成矩阵,λ是由λji构成的矩阵;
S403:如果q已收敛则转到S408,否则转到S404;
S404:固定q使用梯度下降的方法更新α,β和λ;
S405:对于计数器i从1增加到H,进行以下操作:
-计算梯度
Figure BDA0000047862090000142
Figure BDA0000047862090000143
Figure BDA0000047862090000144
-更新logαk ( log &alpha; k + &eta; &times; &dtri; log &alpha; k ) ;
-更新logβij ( log &beta; ij + &eta; &times; &dtri; log &beta; ij ) ;
-更新logλji ( log &lambda; ji + &eta; &times; &dtri; log &lambda; ji ) ;
S406:固定α,β和λ来求解q;
S407:输出学习后的参数θ=({qi}{αk}{βij}{λji})。
动态抗噪音因子图的学习算法上最消耗时间的步骤在于计算各个变量的梯度。的梯度计算需要计算对应梯度矩阵的的逆矩阵。由于该梯度矩阵的规模是NT×NT的,它所占据的内存将非常巨大,不可能直接放到内存中,只能将对该矩阵求逆的过程转换为独立计算其逆矩阵的每一列。而每一列的计算可以通过求解线性方程组来实现。因此,在所述步骤S104中模型学习算法的基础上,可采用并行算法来完成梯度计算,其步骤为(基于MPI实现并行计算):
S501:输入迭代H的个数和学习率η;
S502:初始化归一化因子q,权重α,β和λ,其中,α是αk构成的向量,β是由βij构成矩阵,λ是由λji构成的矩阵;
S503:如q已收敛则转到S509,否则转到S504;
S504:主服务器广播q;
S505:固定q使用梯度下降的方法更新α,β和λ;
S506:对于计数器i从1增加到H,进行以下操作:
-主服务器广播α,β和λ;
-分别计算梯度
Figure BDA0000047862090000151
Figure BDA0000047862090000152
Figure BDA0000047862090000153
-从服务器发回该计算结果;
-主服务器简化该计算结果;
-主服务器更新α,β和λ;
S507:固定α,β和λ来求解q;
S508:输出学习后的参数θ=({qi}{αk}{βij}{λji})。
步骤S105,根据所述θ预测用户行为。
基于所述步骤S104中所学到的变量组θ,可以预测用户的行为。具体地,为了预测用户vi在下一时间段T+1的行为
Figure BDA0000047862090000154
首先计算隐状态
Figure BDA0000047862090000155
然后利用这个隐行为状态来估计
Figure BDA0000047862090000156
为了计算
Figure BDA0000047862090000157
可以简化地利用下面的公式:
z i T + 1 = &Sigma; k = 1 d &alpha; k x ik + &Sigma; j = 1 N &lambda; ji m T z j T &Sigma; K = 1 d &alpha; k + &Sigma; j = 1 N &lambda; ji m ji T
然后,就可以根据用户各自的隐行为状态
Figure BDA0000047862090000159
来预测他们的行为
Figure BDA00000478620900001510
y i T + 1 = 0 if | z i T + 1 - z &OverBar; + | < = | z i T + 1 - z &OverBar; - | 1 otherwise .
其中
Figure BDA00000478620900001513
分别表示对应行为y=1和y=0在训练集中的隐行为状态的平均值,具体的计算方法如下:
z &OverBar; - = &Sigma; t = 1 T &Sigma; i = 1 N z i t I ( y i t = 0 ) &Sigma; t = 1 T &Sigma; i = 1 N I ( y i t = 0 )
z &OverBar; + = &Sigma; t = 1 T &Sigma; i = 1 N z i t I ( y i t = 1 ) &Sigma; t = 1 T &Sigma; i = 1 N I ( y i t = 1 )
其中,I为示性函数,示性函数
Figure BDA0000047862090000161
表示用户表现了隐行为状态,
Figure BDA0000047862090000162
表示用户没有表现出隐行为状态。
以下是利用本发明方法的实验过程:
本发明是通过在一个分布式系统上基于MPI并行来完成动态抗噪音因子图模型的学习算法并行性的。MPI是一套信息传递接口的协议。在并行的信息传递模型中,数据从一个进行的地址空间转移到另一个进程。基于信息传递的策略,本发明采用master-slave的模型。也就是说,主服务器(master)可以将任务分配给从服务器(slaves),然后又在主服务器上将从服务器的计算结果进行合并。
图6给出了该并行算法的主要实施过程。在每一次迭代中,主服务器将数据广播给每一个从服务器,然后把计算
Figure BDA0000047862090000163
Axi=bi的任务平均地分配给从服务器。所有的从服务器完成各自的运算,然后将结果发送回给主服务器。主服务器将分布在各个从服务器的结果合并,然后将更新后的变量重新发送个各个从服务器,来完成下一次的迭代。
真实实验数据选择
本发明在以下三个真实数据集上完成所设计方法的实施例:
(1)Twitter
这个数据集是Twitter中从“Carel Pedre(carelpedre)”开始抓取获得的.他是海地著名的无线DJ,通过Twitter的平台向世界传播关于这个严重破坏了他的家园的灾难。抓取过程首先抓取了“carelpedre”和他超过(>11,704)的追随者以及他正在追随的用户,然后进一步地抓取这些用户的朋友。同时抓取了每个用户的全部微博,作为用户的属性信息。最后,抓取得到的用来分析用户行为的数据集包括7,521用户,304,275随时间变化的追随关系以及730,568条用户的微博记录。
(2)Flickr
这个数据集包括8,721个用户和485,253个用户间的朋友关系,还有2,504,849加入最喜欢照片的记录。
(3)Arnetminer
这个数据集是从ArnetMiner中获得的,包含640,134研究人员,1,554,643合作关系,以及2,329,760篇论文发表记录。
确定基线算法
为了对比所设计的模型,本发明采用的基线算法包括以下三种:
(1)SVM:它使用用户的相关熟悉和用户邻居的状态来训练分类器,然后用这个分类器去预测用户的行为。对于SVM,本文采用的是SVM-light。
(2)wvRN:它采用了简单的加权投票的算法来训练分类器。它主要使用了网络信息。在预测的时候,这个关系分类器将通过用户邻居的加权平均值来预测用户的行为状态。
(3)NTT-FGM:它使用动态抗噪音因子图模型来训练,并用生成的模型来预测用户行为。
确定评价方法
为了评价提出的模型,本发明从以下三个角度分析本文的实验结果:
(1)预测效果:通过准确率,召回率与合评价(F1-Measure)来衡量模型的预测效果,并且通过和基线算法的比较来说明动态抗噪音因子图模型的有效性,F1-Measure是综合查准率和查全率的一个指标。
(2)运行时间:通过学习模型所使用的时间来衡量算法的快慢。这表明了提出的并行算法所达到的加速比。
(3)样例研究:最后用一些样例研究的方法来具体地分析模型的优点。
实施例的软硬件环境
基本的学习算法是使用C++实现的。所有的实验都是在一台安装Ubuntu8.10的服务器上完成的,CPU是AMD Phenom(tm)9650Quad-Core Processor(2.3GHz),而内存是8GB。并行算法则是基于MPI并行编程模型完成的。在5台电脑上完成了训练。这5台电脑一共有20个CPU,都是AMD processors(2.3GHz)和一共40GB的内存。实验过程中将最大迭代数设为250,收敛的判断标准为α,β,和λ的相对变化小于1e-3。
给出实施例预测效果
在所有的三个数据集上,本发明使用用户历史的行为来训练动态抗噪音因子图模型。然后用学到的模型来预测用户最后一个时间段的行为。图7列出了不同方法的效果,本发明从预测效果比较、因子函数贡献分析和隐行为状态分析三个角度说明该实施例的预测效果:
(1)预测效果比较
和基线算法相比,动态抗噪音因子图模型取得更好的效果。以F1-Measure为评判标准,动态抗噪音模型比SVM提高了超过10%。同时动态抗噪音因子图模型预测的结果具备更好的鲁棒性。而wvRN的结果对于数据本身的特性非常敏感。它在Flickr的数据集上得到了最高的F1-Measure,但是在Twitter上却极低。这是因为,在Flickr上,用户将照片加入最喜欢列表的行为主要是受到他们朋友行为的影响,而wvRN是一个简单的影响模型,所以wvRN大量地预测出“1”的结果,然而Twitter的网络上在实验中是相对稀疏的。于是wvRN输出的结果主要是“0”。而本文的方法在各个数据集中表现出稳定而一致的结果。这对于模型的扩展性是非常重要的。
(2)不同因子函数贡献分析
动态抗噪音因子图模型考虑了三个因素:1)社会影响;2)用户行为的网络相关和;3)个人的兴趣或者属性。本发明将分析不同的因素在模型中的贡献。具体地,逐个地在模型中删除掉这些因素,(首先是社会影响因子,然后是网络相关因子),然后再训练动态抗噪音因子图模型,并用它进行预测。图8给出了忽略部分因子函数之后的F1-Measure。NTT-FGM-I表示的是模型在忽略社会影响因子之后的结果(λ=0),而NTT-FGM-IC表示的是模型在忽略社会影响因子函数和用户行为的网络相关因子函数(λ=0,β=0)的结果。可以发现预测的效果出现明显的下降,这说明模型通过综合考虑不同因子达到了预期的效果,而且考虑的不同因子都在模型中起到了一定的改进作用。同时也可以发现这种改进在不同数据集上不一样。在Twitter上,用户之间的网络相关性并不明显,因为用户发表微博主要是根据自己之前的状态和自己朋友之前的状态,在t时刻显得相对独立。
(3)隐行为状态分析
学到的隐行为状态可以起到平滑的作用。图9给出了几个隐行为状态的结果。可以看到得到的隐行为状态比原来的二值用户行为要平滑得多。这说明隐行为状态可以起到平衡行为日志中噪音的作用。这正是本文希望在建模过程中得到的结果,也再一次证明了该模型的优势。
进行算法效率比较
本发明将对并行实现和基本的训练算法在三个数据集上的运行时间进行算法效率比较。图10给出了学习动态抗噪音因子图模型所需的时间,分别在一台机器上(Basic NTT-FGM)和通过并行算法,在5台机器上(每台4个核)。可以看到并行的学习算法一般都能取得非常明显的加速效果,显著地减少运行时间。例如,在Arnetminer数据集上,可以达到>17倍的加速比,而在Flickr的数据集上,本文的并行学习算法可以达到>13倍的加速比。其次,本文做了使用不同电脑节点个数(5个,10个,15个,20个核)的情况下,并行学习算法的加速比的实验,用这个实验来衡量信息传递的代价。在图11中的(a)部分中,比较了不同的内核数下并行算法的加速比。x轴表示的是使用的内核个数,y轴表示的是加速比
Figure BDA0000047862090000191
图11中的(b)部分比较了不同网络密度下运行时时间的变化。网络密度定义成
Figure BDA0000047862090000201
x轴即为网络密度
Figure BDA0000047862090000202
y轴是以秒为单位的运行时间。图11中的(c)部分比较了不同网络密度下的加速比。x轴同样是网络密度
Figure BDA0000047862090000203
y轴表示的则是加速比speedup。如图11中(a)中所示,加速比在开始的时候非常接近于理想值。随着核数的增加,加速比发生不可避免的下降,但是仍然能在15个线程的时候达到>10倍以上的加速比。
下面以一个关于海地地震(“Haiti Earthquake”)的微博中网络用户行为为例,来验证本发明提出的基于图模型的动态社会网络用户行为的建模与预测方法。
海地地震是一次非常严重的灾难,将这个国家变成了废墟。下面将用本发明多提出模型的结果,来分析人们在Twitter上对于海地地震的反应。图12列出了一些关于海地地震(“Haiti Earthquake”)的微博样例。可以看到这些微博都和一个著名的网球运动员“Serena Williams(serenajwilliams)”发起的募捐有关。这条募捐信息很快地被“actsofFaithblog”和“madameali”在他们的微博中进行转发。很快,海地著名的无线主持人“carelpedre”在Serena Williams’sTwitter上进行了回复。这些Twitter的用户是Twitter上非常有影响力的用户之一,他们在海地地震中的行为很快的通过转发和回复在Twitter进行传播。(正因为如此Carel Pedre在第二届纽约的“Shorty Awards”得到的最有人性奖)。根据本发明设计提出的模型,可以找到最有影响力的人。他们的行为可以引起大量的层连的效果,可以通过有高影响因子和高相关因子的社会关系来发现信息的传递过程。用这种方法可以更好地理解信息如何在人们之间传递。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (4)

1.一种动态社会网络用户行为的预测方法,其特征在于,包括以下步骤:
S1:从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进行概率统计分析;
S2:采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形式化定义动态社会网络中用户行为的建模问题,具体包括:
用户行为定义为用户vi在t时刻的行为,用一个三元组来表示:(y,vi,t)即为
Figure FDA0000047862080000011
y为用户行为,定义Yt为所有用户t时刻行为的集合,将所有用户的全部行为定义成行为的历史记录Y={(y,vi,t)}i,t
动态属性矩阵Xt定义为N×d的矩阵,N表示用户数,d表示属性个数,表示的是t时刻网络中全部用户属性的矩阵,其中每一行xi表示的是用户vi的全部属性,而每一列表示属性的全部值,元素xij表示的是用户vi的第j个属性;
属性加强网络定义为Gt=(Vt,Et,Xt,Yt),其中Vt是t时刻用户的集合,而Et是t时刻边的集合,边表示用户间的好友关系;
S3:根据步骤S2中的建模建立动态抗噪音因子图模型,给定连续T时刻的属性加强网络G={Gt=(Vt,Et,Xt,Yt)},t∈{1,...,T},V=V1∪V2∪...∪VT,|V|=N,定义G中历史记录Y的联合分布:
p ( Y | G ) = &Pi; t = 1 T &Pi; i = 1 N f ( y i t | z i t ) f ( z i t | z ~ v i t - 1 ) f ( z i t | z ~ v i t , x i t )
其中~vi表示的是vi在社会网络中的邻居,
Figure FDA0000047862080000013
表示t时刻用户vi的隐行为状态,
Figure FDA0000047862080000014
表示t时刻vi与其朋友之间的隐行为状态,
Figure FDA0000047862080000015
为vi的朋友历史行为的记录,
Figure FDA0000047862080000016
表示t时刻包括用户vi全部属性的属性向量;
动态抗噪音因子图模型包括三类因子函数:
行为偏差因子
Figure FDA0000047862080000017
表示t时刻在用户vi的隐行为状态的条件下得到行为的概率,公式如下:
f ( y i t | z i t ) = 1 2 &pi; &delta; 2 exp { - ( y i t - z i t ) 2 2 &delta; 2 }
其中δ是用来调整用户行为噪音权重的变量,
所述隐行为状态为:对于每个用户在t时刻的行为定义一个连续的状态
Figure FDA0000047862080000024
这个状态相对而言可能有个偏差,这个状态用来描述用户内心真实的想完成这个行为的程度;
社会影响因子反映了用户朋友对于用户vi在t时刻行为的影响,公式如下:
f ( z i t | z ~ v i t - 1 ) = 1 Q 1 exp { &Sigma; j = 1 N &lambda; ji m ji t - 1 g ji ( z i t , z j t - 1 ) }
其中
Figure FDA0000047862080000028
是定义在两个用户的隐行为状态
Figure FDA0000047862080000029
上的函数,当且仅当
Figure FDA00000478620800000211
时,λji表示用户vj对用户vi的影响值,Q1为归一化因子,
Figure FDA00000478620800000212
说明在t-1时刻的社会网络中,用户vi和vj之间有边;
网络相关因子
Figure FDA00000478620800000213
表示用户t时刻行为间的网络相关性,公式如下:
f ( z i t | z ~ v i t , x i ) = 1 Q 2 exp { ( &Sigma; j = 1 N &beta; ij m ij t h ij ( z i t , z j t ) } + &Sigma; k = 1 d a k h k ( z i t , x ik t ) ) }
其中,因子函数
Figure FDA00000478620800000215
表示用户vi和用户vj在t时刻行为趋于一致,
Figure FDA00000478620800000216
用于衡量在t时刻用户vi和其第k个属性
Figure FDA00000478620800000217
的关系,d表示属性的个数,βij和αk分别是
Figure FDA00000478620800000218
的权重,Q2为归一化因子;
由行为偏差因子和用户行为相关性推出动态抗噪音因子图模型期望最大化的目标函数为:
p ( Y | G ) = 1 Q exp { &Sigma; t = 1 T &Sigma; i = 1 N ( y i t - z i t ) 2 2 &delta; 2 + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &lambda; ji m ji t - 1 g ( z i t , z j t - 1 )
+ &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; j = 1 N &beta; ij m ij t h ij ( z i t , z j t ) + &Sigma; t = 1 T &Sigma; i = 1 N &Sigma; k = 1 d &alpha; k h k ( z i t , x ik t ) }
其中为归一化因子;
S4:对所述动态抗噪音因子图模型进行学习,从所述历史记录Y里估计参数的值θ=({qi}{αk}{βij}{λji}),使得目标函数最大化,其中,qi是归一化因子,αk和βij分别是所述步骤S3中
Figure FDA0000047862080000032
的权重;
S5:根据所述θ预测用户行为。
2.如权利要求1所述的动态社会网络用户行为的预测方法,其特征在于,所述步骤S4中从所述历史记录Y里估计参数的值θ=({qi}{αk}{βij}{λji})具体步骤包括:
S4.1:输入迭代H的个数和学习率η;
S4.2:初始化归一化因子q,权重α,β和λ,其中,q是qi构成的向量,α是αk构成的向量,β是由βij构成矩阵,λ是由λji构成的矩阵;
S4.3:如果q已收敛则转到S4.8,否则转到S4.4;
S4.4:固定q使用梯度下降的方法更新α,β和λ;
S4.5:对于计数器i从1增加到H,进行以下操作:
-计算梯度
Figure FDA0000047862080000034
Figure FDA0000047862080000035
-更新logαk log &alpha; k + &eta; &times; &dtri; log &alpha; k ;
-更新logβij log &beta; ij + &eta; &times; &dtri; log &beta; ij ;
-更新logλji log &lambda; ji + &eta; &times; &dtri; log &lambda; ji ;
S4.6:固定α,β和λ求解q;
S4.7:输出学习后的参数θ=({qi}{αk}{βij}{λji})。
3.如权利要求2所述的动态社会网络用户行为的预测方法,其特征在于,步骤S4中从所述历史记录Y里估计参数的值θ=({qi}{αk}{βij}{λji})具体步骤包括:
S5.1:输入迭代H的个数和学习率η;
S5.2:初始化归一化因子z,权重α,β和λ,其中,α是αk构成的向量,β是由βij构成矩阵,λ是由λji构成的矩阵,q表示Q或qi
S5.3:如果q已收敛则转到S5.9,否则转到S5.4;
S5.4:主服务器广播q;
S5.5:固定q使用梯度下降的方法更新α,β和λ;
S5.6:对于计数器i从1增加到H,进行以下操作:
-主服务器广播α,β和λ;
-分别计算梯度
Figure FDA0000047862080000042
Figure FDA0000047862080000043
-从服务器发回该计算结果;
-主服务器简化该计算结果;
-主服务器更新α,β和λ;
S5.7:固定α,β和λ来求解z;
S5.8:输出学习后的参数θ=({qi}{αk}{βij}{λji})。
4.如权利要求2或3所述的动态社会网络用户行为的预测方法,其特征在于,步骤S5具体包括:
计算隐状态
Figure FDA0000047862080000044
然后利用这个隐行为状态来估计
Figure FDA0000047862080000045
计算
Figure FDA0000047862080000046
的公式如下:
z i T + 1 = &Sigma; k = 1 d &alpha; k x ik + &Sigma; j = 1 N &lambda; ji m T z j T &Sigma; K = 1 d &alpha; k + &Sigma; j = 1 N &lambda; ji m ji T
根据用户各自的隐行为状态
Figure FDA0000047862080000048
来预测用户的行为
Figure FDA0000047862080000049
y i T + 1 = 0 if | z i T + 1 - z &OverBar; + | < = | z i T + 1 - z &OverBar; - | 1 otherwise .
其中
Figure FDA00000478620800000411
Figure FDA00000478620800000412
分别表示对应行为y=1和y=0在训练集中的隐行为状态的平均值,具体的计算方法如下:
z &OverBar; - = &Sigma; t = 1 T &Sigma; i = 1 N z i t I ( y i t = 0 ) &Sigma; t = 1 T &Sigma; i = 1 N I ( y i t = 0 )
z &OverBar; + = &Sigma; t = 1 T &Sigma; i = 1 N z i t I ( y i t = 1 ) &Sigma; t = 1 T &Sigma; i = 1 N I ( y i t = 1 )
其中,I为示性函数,示性函数
Figure FDA00000478620800000415
表示用户表现了隐行为状态,
Figure FDA0000047862080000051
表示用户没有表现出隐行为状态。
CN2011100458957A 2011-02-24 2011-02-24 动态社会网络用户行为的预测方法 Pending CN102117325A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100458957A CN102117325A (zh) 2011-02-24 2011-02-24 动态社会网络用户行为的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100458957A CN102117325A (zh) 2011-02-24 2011-02-24 动态社会网络用户行为的预测方法

Publications (1)

Publication Number Publication Date
CN102117325A true CN102117325A (zh) 2011-07-06

Family

ID=44216095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100458957A Pending CN102117325A (zh) 2011-02-24 2011-02-24 动态社会网络用户行为的预测方法

Country Status (1)

Country Link
CN (1) CN102117325A (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982236A (zh) * 2012-11-07 2013-03-20 北京交通大学 一种通过网络用户建模的观点预测方法
CN102999617A (zh) * 2012-11-29 2013-03-27 华东师范大学 一种基于流体模型的微博传播分析方法
CN103077240A (zh) * 2013-01-10 2013-05-01 北京工商大学 一种基于概率图模型的微博水军识别方法
CN103502975A (zh) * 2012-03-26 2014-01-08 邻客音公司 对社交图进行杠杆作用以便与电子消息传递一起使用
CN103678474A (zh) * 2013-09-24 2014-03-26 浙江大学 一种在社交网络中快速获取大量热门话题的方法
CN104899657A (zh) * 2015-06-09 2015-09-09 北京邮电大学 社团融合事件的预测方法
CN105404943A (zh) * 2015-12-08 2016-03-16 南京邮电大学 一种面向移动社交环境的用户行为预测方法
WO2016165058A1 (en) * 2015-04-13 2016-10-20 Hewlett-Packard Development Company,L.P. Social prediction
CN106339769A (zh) * 2015-07-08 2017-01-18 北京大学 一种面向移动社会网络的用户出行预测方法
CN106372072A (zh) * 2015-07-20 2017-02-01 北京大学 一种基于位置的移动社会网络用户关系的识别方法
CN106507406A (zh) * 2016-11-30 2017-03-15 四川九洲电器集团有限责任公司 一种无线网络的设备接入数的预测方法及设备
CN106600052A (zh) * 2016-12-12 2017-04-26 西安交通大学 一种基于时空轨迹的用户属性与社会网络检测系统
CN106600053A (zh) * 2016-12-12 2017-04-26 西安交通大学 一种基于时空轨迹和社会网络的用户属性预测系统
CN106708871A (zh) * 2015-11-16 2017-05-24 阿里巴巴集团控股有限公司 一种社交业务特征用户的识别方法和装置
CN106910013A (zh) * 2017-02-16 2017-06-30 中国科学院自动化研究所 基于动态表达学习的不实信息检测方法和装置
CN107808168A (zh) * 2017-10-31 2018-03-16 北京科技大学 一种基于强弱关系的社交网络用户行为预测方法
CN107908700A (zh) * 2017-11-06 2018-04-13 余帝乾 一种微博用户行为分析预测的方法
CN108197424A (zh) * 2018-01-11 2018-06-22 西安交通大学 大规模网络教育中网络学习行为幂律分布概率建模方法
CN108230170A (zh) * 2017-12-20 2018-06-29 重庆邮电大学 面向社交网络的多信息和多维网络信息传播模型及方法
US10027778B2 (en) 2012-11-08 2018-07-17 Microsoft Technology Licensing, Llc Skills endorsements
CN108446374A (zh) * 2018-03-16 2018-08-24 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质
CN109033815A (zh) * 2018-06-15 2018-12-18 国网浙江省电力有限公司 基于矩阵分解的Webshell检测方法
CN109564582A (zh) * 2016-08-16 2019-04-02 索尼公司 信息处理系统和信息处理方法
CN110262855A (zh) * 2019-05-28 2019-09-20 东华大学 车联网中基于背景信息的成员推测攻击原型系统
CN112288195A (zh) * 2020-11-24 2021-01-29 北京智源人工智能研究院 基于好友行为预测中心用户行为的方法、装置和电子设备
CN113570204A (zh) * 2021-07-06 2021-10-29 北京淇瑀信息科技有限公司 用户行为预测方法、系统和计算机设备
CN114169738A (zh) * 2021-12-02 2022-03-11 天津大学 一种基于价值驱动的平台算法进行行为分析系统

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103502975B (zh) * 2012-03-26 2017-12-26 邻客音公司 对社交图进行杠杆作用以便与电子消息传递一起使用
CN103502975A (zh) * 2012-03-26 2014-01-08 邻客音公司 对社交图进行杠杆作用以便与电子消息传递一起使用
US9971993B2 (en) 2012-03-26 2018-05-15 Microsoft Technology Licensing, Llc Leveraging a social graph for use with electronic messaging
CN102982236B (zh) * 2012-11-07 2016-04-06 北京交通大学 一种通过网络用户建模的观点预测方法
CN102982236A (zh) * 2012-11-07 2013-03-20 北京交通大学 一种通过网络用户建模的观点预测方法
US10027778B2 (en) 2012-11-08 2018-07-17 Microsoft Technology Licensing, Llc Skills endorsements
US10397364B2 (en) 2012-11-08 2019-08-27 Microsoft Technology Licensing, Llc Skills endorsements
CN102999617B (zh) * 2012-11-29 2016-12-21 华东师范大学 一种基于流体模型的微博传播分析方法
CN102999617A (zh) * 2012-11-29 2013-03-27 华东师范大学 一种基于流体模型的微博传播分析方法
CN103077240B (zh) * 2013-01-10 2015-09-23 北京工商大学 一种基于概率图模型的微博水军识别方法
CN103077240A (zh) * 2013-01-10 2013-05-01 北京工商大学 一种基于概率图模型的微博水军识别方法
CN103678474A (zh) * 2013-09-24 2014-03-26 浙江大学 一种在社交网络中快速获取大量热门话题的方法
WO2016165058A1 (en) * 2015-04-13 2016-10-20 Hewlett-Packard Development Company,L.P. Social prediction
CN104899657A (zh) * 2015-06-09 2015-09-09 北京邮电大学 社团融合事件的预测方法
CN106339769A (zh) * 2015-07-08 2017-01-18 北京大学 一种面向移动社会网络的用户出行预测方法
CN106372072A (zh) * 2015-07-20 2017-02-01 北京大学 一种基于位置的移动社会网络用户关系的识别方法
CN106708871B (zh) * 2015-11-16 2020-08-11 阿里巴巴集团控股有限公司 一种社交业务特征用户的识别方法和装置
CN106708871A (zh) * 2015-11-16 2017-05-24 阿里巴巴集团控股有限公司 一种社交业务特征用户的识别方法和装置
CN105404943A (zh) * 2015-12-08 2016-03-16 南京邮电大学 一种面向移动社交环境的用户行为预测方法
US11778060B2 (en) 2016-08-16 2023-10-03 Sony Corporation Information processing system and information processing method
CN109564582A (zh) * 2016-08-16 2019-04-02 索尼公司 信息处理系统和信息处理方法
CN106507406B (zh) * 2016-11-30 2020-01-07 四川九洲电器集团有限责任公司 一种无线网络的设备接入数的预测方法及设备
CN106507406A (zh) * 2016-11-30 2017-03-15 四川九洲电器集团有限责任公司 一种无线网络的设备接入数的预测方法及设备
CN106600052A (zh) * 2016-12-12 2017-04-26 西安交通大学 一种基于时空轨迹的用户属性与社会网络检测系统
CN106600053A (zh) * 2016-12-12 2017-04-26 西安交通大学 一种基于时空轨迹和社会网络的用户属性预测系统
CN106600052B (zh) * 2016-12-12 2020-04-10 西安交通大学 一种基于时空轨迹的用户属性与社会网络检测系统
CN106600053B (zh) * 2016-12-12 2020-04-10 西安交通大学 一种基于时空轨迹和社会网络的用户属性预测系统
CN106910013A (zh) * 2017-02-16 2017-06-30 中国科学院自动化研究所 基于动态表达学习的不实信息检测方法和装置
CN107808168A (zh) * 2017-10-31 2018-03-16 北京科技大学 一种基于强弱关系的社交网络用户行为预测方法
CN107908700A (zh) * 2017-11-06 2018-04-13 余帝乾 一种微博用户行为分析预测的方法
CN108230170A (zh) * 2017-12-20 2018-06-29 重庆邮电大学 面向社交网络的多信息和多维网络信息传播模型及方法
CN108197424A (zh) * 2018-01-11 2018-06-22 西安交通大学 大规模网络教育中网络学习行为幂律分布概率建模方法
CN108446374A (zh) * 2018-03-16 2018-08-24 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质
CN109033815A (zh) * 2018-06-15 2018-12-18 国网浙江省电力有限公司 基于矩阵分解的Webshell检测方法
CN110262855A (zh) * 2019-05-28 2019-09-20 东华大学 车联网中基于背景信息的成员推测攻击原型系统
CN112288195A (zh) * 2020-11-24 2021-01-29 北京智源人工智能研究院 基于好友行为预测中心用户行为的方法、装置和电子设备
CN112288195B (zh) * 2020-11-24 2021-08-31 北京智谱华章科技有限公司 基于好友行为预测中心用户行为的方法、装置和电子设备
CN113570204A (zh) * 2021-07-06 2021-10-29 北京淇瑀信息科技有限公司 用户行为预测方法、系统和计算机设备
CN114169738A (zh) * 2021-12-02 2022-03-11 天津大学 一种基于价值驱动的平台算法进行行为分析系统
CN114169738B (zh) * 2021-12-02 2024-08-02 天津大学 一种基于价值驱动的平台算法进行行为分析系统

Similar Documents

Publication Publication Date Title
CN102117325A (zh) 动态社会网络用户行为的预测方法
Yang et al. Social collaborative filtering by trust
Chen et al. Time-aware smart object recommendation in social internet of things
CN106649659B (zh) 一种面向社交网络的链接预测系统及方法
Wang et al. Users’ mobility enhances information diffusion in online social networks
CN111241421B (zh) 基于社交上下文信息的用户转发行为预测方法
Hou et al. Prediction methods and applications in the science of science: A survey
Zhang et al. Recurrent tensor factorization for time-aware service recommendation
CN113326425B (zh) 一种基于结构和语义注意力堆叠的会话推荐方法及系统
Gong et al. Efficient parallel computing on the game theory-aware robust influence maximization problem
CN113918833A (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
Jamali et al. A generalized stochastic block model for recommendation in social rating networks
Cao et al. Multi-feature based event recommendation in event-based social network
Chen et al. A temporal recommendation mechanism based on signed network of user interest changes
Shirvani Novel solutions and applications of the object partitioning problem
Gong et al. Hybrid deep neural networks for friend recommendations in edge computing environment
Zhang et al. R $^{2} $ fed: resilient reinforcement federated learning for industrial applications
Zhou et al. Betweenness centrality-based community adaptive network representation for link prediction
CN113918834A (zh) 融合社交关系的图卷积协同过滤推荐方法
Ren et al. An improved spectral clustering community detection algorithm based on probability matrix
Goode et al. Pricing a protest: Forecasting the dynamics of civil unrest activity in social media
Meng et al. POI recommendation for occasional groups Based on hybrid graph neural networks
Kumar et al. Graph Convolutional Neural Networks for Link Prediction in Social Networks
Chantamunee et al. Collaborative filtering for personalised facet selection
Fang et al. A context-aware matrix factorization recommender algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110706