CN103077247A - 一种社交网络中的朋友关系传递树的建立方法 - Google Patents

一种社交网络中的朋友关系传递树的建立方法 Download PDF

Info

Publication number
CN103077247A
CN103077247A CN2013100269653A CN201310026965A CN103077247A CN 103077247 A CN103077247 A CN 103077247A CN 2013100269653 A CN2013100269653 A CN 2013100269653A CN 201310026965 A CN201310026965 A CN 201310026965A CN 103077247 A CN103077247 A CN 103077247A
Authority
CN
China
Prior art keywords
node
friend
self
intermediary
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100269653A
Other languages
English (en)
Other versions
CN103077247B (zh
Inventor
王建民
王朝坤
张君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201310026965.3A priority Critical patent/CN103077247B/zh
Publication of CN103077247A publication Critical patent/CN103077247A/zh
Application granted granted Critical
Publication of CN103077247B publication Critical patent/CN103077247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种社交网络中的朋友关系传递树的建立方法,属于计算机数据挖掘技术领域。为每个自我节点建立朋友关系传递树,添加自我节点和朋友节点。在每个时间段,建立社交行为概率生成模型,初始化自我节点的中介偏好概率分布和好友关系强度分布的先验参数以及每个自我节点和新朋友节点的候选中介人,并不断迭代更新候选中介人,将迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的社交网络中添加z→y。本发明方法基于好友关系传递性对用户在社交网络中的行为进行建模,提供扁平社交网络的层次化呈现方法,便于深入分析社交网络的成因与内在结构,预测社交网络未来的发展与变化。

Description

一种社交网络中的朋友关系传递树的建立方法
技术领域
本发明涉及一种社交网络中的朋友关系传递树的建立方法,属于计算机数据挖掘技术领域。
背景技术
社交网络在近些年得到了飞速的发展,也受到了许多研究人员的重视。其中社交网络的形成与演化过程研究一直都是一项有意义而且有挑战的工作。已有的工作主要从两个方面来研究社交网络的形成与演化。一方面,人们以社交网络演化中在某一时刻的快照或者多个时刻的快照为对象,研究社交网络的宏观结构特征变化;另一方面,人们关注社交网络发展的微观模式,并发现了许多的模式用以解释和分析人们如何交朋友。这样的模式包括偏好依附(Preferential Attachment)、三元闭合(triadic closure)、互惠(Reciprocity)、同质性(Homophily)等等,其中三元闭合(triadic closure)是社交网络的链接形成中最普遍的现象之一,其社会学原理是朋友关系的传递性(thetransitivity of friendship),即两个有公共朋友的人更可能成为朋友。朋友关系的传递性已经被证明可以用于对网络演化过程进行建模以及预测未来的链接形成,然而这一性质在网络演化过程中所起的作用并没有得到很深的探究。
学者Simmel分析了在这样三元结构中三个参与者的角色,并且指出第三个人一般扮演着中介人或者协调者的作用。然而,其中还是不清楚第三个人是如何影响、促使另外两个人成为朋友的。学者D.Yin等人在链接预测问题中考虑了中介人的作用,并且把链接产生看作是中间人“潜在的推荐”的结果。他们在矩阵分解中引入了中介人潜在推荐这一潜在的维度,然而这一分析是对于静态网络进行的,没有考虑到网络的发展以及中介人在微观上对于网络中每一条链接形成的影响。
好友推荐是交友网站中的一项重要的功能,许多交友网站依靠为用户推荐好友来吸引用户、增强用户对交友网站的依赖性。目前研究者已经提出了许多算法来解决好友推荐的问题,比如随机游走算法、有监督的随机游走算法、矩阵分解算法等等,然而这些算法都把社交网络当作一个图来处理,并没有考虑到用户的动机和行为在好友推荐中的重要作用。
发明内容
本发明的目的是提出一种社交网络中的朋友关系传递树的建立方法,通过对用户的行为进行建模,基于朋友关系的传递性来推测和表达社交网络的形成和演化过程,从而便于对社交网络未来发展情况进行预测。
本发明提出的社交网络中的朋友关系传递树的建立方法,包括以下步骤:
(1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点u,将该用户的朋友记为朋友节点v,为社交网络中的自我节点u,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;
(2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,对于与第i段交互对应的时间段Ti,执行步骤(3)-(9),i=1,2,……,N;
(3)对于时间段Ti,建立如下社交行为概率生成模型:
(3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为Vu,社交网络中每个自我节点u的新交朋友数为Nu
(3-2)分别用先验参数为
Figure BDA00002774708000021
的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布
(3-3)从上述好友关系强度分布
Figure BDA00002774708000023
中,采样得到社交网络中每个自我节点u的每次交互对象x;
(3-4)分别用先验参数为
Figure BDA00002774708000024
的狄利克雷分布表示社交网络中每个自我节点u的中介偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布
Figure BDA00002774708000025
(3-5)分别从上述中介偏好概率分布
Figure BDA00002774708000026
中采样得到社交网络中每个自我节点u的中介人z,从与中介人z对应的好友关系强度分布中采样得到社交网络中自我节点u的新朋友节点y;
(3-6)用
Figure BDA00002774708000028
表示社交网络中自我节点u在时间段Ti的朋友节点集合,用
Figure BDA00002774708000029
表示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用
Figure BDA00002774708000031
表示在时间段Ti中介人z选择z的朋友y′交互的次数,用
Figure BDA00002774708000032
表示在时间段Ti中介人z将朋友y′推荐给别人的次数;
(4)对于时间段Ti
若上一时间段Ti-1之前,社交网络自我节点u和朋友节点v已经是朋友,则先验参数和先验参数
Figure BDA00002774708000034
分别为:
α u , v ( T i ) = λ · α u , v ( T i - 1 ) + Ω u , v ( T i - 1 )
β u , v ( T i ) = λ · β u , v ( T i - 1 ) + Λ u , v ( T i - 1 ) + ψ u , v ( T i - 1 )
其中,
Figure BDA00002774708000037
表示在时间段Ti-1自我节点u选择朋友v作为中介人的次数,
Figure BDA00002774708000038
表示在时间段Ti-1自我节点u作为中介人与朋友节点v交互的次数,表示在时间段Ti-1自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为0~1,为在Ti-1时间段自我节点u的中介偏好概率分布
Figure BDA000027747080000311
的先验参数中与朋友节点v相应的先验值,为在Ti-1时间段自我节点u的好友关系强度分布先验参数中与朋友节点v相应的先验值;
若自我节点u和朋友节点v是上一时间段Ti-1中的新朋友,则先验参数
Figure BDA000027747080000314
和先验参数
Figure BDA000027747080000315
分别为:
α u , v ( T i ) = κ · α u , z ( T i ) + α 0
β u , v ( T i ) = κ · β u , z ( T i ) + β 0
其中中介人z是自我节点u认识朋友节点v的中介人,κ为权重系数,取值范围为0~1,α0和β0分别为先验参数的预设值,α0和β0分别为正数;
(5)对于时间段Ti,若自我节点u和自我节点u的新朋友节点y有共同朋友,则从共同朋友中随机选择共同朋友z作为自我节点u与新朋友节点y之间的候选中介人,记录共同朋友z被选为自我节点u与新朋友节点y之间的候选中介人的次数为1,若自我节点u和自我节点u的新朋友节点y没有共同朋友,则选择自我节点u作为自我节点u与新朋友节点y之间的候选中介人;
(6)对于时间段Ti
若自我节点u与自我节点u的新朋友节点y有共同朋友,则按照下式计算共同朋友z′作为自我节点u与新朋友节点y之间的中介人z的概率
Figure BDA00002774708000041
p ( T i ) ( z = z ′ | u , y ) = α u , z ′ ( T i ) + Ω u , z ′ ( T i ) - 1 Σ v ∈ F ( T i ) ( u ) ( α u , v ( T i ) + Ω u , v ( T i ) ) - 1 · β z ′ , y ( T i ) + Λ z ′ , y ( T i ) + ψ z ′ , y ( T i ) - 1 Σ y ′ ∈ F ( T i ) ( z ′ ) ( β z ′ , y ′ ( T i ) + Λ z ′ , y ′ ( T i ) + ψ z ′ , y ′ ( T i ) ) - 1
其中,
Figure BDA00002774708000043
表示在时间段Ti自我节点u选择共同朋友z′作为中介人的次数,
Figure BDA00002774708000044
表示在时间段Ti共同朋友z′作为中介人与自我节点u的新朋友节点y交互的次数,
Figure BDA00002774708000045
表示在时间段Ti共同朋友z′作为中介人将自我节点u的新朋友节点y推荐给社交网络中其他用户的次数,
Figure BDA00002774708000046
为在Ti时间段自我节点u的中介偏好概率分布
Figure BDA00002774708000047
的先验参数中与共同朋友z′相应的先验值,
Figure BDA00002774708000048
为在Ti时间段自我节点z′的好友关系强度分布φz′先验参数中与朋友节点y相应的先验值,v为在Ti时间段自我节点u的朋友节点,y′为在Ti时间段共同朋友z′的朋友节点,
Figure BDA00002774708000049
表示在时间段Ti自我节点u选择朋友v作为中介人的次数,
Figure BDA000027747080000410
表示在时间段Ti共同朋友z′作为中介人与z′的朋友节点y′交互的次数,
Figure BDA000027747080000411
表示在时间段Ti共同朋友z′作为中介人将z′的朋友节点y′推荐给社交网络中其他用户的次数,
Figure BDA000027747080000412
为在Ti时间段自我节点u的中介偏好概率分布
Figure BDA000027747080000413
的先验参数中与朋友节点v相应的先验值,
Figure BDA000027747080000414
为在Ti时间段自我节点z′的好友关系强度分布
Figure BDA000027747080000415
先验参数中与朋友节点y′相应的先验值;
根据得到的概率,采样确定自我节点u与新朋友节点y之间的新候选中介人z,并在记录中介人z被选为自我节点u与新朋友节点y之间的候选中介人的次数上增加1,进行步骤(7);
若自我节点u与自我节点u的新朋友节点y没有共同朋友,则保持步骤(5)的候选中介人不变,进行步骤(7);
(7)按照下式,分别计算自我节点u的中介偏好概率分布
Figure BDA000027747080000416
和好友关系强度分布
Figure BDA000027747080000417
θ u , v ( T i ) = α u , v ( T i ) + Ω u , v ( T i ) Σ v ′ ∈ F ( T i ) ( u ) ( α u , v ′ ( T i ) + Ω u , v ′ ( T i ) )
φ u , v ( T i ) = β u . v ( T i - 1 ) + Λ u . v ( T i - 1 ) + ψ u . v ( T i - 1 ) Σ v ′ ∈ F ( T i ) ( z ) ( β u . v ′ ( T i - 1 ) + Λ u . v ′ ( T i - 1 ) + ψ u . v ′ ( T i - 1 ) )
其中,
Figure BDA00002774708000051
表示在时间段Ti自我节点u选择朋友v作为中介人的次数,
Figure BDA00002774708000052
表示在时间段Ti自我节点u作为中介人与朋友节点v交互的次数,
Figure BDA00002774708000053
表示在时间段Ti自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,为在Ti时间段自我节点u的中介偏好概率分布
Figure BDA00002774708000055
的先验参数中与朋友节点v相应的先验值,
Figure BDA00002774708000056
为在Ti时间段自我节点u的好友关系强度分布
Figure BDA00002774708000057
先验参数中与朋友节点v相应的先验值;
根据以上得到的自我节点u的中介偏好概率分布
Figure BDA00002774708000058
和好友关系强度分布
Figure BDA00002774708000059
和上一轮迭代后计算所得到的中介偏好概率分布和好友关系强度分布
Figure BDA000027747080000511
分别计算中介偏好概率分布变化量Δθ和好友关系强度分布变化量Δφ
Δ θ = Σ u Σ v ∈ F ( T i ) ( u ) ( θ u , v ( T i ) - θ ′ u , v ( T i ) ) 2
Δ φ = Σ u Σ v ∈ F ( T i ) ( u ) ( φ u , v ( T i ) - φ ′ u , v ( T i ) ) 2
设定一个变化量阈值,若Δθ和Δφ同时小于指定阈值,则进行步骤(8);若Δθ和Δφ中的任何一个大于或等于指定阈值,则设
Figure BDA000027747080000514
并返回步骤(6);
(9)在时间段Ti,对于自我节点u与自我节点u的新朋友节点y,将步骤(5)迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的朋友关系传递树中添加一条边z→y;
(10)遍历所有时间段,得到社交网络中每个自我节点u的朋友关系传递树。
本发明提出的社交网络中的朋友关系传递树的建立方法,其优点是:
1、本发明方法建立的社交网络中的朋友关系传递树,从好友关系传递性的角度出发,提供了对于传统上扁平结构的社交网络的层次化呈现方法,便于深入分析社交网络的成因与内在结构,以及预测社交网络未来的发展与变化,从而为交友网站的设计与运营提供参考。
2、本发明方法基于社会学原理,对用户在社交网络中的行为进行合理建模,在考虑用户的交友行为时,不仅考虑用户对于朋友的偏好,还考虑用户在选择朋友时对于中介人的偏好,可以更准确地预测用户未来的交友行为,从而可以为交友网站提供更准确的好友推荐结果。
3、本发明方法能够体现出用户的交友行为与习惯在不同时间的变化情况,从而可以更好地用于预测用户在不同时间的交友行为,以及整个社交网络在不同时间的演化情况,可以使得交友网站能够根据用户的行为变化在不同时间为用户推荐最合适的新朋友。
4、本发明方法采用了吉布斯采样法进行模型的求解,执行速度快,可扩展性强。
附图说明
图1是一个典型的自我中心网络示意图。
图2是本发明提出的社交网络中的朋友关系传递树的示意图。
图3是本发明方法中建立的社交行为概率生成模型的示意图。
具体实施方式
本发明提出的社交网络中的朋友关系传递树的建立方法,其最后建立的树状网络如图2所示,包括以下步骤:
(1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点u,将该用户的朋友记为朋友节点v,为社交网络中的自我节点u,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;
(2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,交互数据包括用户与朋友建立朋友关系和用户与朋友的信息交流,对于与第i段交互对应的时间段Ti,执行步骤(3)-(9),i=1,2,……,N;
(3)对于时间段Ti,建立如下社交行为概率生成模型:
(3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为Vu,社交网络中每个自我节点u的新交朋友数为Nu
(3-2)分别用先验参数为
Figure BDA00002774708000061
的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布
Figure BDA00002774708000062
(3-3)从上述好友关系强度分布
Figure BDA00002774708000063
中,采样得到社交网络中每个自我节点u的每次交互对象x;
(3-4)分别用先验参数为
Figure BDA00002774708000064
的狄利克雷分布表示社交网络中每个自我节点u的中介偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布
Figure BDA00002774708000071
(3-5)分别从上述中介偏好概率分布中采样得到社交网络中每个自我节点u的中介人z,从与中介人z对应的好友关系强度分布
Figure BDA00002774708000073
中采样得到社交网络中自我节点u的新朋友节点y;
(3-6)用
Figure BDA000027747080000722
表示社交网络中自我节点u在时间段Ti的朋友节点集合,用
Figure BDA00002774708000074
表示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用
Figure BDA00002774708000075
表示在时间段Ti中介人z选择z的朋友y′交互的次数,用
Figure BDA00002774708000076
表示在时间段Ti中介人z将朋友y′推荐给别人的次数;
(4)对于时间段Ti
若上一时间段Ti-1之前,社交网络自我节点u和朋友节点v已经是朋友,则先验参数
Figure BDA00002774708000077
和先验参数分别为:
α u , v ( T i ) = λ · α u , v ( T i - 1 ) + Ω u , v ( T i - 1 )
β u , v ( T i ) = λ · β u , v ( T i - 1 ) + Λ u , v ( T i - 1 ) + ψ u , v ( T i - 1 )
其中,
Figure BDA000027747080000711
表示在时间段Ti-1自我节点u选择朋友v作为中介人的次数,
Figure BDA000027747080000712
表示在时间段Ti-1自我节点u作为中介人与朋友节点v交互的次数,
Figure BDA000027747080000713
表示在时间段Ti-1自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为0~1,
Figure BDA000027747080000714
为在Ti-1时间段自我节点u的中介偏好概率分布
Figure BDA000027747080000715
的先验参数中与朋友节点v相应的先验值,
Figure BDA000027747080000716
为在Ti-1时间段自我节点u的好友关系强度分布
Figure BDA000027747080000717
先验参数中与朋友节点v相应的先验值;
若自我节点u和朋友节点v是上一时间段Ti-1中的新朋友,则先验参数
Figure BDA000027747080000718
和先验参数
Figure BDA000027747080000719
分别为:
α u , v ( T i ) = κ · α u , z ( T i ) + α 0
β u , v ( T i ) = κ · β u , z ( T i ) + β 0
其中中介人z是自我节点u认识朋友节点v的中介人,κ为权重系数,取值范围为0~1,α0和β0分别为先验参数的预设值,α0和β0分别为正数;
(5)对于时间段Ti,若自我节点u和自我节点u的新朋友节点y有共同朋友,则从共同朋友中随机选择共同朋友z作为自我节点u与新朋友节点y之间的候选中介人,记录共同朋友z被选为自我节点u与新朋友节点y之间的候选中介人的次数为1,若自我节点u和自我节点u的新朋友节点y没有共同朋友,则选择自我节点u作为自我节点u与新朋友节点y之间的候选中介人;
(6)对于时间段Ti
若自我节点u与自我节点u的新朋友节点y有共同朋友,则按照下式计算共同朋友z′作为自我节点u与新朋友节点y之间的中介人z的概率
Figure BDA00002774708000081
p ( T i ) ( z = z ′ | u , y ) = α u , z ′ ( T i ) + Ω u , z ′ ( T i ) - 1 Σ v ∈ F ( T i ) ( u ) ( α u , v ( T i ) + Ω u , v ( T i ) ) - 1 · β z ′ , y ( T i ) + Λ z ′ , y ( T i ) + ψ z ′ , y ( T i ) - 1 Σ y ′ ∈ F ( T i ) ( z ′ ) ( β z ′ , y ′ ( T i ) + Λ z ′ , y ′ ( T i ) + ψ z ′ , y ′ ( T i ) ) - 1
其中,
Figure BDA00002774708000083
表示在时间段Ti自我节点u选择共同朋友z′作为中介人的次数,
Figure BDA00002774708000084
表示在时间段Ti共同朋友z′作为中介人与自我节点u的新朋友节点y交互的次数,
Figure BDA00002774708000085
表示在时间段Ti共同朋友z′作为中介人将自我节点u的新朋友节点y推荐给社交网络中其他用户的次数,为在Ti时间段自我节点u的中介偏好概率分布
Figure BDA00002774708000087
的先验参数中与共同朋友z′相应的先验值,
Figure BDA00002774708000088
为在Ti时间段自我节点z′的好友关系强度分布φz′先验参数中与朋友节点y相应的先验值,v为在Ti时间段自我节点u的朋友节点,y′为在Ti时间段共同朋友z′的朋友节点,
Figure BDA00002774708000089
表示在时间段Ti自我节点u选择朋友v作为中介人的次数,
Figure BDA000027747080000810
表示在时间段Ti共同朋友z′作为中介人与z′的朋友节点y′交互的次数,
Figure BDA000027747080000811
表示在时间段Ti共同朋友z′作为中介人将z′的朋友节点y′推荐给社交网络中其他用户的次数,
Figure BDA000027747080000812
为在Ti时间段自我节点u的中介偏好概率分布
Figure BDA000027747080000813
的先验参数中与朋友节点v相应的先验值,为在Ti时间段自我节点z′的好友关系强度分布
Figure BDA000027747080000815
先验参数中与朋友节点y′相应的先验值;
根据得到的概率,采样确定自我节点u与新朋友节点y之间的新候选中介人z,并在记录中介人z被选为自我节点u与新朋友节点y之间的候选中介人的次数上增加1,进行步骤(7);
若自我节点u与自我节点u的新朋友节点y没有共同朋友,则保持步骤(5)的候选中介人不变,进行步骤(7);
(7)按照下式,分别计算自我节点u的中介偏好概率分布
Figure BDA00002774708000091
和好友关系强度分布
Figure BDA00002774708000092
θ u , v ( T i ) = α u , v ( T i ) + Ω u , v ( T i ) Σ v ′ ∈ F ( T i ) ( u ) ( α u , v ′ ( T i ) + Ω u , v ′ ( T i ) )
φ u , v ( T i ) = β u . v ( T i - 1 ) + Λ u . v ( T i - 1 ) + ψ u . v ( T i - 1 ) Σ v ′ ∈ F ( T i ) ( z ) ( β u . v ′ ( T i - 1 ) + Λ u . v ′ ( T i - 1 ) + ψ u . v ′ ( T i - 1 ) )
其中,
Figure BDA00002774708000095
表示在时间段Ti自我节点u选择朋友v作为中介人的次数,
Figure BDA00002774708000096
表示在时间段Ti自我节点u作为中介人与朋友节点v交互的次数,
Figure BDA00002774708000097
表示在时间段Ti自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,
Figure BDA00002774708000098
为在Ti时间段自我节点u的中介偏好概率分布
Figure BDA00002774708000099
的先验参数中与朋友节点v相应的先验值,
Figure BDA000027747080000910
为在Ti时间段自我节点u的好友关系强度分布
Figure BDA000027747080000911
先验参数中与朋友节点v相应的先验值;
根据以上得到的自我节点u的中介偏好概率分布
Figure BDA000027747080000912
和好友关系强度分布和上一轮迭代后计算所得到的中介偏好概率分布
Figure BDA000027747080000914
和好友关系强度分布
Figure BDA000027747080000915
分别计算中介偏好概率分布变化量Δθ和好友关系强度分布变化量Δφ
Δ θ = Σ u Σ v ∈ F ( T i ) ( u ) ( θ u , v ( T i ) - θ ′ u , v ( T i ) ) 2
Δ φ = Σ u Σ v ∈ F ( T i ) ( u ) ( φ u , v ( T i ) - φ ′ u , v ( T i ) ) 2
设定一个变化量阈值,若Δθ和Δφ同时小于指定阈值,则进行步骤(8);若Δθ和Δφ中的任何一个大于或等于指定阈值,则设
Figure BDA000027747080000918
并返回步骤(6);
(9)在时间段Ti,对于自我节点u与自我节点u的新朋友节点y,将步骤(5)迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的朋友关系传递树中添加一条边z→y;
(10)遍历所有时间段,得到社交网络中每个自我节点u的朋友关系传递树。
本发明提出的社交网络中的朋友关系传递树(Latent Friendship Transitivity Tree,下文简称LaFT-Tree)是针对于自我中心网络(Egocentric Network)而定义的。自我中心网络指环绕在自我周围的社会网络,它既包括自我与他人的直接联结,也包括这些与自我联结的他人之间的联结。自我中心网络一般包含一个自我节点(ego),以及该自我节点在社交网络中的朋友。典型的一个自我中心网络例子如图1所示,其中节点v1是自我节点,其他节点都是v1的朋友。在自我中心网络中,所有的朋友都与自我节点直接相连,形成一种扁平化的结构。这一结构无法体现出不同的朋友在v1的社交网络中的影响与作用,也无法体现出v1的自我中心网络的形成过程与未来演化趋势。因此我们提出了LaFT-Tree,来层次化地表达自我中心网络的形成过程。LaFT-Tree是一个树状结构,其根节点就是自我中心网络的自我节点,而每一个叶节点和分支节点都是自我节点的朋友。树中的每一条边u->v都表示自我节点是通过u认识了v;如果u是自我节点,那么这一条边表示自我节点直接认识了v。LaFT-Tree的一个例子如图2所示,它描述了如图v1所示的自我中心网络的一种可能的形成过程:v1直接认识了v2,然后通过v2认识了v4和v9;v1直接认识了v1,然后通过v1认识了v3、v6和v14;等等。在LaFT-Tree中离根节点越远的节点表示他认识根节点的时间越晚。
本发明提出的社交行为概率生成模型命名为LaFT-LDA。LaFT-LDA是一个概率生成模型,它假设每个用户在社交网络中的交友行为包括两个步骤:一是选择一位朋友作为中介人,二是选择这位中介人的一个朋友作为自己的新朋友。模型的图形化表示如图3所示。在图中,U表示社交网络中总用户数,Nu表示每个用户u新交的朋友数,Vu表示每个用户u与他的朋友们的交互数。θ是每个用户的中介偏好概率分布,φ是每个用户的好友关系强度分布,α,β分别是θ,φ的先验分布。

Claims (1)

1.一种社交网络中的朋友关系传递树的建立方法,其特征在于该方法包括以下步骤:
(1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点u,将该用户的朋友记为朋友节点v,为社交网络中的自我节点u,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;
(2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,对于与第i段交互对应的时间段Ti,执行步骤(3)-(9),i=1,2,……,N;
(3)对于时间段Ti,建立如下社交行为概率生成模型:
(3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为Vu,社交网络中每个自我节点u的新交朋友数为Nu
(3-2)分别用先验参数为
Figure FDA00002774707900011
的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布
Figure FDA00002774707900012
(3-3)从上述好友关系强度分布
Figure FDA00002774707900013
中,采样得到社交网络中每个自我节点u的每次交互对象x;
(3-4)分别用先验参数为的狄利克雷分布表示社交网络中每个自我节点u的中介偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布
Figure FDA00002774707900015
(3-5)分别从上述中介偏好概率分布
Figure FDA00002774707900016
中采样得到社交网络中每个自我节点u的中介人z,从与中介人z对应的好友关系强度分布
Figure FDA00002774707900017
中采样得到社交网络中自我节点u的新朋友节点y;
(3-6)用表示社交网络中自我节点u在时间段Ti的朋友节点集合,用
Figure FDA00002774707900019
表示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用
Figure FDA000027747079000110
表示在时间段Ti中介人z选择z的朋友y′交互的次数,用
Figure FDA000027747079000111
表示在时间段Ti中介人z将朋友y′推荐给别人的次数;
(4)对于时间段Ti
若上一时间段Ti-1之前,社交网络自我节点u和朋友节点v已经是朋友,则先验参数
Figure FDA00002774707900021
和先验参数
Figure FDA00002774707900022
分别为:
α u , v ( T i ) = λ · α u , v ( T i - 1 ) + Ω u , v ( T i - 1 )
β u , v ( T i ) = λ · β u , v ( T i - 1 ) + Λ u , v ( T i - 1 ) + ψ u , v ( T i - 1 )
其中,
Figure FDA00002774707900025
表示在时间段Ti-1自我节点u选择朋友v作为中介人的次数,
Figure FDA00002774707900026
表示在时间段Ti-1自我节点u作为中介人与朋友节点v交互的次数,表示在时间段Ti-1自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为0~1,
Figure FDA00002774707900028
为在Ti-1时间段自我节点u的中介偏好概率分布
Figure FDA00002774707900029
的先验参数中与朋友节点v相应的先验值,
Figure FDA000027747079000210
为在Ti-1时间段自我节点u的好友关系强度分布
Figure FDA000027747079000211
先验参数中与朋友节点v相应的先验值;
若自我节点u和朋友节点v是上一时间段Ti-1中的新朋友,则先验参数和先验参数
Figure FDA000027747079000213
分别为:
α u , v ( T i ) = κ · α u , z ( T i ) + α 0
β u , v ( T i ) = κ · β u , z ( T i ) + β 0
其中中介人z是自我节点u认识朋友节点v的中介人,κ为权重系数,取值范围为0~1,α0和β0分别为先验参数的预设值,α0和β0分别为正数;
(5)对于时间段Ti,若自我节点u和自我节点u的新朋友节点y有共同朋友,则从共同朋友中随机选择共同朋友z作为自我节点u与新朋友节点y之间的候选中介人,记录共同朋友z被选为自我节点u与新朋友节点y之间的候选中介人的次数为1,若自我节点u和自我节点u的新朋友节点y没有共同朋友,则选择自我节点u作为自我节点u与新朋友节点y之间的候选中介人;
(6)对于时间段Ti
若自我节点u与自我节点u的新朋友节点y有共同朋友,则按照下式计算共同朋友z′作为自我节点u与新朋友节点y之间的中介人z的概率
Figure FDA000027747079000216
p ( T i ) ( z = z ′ | u , y ) = α u , z ′ ( T i ) + Ω u , z ′ ( T i ) - 1 Σ v ∈ F ( T i ) ( u ) ( α u , v ( T i ) + Ω u , v ( T i ) ) - 1 · β z ′ , y ( T i ) + Λ z ′ , y ( T i ) + ψ z ′ , y ( T i ) - 1 Σ y ′ ∈ F ( T i ) ( z ′ ) ( β z ′ , y ′ ( T i ) + Λ z ′ , y ′ ( T i ) + ψ z ′ , y ′ ( T i ) ) - 1
其中,
Figure FDA00002774707900031
表示在时间段Ti自我节点u选择共同朋友z′作为中介人的次数,
Figure FDA00002774707900032
表示在时间段Ti共同朋友z′作为中介人与自我节点u的新朋友节点y交互的次数,
Figure FDA00002774707900033
表示在时间段Ti共同朋友z′作为中介人将自我节点u的新朋友节点y推荐给社交网络中其他用户的次数,
Figure FDA00002774707900034
为在Ti时间段自我节点u的中介偏好概率分布的先验参数中与共同朋友z′相应的先验值,
Figure FDA00002774707900036
为在Ti时间段自我节点z′的好友关系强度分布φz′先验参数中与朋友节点y相应的先验值,v为在Ti时间段自我节点u的朋友节点,y′为在Ti时间段共同朋友z′的朋友节点,表示在时间段Ti自我节点u选择朋友v作为中介人的次数,
Figure FDA00002774707900038
表示在时间段Ti共同朋友z′作为中介人与z′的朋友节点y′交互的次数,
Figure FDA00002774707900039
表示在时间段Ti共同朋友z′作为中介人将z′的朋友节点y′推荐给社交网络中其他用户的次数,
Figure FDA000027747079000310
为在Ti时间段自我节点u的中介偏好概率分布
Figure FDA000027747079000311
的先验参数中与朋友节点v相应的先验值,
Figure FDA000027747079000312
为在Ti时间段自我节点z′的好友关系强度分布
Figure FDA000027747079000313
先验参数中与朋友节点y′相应的先验值;
根据得到的概率,采样确定自我节点u与新朋友节点y之间的新候选中介人z,并在记录中介人z被选为自我节点u与新朋友节点y之间的候选中介人的次数上增加1,进行步骤(7);
若自我节点u与自我节点u的新朋友节点y没有共同朋友,则保持步骤(5)的候选中介人不变,进行步骤(7);
(7)按照下式,分别计算自我节点u的中介偏好概率分布
Figure FDA000027747079000314
和好友关系强度分布
Figure FDA000027747079000315
θ u , v ( T i ) = α u , v ( T i ) + Ω u , v ( T i ) Σ v ′ ∈ F ( T i ) ( u ) ( α u , v ′ ( T i ) + Ω u , v ′ ( T i ) )
φ u , v ( T i ) = β u . v ( T i - 1 ) + Λ u . v ( T i - 1 ) + ψ u . v ( T i - 1 ) Σ v ′ ∈ F ( T i ) ( z ) ( β u . v ′ ( T i - 1 ) + Λ u . v ′ ( T i - 1 ) + ψ u . v ′ ( T i - 1 ) )
其中,
Figure FDA000027747079000318
表示在时间段Ti自我节点u选择朋友v作为中介人的次数,
Figure FDA000027747079000319
表示在时间段Ti自我节点u作为中介人与朋友节点v交互的次数,
Figure FDA000027747079000320
表示在时间段Ti自我节点u作为中介人将朋友节点v推荐给社交网络中其他用户的次数,
Figure FDA000027747079000321
为在Ti时间段自我节点u的中介偏好概率分布
Figure FDA00002774707900041
的先验参数中与朋友节点v相应的先验值,
Figure FDA00002774707900042
为在Ti时间段自我节点u的好友关系强度分布
Figure FDA00002774707900043
先验参数中与朋友节点v相应的先验值;
根据以上得到的自我节点u的中介偏好概率分布
Figure FDA00002774707900044
和好友关系强度分布
Figure FDA00002774707900045
和上一轮迭代后计算所得到的中介偏好概率分布
Figure FDA00002774707900046
和好友关系强度分布
Figure FDA00002774707900047
分别计算中介偏好概率分布变化量Δθ和好友关系强度分布变化量Δφ
Δ θ = Σ u Σ v ∈ F ( T i ) ( u ) ( θ u , v ( T i ) - θ ′ u , v ( T i ) ) 2
Δ φ = Σ u Σ v ∈ F ( T i ) ( u ) ( φ u , v ( T i ) - φ ′ u , v ( T i ) ) 2
设定一个变化量阈值,若Δθ和Δφ同时小于指定阈值,则进行步骤(8);若Δθ和Δφ中的任何一个大于或等于指定阈值,则设
Figure FDA000027747079000410
并返回步骤(6);
(9)在时间段Ti,对于自我节点u与自我节点u的新朋友节点y,将步骤(5)迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的朋友关系传递树中添加一条边z→y;
(10)遍历所有时间段,得到社交网络中每个自我节点u的朋友关系传递树。
CN201310026965.3A 2013-01-17 2013-01-17 一种社交网络中的朋友关系传递树的建立方法 Active CN103077247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310026965.3A CN103077247B (zh) 2013-01-17 2013-01-17 一种社交网络中的朋友关系传递树的建立方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310026965.3A CN103077247B (zh) 2013-01-17 2013-01-17 一种社交网络中的朋友关系传递树的建立方法

Publications (2)

Publication Number Publication Date
CN103077247A true CN103077247A (zh) 2013-05-01
CN103077247B CN103077247B (zh) 2016-05-25

Family

ID=48153777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310026965.3A Active CN103077247B (zh) 2013-01-17 2013-01-17 一种社交网络中的朋友关系传递树的建立方法

Country Status (1)

Country Link
CN (1) CN103077247B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345513A (zh) * 2013-07-09 2013-10-09 清华大学 一种社交网络中的基于朋友关系传播的朋友推荐方法
CN103942278A (zh) * 2014-04-01 2014-07-23 清华大学 通过分析用户主动交友意愿进行朋友推荐的方法
CN104182422A (zh) * 2013-05-28 2014-12-03 中国电信股份有限公司 统一通讯录信息处理方法和系统
WO2015043073A1 (zh) * 2013-09-29 2015-04-02 北大方正集团有限公司 一种关键知识点推荐方法及其系统
CN105959283A (zh) * 2016-05-03 2016-09-21 惠州Tcl移动通信有限公司 一种社交软件中目标人物安全性提示方法及系统
CN103838964B (zh) * 2014-02-25 2017-01-18 中国科学院自动化研究所 一种基于人工交通系统的社交关系网络生成方法及装置
CN107154862A (zh) * 2016-03-04 2017-09-12 上海海岸展览服务有限公司 一种中间人推荐方法和系统
CN107376357A (zh) * 2016-05-17 2017-11-24 蔡小华 一种好友互动类网络游戏方法
CN107895038A (zh) * 2017-11-29 2018-04-10 四川无声信息技术有限公司 一种链路预测关系推荐方法及装置
CN108038692A (zh) * 2017-11-06 2018-05-15 阿里巴巴集团控股有限公司 角色识别方法、装置及服务器
CN108173746A (zh) * 2017-12-26 2018-06-15 东软集团股份有限公司 好友推荐方法、装置和计算机设备
CN108492200A (zh) * 2018-02-07 2018-09-04 中国科学院信息工程研究所 一种基于卷积神经网络的用户属性推断方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066139A1 (en) * 2010-09-09 2012-03-15 At&T Intellectual Property I, Lp Methods, Systems, and Processes for Identifying Affected and Related Individuals During a Crisis
CN102662975A (zh) * 2012-03-12 2012-09-12 浙江大学 一种混合双向聚类好友推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066139A1 (en) * 2010-09-09 2012-03-15 At&T Intellectual Property I, Lp Methods, Systems, and Processes for Identifying Affected and Related Individuals During a Crisis
CN102662975A (zh) * 2012-03-12 2012-09-12 浙江大学 一种混合双向聚类好友推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SYED K. TANBEER 等: "DIFSoN:Discovering influential Friends from Social Networks", 《2012 FOURTH INTERNATIONA CONFERENCE ON CASON,IEEE》 *
原福永 等: "社交网络中模块关系树的相似性算法的研究", 《计算机应用研究》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104182422A (zh) * 2013-05-28 2014-12-03 中国电信股份有限公司 统一通讯录信息处理方法和系统
CN104182422B (zh) * 2013-05-28 2018-01-23 中国电信股份有限公司 统一通讯录信息处理方法和系统
CN103345513B (zh) * 2013-07-09 2017-07-18 清华大学 一种社交网络中的基于朋友关系传播的朋友推荐方法
CN103345513A (zh) * 2013-07-09 2013-10-09 清华大学 一种社交网络中的基于朋友关系传播的朋友推荐方法
US10289623B2 (en) 2013-09-29 2019-05-14 Peking University Founder Group Co. Ltd. Method and system for key knowledge point recommendation
WO2015043073A1 (zh) * 2013-09-29 2015-04-02 北大方正集团有限公司 一种关键知识点推荐方法及其系统
CN103838964B (zh) * 2014-02-25 2017-01-18 中国科学院自动化研究所 一种基于人工交通系统的社交关系网络生成方法及装置
CN103942278A (zh) * 2014-04-01 2014-07-23 清华大学 通过分析用户主动交友意愿进行朋友推荐的方法
CN107154862A (zh) * 2016-03-04 2017-09-12 上海海岸展览服务有限公司 一种中间人推荐方法和系统
CN105959283A (zh) * 2016-05-03 2016-09-21 惠州Tcl移动通信有限公司 一种社交软件中目标人物安全性提示方法及系统
CN105959283B (zh) * 2016-05-03 2019-10-29 Tcl移动通信科技(宁波)有限公司 一种社交软件中目标人物安全性提示方法及系统
CN107376357A (zh) * 2016-05-17 2017-11-24 蔡小华 一种好友互动类网络游戏方法
CN108038692A (zh) * 2017-11-06 2018-05-15 阿里巴巴集团控股有限公司 角色识别方法、装置及服务器
CN108038692B (zh) * 2017-11-06 2021-06-01 创新先进技术有限公司 角色识别方法、装置及服务器
CN107895038A (zh) * 2017-11-29 2018-04-10 四川无声信息技术有限公司 一种链路预测关系推荐方法及装置
CN107895038B (zh) * 2017-11-29 2020-05-12 四川无声信息技术有限公司 一种链路预测关系推荐方法及装置
CN108173746A (zh) * 2017-12-26 2018-06-15 东软集团股份有限公司 好友推荐方法、装置和计算机设备
CN108492200A (zh) * 2018-02-07 2018-09-04 中国科学院信息工程研究所 一种基于卷积神经网络的用户属性推断方法和装置
CN108492200B (zh) * 2018-02-07 2022-06-17 中国科学院信息工程研究所 一种基于卷积神经网络的用户属性推断方法和装置

Also Published As

Publication number Publication date
CN103077247B (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
CN103077247B (zh) 一种社交网络中的朋友关系传递树的建立方法
CN103345513B (zh) 一种社交网络中的基于朋友关系传播的朋友推荐方法
CN102262681A (zh) 一种博客信息传播中识别关键博客集的方法
CN105893637A (zh) 大规模微博异构信息网络中的链接预测方法
CN106326637A (zh) 一种基于局部有效路径度的链路预测方法
CN105760649A (zh) 一种面向大数据的可信度量方法
Jeong et al. Development of a patent roadmap through the Generative Topographic Mapping and Bass diffusion model
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN113780002A (zh) 基于图表示学习和深度强化学习的知识推理方法及装置
CN105608624A (zh) 基于用户体验的微博大数据兴趣社区分析优化方法
CN113050931A (zh) 一种基于图注意力机制的符号网络链路预测方法
CN106919564A (zh) 一种基于移动用户行为的影响力度量方法
CN109472030A (zh) 一种系统回复质量的评价方法及装置
Wang et al. Roof pressure prediction in coal mine based on grey neural network
CN106780067A (zh) 一种考虑节点局部标注特性的符号预测方法
CN104657901A (zh) 一种基于随机游走的标签传播社区发现方法
CN106649714A (zh) 针对数据不均匀及数据稀疏的topN推荐系统及方法
CN117057943B (zh) 一种节点特征感知的时序社交网络影响力最大化方法及系统
CN103399919A (zh) 基于社会关系网的信任增强服务推送方法
CN103942278B (zh) 通过分析用户主动交友意愿进行朋友推荐的方法
CN109086341B (zh) 应用群体智能的热点事件热度度量方法
CN106506183B (zh) 网络社区的发现方法及装置
CN105761152A (zh) 社交网络中一种基于三元组的参与话题预测方法
CN106780066B (zh) 一种个体与群体之间的影响力评估方法
CN107577698A (zh) 一种基于用户间影响力的移动用户偏好预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant