CN103745105B - 一种社交网络中用户属性的预测方法及系统 - Google Patents

一种社交网络中用户属性的预测方法及系统 Download PDF

Info

Publication number
CN103745105B
CN103745105B CN201410005723.0A CN201410005723A CN103745105B CN 103745105 B CN103745105 B CN 103745105B CN 201410005723 A CN201410005723 A CN 201410005723A CN 103745105 B CN103745105 B CN 103745105B
Authority
CN
China
Prior art keywords
user
moment
good friend
attribute
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410005723.0A
Other languages
English (en)
Other versions
CN103745105A (zh
Inventor
程学旗
贾岩涛
王元卓
张泽慧
冯凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201410005723.0A priority Critical patent/CN103745105B/zh
Publication of CN103745105A publication Critical patent/CN103745105A/zh
Application granted granted Critical
Publication of CN103745105B publication Critical patent/CN103745105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种社交网络中用户属性的预测方法及系统,所述方法包括:统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;以及根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。在地理位置社交网络数据集上的实验数据表明,本发明提供的社交网络中用户属性的预测方法及系统可提高用户属性预测的准确性。

Description

一种社交网络中用户属性的预测方法及系统
技术领域
本发明涉及预测社交网络中用户属性的技术,尤其涉及一种社交网络中用户地理位置的预测方法及系统。
背景技术
社交网络,又称社交网络服务(Social Networking Service,简称SNS),其主要作用是为一群拥有相同兴趣与活动的人创建在线社区。这类服务往往是基于互联网,为用户提供各种联系和交流的交互通路,如电子邮件、实时消息服务等。多数社交网络会提供多种让用户交互起来的方式,包括聊天、寄信、影音、文件分享、博客、讨论组群等,社交网络为信息的交流与分享提供了新的途径。社交网络的网站一般拥有数百万的登记用户,使用社交网络服务已成为用户每天生活不可或缺的一部分。
在社交网络(例如Twitter,Facebook和Gollwala等)中预测用户的属性,在近年来受到很大关注。这是因为预测用户的属性很有意义,以用户的地理位置为例,预测用户的地理位置对基于地理位置的推送服务很有帮助,如疾病预防和控制、个人账户安全,以及人口统计分析等等。目前,如果每个用户公开他们的属性,通常可以基于用户好友的影响力以及好友的属性来预测该用户在未来某个时间的属性。本文中,属性指那些在外界因素的影响下可动态变化的属性,如用户位置、兴趣、情感、观点和行为(如在线购物,投票)等。对于地理位置属性,现有技术通常是基于用户在移动行为上的相似性来定义用户影响力的,但其均没有考虑到好友影响力会随时间发生变化,这导致最终预测的用户位置准确性较低。
发明内容
为解决现有预测技术中存在的问题,根据本发明的一个实施例,提供一种社交网络中用户属性的预测方法,所述方法包括:
步骤1)、统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;
步骤2)、根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。
在一个实施例中,步骤1)包括:
步骤11)、对于一段时间内的每个时刻,通过计算好友对所述用户在所述属性的一个或多个方面的影响力,得到该好友对所述用户在该时刻的影响力;
步骤12)、选择每个时刻对用户影响力最大的N个好友。
在进一步的实施例中,在步骤11)中,利用下式得到好友v对所述用户u在ti时刻的影响力:
其中,表示好友v对所述用户u在ti时刻的影响力;m为针对所述属性考虑的方面个数;表示在ti时刻,好友v对所述用户u在所述属性的第j个方面的影响力;wj表示所述属性的第j个方面的权重。
在进一步的实施例中,根据以下步骤获得所述属性的第j个方面的权重wj
步骤A)、初始化权重向量w为任意的m元组,其中m是针对所述属性考虑的方面个数;
步骤B)、计算ti时刻好友对所述用户的影响力;
步骤C)、根据ti时刻好友对所述用户的影响力计算随机游走转移概率矩阵其中,α为重新启动概率,其使得随机游走具有α概率跳回用户v并在ti时刻重启动;
步骤D)、计算重启动的随机游走在ti时刻的固定分布其满足:
步骤E)、根据下式更新权重向量w:
其中,λ是可选步长;且
其中,g(p)=1/(1+e-p),h(x)=max{x,0}2 是ti时刻用户u的非好友集,是ti时刻用户u的好友集合,δld的差值。
步骤F)、如果更新后的w与更新前的w的差值小于预定阈值,则得到最终的权重向量,否则返回步骤B)。
在一个实施例中,在步骤2)中,根据下式得到在将来时刻所述用户的属性:
其中,x1:T是在将来一段时间1至T内每个时刻所预测的所述用户的属性的随机变量序列,y1:T是在一段时间1至T内每个时刻观测到的所述用户影响力最大的N个好友的属性的随机变量。
在一个实施例中,所述属性为地理位置,且在步骤11)中,好友对所述用户在所述属性的一个或多个方面的影响力包括下列的一个或多个:
好友对所述用户的动态影响力,该动态影响力是由所述用户距离自己家的距离和所述用户距离好友家的距离确定的;
好友对所述用户的空间影响力,该空间影响力是由所述用户与好友的签到位置轨迹的相似性确定的;以及
好友对所述用户的时间影响力,该时间影响力是由所述用户和好友的签到行为的相似性确定的。
在一个实施例中,在步骤11)中,利用下式计算在ti时刻好友v对所述用户u的动态影响力
其中,β(Pu(ti),Hu)表示平滑参数β与Pu(ti)和Hu之间的几何乘积;Pu(ti)表示用户u在ti时刻的位置;Hu表示用户家的位置;E(Pu(ti),Hv)表示在ti时刻,用户u的位置与好友家的位置Hv的距离。
在一个实施例中,在步骤11)中,计算在ti时刻好友v对所述用户u的空间影响力包括:
步骤a)、计算在ti时刻前所述用户签到位置的中心集合Cu,以及好友签到位置的中心集合Cv
步骤b)、根据中心集合Cu和Cv,分别定义签到位置的分布为多中心的所述用户u和好友v的高斯分布函数;
步骤c)、利用下式计算在ti时刻好友v对所述用户u的空间影响力
其中DKL(Nu||Nv)是用户u和好友v的高斯分布函数的Kullback-Leibler距离。
在进一步的实施例中,在步骤a)中,计算在ti时刻前所述用户签到位置的中心集合Cu包括:
根据访问频率对ti时刻前所述用户u的签到位置集合中所有签到位置进行排序,选取访问次数最多的位置;
将访问次数最多的签到位置与其他签到位置进行对比,若两者之间的距离不小于预定阈值d,则将进行对比的签到位置记录下来;
在所记录的签到位置中,将签到次数与所述用户u签到总数的比例大于阈值θ的签到位置放入Cu中。
在一个实施例中,在步骤11)中,计算在ti时刻好友v对所述用户u的时间影响力包括:
步骤i)、统计所述用户u和好友v在ti时刻之前的所有签到位置和签到时刻;
步骤ii)、两两计算在ti时刻之前所述用户u的每次签到位置和好友v的每次签到位置之间的距离并且两两计算在ti时刻之前所述用户u的每次签到时刻与好友v的每次签到时刻之间的时间差其中表示所述用户u在ti时刻之前的第j个签到位置,表示所述好友v在ti时刻之前的第k个签到位置;表示所述用户u在ti时刻之前第j个签到的时刻,表示好友v在ti时刻之前第k个签到的时间戳;
步骤iii)、利用下式计算在ti时刻好友v对所述用户u的时间影响力
其中,Nu是所述用户u在ti时刻之前的签到记录个数,Nv是好友v在ti时刻之前的签到记录个数;ΔT是时间差参数;Θ(x)是Heaviside Step函数;∈是预先定义的阈值,当E(x,y)≤∈时E(x,y)为1,否则为0。
根据本发明的一个实施例,还提供一种社交网络中用户属性的预测系统,其中所述属性是在外界因素影响下动态变化的属性,所述系统包括:
统计模块,用于统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;
预测模块,用于根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。
本发明所提供的预测方法及系统考虑到好友影响力会随时间发生变化,选择在过去一段时间每个时刻最具影响力的多个好友,在好友选择方面提高了预测的准确率,然后通过时空演化的贝叶斯模型进行用户属性预测。在地理位置社交网络数据集上的实验数据表明,本发明可提高用户属性预测的准确性。
附图说明
图1是根据一个实施例的社交网络中用户属性的预测方法流程图;
图2是根据一个实施例的计算用户位置中心集合的方法流程图;
图3是根据一个实施例的计算最具影响力的N个好友的方法流程图;以及
图4是根据一个实施例的时空演化的贝叶斯网络模型的示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
根据本发明的一个实施例,提供一种社交网络中用户属性的预测方法。图1示出了该方法包括的以下几个步骤:获取目标用户(本文中也简称为用户)的好友关系及信息;计算目标用户的好友在过去每个时刻对该目标用户的影响力;选出在过去每个时刻对该目标用户影响力最大的N个好友;以及,对目标用户在将来某时刻的属性进行预测。下面以地理位置为例按步骤展开描述,其中社交网络可提供的基本信息包括用户个人信息、用户好友列表,用户和好友的位置和时间信息等。
步骤S101、获取目标用户的好友列表,以及该目标用户和好友签到的位置和时间信息。
在社交网络中,用户会将自己在什么地方做什么以签到的形式发布到社交网络中。在一个实施例中,可通过网络爬虫或第三方应用API等技术来获取用户的好友列表、个人信息(包括用户姓名、性别、年龄等基础信息)、好友关系,以及用户签到的时间和位置信息。
步骤S102、计算目标用户好友列表中的好友在过去一段时间中每个时刻对于该目标用户的影响力。
本步骤计算好友在多个时刻对用户的影响力,即对于每个好友计算其对该用户的一组因时间而异的影响力。在现有技术中,计算每一时刻好友对用户的影响力通常采用多方面衡量的方法,即先根据好友与用户在某些方面的相似性来得到该好友对目标用户在多个方面的影响力,再根据这些影响力加权统计出该好友对用户的最终影响力。在现有技术中,计算好友对目标用户地理位置的影响力可包括计算好友对该目标用户的动态影响力、时间影响力和空间影响力中的一个或多个,然后经过加权得到该好友对该目标用户的最终影响力。本实施例以这三种影响力为例描述如何计算好友在每个时刻对于该目标用户的最终影响力,包括以下步骤:
第一步:计算好友对目标用户的动态影响力
计算好友对目标用户的动态影响力,即要算出用户与自己家的位置以及与好友家的位置的距离,如果用户距离自己家越远,距离好友家越近,则认为该好友对用户的影响力越大。包括以下子步骤:
a)、计算用户家的位置
给定用户u,该用户自己家的位置可表示为Hu=(hux,huy),其独立于任何时刻;而用户u在ti时刻的位置可表示为Pu(ti)=(pux(ti),puy(ti))。
b)、计算好友家的位置
类似地,对于某个好友v,该好友家的位置可表示为Hv=(hvx,hvy),其独立于任何时刻;而好友v在ti时刻的位置可表示为Pv(ti)=(pvx(ti),pvy(ti))。
c)、计算用户位置与自己家的位置的距离
用户位置Pu(ti)与自己家的位置Hu的距离可表示为E(Pu(ti),Hu),其中E(P,H)是两个点P=(px,py)和H=(hx,hy)之间的几何距离。
d)、计算用户位置与好友家的位置的距离
用户位置Pu(ti)与其好友家位置Hv的距离为E(Pu(ti),Hv),同样,E(P,H)是两个点P=(px,py)和H=(hx,hy)之间的几何距离。
e)、计算好友对用户在每个时刻的动态影响力
在ti时刻,好友v对用户u的动态影响力可定义为在一个实施例中,为平滑参数β与Pu(ti)和Hu之间的几何乘积,再除以Pu(ti)和Hv的距离,计算如下:
其中,β为平滑参数,是一个非负整数。r是用于确定β的值的好友活动圆盘的半径,为正整数。其中,当E(Pu(ti),Hv)≤r时,β>0;否则β=0。
第二步:计算好友对目标用户的空间影响力,即通过用户的签到位置轨迹和其好友的签到位置轨迹的相似性来得到好友对用户的空间影响力,如果用户与好友的签到轨迹位置越相似(越接近),则认为该好友对该用户的空间影响力越大。包括以下子步骤:
a)、计算在某一时刻之前目标用户位置的中心集合Cu
参考图2,根据本发明的一个实施例描述用于获得用户位置的中心集合的方法。
首先,根据访问频率对某时刻之前用户u的签到位置集合中所有的签到位置进行排序,选取访问次数最多的位置,并与其他签到位置进行对比,若两者之间的距离不小于d公里,则将进行对比的签到位置记录下来。接着,在所记录的签到位置中,寻找被签到的次数与用户签到总数的比例大于阈值θ的位置,则将满足条件的那些位置构成Cu。在一个实施例中,θ的值可设置为0.02,距离d可设置为15。
b)、计算在某一时刻之前好友位置的中心集合Cv
如同计算目标用户位置的中心集合,可得到好友位置的中心集合Cv
c)、计算用户u在ti时刻之前的所有位置的分布函数,该分布函数体现用户签到的位置轨迹
在一个实施例中,根据用户位置的中心集合Cu,可定义用户u签到地点的分布为多中心的高斯分布函数:
其中,Cu为用户u的位置的中心集合;l表示位置的经度和纬度;P(l∈Cu)表示位置l属于Cu的概率,与l和中心集合Cu的距离(例如,l与中心集合Cu中每个中心点的距离)成反比;表示在中心集合Cu的签到频率,其中,为了避免由高频率的签到产生过大的影响引入参数α,在一个实施例中,参数α的值取0.2;为概率密度函数,其中是中心集合Cu的区域的均值和方差。
d)、计算好友v在ti时刻之前的所有位置的分布函数
同样,可根据用好友位置的中心集合Cv,定义好友v签到地点的分布为多中心的高斯分布函数:
其中,l表示位置的经度和纬度;P(l∈Cv)表示位置l属于Cv的概率,与l与中心集合Cv的距离成反比,表示中心集合Cv的签到频率,在一个实施例中,参数α的值可以取0.2。为概率密度函数,是中心集合Cv的区域的均值和方差。
e)、计算上述两个分布函数的距离
在一个实施例中,该距离可以是Kullback-Leibler距离。之间的Kullback-Leibler距离是:
其中,k是分布的维度;tr是矩阵的trace,即主对角线元素的和。
f)、计算在某一时刻好友对用户的空间影响力
在一个实施例中,在ti时刻,按下式计算好友对用户的空间距离影响力:
其中DKL(·||·)是上一步中两个概率密度函数的Kullback-Leibler距离。
第三步:计算好友对用户的时间影响力,其中在某一时刻之前,如果用户和好友在相距不远的位置有同时签到的行为,距离越近,则认为好友对用户的时间影响力越大。包括以下子步骤:
a)、统计用户在ti时刻之前的所有签到位置和时刻
在ti时刻之前,假设用户u有Nu个签到记录,设表示用户u在ti时刻之前的第j个签到地点,表示用户u在ti时刻之前第j个签到的时间戳(签到时刻),1≤j≤Nu
b)、统计好友在ti时刻之前所有的签到位置和时刻
在ti时刻之前,假设用户好友v有Nv个签到记录,设表示好友v在ti时刻之前第j个签到地点,表示ti时刻之前好友v的第j个签到的时间戳(签到时刻),1≤j≤Nv
c)、两两计算用户的每次签到位置和好友的每次签到位置之间的距离
可以设用户每次签到位置和好友的每次签到位置的距离为
d)、两两计算用户的每次签到时刻与好友的每次签到时刻之间的时间差
可以设用户的每次签到时刻与好友的每次签到时刻的时间差为
e)、加权统计在某个时刻好友对用户的时间影响力
表示在ti时刻好友v对用户u的时间影响力,在一个实施例中,可通过下式计算
其中ΔT是时间差参数,通常设置为1;Θ(x)是Heaviside Step函数;当E(x,y)≤∈时E(x,y)为1,否则为0,其中∈是预先定义的阈值。
本文中,针对地理位置的预测考虑了动态影响力、空间影响力和时间影响力这三个方面,但本领域技术人员应理解,在计算好友对用户的某一属性的影响力时,还可以考虑与该属性相关的其他方面的要素,如用户与好友属性的结构相似度、内容相似度等等。
此外,尽管上面的步骤以特定的顺序说明了如何计算好友的动态影响力、空间影响力和时间影响力,应理解,也可采用其他顺序或者并行地计算这些要素。
第四步:加权统计得到每个时刻好友对用户的影响力
同时考虑好友对用户的动态影响力、空间影响力和时间影响力,加权得出好友对用户的影响力。在一个实施例中,可利用Logistic函数进行加权计算。定义ti时刻,好友v对用户u产生的影响力为:
其中w=(w1,w2,w3)是衡量好友v对于用户u的动态影响力、空间影响力和时间影响力的权重向量。不管在任何时刻、对于任何好友,权重向量w是不变的。
步骤S103、确定上述步骤的参数w,选择每个时刻最具影响力的N个好友
在一个实施例中,使用时序带返回的随机游走模型来确定上述步骤中的参数w,返回ti时刻排名前N的好友(即ti时刻影响力最大的前N个好友)作为对用户最有影响力的好友,参考图3,具体步骤如下:
第一步:初始化权重向量w0为任意三元组
第二步:根据公式(7)计算好友对用户在每个时刻的影响力
第三步:根据第二步得到的每个时刻的影响力计算随机游走转移概率矩阵
引入重新启动概率α(例如α=0.2),使得随机游走具有α概率跳回用户v并在ti时刻重新启动,如:
第四步:计算向量
是重启动的随机游走在ti时刻的固定分布,满足公式:
第五步:计算梯度
根据以下公式计算梯度,其中g(p)=1/(1+e-p),h(x)=max{x,0}2
其中 是ti时刻u的非好友集,是ti时刻u的好友集合,λ是可选步长,δld的差值。
第六步:将w0更新为w1
在一个实施例中,可根据下式进行更新:
第七步:继续上述第二步至第六步,直到|wi+1-wi|<epsilon,其中epsilon为预先设定的很小的正数。
第八步、对于每个时刻,选择排名前N的好友作为对于用户最有影响力的好友,N为正整数。
步骤S104、给定时刻tj,对每个时刻ti≤tj,将目标用户和选择的N个好友的签到位置作为随机变量,构建时空演化的贝叶斯网络模型,学习该贝叶斯网络的参数,并根据N个好友位置对目标用户在将来时刻的地理位置进行预测,具体步骤如下:
第一步:利用最大似然估计学习时空演化的贝叶斯网络模型的参数,构建贝叶斯网络模型(参见图4):
学习用来定义变化模型P(μt+1t)和观测模型P(Ott)的参数θ,用于后续的预测过程,使目标函数最大化:
θML*=argmaxθlog(P(Y1:T|θ)) (12)
其中Ot表示变量集合 …,td和w。其中, …,分别表示N个好友在ti时刻的位置的随机变量;td表示一天中的时段,是根据用户签到的频率来计算的;w指示是周末还是平时工作日。例如,如果用户每20分钟签到一次,那么td的取值范围是{0,...71};Y1:T是时间1和T之间所有N个好友的位置随机变量的序列。
第二步:预测目标用户在将来某个时刻最有可能的地理位置:
在一个实施例中,可根据观测数据用Viterbi译码来计算用户u在将来某个时刻最可能出现的地点序列:
其中x1:T是将来一段时间1至T之间用户位置的随机变量,y1:T是过去一段时间1至T之间观测到的N个好友的随机变量。
根据本发明的一个实施例,还提供一种社交网络中用户属性的预测系统,该系统包括统计模块和预测模块。其中,统计模块用于统计在过去一段时间内每个时刻对用户影响力最大的N个好友。预测模块用于根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻用户的属性。
为验证本发明提供的社交网络中用户属性的预测方法的有效性,发明人在基于位置的社交网络Gowalla数据集上进行了实验,实验参数如下:
其中,实验数据集包括好友网络中记录了用户和好友关系的196591个节点以及950327条边。同时包括了2009年2月至2010年10月所有用户签到6442890次的时间和地理位置信息。选取其中每个月签到次数超过100次的用户作为实验对象,由于每个用户均有好友签到次数不超过10次,所以限定每个用户的有效好友为10个。同时为了降低GPS带来的位置数据噪音,去除掉用户抵达过不超过5次的地点,得到18771个不同的地理位置。
在实验的过程中,发现了最佳参数配置。其中,朋友活动圆盘的半径r的最优值为1.5;平滑参数β的最优值为10;参数λ的最优值为1;重启动的概率值为0.6;对于函数g(p),逻辑函数g(p)=1/(1+e-p)比g(p)=p更优。
经过实验,得到如下结果:
对于全年12个月份的用户位置预测,本发明均比现有预测技术更精确。与目前最好的地理位置预测方法(Sadilek等提供的动态贝叶斯方法,WSDM会议,2012年)相比,本发明提供的社交网络中用户属性的预测方法对于用户的地理位置预测的平均精确度提高了16%。
应该注意到并理解,在不脱离后附的权利要求所要求的本发明的精神和范围的情况下,能够对上述详细描述的本发明做出各种修改和改进。因此,要求保护的技术方案的范围不受所给出的任何特定示范教导的限制。

Claims (12)

1.一种社交网络中用户属性的预测方法,其中所述属性是在外界因素影响下动态变化的属性,所述方法包括:
步骤1)、针对在一段时间内的每个时刻,统计对用户影响力最大的N个好友,其中N为正整数;
步骤2)、根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。
2.根据权利要求1所述的方法,其中,步骤1)包括:
步骤11)、对于一段时间内的每个时刻,通过计算好友对所述用户在所述属性的一个或多个方面的影响力,得到该好友对所述用户在该时刻的影响力;
步骤12)、选择每个时刻对用户影响力最大的N个好友。
3.根据权利要求2所述的方法,在步骤11)中,利用下式得到好友v对所述用户u在ti时刻的影响力:
I t i ( u , v ) = 1 1 + e - &Sigma; j = 1 m w j S j , t i ( u , v )
其中,表示好友v对所述用户u在ti时刻的影响力;m为针对所述属性考虑的方面个数;表示在ti时刻,好友v对所述用户u在所述属性的第j个方面的影响力;wj表示所述属性的第j个方面的权重。
4.根据权利要求3所述的方法,其中,根据以下步骤获得所述属性的第j个方面的权重wj
步骤A)、初始化权重向量w为任意的m元组,其中m是针对所述属性考虑的方面个数;
步骤B)、计算ti时刻好友对所述用户的影响力;
步骤C)、根据ti时刻好友对所述用户的影响力计算随机游走转移概率矩阵其中,α为重新启动概率,其使得随机游走具有α概率跳回用户v并在ti时刻重启动;
步骤D)、计算重启动的随机游走在ti时刻的固定分布其满足:
步骤E)、根据下式更新权重向量w:
w = w - &lambda; &part; F ( w , t i ) &part; w
其中,λ是可选步长;且
&part; F ( w , t i ) &part; w = 2 w + &lambda; &Sigma; l , d &part; h ( &delta; l d ) &part; &delta; l d ( &part; g ( p l , t i ) &part; w - &part; g ( p d , t i ) &part; w )
其中,g(p)=1/(1+e-p),h(x)=max{x,0}2 是ti时刻用户u的非好友集,是ti时刻用户u的好友集合,δld的差值;
步骤F)、如果更新后的w与更新前的w的差值小于预定阈值,则得到最终的权重向量,否则返回步骤B)。
5.根据权利要求1-4中任何一个所述的方法,在步骤2)中,根据下式得到在将来时刻所述用户的属性:
x 1 : T * = arg max x 1 : T l o g ( P ( x 1 : T | y 1 : T ) )
其中,x1:T是在将来一段时间1至T内每个时刻所预测的所述用户的属性的随机变量序列,y1:T是在一段时间1至T内每个时刻观测到的所述用户影响力最大的N个好友的属性的随机变量。
6.根据权利要求2-4中任何一个所述的方法,其中所述属性为地理位置。
7.根据权利要求6所述的方法,在步骤11)中,好友对所述用户在所述属性的一个或多个方面的影响力包括下列的一个或多个:
好友对所述用户的动态影响力,该动态影响力是由所述用户距离自己家的距离和所述用户距离好友家的距离确定的;
好友对所述用户的空间影响力,该空间影响力是由所述用户与好友的签到位置轨迹的相似性确定的;以及
好友对所述用户的时间影响力,该时间影响力是由所述用户和好友的签到行为的相似性确定的。
8.根据权利要求7所述的方法,在步骤11)中,利用下式计算在ti时刻好友v对所述用户u的动态影响力
DI t i ( u , v ) = &beta; ( P u ( t i ) , H u ) / E ( P u ( t i ) , H v ) ,
其中,β(Pu(ti),Hu)表示平滑参数β与Pu(ti)和Hu之间的几何乘积;Pu(ti)表示用户u在ti时刻的位置;Hu表示用户家的位置;E(Pu(ti),Hv)表示在ti时刻,用户u的位置与好友家的位置Hv的距离。
9.根据权利要求7所述的方法,在步骤11)中,计算在ti时刻好友v对所述用户u的空间影响力包括:
步骤a)、计算在ti时刻前所述用户签到位置的中心集合Cu,以及好友签到位置的中心集合Cv
步骤b)、根据中心集合Cu和Cv,分别定义签到位置的分布为多中心的所述用户u和好友v的高斯分布函数;
步骤c)、利用下式计算在ti时刻好友v对所述用户u的空间影响力
S t i ( u , v ) = e - D K L ( N u | | N v )
其中DKL(Nu||Nv)是用户u和好友v的高斯分布函数的Kullback-Leibler距离。
10.根据权利要求9所述的方法,在步骤a)中,计算在ti时刻前所述用户签到位置的中心集合Cu包括:
根据访问频率对ti时刻前所述用户u的签到位置集合中所有签到位置进行排序,选取访问次数最多的位置;
将访问次数最多的签到位置与其他签到位置进行对比,若两者之间的距离不小于预定阈值d,则将进行对比的签到位置记录下来;
在所记录的签到位置中,将签到次数与所述用户u签到总数的比例大于阈值θ的签到位置放入Cu中。
11.根据权利要求7所述的方法,在步骤11)中,计算在ti时刻好友v对所述用户u的时间影响力包括:
步骤i)、统计所述用户u和好友v在ti时刻之前的所有签到位置和签到时刻;
步骤ii)、两两计算在ti时刻之前所述用户u的每次签到位置和好友v的每次签到位置之间的距离并且两两计算在ti时刻之前所述用户u的每次签到时刻与好友v的每次签到时刻之间的时间差其中表示所述用户u在ti时刻之前的第j个签到位置,表示所述好友v在ti时刻之前的第k个签到位置;表示所述用户u在ti时刻之前第j个签到的时刻,表示好友v在ti时刻之前第k个签到的时刻;
步骤iii)、利用下式计算在ti时刻好友v对所述用户u的时间影响力
T t i ( u , v ) = &Sigma; j = 1 N u &Sigma; k = 1 N v &Theta; ( &Delta; T - | T u , t i , j - T v , t i , k | ) E &Element; ( P u , t i , j - P v , t i , k ) &Sigma; j = 1 N u &Sigma; k = 1 N v &Theta; ( &Delta; T - | T u , t i , j - T v , t i , k | )
其中,Nu是所述用户u在ti时刻之前的签到记录个数,Nv是好友v在ti时刻之前的签到记录个数;ΔT是时间差参数;Θ(x)是Heaviside Step函数;∈是预先定义的阈值,当E(x,y)≤∈时E(x,y)为1,否则为0。
12.一种社交网络中用户属性的预测系统,其中所述属性是在外界因素影响下动态变化的属性,所述系统包括:
统计模块,用于统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;
预测模块,用于根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。
CN201410005723.0A 2014-01-06 2014-01-06 一种社交网络中用户属性的预测方法及系统 Active CN103745105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410005723.0A CN103745105B (zh) 2014-01-06 2014-01-06 一种社交网络中用户属性的预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410005723.0A CN103745105B (zh) 2014-01-06 2014-01-06 一种社交网络中用户属性的预测方法及系统

Publications (2)

Publication Number Publication Date
CN103745105A CN103745105A (zh) 2014-04-23
CN103745105B true CN103745105B (zh) 2017-05-03

Family

ID=50502122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410005723.0A Active CN103745105B (zh) 2014-01-06 2014-01-06 一种社交网络中用户属性的预测方法及系统

Country Status (1)

Country Link
CN (1) CN103745105B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408043B (zh) * 2014-10-17 2019-02-22 深圳大学 一种信息处理方法及服务器
CN104680250B (zh) * 2015-02-11 2018-04-17 北京邮电大学 一种位置预测系统
CN104750829B (zh) * 2015-04-01 2017-10-31 华中科技大学 一种基于签到特征的用户位置分类方法及系统
WO2016206095A1 (en) * 2015-06-26 2016-12-29 Hewlett-Packard Development Company, L.P. Social influence determination
CN106611339B (zh) * 2015-10-21 2020-12-29 创新先进技术有限公司 种子用户筛选方法、产品的用户影响力评价方法及装置
CN105787104B (zh) * 2016-03-21 2020-02-11 百度在线网络技术(北京)有限公司 用户属性信息的获取方法和装置
CN106909594B (zh) * 2016-06-06 2020-05-05 阿里巴巴集团控股有限公司 信息推送方法及装置
CN106202236A (zh) * 2016-06-28 2016-12-07 联想(北京)有限公司 一种用户位置预测方法及装置
CN106169036B (zh) * 2016-06-30 2018-10-09 腾讯科技(深圳)有限公司 一种图片显示方法及装置
CN106503858A (zh) * 2016-10-28 2017-03-15 中国科学院计算技术研究所 一种训练用于预测社交网络用户转发消息的模型的方法
CN108520470B (zh) * 2017-02-28 2022-06-03 百度在线网络技术(北京)有限公司 用于生成用户属性信息的方法和装置
CN107145977B (zh) * 2017-04-28 2020-07-31 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法
CN107169063B (zh) * 2017-05-03 2021-03-02 西安交通大学 一种基于社交信息的用户属性预测方法与系统
CN107194560B (zh) * 2017-05-12 2020-11-27 东南大学 Lbsn中基于好友聚类的社交搜索评价方法
CN107222394B (zh) * 2017-06-16 2020-07-17 深圳量子云科技有限公司 一种社交网络的用户访问控制方法及系统
CN108345662B (zh) * 2018-02-01 2022-08-12 福建师范大学 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN110222273B (zh) * 2019-05-14 2021-08-17 上海交通大学 基于地理社区的社交网络中的商业点推广方法和系统
CN112132326B (zh) * 2020-08-31 2023-12-01 浙江工业大学 一种基于随机游走度惩罚机制的社交网络好友预测方法
CN113836316B (zh) * 2021-09-23 2023-01-03 北京百度网讯科技有限公司 三元组数据的处理方法、训练方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101465879A (zh) * 2007-12-21 2009-06-24 音乐会技术公司 用于识别暂时朋友的系统和方法
US20100070335A1 (en) * 2008-09-18 2010-03-18 Rajesh Parekh Method and System for Targeting Online Ads Using Social Neighborhoods of a Social Network
CN102016848A (zh) * 2008-05-15 2011-04-13 雅虎公司 利用社交网络信息来示出评论的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101465879A (zh) * 2007-12-21 2009-06-24 音乐会技术公司 用于识别暂时朋友的系统和方法
CN102016848A (zh) * 2008-05-15 2011-04-13 雅虎公司 利用社交网络信息来示出评论的方法和装置
US20100070335A1 (en) * 2008-09-18 2010-03-18 Rajesh Parekh Method and System for Targeting Online Ads Using Social Neighborhoods of a Social Network

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Finding your friends and following them to where you are;A.Sadilek ET AL;《Proceedings of the fifth ACM international conference on Web search and data mining》;20121231;第723-732页 *
Friendship and Mobility: User Movement In Location-Based Social Networks;Eunjoon Cho ET AL;《Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining》;20111231;第1082-1090页 *
Fused matrix factorization with geographical and social influence in location-based social networks;Chen Cheng et al;《Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence》;20121231;第17-23页 *
Human Mobility, Social Ties and Link Prediction;Dashun Wang et al;《Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining》;20111231;第1100-1108页 *
Supervised Random Walks:Predicting and Recommending Links in Social Networks;Lars Backstrom ET AL;《Proceedings of the fourth ACM international conference on Web search and data mining》;20111231;第635-644页 *

Also Published As

Publication number Publication date
CN103745105A (zh) 2014-04-23

Similar Documents

Publication Publication Date Title
CN103745105B (zh) 一种社交网络中用户属性的预测方法及系统
Zhang et al. Interactive COVID-19 mobility impact and social distancing analysis platform
Cui et al. Personalized travel route recommendation using collaborative filtering based on GPS trajectories
CN105532030B (zh) 用于分析目标实体的移动的装置、系统和方法
Cheng et al. Fused matrix factorization with geographical and social influence in location-based social networks
Gambs et al. De-anonymization attack on geolocated data
Bao et al. A new temporal and social PMF-based method to predict users' interests in micro-blogging
US8954503B2 (en) Identify experts and influencers in a social network
US20150242447A1 (en) Identifying effective crowdsource contributors and high quality contributions
US8732015B1 (en) Social media pricing engine
Roy et al. Development of trust scores in social media (TSM) algorithm and application to advertising practice and research
CN104756504A (zh) 估计使用社交媒体的用户的人口统计数据的方法和设备
US10559004B2 (en) Systems and methods for establishing and utilizing a hierarchical Bayesian framework for ad click through rate prediction
Christoforidis et al. Recommendation of points-of-interest using graph embeddings
Li et al. Exploiting concept drift to predict popularity of social multimedia in microblogs
US20140214480A1 (en) Determining a customer profile state
Allahviranloo et al. Mining activity pattern trajectories and allocating activities in the network
Fan et al. Modeling temporal effectiveness for context-aware web services recommendation
Soroori et al. Modeling spatial nonstationary and overdispersed crash data: Development and comparative analysis of global and geographically weighted regression models applied to macrolevel injury crash data
CN111475744B (zh) 一种基于集成学习的个性化位置推荐方法
He et al. Inferring continuous latent preference on transition intervals for next point-of-interest recommendation
Wu et al. Effects of customer heterogeneity on participation performance in virtual brand community: A two-stage semiparametric approach
Liu et al. VGMF: visual contents and geographical influence enhanced point‐of‐interest recommendation in location‐based social network
Luan et al. Collaborative tensor factorization and its application in POI recommendation
Malesios Some variations on the standard theoretical models for the h‐index: A comparative analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140423

Assignee: Branch DNT data Polytron Technologies Inc

Assignor: Institute of Computing Technology, Chinese Academy of Sciences

Contract record no.: 2018110000033

Denomination of invention: Method and system for predicting user property in social network

Granted publication date: 20170503

License type: Common License

Record date: 20180807