CN106570764A - 一种用户关系预测方法及装置 - Google Patents
一种用户关系预测方法及装置 Download PDFInfo
- Publication number
- CN106570764A CN106570764A CN201610986113.2A CN201610986113A CN106570764A CN 106570764 A CN106570764 A CN 106570764A CN 201610986113 A CN201610986113 A CN 201610986113A CN 106570764 A CN106570764 A CN 106570764A
- Authority
- CN
- China
- Prior art keywords
- user
- similarity
- business
- mobile subscriber
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010030 laminating Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种用户关系预测方法,包括:分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。另外,本发明还公开了一种用户关系预测装置。采用本发明实施例,能够提高用户关系预测的精确度。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种用户关系预测方法及装置。
背景技术
随着移动应用的发展,以QQ和微信为代表的基于社交网络和位置融合的移动应用已经成为用户在现实世界活动的镜像。用户通过相互通信形成了一种复杂的社会网络,该网络在一定程度上体现了用户的交友偏好、用户之间的关系和用户的行为模式。因此,越来越多的商家开始关注信息如何在复杂的社会网络进行有效扩散,以便商家或者运营商实现个性化的位置、好友和广告推荐。
用户关系的预测起源于“六度理论”,即任意两个陌生人之间只需要6个中间人即可产生联系,随着互联网和移动通信的发展、交通方式的进步,人们的社交圈也会越来越广泛,当今社会网络两个人认识的中间人甚至更少,例如Facebook社交网站的统计己经将这一数字变为了4.7。Lambiotte提出,移动用户双方的社交关系紧密程度和他们之间的距离的平方成反比,用户会优先选择与他距离较小的人交朋友。Newman用用户间的相似度证明了用户共同好友的个数与他们在将来会成为好友的可能性存在正相关的关系。Adamic和Adar通过统计共同好友的好友情况来分析用户关系,在考虑社交关系的基础上,通过Adamic-Adar系数来衡量用户之间社交关系。Lu考虑到用户关系的差异性,将用户间的关系赋予不同的权值,提出一种结合用户关系权重的用户关系分析方法。然而上述的方法仅仅从社交网络或者地理位置单一的角度来挖掘用户之间的关系,没有综合他们现实世界和虚拟世界两方面的特性来考虑问题而导致挖掘出来的用户关系精确度不高。
发明内容
本发明实施例提出一种用户关系预测方法及装置,能够提高用户关系预测的精确度。
本发明实施例提供一种用户关系预测方法,包括:
分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;
分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;
根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。
进一步地,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度,具体包括:
根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;
根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。
进一步地,所述区域分布算法如下:
其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;
所述位置相似度算法如下:
其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。
进一步地,所述关系预测模型如下:
MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。
进一步地,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度之前,还包括:
将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;
去除所述实际重合度小于预设阈值的移动用户;
所述重合度算法如下:
其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。
相应地,本发明实施例还提供一种用户关系预测装置,包括:
数据提取模块,用于分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
位置相似度计算模块,用于根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;
社交相似度计算模块,用于分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;以及,
预测模块,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。
进一步地,所述位置相似度计算模块具体包括:
区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;以及,
位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。
进一步地,所述区域分布算法如下:
其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;
所述位置相似度算法如下:
其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。
进一步地,所述关系预测模型如下:
MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。
进一步地,所述用户关系预测装置还包括:
数据划分模块,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
第一重合度计算模块,用于根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
第二重合度计算模块,用于根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
实际重合度计算模块,用于将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,
过滤模块,用于去除所述实际重合度小于预设阈值的移动用户;
所述重合度算法如下:
其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的用户关系预测方法及装置,能够从移动用户和目标用户的用户终端发生业务的信息中提取出用户的轨迹数据,再根据轨迹数据分别计算出移动用户与目标用户在地理位置和社交网络上的相似度,进而根据两个相似度预测出移动用户与目标用户的用户关系,基于地理位置和社交网络的相似度预测用户关系,提高了用户关系预测的精确度;通过每个移动用户与目标用户在时间和地理位置上的重合度对移动用户进行过滤,降低其后用户关系预测的误差。
附图说明
图1是本发明提供的用户关系预测方法的一个实施例的流程示意图;
图2是本发明提供的用户关系预测装置的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明提供的用户关系预测方法的一个实施例的流程示意图,包括:
S1、分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
S2、根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;
S3、分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;
S4、根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。
需要说明的是,移动用户和目标用户在移动的过程中,其用户终端会发生各种业务或进行小区切换,这些信息都会记录在用户的轨迹数据中。在预测前,需先提取移动用户和目标用户在预设时间段内的轨迹数据。其中,轨迹数据包括业务的发起ID、开始时间、结束时间、开始基站识别码、接收基站识别码和接收ID。例如,对某市的某运营商的10万移动用户在一个月的全部轨迹数据进行提取,其中,轨迹数据的数据表如表1所示。
发起ID | 开始时间 | 结束时间 | 开始站点 | 结束站点 | 接收ID |
156** | 20140801213209 | 20140803352024 | 20656 | 23201 | 186**** |
156** | 20140802122342 | 20140802352919 | 23201 | 20656 | 156**** |
156** | 。。。 | 。。。 | 。。。 | 。。。 | |
156** | 20140806114635 | 20140806114711 | 23201 | 20656 | 156**** |
表1
在分别提取每个移动用户和目标用户的轨迹数据后,通过对用户的“时空切片”求余弦相似性即可得到用户在地理移动上的相关程度,从而计算出每个移动用户与目标用户在地理位置上的位置相似度。对于用户在社交网络上的社交相似度可采用现有技术中的社交相似度算法来进行计算,例如,采用A-A系数的算法。社交网络的链接预测最常见的预测方法为基于节点相似度的算法,在无向网络中,设任意节点u和v,节点u的邻居集合为F(u),节点v的邻居集合为F(v),则u和v的共同邻居为F(u)和F(v)的交集,记F(u)∩F(v)。经过归一化处理之后,u和v共同邻居占所有用户的比例为在考虑社交关系的基础上,A-A系数的算法对该公式进行改进提出A-A系数,链接预测中,一个兴趣被越少的人拥有,则拥有此兴趣的人越可能成为朋友,而大众兴趣的人之间成为朋友的可能性要低一些,因此该算法给度数较少的节点分配较高的相似度值,则用户在社交网络上的社交相似度计算为其中,t为u和v的共同邻居,dt为共同邻居t的度,即与共同邻居t直接连接的用户数量。
在计算每个移动用户与目标用户在地理位置和社交网络上的相似度后,结合位置相似度和社交相似度,采用预先建立的关系预测模型,即可预测每个移动用户与目标用户的用户关系。在本实施例中,基于运营商的轨迹数据很容易通过运营商获取,使得轨迹数据的获取便利,而且本发明考虑了用户交往网络的动态性和地理位置的动态性变化,贴合运营商进行市场推广的特点。同时,结合社交网络和地理位置的相似度对用户关系进行预测,相对于现有技术中仅仅考虑社交网络的相似度来说,提高了用户关系预测的准确性。
进一步地,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度,具体包括:
根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;
根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。
需要说明的是,与基于社会网络研究社交关系类似,基于地理位置相似度来研究空间位置的相似性来描述用户关系的紧密程度。一般来说,在地理轨迹上相似程度高的用户成为好友的可能性也非常高。在提取用户的轨迹数据后,用户轨迹可通过轨迹数据中的时间戳和基站识别码的组合来表示,根据用户轨迹即可获取用户的区域分布。例如,假设用户u的轨迹为<t1,l1>,<t2,l2>…<tn,ln>,其中,t为时间戳,l为基站识别码,n为用户的用户终端发生业务的次数,则用户u的区域分布为GP(u,r)。其中,按照小时颗粒度划分,用户的区域分布为用户在每个时间段出现在每个基站的概率分布。例如,某用户在每个时刻出现在每个基站的情况如表2所示。
时间段 | 基站ID1 | 基站ID2 | 基站IDj | … | 基站IDm |
1 | 0.20 | 0 | 0.1 | ||
ti | 0.8 | ||||
… | 0 | ||||
24 | 0.34 | 1 | … |
表2
在获取用户的区域分布后,采用位置相似度算法,即通过对用户的“时空切片”求余弦相似性即可得到用户在地理移动上的相似度。
进一步地,所述区域分布算法如下:
其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布。
其中,当r=li(u)时,δ(r,li(u))=1,否则为0。
进一步地,所述位置相似度算法如下:
其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。
进一步地,所述关系预测模型如下:
MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。
基于地理位置和社交网络的重合度来构建关系预测模型,计算复杂度不高,省去了传统考虑多种社会因素进行建模的麻烦。
进一步地,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度之前,还包括:
将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;
去除所述实际重合度小于预设阈值的移动用户;
所述重合度算法如下:
其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。
需要说明的是,在提取用户的轨迹数据后,还需结合地理位置和时间的重合度算法对数据进行去噪。先将提取的轨迹数据划分为工作时间段(8点-17点)的轨迹数据和非工作时间段(19点-24点)的轨迹数据。结合时间因素,以△T为时间精度(一般设为1个小时),反应所有用户在邻近时间在相同的地理位置的比例。同时,考虑工作时间段与非工作时间段的影响因素,在工作时间段和非工作时间段设置不同权重,由于本发明的重点是识别朋友关系,因此可设置非工作时间段的权重较大,而工作时间段的权重较小。设置好权重后,采用重合度算法,分别计算每个移动用户与目标用户在工作时间段的第一重合度,以及在非工作时间段的第二重合度。例如,设置非工作时间段的权重为0.7,工作时间段的权重为0.3,以便通过计算出的实际重合度来剔除在工作时间段与目标用户关系紧密的同事。通过地理位置和时间的重合度过滤掉大部分的同事关系,降低其后用户关系预测的误差。
例如,对提取的某市某运营商的10万移动用户在一个月的全部轨迹数据进行去噪后,得到与目标用户的实际重合度满足一定阈值的移动用户仅有17302个。再把过滤后的用户的轨迹数据按照日期分为两部分,前20天作为训练集,后10天作为测试集。设置γ=0.2,根据预测关系模块对训练集进行预测,得到一系列移动用户与目标用户之间的MR值(基于关系预测模型)和A-A值(基于A-A系数的算法)。再分别将MR值和A-A值按照大小排序,选择MR值大于0.25和A-A值大于0.5的用户关系作为候选集。最后与测试集进行比较,得到训练集中基于关系预测模型进行预测的正确率为0.82,基于A-A系数的算法进行预测的正确率为0.76,而测试集中基于关系预测模型进行预测的正确率为0.77,基于A-A系数的算法进行预测的正确率为0.68。可见,仅考虑社交网络的关系预测方法在预测用户关系上的准确率较低。因此,结合社交网络和地理位置的重合度来进行用户关系预测能够提升用户关系预测的准确度。
本发明实施例提供的用户关系预测方法,能够从移动用户和目标用户的用户终端发生业务的信息中提取出用户的轨迹数据,再根据轨迹数据分别计算出移动用户与目标用户在地理位置和社交网络上的相似度,进而根据两个相似度预测出移动用户与目标用户的用户关系,基于地理位置和社交网络的相似度预测用户关系,提高了用户关系预测的精确度;通过每个移动用户与目标用户在时间和地理位置上的重合度对移动用户进行过滤,降低其后用户关系预测的误差。
相应的,本发明还提供一种用户关系预测装置,能够实现上述实施例中的用户关系预测方法的所有流程。
参见图2,是本发明提供的用户关系预测装置的一个实施例的结构示意图,包括:
数据提取模块1,用于分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
位置相似度计算模块2,用于根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;
社交相似度计算模块3,用于分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;以及,
预测模块4,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。
进一步地,所述位置相似度计算模块具体包括:
区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;以及,
位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。
进一步地,所述区域分布算法如下:
其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;
所述位置相似度算法如下:
其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。
进一步地,所述关系预测模型如下:
MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。
进一步地,所述用户关系预测装置还包括:
数据划分模块,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
第一重合度计算模块,用于根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
第二重合度计算模块,用于根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
实际重合度计算模块,用于将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,
过滤模块,用于去除所述实际重合度小于预设阈值的移动用户;
所述重合度算法如下:
其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。
本发明实施例提供的用户关系预测装置,能够从移动用户和目标用户的用户终端发生业务的信息中提取出用户的轨迹数据,再根据轨迹数据分别计算出移动用户与目标用户在地理位置和社交网络上的相似度,进而根据两个相似度预测出移动用户与目标用户的用户关系,基于地理位置和社交网络的相似度预测用户关系,提高了用户关系预测的精确度;通过每个移动用户与目标用户在时间和地理位置上的重合度对移动用户进行过滤,降低其后用户关系预测的误差。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种用户关系预测方法,其特征在于,包括:
分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;
分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;
根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。
2.如权利要求1所述的用户关系预测方法,其特征在于,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度,具体包括:
根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;
根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。
3.如权利要求2所述的用户关系预测方法,其特征在于,所述区域分布算法如下:
其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;
所述位置相似度算法如下:
其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。
4.如权利要求3所述的用户关系预测方法,其特征在于,所述关系预测模型如下:
MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。
5.如权利要求1至4任一项所述的用户关系预测方法,其特征在于,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度之前,还包括:
将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;
去除所述实际重合度小于预设阈值的移动用户;
所述重合度算法如下:
其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。
6.一种用户关系预测装置,其特征在于,包括:
数据提取模块,用于分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
位置相似度计算模块,用于根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;
社交相似度计算模块,用于分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;以及,
预测模块,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。
7.如权利要求6所述的用户关系预测装置,其特征在于,所述位置相似度计算模块具体包括:
区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区域分布;以及,
位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度。
8.如权利要求7所述的用户关系预测装置,其特征在于,所述区域分布算法如下:
其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区域分布;
所述位置相似度算法如下:
其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)为用户u与用户v的位置相似度。
9.如权利要求8所述的用户关系预测装置,其特征在于,所述关系预测模型如下:
MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,v)为用户u与用户v的用户关系。
10.如权利要求6至9任一项所述的用户关系预测装置,其特征在于,所述用户关系预测装置还包括:
数据划分模块,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
第一重合度计算模块,用于根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
第二重合度计算模块,用于根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
实际重合度计算模块,用于将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,
过滤模块,用于去除所述实际重合度小于预设阈值的移动用户;
所述重合度算法如下:
其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作时段的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610986113.2A CN106570764A (zh) | 2016-11-09 | 2016-11-09 | 一种用户关系预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610986113.2A CN106570764A (zh) | 2016-11-09 | 2016-11-09 | 一种用户关系预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106570764A true CN106570764A (zh) | 2017-04-19 |
Family
ID=58540741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610986113.2A Pending CN106570764A (zh) | 2016-11-09 | 2016-11-09 | 一种用户关系预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570764A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241219A (zh) * | 2017-05-26 | 2017-10-10 | 广州杰赛科技股份有限公司 | 用户信任度预测方法和装置 |
CN107741953A (zh) * | 2017-09-14 | 2018-02-27 | 平安科技(深圳)有限公司 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
CN108009278A (zh) * | 2017-12-20 | 2018-05-08 | 华南师范大学 | 一种基于时态推理的学术关系精准判别方法和系统 |
CN108319647A (zh) * | 2017-12-27 | 2018-07-24 | 福建工程学院 | 一种基于浮动车技术的社交关系发现方法及终端 |
CN108600961A (zh) * | 2018-03-23 | 2018-09-28 | 广州杰赛科技股份有限公司 | 用户相似度的获得方法和装置、设备、存储介质 |
CN108650614A (zh) * | 2018-03-19 | 2018-10-12 | 复旦大学 | 一种自动推断社会关系的移动用户位置预测方法与装置 |
CN109828967A (zh) * | 2018-12-03 | 2019-05-31 | 深圳市北斗智能科技有限公司 | 一种伴随关系获取方法、系统、设备、存储介质 |
CN109829485A (zh) * | 2019-01-08 | 2019-05-31 | 科大国创软件股份有限公司 | 一种基于移动通信数据的用户关系挖掘方法及系统 |
CN109937343A (zh) * | 2017-06-22 | 2019-06-25 | 百度时代网络技术(北京)有限公司 | 用于自动驾驶车辆交通预测中的预测轨迹的评估框架 |
CN110196891A (zh) * | 2018-11-15 | 2019-09-03 | 腾讯大地通途(北京)科技有限公司 | 街区类型的确定方法、装置、存储介质及电子装置 |
CN110598122A (zh) * | 2018-06-13 | 2019-12-20 | 百度在线网络技术(北京)有限公司 | 社交群体挖掘方法、装置、设备及存储介质 |
CN110730432A (zh) * | 2019-10-21 | 2020-01-24 | 深圳市名通科技股份有限公司 | 邻近用户识别方法、终端及可读存储介质 |
CN110837602A (zh) * | 2019-11-05 | 2020-02-25 | 重庆邮电大学 | 基于表示学习和多模态卷积神经网络的用户推荐方法 |
CN110855487A (zh) * | 2019-11-13 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 网络用户相似度管理方法、装置及存储介质 |
CN111324741A (zh) * | 2018-12-17 | 2020-06-23 | 中国移动通信集团山西有限公司 | 用户关系识别方法、装置、设备及介质 |
CN111680077A (zh) * | 2020-06-17 | 2020-09-18 | 郑州市中之易科技有限公司 | 一种通过关联度评分和模型比对确定相互关系的方法 |
CN111695019A (zh) * | 2020-06-11 | 2020-09-22 | 腾讯科技(深圳)有限公司 | 一种识别关联账号的方法及装置 |
CN112153091A (zh) * | 2019-06-27 | 2020-12-29 | 北京百度网讯科技有限公司 | 用于确定设备的相关性的方法及装置 |
CN117648556A (zh) * | 2024-01-29 | 2024-03-05 | 深圳市名通科技股份有限公司 | 基于时空大数据的家庭成员关系识别的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103700018A (zh) * | 2013-12-16 | 2014-04-02 | 华中科技大学 | 一种移动社会网络中的人群划分方法 |
CN104881459A (zh) * | 2015-05-22 | 2015-09-02 | 电子科技大学 | 一种移动社会网络的好友推荐方法 |
CN105791085A (zh) * | 2016-01-26 | 2016-07-20 | 西安电子科技大学 | 在位置社交网络中基于位置与时间的好友推荐方法 |
-
2016
- 2016-11-09 CN CN201610986113.2A patent/CN106570764A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103700018A (zh) * | 2013-12-16 | 2014-04-02 | 华中科技大学 | 一种移动社会网络中的人群划分方法 |
CN104881459A (zh) * | 2015-05-22 | 2015-09-02 | 电子科技大学 | 一种移动社会网络的好友推荐方法 |
CN105791085A (zh) * | 2016-01-26 | 2016-07-20 | 西安电子科技大学 | 在位置社交网络中基于位置与时间的好友推荐方法 |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241219B (zh) * | 2017-05-26 | 2019-12-03 | 广州杰赛科技股份有限公司 | 用户信任度预测方法和装置 |
CN107241219A (zh) * | 2017-05-26 | 2017-10-10 | 广州杰赛科技股份有限公司 | 用户信任度预测方法和装置 |
CN109937343A (zh) * | 2017-06-22 | 2019-06-25 | 百度时代网络技术(北京)有限公司 | 用于自动驾驶车辆交通预测中的预测轨迹的评估框架 |
CN107741953A (zh) * | 2017-09-14 | 2018-02-27 | 平安科技(深圳)有限公司 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
CN107741953B (zh) * | 2017-09-14 | 2020-01-21 | 平安科技(深圳)有限公司 | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
CN108009278A (zh) * | 2017-12-20 | 2018-05-08 | 华南师范大学 | 一种基于时态推理的学术关系精准判别方法和系统 |
CN108319647A (zh) * | 2017-12-27 | 2018-07-24 | 福建工程学院 | 一种基于浮动车技术的社交关系发现方法及终端 |
CN108650614A (zh) * | 2018-03-19 | 2018-10-12 | 复旦大学 | 一种自动推断社会关系的移动用户位置预测方法与装置 |
CN108650614B (zh) * | 2018-03-19 | 2020-07-28 | 复旦大学 | 一种自动推断社会关系的移动用户位置预测方法与装置 |
CN108600961A (zh) * | 2018-03-23 | 2018-09-28 | 广州杰赛科技股份有限公司 | 用户相似度的获得方法和装置、设备、存储介质 |
CN110598122B (zh) * | 2018-06-13 | 2022-04-01 | 百度在线网络技术(北京)有限公司 | 社交群体挖掘方法、装置、设备及存储介质 |
CN110598122A (zh) * | 2018-06-13 | 2019-12-20 | 百度在线网络技术(北京)有限公司 | 社交群体挖掘方法、装置、设备及存储介质 |
CN110196891A (zh) * | 2018-11-15 | 2019-09-03 | 腾讯大地通途(北京)科技有限公司 | 街区类型的确定方法、装置、存储介质及电子装置 |
CN110196891B (zh) * | 2018-11-15 | 2024-03-15 | 腾讯大地通途(北京)科技有限公司 | 街区类型的确定方法、装置、存储介质及电子装置 |
CN109828967A (zh) * | 2018-12-03 | 2019-05-31 | 深圳市北斗智能科技有限公司 | 一种伴随关系获取方法、系统、设备、存储介质 |
CN109828967B (zh) * | 2018-12-03 | 2021-10-19 | 深圳市北斗智能科技有限公司 | 一种伴随关系获取方法、系统、设备、存储介质 |
CN111324741B (zh) * | 2018-12-17 | 2023-08-18 | 中国移动通信集团山西有限公司 | 用户关系识别方法、装置、设备及介质 |
CN111324741A (zh) * | 2018-12-17 | 2020-06-23 | 中国移动通信集团山西有限公司 | 用户关系识别方法、装置、设备及介质 |
CN109829485A (zh) * | 2019-01-08 | 2019-05-31 | 科大国创软件股份有限公司 | 一种基于移动通信数据的用户关系挖掘方法及系统 |
CN112153091B (zh) * | 2019-06-27 | 2022-05-13 | 北京百度网讯科技有限公司 | 用于确定设备的相关性的方法及装置 |
CN112153091A (zh) * | 2019-06-27 | 2020-12-29 | 北京百度网讯科技有限公司 | 用于确定设备的相关性的方法及装置 |
CN110730432B (zh) * | 2019-10-21 | 2021-01-08 | 深圳市名通科技股份有限公司 | 邻近用户识别方法、终端及可读存储介质 |
CN110730432A (zh) * | 2019-10-21 | 2020-01-24 | 深圳市名通科技股份有限公司 | 邻近用户识别方法、终端及可读存储介质 |
CN110837602B (zh) * | 2019-11-05 | 2022-10-04 | 重庆邮电大学 | 基于表示学习和多模态卷积神经网络的用户推荐方法 |
CN110837602A (zh) * | 2019-11-05 | 2020-02-25 | 重庆邮电大学 | 基于表示学习和多模态卷积神经网络的用户推荐方法 |
CN110855487B (zh) * | 2019-11-13 | 2022-02-18 | 腾讯科技(深圳)有限公司 | 网络用户相似度管理方法、装置及存储介质 |
CN110855487A (zh) * | 2019-11-13 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 网络用户相似度管理方法、装置及存储介质 |
CN111695019A (zh) * | 2020-06-11 | 2020-09-22 | 腾讯科技(深圳)有限公司 | 一种识别关联账号的方法及装置 |
CN111695019B (zh) * | 2020-06-11 | 2023-08-08 | 腾讯科技(深圳)有限公司 | 一种识别关联账号的方法及装置 |
CN111680077A (zh) * | 2020-06-17 | 2020-09-18 | 郑州市中之易科技有限公司 | 一种通过关联度评分和模型比对确定相互关系的方法 |
CN111680077B (zh) * | 2020-06-17 | 2023-10-27 | 郑州市中之易科技有限公司 | 一种通过关联度评分和模型比对确定相互关系的方法 |
CN117648556A (zh) * | 2024-01-29 | 2024-03-05 | 深圳市名通科技股份有限公司 | 基于时空大数据的家庭成员关系识别的方法 |
CN117648556B (zh) * | 2024-01-29 | 2024-05-10 | 深圳市名通科技股份有限公司 | 基于时空大数据的家庭成员关系识别的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570764A (zh) | 一种用户关系预测方法及装置 | |
CN104239556B (zh) | 基于密度聚类的自适应轨迹预测方法 | |
CN106912015B (zh) | 一种基于移动网络数据的人员出行链识别方法 | |
CN106156941B (zh) | 一种用户信用评分优化方法和装置 | |
CN102594905B (zh) | 一种基于场景的社交网络位置兴趣点推荐方法 | |
CN107920362A (zh) | 一种基于微区域的lte网络性能评估方法 | |
US8700631B2 (en) | Tempo spatial data extraction from network connected devices | |
Pourkhabbaz et al. | Suitability analysis for determining potential agricultural land use by the multi-criteria decision making models SAW and VIKOR-AHP (Case study: Takestan-Qazvin Plain) | |
CN106792517A (zh) | 基于手机位置时空转移概率的基站服务人数时序预测方法 | |
DE102012223468A1 (de) | Ermitteln eines üblichen Startpunkts, eines üblichen Zielpunkts und einer üblichen Route aus einem Netzdatensatz | |
US8838134B2 (en) | Method and computer programs for the construction of communting matrices using call detail records and a use for providing user's mobility information | |
CN103929719B (zh) | 定位信息的优化方法和优化装置 | |
CN106604228A (zh) | 一种基于lte信令数据的指纹定位方法 | |
CN104980950A (zh) | 一种网络优化服务器、实现网络优化的移动设备和系统 | |
CN105808680A (zh) | 基于张量分解进行上下文相关的位置推荐方法 | |
CN111107556B (zh) | 一种移动通信网络的信号覆盖质量评估方法和装置 | |
Sudo et al. | Particle filter for real-time human mobility prediction following unprecedented disaster | |
CN112579922B (zh) | 一种基于用户轨迹的兴趣点推荐方法 | |
CN103209422A (zh) | 一种wlan网络精确选点的方法 | |
CN105281959B (zh) | 一种基于隐马尔可夫模型的移动通信用户流失预测方法 | |
CN114239924A (zh) | 基于天气参数的影响指数确定方法及装置 | |
CN104360998B (zh) | 一种基于协作频度聚类的Web服务信任度评估方法 | |
CN109934623A (zh) | 基于用户app使用行为的个体经济消费能力预测方法 | |
CN102385586A (zh) | 多方协同过滤方法和系统 | |
O’Toole et al. | Local perceptions of sustainability indicators: issues of scale and implications for management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170419 |