CN108683995B - 用户移动轨迹的获得方法和装置 - Google Patents

用户移动轨迹的获得方法和装置 Download PDF

Info

Publication number
CN108683995B
CN108683995B CN201810244916.XA CN201810244916A CN108683995B CN 108683995 B CN108683995 B CN 108683995B CN 201810244916 A CN201810244916 A CN 201810244916A CN 108683995 B CN108683995 B CN 108683995B
Authority
CN
China
Prior art keywords
track
weight
obtaining
user
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810244916.XA
Other languages
English (en)
Other versions
CN108683995A (zh
Inventor
杜翠凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jiesai Communication Planning And Design Institute Co ltd
GCI Science and Technology Co Ltd
Original Assignee
Guangzhou Jiesai Communication Planning And Design Institute Co ltd
GCI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jiesai Communication Planning And Design Institute Co ltd, GCI Science and Technology Co Ltd filed Critical Guangzhou Jiesai Communication Planning And Design Institute Co ltd
Priority to CN201810244916.XA priority Critical patent/CN108683995B/zh
Publication of CN108683995A publication Critical patent/CN108683995A/zh
Application granted granted Critical
Publication of CN108683995B publication Critical patent/CN108683995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Navigation (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了一种用户移动轨迹的获得方法和装置。所述用户移动轨迹的获得方法包括:获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点;获得每个所述轨迹点的第一权重;根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重;根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重;根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹。采用本发明,能够提高获得的用户移动轨迹的准确度,减少数据的冗余。

Description

用户移动轨迹的获得方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户移动轨迹的获得方法和装置。
背景技术
在电信运营商运营过程中,常常需要获取用户的移动轨迹,并通过对这些移动轨迹进行分析,从中挖据出更深层次的数据信息,从而根据这些数据信息对电信服务进行完善和改进,提高用户体验。
在现有技术中,用户的移动轨迹通常都是通过对用户的位置进行实时定位来实现的,如,通过采用GPS(Global Positioning System,全球定位系统)技术实时获取用户的位置信息,从而生成相应的移动轨迹。随后,通过对生成的移动轨迹进行分析,从中获得相应的数据信息。由于现有的实时定位技术存在一定的误差,无法避免由于设备自身或者设备外部环境影响所带来的定位点偏移、跳动等现象,因此,最终获得的用户移动轨迹中不可避免地存在一些异常的轨迹点,准确度不高。另外,对用户偶尔一两次出现在某个地理位置所生成的移动轨迹进行分析,通常没有太大的实际意义,因此,最终获得的用户移动轨迹中存在大量的冗余的数据,容易造成最终的分析结果出现误差。
发明内容
本发明实施例提出一种用户移动轨迹的获得方法和装置,能够提高获得的用户移动轨迹的准确度,减少数据的冗余。
本发明实施例提供的一种用户移动轨迹的获得方法,具体包括:
获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点;
获得每个所述轨迹点的第一权重;
根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重;
根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重;
根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹。
进一步地,所述获得每个所述轨迹点的第一权重,具体包括:
获得每个所述轨迹点对应的第一时间值;
根据每个所述轨迹点对应的第一时间值,分别获得每个所述轨迹点类别对应的第二时间值;
将每个所述第二时间值设置为对应的轨迹点类别所对应的每个所述轨迹点的第一权重。
进一步地,所述第一时间值为所述目标用户在对应的轨迹点上的停留时长值。
进一步地,所述根据每个所述轨迹点对应的第一时间值,分别获得每个所述轨迹点类别对应的第二时间值,具体包括:
分别计算属于同一所述轨迹点类别的每个所述轨迹点的第一时间值的平均值,获得每个所述轨迹点类别对应的第二时间值。
进一步地,所述根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重,具体包括:
计算获得所有所述轨迹点的第一权重的第一权重和值;
根据每个所述轨迹点的第一权重,分别获得每个所述第一用户移动轨迹对应的第二权重和值;
根据所述第一权重和值和每个所述第二权重和值,获得每个所述第一用户移动轨迹的轨迹权重。
进一步地,所述根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重,具体包括:
将每个所述轨迹权重设置为对应的第一用户移动轨迹中的每个轨迹点的第二权重;
根据每个所述轨迹点的第二权重,分别获得每个所述轨迹点类别对应的类别权重。
进一步地,所述根据每个所述轨迹点的第二权重,分别获得每个所述轨迹点类别对应的类别权重,具体包括:
分别计算属于同一所述轨迹点类别的每个所述轨迹点的第二权重之和,获得每个所述轨迹点类别对应的类别权重。
进一步地,所述根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹,具体包括:
根据每个所述轨迹点类别对应的类别权重,构建所述目标用户对应的用户移动轨迹数据结构;
对所述用户移动轨迹数据结构进行解析,获得所述第二用户移动轨迹。
进一步地,所述用户移动轨迹数据结构为加权FP树;
则所述对所述用户移动轨迹数据结构进行解析,获得所述第二用户移动轨迹,具体包括:
获得所述加权FP树中的每个条件模式基;
根据每个所述条件模式基,从所述加权FP树中提取获得用户移动轨迹频繁项集;
将所述用户移动轨迹频繁项集设置为所述第二用户移动轨迹。
相应地,本发明实施例还提供了一种用户移动轨迹的获得装置,具体包括:
第一用户移动轨迹获得模块,用于获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点;
轨迹点第一权重获得模块,用于获得每个所述轨迹点的第一权重;
移动轨迹权重获得模块,用于根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重;
轨迹点类别权重获得模块,用于根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重;以及,
第二用户移动轨迹提取模块,用于根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的用户移动轨迹的获得方法和装置,通过根据多个用户移动轨迹中的各个轨迹点的权重,获得各个轨迹点类别对应的类别权重,进而根据这些类别权重从该多个用户移动轨迹中提取获得较为集中的数据,将其中较为偶发的、异常的数据剔除,即从中获得一个能够反映用户频繁访问的地理位置以及各个地理位置之间的连接关系的用户移动轨迹,从而能够解决获得的用户移动轨迹的数据稀疏性的问题,提高获得的用户移动轨迹的准确度,减少其中的数据的冗余程度。在一些具体的实施例中,在对获得的用户移动轨迹进行分析的过程中,由于获得的用户移动轨迹的数据量较小,冗余数据少,因此还能够提高分析过程的效率和准确度。
附图说明
图1是本发明提供的用户移动轨迹的获得方法的一个优选的实施例的流程示意图;
图2是本发明提供的用户移动轨迹的获得方法中的一个加权FP树的结构示意图;
图3是本发明提供的用户移动轨迹的获得方法中的一个FP子树的结构示意图;
图4是本发明提供的用户移动轨迹的获得方法中的一个条件模式的结构示意图;
图5是本发明提供的用户移动轨迹的获得装置的一个优选的实施例的结构示意图;
图6是本发明提供的服务器设备的一个优选的实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明提供的用户移动轨迹的获得方法的一个优选的实施例的流程示意图,包括步骤S11至S15,具体如下:
S11:获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点。
需要说明的是,本发明实施例由系统执行。其中,该系统可以为电信运营商服务器中的系统。
电信运营商在各处设置若干基站,系统通过获取用户的通信数据,从而获得用户的用户移动轨迹。通过对通信数据进行分析,从而获得用户移动轨迹,能够减少用户终端设备与电信运营商服务器之间的通信次数和通信时间,从而减少用户终端设备的资源消耗,提高数据处理的速率。具体地,系统对目标用户进行实时监测,获取目标用户微信、短信、QQ等通信数据,通过对这些通信数据进行分析,从而判断目标用户在这段时间内经过的基站。在本实施例中,每当检测到目标用户移动至一个基站附近时,将该基站记录为一个轨迹点,通过记录目标用户在预设的时间段内经过的基站,即可获得上述第一用户移动轨迹。在一些具体的实施例中,还可以采用L表示基站,则上述第一用户移动轨迹可以采用Li→Lj的形式表示,表示用户在这段时间内从基站Li移动至基站Lj
需要说明的是,在一些具体的实施例中,为了减少“乒乓切换”的现象出现,还可以通过计算目标用户的合理移动速度来对各个第一用户移动轨迹中的异常轨迹点进行剔除,从而提高获取的第一用户移动轨迹的准确度,进而提高获得的第二用户移动轨迹的准确度,减少数据的冗余。其中,异常轨迹点指的是目标用户移动至该轨迹点时,移动速度出现异常(大于预设阈值)的现象。
S12:获得每个所述轨迹点的第一权重。
需要说明的是,在获得目标用户的一个或者多个第一用户移动轨迹之后,根据这些第一用户移动轨迹,获得每个轨迹点对应的第一权重。
S13:根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重。
需要说明的是,对于每个第一用户移动轨迹,获取该第一用户移动轨迹中的各个轨迹点对应的第一权重,并通过采用对这些第一权重进行求平均值、求和或求中位数等多种方式获得该第一用户移动轨迹对应的轨迹权重。
S14:根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重。
需要说明的是,上述轨迹点类别和上述基站具有一一对应关系,具体地,通过判断轨迹点所对应的基站,从而判定该轨迹点所属的轨迹点类别。例如,假设系统获得的目标用户的一个第一用户移动轨迹a→b→c,假设其中轨迹点a是在目标用户经过基站A时获得的,轨迹点b是在目标用户经过基站B时获得的,轨迹点c是在目标用户经过基站A时获得的,则判定轨迹点a和轨迹点c归属于基站A所对应的轨迹点类别,轨迹点b归属于基站B所对应的轨迹点类别。
在判定各个轨迹点所属的轨迹点类别之后,即可根据各个第一用户移动轨迹的轨迹权重,获得各个轨迹点类别的类别权重。
S15:根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹。
需要说明的是,在获得各个轨迹点类别对应的类别权重之后,根据这些类别权重,从各个第一用户移动轨迹中提取出目标用户经常涉及的轨迹点类别,从而获得目标用户经常访问的基站,根据这些基站,进而获得由这些基站相互连接组成的目标用户的频繁移动轨迹,即获得目标用户对应的第二用户移动轨迹。
本实施例通过根据多个用户移动轨迹中的各个轨迹点的权重,获得各个轨迹点类别对应的类别权重,进而根据这些类别权重从该多个用户移动轨迹中提取获得较为集中的数据,将其中较为偶发的、异常的数据剔除,即从中获得一个能够反映用户频繁访问的地理位置以及各个地理位置之间的连接关系的用户移动轨迹,从而能够解决获得的用户移动轨迹的数据稀疏性的问题,提高获得的用户移动轨迹的准确度,减少其中的数据的冗余程度。在一些具体的实施例中,在对获得的用户移动轨迹进行分析的过程中,由于获得的用户移动轨迹的数据量较小,冗余数据少,因此还能够提高分析过程的效率和准确度。
在另一个优选的实施例中,上述步骤S12进一步包括步骤S1201至S1203,具体如下:
S1201:获得每个所述轨迹点对应的第一时间值。
需要说明的是,上述第一时间值可以为上述目标用户到达对应的轨迹点的时刻值,也可以为上述目标用户离开对应的轨迹点的时刻值。
更优选地,所述第一时间值为所述目标用户在对应的轨迹点上的停留时长值。
S1202:根据每个所述轨迹点对应的第一时间值,分别获得每个所述轨迹点类别对应的第二时间值。
需要说明的是,可以通过对各个轨迹点对应的第一时间值进行求和、求平均值、求中位值或者加权求和的方式,计算获得各个轨迹点类别对应的第二时间值。
进一步地,上述步骤S1202进一步包括步骤S1202_1,具体如下:
S1202_1:分别计算属于同一所述轨迹点类别的每个所述轨迹点的第一时间值的平均值,获得每个所述轨迹点类别对应的第二时间值。
需要说明的是,在识别出每个第一用户移动轨迹中的每个轨迹点所属的轨迹点类别之后,针对每个轨迹点类别,分别计算属于该轨迹点类别的所有轨迹点对应的第一时间值的平均值,从而获得该轨迹点类别对应的第二时间值。
例如,假设获得目标用户的若干第一用户移动轨迹,其中,在第一个第一用户移动轨迹中,目标用户在某一基站A附近停留的时间为t1,在第二个第一用户移动轨迹中,目标用户在该基站A附近停留的时间为t2,在第三个第一用户移动轨迹中,目标用户在该基站A附近停留的时间为t3,则获得该基站A对应的轨迹点类别所对应的三个第一时间值t1、t2和t3。随后,通过计算该第一时间值t1、t2和t3的平均值,从而获得该基站A所对应的轨迹点类别所对应的第二时间值T1(即
Figure BDA0001605989600000081
)。
S1203:将每个所述第二时间值设置为对应的轨迹点类别所对应的每个所述轨迹点的第一权重。
需要说明的是,在计算获得各个轨迹点类别对应的第二时间值后,对于每个轨迹点类别,将该轨迹点类别的第二时间值作为属于该轨迹点类别的所有轨迹点的第一权重。
在又一个优选的实施例中,上述步骤S13进一步包括步骤S1301至S1303,具体如下:
S1301:计算获得所有所述轨迹点的第一权重的第一权重和值。
需要说明的是,在本实施例中,采用归一化的方式计算获得每个第一用户移动轨迹的轨迹权重。具体地,首先对所有第一用户移动轨迹中的所有轨迹点的第一权重求和,获得上述第一权重和值。
S1302:根据每个所述轨迹点的第一权重,分别获得每个所述第一用户移动轨迹对应的第二权重和值。
需要说明的是,在计算获得上述第一权重和值之后,针对每个第一用户移动轨迹,对属于该第一用户移动轨迹的所有轨迹点的第一权重求和,获得该第一用户移动轨迹的第二权重和值。
S1303:根据所述第一权重和值和每个所述第二权重和值,获得每个所述第一用户移动轨迹的轨迹权重。
需要说明的是,在计算上述第一权重和值和每个第一用户移动轨迹的第二权重和值之后,对于每个第一用户移动轨迹,通过将对应的第二权重和值和第一权重和值相除,从而获得该第一用户移动轨迹的轨迹权重。
例如,假设基站L1对应的第一权重为T1,基站L2对应的第一权重为T2,基站L3对应的第一权重为T3,基站L4对应的第一权重为T4,基站L5对应的第一权重为T5;假设获得的目标用户的第一用户移动轨迹的个数为3个,分别为L1→L2→L3→L5、L1→L2→L4和L3。则上述第一权重和值=T1+T2+T3+T5+T1+T2+T4+T3=2T1+2T2+2T3+T4+T5,每个上述第一用户移动轨迹对应的第二权重和值和轨迹权重如下表1所示:
表1
Figure BDA0001605989600000091
在本实施例中,通过采用归一化的方式计算获得各个第一用户移动轨迹的轨迹权重,从而提高所获得的轨迹权重的准确度,进而进一步提高获得的用户移动轨迹的准确度。
在又一个优选的实施例中,上述步骤S14进一步包括步骤S1401至S1402,具体如下:
S1401:将每个所述轨迹权重设置为对应的第一用户移动轨迹中的每个轨迹点的第二权重。
需要说明的是,在计算获得各个第一用户移动轨迹对应的轨迹权重后,对于每个第一用户移动轨迹,将该第一用户移动轨迹对应的轨迹权重作为该第一用户移动轨迹中的每个轨迹点的第二权重。
S1402:根据每个所述轨迹点的第二权重,分别获得每个所述轨迹点类别对应的类别权重。
需要说明的是,对于每个轨迹点类别,通过对属于该轨迹点类别的所有轨迹点的第二权重进行求和、求平均值或者求乘积等多种方式,计算获得该轨迹点类别对应的类别权重。
进一步地,上述步骤S1402进一步包括步骤S1402_1,具体如下:
S1402_1:分别计算属于同一所述轨迹点类别的每个所述轨迹点的第二权重之和,获得每个所述轨迹点类别对应的类别权重。
需要说明的是,在本实施例中,通过对属于同一轨迹点类别的所有轨迹点的第二权重进行求和,从而获得该轨迹点类别对应的类别权重。
例如,根据上表1,可以获得轨迹点L1在第一个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000101
轨迹点L1在第二个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000102
则基站L1对应的轨迹点类别的类别权重为二者之和,即为
Figure BDA0001605989600000103
根据上表1,可以获得轨迹点L2在第一个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000104
轨迹点L2在第二个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000105
则基站L2对应的轨迹点类别的类别权重为二者之和,即为
Figure BDA0001605989600000106
根据上表1,可以获得轨迹点L3在第一个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000107
轨迹点L3在第三个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000108
则基站L3对应的轨迹点类别的类别权重为二者之和,即为
Figure BDA0001605989600000111
根据上表1,可以获得轨迹点L4在第二个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000112
则基站L4对应的轨迹点类别的类别权重即为
Figure BDA0001605989600000113
根据上表1,可以获得轨迹点L5在第一个第一用户移动轨迹中的第二权重为
Figure BDA0001605989600000114
则基站L5对应的轨迹点类别的类别权重即为
Figure BDA0001605989600000115
在又一个优选的实施例中,上述步骤S15进一步包括步骤S1501至S1502,具体如下:
S1501:根据每个所述轨迹点类别对应的类别权重,构建所述目标用户对应的用户移动轨迹数据结构。
S1502:对所述用户移动轨迹数据结构进行解析,获得所述第二用户移动轨迹。
进一步地,所述用户移动轨迹数据结构为加权FP树;
需要说明的是,在本实施例中,假设获得的基站L1至L7对应的轨迹点类别的类别权重如下表2所示:
表2
Figure BDA0001605989600000116
Figure BDA0001605989600000121
则在按照类别权重从大到小对上述各个基站进行排序之后,构建获得如图2所示的加权FP树。
需要说明的是,在一些具体的实施例中,上述第一用户移动数据采用表格的形式记录,则在构建上述加权FP树之前,还需要将该第一用户移动数据转换为字符串的形式,从而提高数据的处理速度。
则上述步骤S1502进一步包括步骤S1502_1至S1502_3,具体包括:
S1502_1:获得所述加权FP树中的每个条件模式基。
需要说明的是,上述条件模式基,指的是将上述加权FP树中的某一待挖掘的节点作为叶子节点后,该叶子节点对应的FP子树。例如,从图2所示的加权FP树中挖掘出节点L7对应的FP子树,从而获得如图3所示的FP子树。
S1502_2:根据每个所述条件模式基,从所述加权FP树中提取获得用户移动轨迹频繁项集。
需要说明的是,上述用户移动轨迹频繁项集为反映目标用户的出行行为具有相同或者相似特征、规律的项集。在本实施例中,对于每个条件模式基,在获得该条件模式基后,将该条件模式基中的各个节点的计数项替换为该条件模式基中的叶子节点的计数项。随后,结合预设的最小支持度,将各个条件模式基中的支持度低于该最小支持度的节点删除,获得各个条件模式基中的条件模式,即可从上述加权FP树中获得由这些条件模式组成的用户移动轨迹频繁项集。
例如,在获得如图3所示的FP子树之后,将该FP子树中的各个节点的类别权重替换为该FP子树中的叶子节点(节点L7)的类别权重,即将该FP子树中的每个节点的类别权重依次设置为(2T1+2T2+2T3+2T5+2T7)/(8T1+8T2+8T3+5T4+2T5+2T6+2T7)。随后,结合预设的最小支持度,将该FP子树中的支持度小于该最小支持度的节点删除,从而获得如图4所示的条件模式。以此类推,即可获得上述加权FP树中的所有条件模式基对应的条件模式,并获得由这些条件模式组成的用户移动轨迹频繁项集。
S1502_3:将所述用户移动轨迹频繁项集设置为所述第二用户移动轨迹。
需要说明的是,在一些具体的实施例中,在通过上述实施例提供的用户移动轨迹的获得方法获得不同用户的第二用户移动轨迹之后,可以通过计算这些第二用户移动轨迹之间的相似度来判断这些用户之间的相似度,从而可以在电信运营过程中,对新入网的用户是否为重入网用户进行判断。例如,假设某用户甲之前使用的号码是159********,并在使用2个月后停用了该号码,2个月后,某用户乙在同一个电信运营商开通了一个新号186********。此时,电信运营商通过上述实施例提供的用户移动轨迹的获得方法分别获得该用户甲的第二用户移动轨迹和该用户乙的第二用户移动轨迹,随后,通过计算该用户甲的第二用户移动轨迹与该用户乙的第二用户移动轨迹之间的相似度,从而获得该用户甲与该用户乙之间的用户相似度,若该用户相似度大于某一预设阈值,则可以认为该用户甲与该用户乙为同一个人,则判定该用户乙则为重入网用户;若该用户相似度小于或者等于某一预设阈值,则认为该用户甲与该用户乙不是同一个人,则判定该用户乙则为新入网用户。
需要进一步说明的是,上述步骤标号仅用于表示不同步骤,而不对各步骤之间的执行顺序进行限定。
本发明实施例提供的用户移动轨迹的获得方法,通过根据多个用户移动轨迹中的各个轨迹点的权重,获得各个轨迹点类别对应的类别权重,进而根据这些类别权重从该多个用户移动轨迹中提取获得较为集中的数据,将其中较为偶发的、异常的数据剔除,即从中获得一个能够反映用户频繁访问的地理位置以及各个地理位置之间的连接关系的用户移动轨迹,从而能够解决获得的用户移动轨迹的数据稀疏性的问题,提高获得的用户移动轨迹的准确度,减少其中的数据的冗余程度。在一些具体的实施例中,在对获得的用户移动轨迹进行分析的过程中,由于获得的用户移动轨迹的数据量较小,冗余数据少,因此还能够提高分析过程的效率和准确度。
相应地,本发明还提供一种用户移动轨迹的获得装置,能够实现上述实施例中的用户移动轨迹的获得方法的所有流程。
如图5所示,为本发明提供的用户移动轨迹的获得装置的一个优选的实施例的结构示意图,具体如下:
第一用户移动轨迹获得模块51,用于获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点;
轨迹点第一权重获得模块52,用于获得每个所述轨迹点的第一权重;
移动轨迹权重获得模块53,用于根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重;
轨迹点类别权重获得模块54,用于根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重;以及,
第二用户移动轨迹提取模块55,用于根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹。
进一步地,所述轨迹点第一权重获得模块,具体包括:
第一时间值获得单元,用于获得每个所述轨迹点对应的第一时间值;
第二时间值获得单元,用于根据每个所述轨迹点对应的第一时间值,分别获得每个所述轨迹点类别对应的第二时间值;以及,
第一权重设置单元,用于将每个所述第二时间值设置为对应的轨迹点类别所对应的每个所述轨迹点的第一权重。
进一步地,所述第一时间值为所述目标用户在对应的轨迹点上的停留时长值。
进一步地,所述第二时间值获得单元,具体包括:
第二时间值获得子单元,用于分别计算属于同一所述轨迹点类别的每个所述轨迹点的第一时间值的平均值,获得每个所述轨迹点类别对应的第二时间值。
进一步地,所述移动轨迹权重获得模块,具体包括:
第一权重和值计算单元,用于计算获得所有所述轨迹点的第一权重的第一权重和值;
第二权重和值计算单元,用于根据每个所述轨迹点的第一权重,分别获得每个所述第一用户移动轨迹对应的第二权重和值;以及,
轨迹权重获得单元,用于根据所述第一权重和值和每个所述第二权重和值,获得每个所述第一用户移动轨迹的轨迹权重。
进一步地,所述轨迹点类别权重获得模块,具体包括:
第二权重设置单元,用于将每个所述轨迹权重设置为对应的第一用户移动轨迹中的每个轨迹点的第二权重;
类别权重获得单元,用于根据每个所述轨迹点的第二权重,分别获得每个所述轨迹点类别对应的类别权重。
进一步地,所述类别权重获得单元,具体包括;
类别权重计算子单元,用于分别计算属于同一所述轨迹点类别的每个所述轨迹点的第二权重之和,获得每个所述轨迹点类别对应的类别权重。
进一步地,所述第二用户移动轨迹提取模块,具体包括:
移动轨迹数据结构构建单元,用于根据每个所述轨迹点类别对应的类别权重,构建所述目标用户对应的用户移动轨迹数据结构;以及,
第二用户移动轨迹获得单元,用于对所述用户移动轨迹数据结构进行解析,获得所述第二用户移动轨迹。
进一步地,所述用户移动轨迹数据结构为加权FP树;
则所述第二用户移动轨迹获得单元,具体包括:
条件模式基获得子单元,用于获得所述加权FP树中的每个条件模式基;
频繁项集提取子单元,用于根据每个所述条件模式基,从所述加权FP树中提取获得用户移动轨迹频繁项集;以及,
用户移动轨迹设置子单元,用于将所述用户移动轨迹频繁项集设置为所述第二用户移动轨迹。
本发明实施例提供的用户移动轨迹的获得装置,通过根据多个用户移动轨迹中的各个轨迹点的权重,获得各个轨迹点类别对应的类别权重,进而根据这些类别权重从该多个用户移动轨迹中提取获得较为集中的数据,将其中较为偶发的、异常的数据剔除,即从中获得一个能够反映用户频繁访问的地理位置以及各个地理位置之间的连接关系的用户移动轨迹,从而能够解决获得的用户移动轨迹的数据稀疏性的问题,提高获得的用户移动轨迹的准确度,减少其中的数据的冗余程度。在一些具体的实施例中,在对获得的用户移动轨迹进行分析的过程中,由于获得的用户移动轨迹的数据量较小,冗余数据少,因此还能够提高分析过程的效率和准确度。
本发明还提供了一种服务器设备。
如图6所示,为本发明提供的服务器设备的一个优选的实施例的结构示意图,包括处理器61、存储器62以及存储在所述存储器62中且被配置为由所述处理器61执行的计算机程序,所述处理器61执行所述计算机程序时实现如上任一实施例所述的用户移动轨迹的获得方法。
需要说明的是,图6仅以该服务器设备中的一个存储器和一个处理器相连接为例进行示意,在一些具体的实施例中,该服务器设备中还可以包括多个存储器和/或多个处理器,其具体的数目及连接方式可根据实际情况需要进行设置和适应性调整。
本发明实施例提供的服务器设备,通过根据多个用户移动轨迹中的各个轨迹点的权重,获得各个轨迹点类别对应的类别权重,进而根据这些类别权重从该多个用户移动轨迹中提取获得较为集中的数据,将其中较为偶发的、异常的数据剔除,即从中获得一个能够反映用户频繁访问的地理位置以及各个地理位置之间的连接关系的用户移动轨迹,从而能够解决获得的用户移动轨迹的数据稀疏性的问题,提高获得的用户移动轨迹的准确度,减少其中的数据的冗余程度。在一些具体的实施例中,在对获得的用户移动轨迹进行分析的过程中,由于获得的用户移动轨迹的数据量较小,冗余数据少,因此还能够提高分析过程的效率和准确度。
本发明还提供了一种计算机可读存储介质,具体包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任一实施例所述的用户移动轨迹的获得方法。
需要说明的是,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要进一步说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明实施例提供的计算机可读存储介质,通过根据多个用户移动轨迹中的各个轨迹点的权重,获得各个轨迹点类别对应的类别权重,进而根据这些类别权重从该多个用户移动轨迹中提取获得较为集中的数据,将其中较为偶发的、异常的数据剔除,即从中获得一个能够反映用户频繁访问的地理位置以及各个地理位置之间的连接关系的用户移动轨迹,从而能够解决获得的用户移动轨迹的数据稀疏性的问题,提高获得的用户移动轨迹的准确度,减少其中的数据的冗余程度。在一些具体的实施例中,在对获得的用户移动轨迹进行分析的过程中,由于获得的用户移动轨迹的数据量较小,冗余数据少,因此还能够提高分析过程的效率和准确度。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (9)

1.一种用户移动轨迹的获得方法,其特征在于,包括:
获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点;
获得每个所述轨迹点的第一权重;
根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重;
根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重;
根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹;
其中,所述根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重,具体包括:
计算获得所有所述轨迹点的第一权重的第一权重和值;
根据每个所述轨迹点的第一权重,分别获得每个所述第一用户移动轨迹对应的第二权重和值;
根据所述第一权重和值和每个所述第二权重和值,获得每个所述第一用户移动轨迹的轨迹权重。
2.如权利要求1所述的用户移动轨迹的获得方法,其特征在于,所述获得每个所述轨迹点的第一权重,具体包括:
获得每个所述轨迹点对应的第一时间值;
根据每个所述轨迹点对应的第一时间值,分别获得每个所述轨迹点类别对应的第二时间值;
将每个所述第二时间值设置为对应的轨迹点类别所对应的每个所述轨迹点的第一权重。
3.如权利要求2所述的用户移动轨迹的获得方法,其特征在于,所述第一时间值为所述目标用户在对应的轨迹点上的停留时长值。
4.如权利要求2所述的用户移动轨迹的获得方法,其特征在于,所述根据每个所述轨迹点对应的第一时间值,分别获得每个所述轨迹点类别对应的第二时间值,具体包括:
分别计算属于同一所述轨迹点类别的每个所述轨迹点的第一时间值的平均值,获得每个所述轨迹点类别对应的第二时间值。
5.如权利要求1所述的用户移动轨迹的获得方法,其特征在于,所述根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重,具体包括:
将每个所述轨迹权重设置为对应的第一用户移动轨迹中的每个轨迹点的第二权重;
根据每个所述轨迹点的第二权重,分别获得每个所述轨迹点类别对应的类别权重。
6.如权利要求5所述的用户移动轨迹的获得方法,其特征在于,所述根据每个所述轨迹点的第二权重,分别获得每个所述轨迹点类别对应的类别权重,具体包括:
分别计算属于同一所述轨迹点类别的每个所述轨迹点的第二权重之和,获得每个所述轨迹点类别对应的类别权重。
7.如权利要求1所述的用户移动轨迹的获得方法,其特征在于,所述根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹,具体包括:
根据每个所述轨迹点类别对应的类别权重,构建所述目标用户对应的用户移动轨迹数据结构;
对所述用户移动轨迹数据结构进行解析,获得所述第二用户移动轨迹。
8.如权利要求7所述的用户移动轨迹的获得方法,其特征在于,所述用户移动轨迹数据结构为加权FP树;
则所述对所述用户移动轨迹数据结构进行解析,获得所述第二用户移动轨迹,具体包括:
获得所述加权FP树中的每个条件模式基;
根据每个所述条件模式基,从所述加权FP树中提取获得用户移动轨迹频繁项集;
将所述用户移动轨迹频繁项集设置为所述第二用户移动轨迹。
9.一种用户移动轨迹的获得装置,其特征在于,包括:
第一用户移动轨迹获得模块,用于获得目标用户的至少一个第一用户移动轨迹;其中,每个所述第一用户移动轨迹中包含至少一个轨迹点;
轨迹点第一权重获得模块,用于获得每个所述轨迹点的第一权重;
移动轨迹权重获得模块,用于根据每个所述轨迹点的第一权重,获得每个所述第一用户移动轨迹的轨迹权重;
轨迹点类别权重获得模块,用于根据每个所述第一用户移动轨迹的轨迹权重,获得至少一个轨迹点类别的类别权重;以及,
第二用户移动轨迹提取模块,用于根据每个所述轨迹点类别的类别权重,从所有所述第一用户移动轨迹中提取获得第二用户移动轨迹;
其中,所述移动轨迹权重获得模块,具体包括:
第一权重和值计算单元,用于计算获得所有所述轨迹点的第一权重的第一权重和值;
第二权重和值计算单元,用于根据每个所述轨迹点的第一权重,分别获得每个所述第一用户移动轨迹对应的第二权重和值;以及,
轨迹权重获得单元,用于根据所述第一权重和值和每个所述第二权重和值,获得每个所述第一用户移动轨迹的轨迹权重。
CN201810244916.XA 2018-03-23 2018-03-23 用户移动轨迹的获得方法和装置 Active CN108683995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810244916.XA CN108683995B (zh) 2018-03-23 2018-03-23 用户移动轨迹的获得方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810244916.XA CN108683995B (zh) 2018-03-23 2018-03-23 用户移动轨迹的获得方法和装置

Publications (2)

Publication Number Publication Date
CN108683995A CN108683995A (zh) 2018-10-19
CN108683995B true CN108683995B (zh) 2020-06-19

Family

ID=63800465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810244916.XA Active CN108683995B (zh) 2018-03-23 2018-03-23 用户移动轨迹的获得方法和装置

Country Status (1)

Country Link
CN (1) CN108683995B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338541A (zh) * 2014-06-30 2016-02-17 华为技术有限公司 一种基于移动无线网络数据的异常轨迹检测方法及装置
CN106339716A (zh) * 2016-08-16 2017-01-18 浙江工业大学 一种基于加权欧氏距离的移动轨迹相似度匹配方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8504035B2 (en) * 2010-11-09 2013-08-06 Ntt Docomo, Inc. System and method for population tracking, counting, and movement estimation using mobile operational data and/or geographic information in mobile network
US9644972B2 (en) * 2015-03-06 2017-05-09 Tallysman Wireless Inc. Method for tracking a path taken by a vehicle

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338541A (zh) * 2014-06-30 2016-02-17 华为技术有限公司 一种基于移动无线网络数据的异常轨迹检测方法及装置
CN106339716A (zh) * 2016-08-16 2017-01-18 浙江工业大学 一种基于加权欧氏距离的移动轨迹相似度匹配方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进LCSS的移动用户轨迹相似性查询算法研究;陈少权;《2016广东蜂窝物联网发展论坛专刊》;20161231;第4节 *

Also Published As

Publication number Publication date
CN108683995A (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
US10936669B2 (en) Object clustering method and system
CN108764951B (zh) 用户相似度获得方法和装置、设备、存储介质
CN104657372A (zh) 页面操作数据处理方法及装置
CN108574933B (zh) 用户轨迹恢复方法及装置
US8229415B1 (en) Wireless communication data store construction and analysis
CN112100250B (zh) 数据处理方法及装置
CN104995870A (zh) 多目标服务器布局确定
CN107240029B (zh) 一种数据处理方法及装置
US20210073669A1 (en) Generating training data for machine-learning models
EP2652909B1 (en) Method and system for carrying out predictive analysis relating to nodes of a communication network
CN108768695B (zh) Kqi的问题定位方法及装置
US10609206B1 (en) Auto-repairing mobile communication device data streaming architecture
CN110224859B (zh) 用于识别团伙的方法和系统
CN112543419B (zh) 一种基于密度聚类的用户轨迹预测方法及装置
CN105447147A (zh) 一种数据处理方法及装置
CN103138981A (zh) 一种社交网络分析方法和装置
US20190043068A1 (en) Virtual net promoter score (vnps) for cellular operators
US20220256364A1 (en) Identification and prioritization of optimum capacity solutions in a telecommunications network
CN111127062A (zh) 一种基于空间搜索算法的群体欺诈识别方法及装置
CN110889526A (zh) 一种用户升级投诉行为预测方法及系统
CN108647735B (zh) 用户出行规律分析方法、装置、设备及存储介质
CN103959305A (zh) 用于在无线电接入网中执行脸部识别的方法
CN108683995B (zh) 用户移动轨迹的获得方法和装置
CN112887910B (zh) 异常覆盖区域的确定方法、装置和计算机可读存储介质
CN111949838A (zh) 一种数据的传播路径生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant