CN108153867B - 基于时间规律性的用户轨迹预测方法和装置 - Google Patents
基于时间规律性的用户轨迹预测方法和装置 Download PDFInfo
- Publication number
- CN108153867B CN108153867B CN201711420735.XA CN201711420735A CN108153867B CN 108153867 B CN108153867 B CN 108153867B CN 201711420735 A CN201711420735 A CN 201711420735A CN 108153867 B CN108153867 B CN 108153867B
- Authority
- CN
- China
- Prior art keywords
- user
- region
- cell
- track
- trajectory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种基于时间规律性的用户轨迹预测方法和装置,所述方法包括:根据用户的当前位置和空间范围参数,检索出该用户在该空间范围内的全部历史轨迹数据;将全部历史轨迹数据映射到空间范围划分的网格中,转换为cell序列;根据cell密度将相邻的cell进行聚合,将全部历史轨迹转换成region序列;根据该用户的region序列,建立轨迹模式图;根据用户当前所处位置、当前时间和该用户的轨迹模式图获取候选region,基于时间规律性求取各个候选region的评分,评分最高的region记为位置预测结果。本发明从用户运动轨迹的时间角度出发,对用户位置进行预测,更加符合用户出行模式,从而实现较高准确度的位置预测。
Description
技术领域
本发明属于数据挖掘领域,具体涉及到基于历史轨迹数据的用户位置预测方法。
背景技术
近年来,智能手机、可穿戴设备、物联网通信等技术的兴起,极大地方便了人们对各种移动对象的定位和跟踪,同时厂家和研究机构也积累了大量的用户轨迹位置数据。在这些轨迹数据中,蕴含着很多非常重要的、有意义的信息,而且其数据量也在不断的增大。面对海量的历史轨迹数据,基于历史运动轨迹的数据挖掘技术应运而生。
在轨迹挖掘研究领域中,已经有大量研究针对移动轨迹数据进行挖掘分析,如轨道交通数据、气候监测数据等;但是只有少量的研究是通过对个人轨迹数据的挖掘来发现用户的活动习惯。目前轨迹挖掘主要是对GPS数据做一些传统的数据挖掘任务,如:分类、聚类及使用决策树来进行一些分类和建立一些简单的模型。与此同时,从个人移动轨迹中发现用户的生活模式也被提出,主要的研究内容有目的地预测,出行的交通工具预测,个人重要地点预测和个人隐私保护等。
基于移动轨迹的数据挖掘已经是数据挖掘学科的一个新兴的分支,在智能交通、环境监测、安全、动物保护等诸多领域有着巨大的应用价值和现实意义。通过对动物轨迹数据的模式挖掘研究可以有助人们进一步了解动物的生活习性。对人类活动轨迹数据的模式挖掘,也具有重大的意义:在微观上,可以理解个体的生活习惯、偏好、性格特征等;在宏观上,可以挖掘出人口流动的规律、区域发展不平衡的深层次原因。如果将这些技术服务于社会的生产发展,必然将成为推动现实世界不断发展的一个巨大动力。
现有的位置预测方法大多在移动对象历史行为模式或关联规则的基础上进行位置预测。多种预测模型被应用到位置预测的实现中,如贝叶斯网络、马尔可夫或隐马尔可夫模型、神经网络方法以及状态预测等方法。有人在Markov模型的基础上,提出了一种基于几何的CRPM(Continuous Route Pattern Mining)算法,通过将用户当前所处位置的周围空间进行区域分割,将用户的历史轨迹使用区域序列表示,进一步使用Markov 模型进行位置预测。现有的研究工作大部分只使用空间域进行轨迹模式的挖掘。然而,一方面,轨迹数据既包含空间信息,还包含时间信息;另一方面,运动对象的运动模式和运动发生的时间息息相关。因此,时间因素也是导致用户选择不同轨迹的直接因素,而已有的方法只是针对空间数据进行挖掘实现位置预测。目前,还没有在用户轨迹预测问题上引入时间因素的预测算法。
发明内容
为解决现有用户轨迹预测算法仅采用空间数据而忽略时间信息进行预测导致的数据利用不充分问题,本发明提供了一种基于时间规律性的用户轨迹预测方法和装置。
为实现上述目的,本发明采用如下技术方案:
一种基于时间规律性的用户轨迹预测方法,包括以下步骤:
步骤1:根据用户的当前位置和空间范围参数,检索出该用户在该空间范围内的全部历史轨迹数据;
步骤2:将全部历史轨迹数据映射到空间范围划分的网格中,转换为cell序列;
步骤3:根据cell密度将相邻的cell进行聚合,将全部历史轨迹转换成region序列;
步骤4:根据该用户的region序列,建立轨迹模式图;
步骤5:根据用户当前所处位置、当前时间和该用户的轨迹模式图获取候选region,基于时间规律性求取各个候选region的评分,评分最高的region记为位置预测结果。
进一步地,所述的步骤1包括:
步骤1-1:给定用户当前位置坐标和算法设定的查询范围,从数据库中查询出该用户在该空间范围内的全部历史轨迹数据,每条历史轨迹包括若干用经纬度和时间戳表示的位置点;
步骤1-2:将每条轨迹内的位置点按照时间先后顺序排序,并采用基于滑动窗口的轨迹过滤算法,识别并剔除轨迹中的异常点。
进一步地,基于滑动窗口的轨迹过滤算法包括:
(a)计算除第一个位置点以外的位置点朝向角;
(b)将每个位置点的朝向角按照位置点时间顺序绘制在坐标系中;
(c)定义一个滑动窗口,窗口包括两个参数:窗宽和窗高;其中,窗宽参数限制窗口在沿时间轴滑动过程中,每次落入窗中的位置点数,窗高参数限制相邻位置点朝向角的最大差值;
(d)在窗口滑动过程中,针对不能落在窗内的冗余位置点,计算这些冗余位置点的质心,仅保留距质心最近的位置点作为过滤结果。
进一步地,所述步骤2包括:
步骤2-1:以用户当前位置为中心,将当前用户附近空间范围使用一个正方形网格进行划分;
步骤2-2:遍历该轨迹中的每个历史位置点,位置点用经度、纬度和时间戳表示,将位置点的经纬度和网格内每个cell的经纬度范围进行比较,得到该位置点对应的cell 坐标,将位置点转换为用cell表示;
步骤2-3:重复执行步骤2-1至2-2,直至该用户的所有历史轨迹都转换完成。
进一步地,所述步骤3包括:
步骤3-1:计算每个cell的密度,即经过该cell的轨迹条数;
步骤3-2:根据cell的密度,将相邻的cell合并为region,合并的条件为:合并之后region的平均密度不变;将cell序列表示的轨迹转换为用region序列表示的轨迹。
进一步地,所述步骤3-2包括:
(a)将每个cell按照密度从大到小排列;
(b)依次遍历cell,对于当前访问的cell,根据扩展条件尝试对其向上下左右四个方向扩展,扩展之后形成的区域成为region,扩展条件为,扩展之后的region内cell的平均密度与扩展之前的cell密度相同。
进一步地,所述步骤4中,所述轨迹模式图的节点包括两部分,一部分是该region的标签,另一部分是该region的运动向量集,所述运动向量集是一个三元组集合,所述三元组形式化为<rpre,rnext,t>,表示用户的运动向量:从region rpre经过该reigon到达rnext,到达时间为t。
进一步地,所述步骤5包括:
步骤5-1:根据用户当前位置对应的经纬度坐标,得到其当前所处的region,并从轨迹模式图中获得候选region列表;
步骤5-2:根据当前时间和当前所处region,对候选region使用评分公式进行打分。
步骤5-3:评分最高的region即作为预测结果输出。
根据本发明的第二目的,本发明还提供了一种基于时间规律性的用户轨迹预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现所述的方法。
根据本发明的第三目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行所述的基于时间规律性的用户轨迹预测方法。本发明的有益效果
1、本发明结合轨迹信息包含空间信息和时间信息的特点,以及用户出行轨迹的时间规律性,提出了一种考虑时间规律性的用户轨迹预测方法,简称TMP(Time Mode basedPrediction)方法。通过将轨迹位置点序列转换成region序列得到待预测用户的轨迹模式图,根据该用户当前位置及当前时间,对候选region进行基于时间的可能性打分,最终选择分值最高的region作为预测结果。本发明充分考虑了用户出行具有的时间规律性特征,并充分挖掘了轨迹数据中的时间域信息,提出时间规律的三个方面:时间相似性、数据有效性和轨迹周期性。实验结果表明,本发明相较于没有利用时间域信息的轨迹预测算法,预测精度具有明显的提高。
2、相较于一些基于神经网络的预测算法,本发明具有很小的迭代计算量,能够在较短时间内完成对历史轨迹数据的训练和建模,可以快速结束训练。
3、本发明的基于滑动窗口的轨迹异常冗余位置点过滤方法,可以在线性时间内完成异常点的识别和剔除,并且可以实现对冗余数据的过滤。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明提出的位置预测算法流程图;
图2是本发明基于滑动窗口的数据过滤算法示意图;其中,图2(a)所示是一条位置点轨迹的示意图,虚线区域为待过滤区域;图2(b)窗口滑动示意图;
图3是由用户历史轨迹生成的cell序列示意图;
图4是由用户历史轨迹生成的region序列示意图;
图5是基于region序列生成的轨迹模式图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和 /或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明提出的总体思路:本发明提出了一种基于时间规律性的用户轨迹预测方法,将待预测用户周围的空间划分为网格,根据用户历史位置点的分布即网格内位置点的密度,将相邻的网格合并为region,得到该用户的轨迹模式图。根据模式图中候选位置的时间分量计算候选位置的可能性评分,选择评分最高的候选位置作为预测结果。
实施例一
本实施例公开了一种基于时间规律性的用户轨迹预测方法,如图1所示,包括以下步骤:
步骤(1)根据用户的当前位置和空间范围参数,检索出该用户在该空间范围内的全部历史轨迹数据;每条历史轨迹含有若干用经纬度和时间戳表示的位置点,然后将每条轨迹内的位置点按照定位时间先后顺序进行排序,识别并剔除轨迹中的异常点;
所述的步骤(1)的具体步骤如下:
(1-1)给定用户当前位置坐标和算法设定的查询范围,从数据库中查询出该用户在该空间范围内的全部历史轨迹数据;
每条历史轨迹含有若干用经纬度和时间戳表示的位置点,所述位置点可以形式化为 p=<lng,lat,t>,所述轨迹可以形式化为tra={p1,p2,…,pn},满足pi.t<pi+1.t。
(1-2)将每条轨迹内的位置点按照时间先后顺序排序,并调用本发明提出的基于滑动窗口的轨迹过滤算法,识别并剔除轨迹中的异常点。
基于滑动窗口的位置点过滤算法
如图2(a)所示是一条位置点轨迹的示意图,其中虚线区域内部存在较多的冗余位置点和异常点,需要设计算法进行识别和剔除。
基于滑动窗口的位置点过滤算法输入为一条原始的按时间顺序排序的位置点序列,输出为一条剔除冗余点及异常点后的位置点序列。用于对该搜索范围内的所有历史轨迹使用所述过滤算法进行过滤。步骤为:
(a)计算除第一个位置点以外的位置点朝向角,朝向角的定义如图2(a)右半部分所示;
(b)将每个位置点的朝向角按照位置点时间顺序绘制在坐标系中,如图2(b)所示;
(c)定义一个滑动窗口,窗口包括两个参数:窗宽和窗高。窗宽参数限制窗口在沿时间轴滑动过程中,每次落入窗中的位置点数。窗高参数限制相邻位置点朝向角的最大差值;
(d)在窗口滑动过程中,能够落在窗内的连续位置点对应于原轨迹中的平滑部分,这部分数据无需过滤;
(e)不能落在窗内的位置点对应于原轨迹中分布混乱的冗余位置点,如p2至p5。对于这些连续的冗余位置点,算法的处理流程为:(1)计算这些冗余位置点的质心,质心pc的计算公式为找到距质心pc最近的位置点作为过滤结果,如图2(a)右半部分所示的p5;(3)删除其余冗余位置点,仅保留距质心pc最近的位置点p5。
步骤(2)将该空间范围划分成网格,每个格子称为一个cell。将一条用经纬度和时间戳表示的轨迹转换成用cell在网格内的横纵坐标和时间戳表示的cell序列;
所述的步骤(2)的具体步骤如下:
(2-1)将当前用户附近空间范围,以用户当前位置为中心,使用一个正方形网格进行划分,网格内的每一个小格称为一个cell,每个cell都有一个唯一的标志其在网格内位置的横纵坐标。
(2-2)遍历该轨迹中的每个历史位置点,位置点的表示格式为<lng,lat,t>,三个参数分别表示该位置点的经度,纬度及记录该位置点时的时间戳。将位置点的经纬度和网格内每个cell的经纬度范围进行比较,得到该位置点对应的cell坐标,将位置点转换为用cell表示,表示格式为<x,y,t>,其中x,y表示该cell在网格内的横纵坐标,t表示原位置点的时间分量,即该用户到达该cell的时间。即,将位于该网格内的以经纬度位置点序列表示的轨迹转换为了使用cell位置点表示的序列。
(2-3)在将位置点序列转换成cell序列时,存在这样一种情况,相邻的位置点被转换到同一个cell中,这种情况下,只保留第一个位置点的转换结果。即cell序列中相邻的两个cell坐标各不相同。
(2-4)重复执行步骤(2-1)-(2-3),直至该用户的所有历史轨迹都转换完成。
步骤(3)根据cell密度的定义,计算每个cell的密度,并使用合并算法将相邻的cell聚合为region。将所有历史轨迹转换成region序列;
所述的步骤(3)的具体步骤如下:
(3-1)根据cell序列在网格范围内的分布情况,计算每个cell的密度。所述cell密度的定义为:经过该cell的轨迹条数。
(3-2)将cell按照密度递减顺序排列,依次遍历每个cell,在满足合并条件的前提下,将空间位置相邻的cell合并为region,合并之后的region还可以继续合并以扩大region的范围。合并扩充的方向可以是上下左右四个方向。所述合并条件为,保证合并之后形成的region的平均密度与合并之前每个cell的密度相等。
(3-3)根据合并之后的region集合及原轨迹位置点序列,将原轨迹位置点序列转换为region序列。合并完成后,一条cell序列表示的轨迹转换为用region序列表示的轨迹。每个cell位置点将使用region位置点表示。所述region位置点可以形式化为rp=<r, t>,其中,r表示该region的标号,t表示原cell位置点的时间分量,即该用户到达该region 的时间,如图3所示。
如果一条用cell位置点表示的轨迹中,相邻的cell位置点合并到了一个region中,则在用region位置点表示的轨迹中,只保留第一个cell对应的region以避免重复。
至此,该用户在该空间范围内的所有轨迹均转换为使用region位置点序列表示。
所述步骤(3-2)包括:
(a)将每个cell按照密度从大到小排列
(b)按照cell密度从大到小的顺序依次遍历cell,对于当前访问的cell,尝试对其向上下左右四个方向扩展,扩展之后形成的区域成为region。扩展需要满足的条件为,扩展之后的region内cell的平均密度与扩展之前的cell密度相同,否则不能扩展。图4 所示即为由图3合并之后的一种可能结果。
在将cell合并为region之后,一个cell位置点唯一对应于一个region。因此,可以用region位置点表示一个cell位置点。region位置点可以形式化为rp=<r,t>,其中,r 表示该region的标号,t表示原cell位置点的时间分量,即该用户到达该region的时间。
步骤(4)根据该用户的region序列,建立轨迹模式图;
所述的步骤(4)的具体步骤如下:
统计该用户的所有region序列,得到region之间的转移图,即该用户的轨迹模式图。图的节点包括两部分,一部分是该region的标签,另一部分是该region的运动向量集。所述运动向量集是指这样一个集合,集合中的每个元素可以形式化为三元组<rpre,rnext, t>,所述三元组的含义为:该用户存在这样一个运动向量,从region rpre经过该reigon 到达rnext,到达时间为t.因此,轨迹模式图即为对用户历史轨迹的完整抽象,包含了空间域和时间域的必要信息。根据该用户在该范围内的所有region位置点序列,可以生成一张如图5所示的轨迹模式图。
步骤(5)根据用户当前所处位置、当前时间和该用户的轨迹模式图,计算各个候选region的可能性评分。选择得分最高的region作为位置预测结果。
所述的步骤(5)的具体步骤如下:
(5-1)根据用户当前位置对应的经纬度坐标,可以得到其当前所处的region,并从轨迹模式图中获得候选region列表根据用户的当前位置得到轨迹模式图中对应的region。
(5-2)根据当前时间和当前所处region,对候选region使用评分公式进行打分。
(5-3)评分最高的region即作为预测结果输出。
基于时间规律性的轨迹预测TMP算法
Step 1.根据用户当前位置点找到对应的region r;
Step 2.从轨迹模式图中,查找该region r的运动向量集,即MVS(r);
Step 3.根据MVS(r),计算每个候选位置的评分。tc为预测时的当前时间,ti为某个运动向量的记录时间。具体的评分步骤为:
(a)计算时间相似性:
ηi=1-diff(ti,tc)/12
(b)计算数据有效性:
(c)计算轨迹周期性:
(d)计算从当前region r至候选region rk的可能性评分:
其中,ti为某个运动向量的时间分量;tc为预测时的当前时间;h表示某个时刻的小
时分量;ηi表示某运动向量的时间相似性权重;表示某个运动向量的数据有效性
权重;m,T,k表示计算数据有效性的公式系数;rk表示某个候选region的索引;
τ表示轨迹周期性权重值;ω1,ω2为评分公式的两个系数,满足
ω1+ω2=1
Step 4.候选region中评分最高的,即为预测结果:
为了更清楚的描述该实施例,对其中的相关术语进行以下说明:
1)异常点及冗余数据
在用户使用GPS设备定位过程中,由于障碍物导致GPS信号弱造成位置点偏离实际位置。这些偏离的点称为异常点,如图2(a)所示,p4即为一个异常点。
在用户记录轨迹过程中,由于用户在某些路段移动速度过慢或者停留,但GPS设备仍保持记录,导致该路段轨迹点过于密集,可能对轨迹预测结果造成影响。如图2(a) 所示,实心圆点表示的位置点即为冗余位置点。
2)cell位置点
一个cell位置点可以形式化为cp=<x,y,t>,其中,x和y表示该cell在网格内的坐标,t表示原位置点的时间分量,即该用户到达该cell的时间。如图3所示,在将用户当前位置周围范围划分为网格之后,每一个用经纬度表示的位置点<lng,lat,t>都唯一对应一个cell位置点。可以通过计算每个cell的经纬度范围并与位置点经纬度进行比较,将一个用经纬度表示的位置点转换为cell位置点。
3)cell轨迹序列
一条用经纬度位置点表示的轨迹序列中的每个位置点都可以转换为cell位置点,因此,一条用位置点表示的轨迹序列可以转换为用cell位置点表示的轨迹序列,如图3所示。在转换过程中,需要注意的一点是,如果相邻的位置点位于同一个cell内,则只保留第一个位置点,即防止转换后的cell轨迹序列存在相邻的两个cell位置点坐标相同的情况。
4)cell密度
经过一个cell的cell轨迹序列条数,称作该cell的密度。如图3所示,cell(0,2)的密度为2,cell(1,2)的密度为1。
5)region轨迹序列
由于一个经纬度位置点可以表示为一个region位置点,因此一条轨迹可以使用region序列表示:tra={<r1,t1>,<r2,t2>,…,<rn,tn>}。
6)运动向量
一个运动向量MV(Moving Vector)可以表示为<ra,rb,t>的形式,其含义为该用户存在一条从region a到达region b的轨迹,且到达region b的时间为t。
7)运动向量集
region r的一个运动向量集MVS(r)(Moving Vector Set(r))表示经过region r的一组运动向量。如图4所示,MVS(rg)={<ra,rf,t44>},表示该用户曾经从region a经过region g 到达region f,且到达时间为t44。
8)候选位置集
给定一个集合MVS(r),其元素第二个分量,即接下来到达的region,称作r的一个候选位置。r的所有候选位置的集合,称为候选位置集。
实施例二
本实施例的目的是提供一种计算装置。
一种基于时间规律性的用户轨迹预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
步骤1:根据用户的当前位置和空间范围参数,检索出该用户在该空间范围内的全部历史轨迹数据;
步骤2:将全部历史轨迹数据映射到空间范围划分的网格中,转换为cell序列;
步骤3:根据cell密度将相邻的cell进行聚合,将全部历史轨迹转换成region序列;
步骤4:根据该用户的region序列,建立轨迹模式图;
步骤5:根据用户当前所处位置、当前时间和该用户的轨迹模式图获取候选region,基于时间规律性求取各个候选region的评分,评分最高的region记为位置预测结果。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,用于指纹图谱相似度计算,该程序被处理器执行时执行以下步骤:
步骤1:根据用户的当前位置和空间范围参数,检索出该用户在该空间范围内的全部历史轨迹数据;
步骤2:将全部历史轨迹数据映射到空间范围划分的网格中,转换为cell序列;
步骤3:根据cell密度将相邻的cell进行聚合,将全部历史轨迹转换成region序列;
步骤4:根据该用户的region序列,建立轨迹模式图;
步骤5:根据用户当前所处位置、当前时间和该用户的轨迹模式图获取候选region,基于时间规律性求取各个候选region的评分,评分最高的region记为位置预测结果。
以上实施例二和三的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
实验结果
以图5所示轨迹模式图为例,假设用户当前位于region a,则候选位置有regionb, region c和region f。
(1)评分公式参数取值
评分公式中的参数取值如下:
参数 | 取值 | 参数 | 取值 | 参数 | 取值 |
m | 1 | k | 1.3 | T | 6 |
ω<sub>1</sub> | 0.9 | ω<sub>2</sub> | 0.1 |
表1 评分公式相关参数
(2)计算候选位置评分
假设图5中各时间取值为:
t<sub>13</sub> | 2017-8-1 06:00 | t<sub>23</sub> | 2017-8-2 08:00 | t<sub>33</sub> | 2017-9-30 12:00 |
t<sub>43</sub> | 2017-9-30 18:00 |
表2 运动向量记录时间
假设预测的当前时间为2017‐10‐1 12:00
将以上参数取值带入评分公式,计算得到的各候选位置评分为
位置 | 评分 | 位置 | 评分 | 位置 | 评分 |
r<sub>b</sub> | 0.492 | r<sub>c</sub> | 1.175 | r<sub>g</sub> | 0.635 |
表3 各候选位置评分
(3)得到预测结果
region rc的预测评分最高,因此rc即为预测结果。
(4)结果分析
注意到t33时间和当前预测时间最为接近,根据用户轨迹的时间规律性,用户有很大可能在相似的时间段选择相似的轨迹。在轨迹模式图中可以看到,虽然用户从ra到过 rb两次,次数最多,但是这两次记录时间较早,参考价值较低,因此评分较低。因此本发明提出的TMP算法可以很好的将时间规律性作为评价指标。
本发明充分考虑了用户出行具有的时间规律性特征,并充分挖掘了轨迹数据中的时间域信息,提出时间规律的三个方面:时间相似性、数据有效性和轨迹周期性。实验结果表明,本发明相较于没有利用时间域信息的轨迹预测算法,预测精度具有明显的提高。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于时间规律性的用户轨迹预测方法,其特征在于,包括以下步骤:
步骤1:根据用户的当前位置和空间范围参数,检索出该用户在该空间范围内的全部历史轨迹数据;
步骤2:将全部历史轨迹数据映射到空间范围划分的网格中,转换为cell序列;
步骤3:根据cell密度将相邻的cell进行聚合,将全部历史轨迹转换成region序列;
步骤4:根据该用户的region序列,建立轨迹模式图;
步骤5:根据用户当前所处位置、当前时间和该用户的轨迹模式图获取候选region,基于时间规律性求取各个候选region的评分,评分最高的region记为位置预测结果。
2.如权利要求1所述的基于时间规律性的用户轨迹预测方法,其特征在于,所述的步骤1包括:
步骤1-1:给定用户当前位置坐标和算法设定的查询范围,从数据库中查询出该用户在该空间范围内的全部历史轨迹数据,每条历史轨迹包括若干用经纬度和时间戳表示的位置点;
步骤1-2:将每条轨迹内的位置点按照时间先后顺序排序,并采用基于滑动窗口的轨迹过滤算法,识别并剔除轨迹中的异常点。
3.如权利要求2所述的基于时间规律性的用户轨迹预测方法,其特征在于,基于滑动窗口的轨迹过滤算法包括:
(a)计算除第一个位置点以外的位置点朝向角;
(b)将每个位置点的朝向角按照位置点时间顺序绘制在坐标系中;
(c)定义一个滑动窗口,窗口包括两个参数:窗宽和窗高;其中,窗宽参数限制窗口在沿时间轴滑动过程中,每次落入窗中的位置点数,窗高参数限制相邻位置点朝向角的最大差值;
(d)在窗口滑动过程中,针对不能落在窗内的冗余位置点,计算这些冗余位置点的质心,仅保留距质心最近的位置点作为过滤结果。
4.如权利要求1所述的基于时间规律性的用户轨迹预测方法,其特征在于,所述步骤2包括:
步骤2-1:以用户当前位置为中心,将当前用户附近空间范围使用一个正方形网格进行划分;
步骤2-2:遍历该轨迹中的每个历史位置点,位置点用经度、纬度和时间戳表示,将位置点的经纬度和网格内每个cell的经纬度范围进行比较,得到该位置点对应的cell 坐标,将位置点转换为用cell表示;
步骤2-3:重复执行步骤2-1至2-2,直至该用户的所有历史轨迹都转换完成。
5.如权利要求1所述的基于时间规律性的用户轨迹预测方法,其特征在于,所述步骤3包括:
步骤3-1:计算每个cell的密度,即经过该cell的轨迹条数;
步骤3-2:根据cell的密度,将相邻的cell合并为region,合并的条件为:合并之后region的平均密度不变;将cell序列表示的轨迹转换为用region序列表示的轨迹。
6.如权利要求5所述的基于时间规律性的用户轨迹预测方法,其特征在于,所述步骤3-2包括:
(a)将每个cell按照密度从大到小排列;
(b)依次遍历cell,对于当前访问的cell,根据扩展条件尝试对其向上下左右四个方向扩展,扩展之后形成的区域成为region,扩展条件为,扩展之后的region内cell的平均密度与扩展之前的cell密度相同。
7.如权利要求1所述的基于时间规律性的用户轨迹预测方法,其特征在于,所述步骤4中,所述轨迹模式图的节点包括两部分,一部分是该region的标签,另一部分是该region的运动向量集,所述运动向量集是一个三元组集合,所述三元组形式化为<rpre,rnext,t>,表示用户的运动向量:从region rpre经过该reigon到达rnext,到达时间为t。
8.如权利要求7所述的基于时间规律性的用户轨迹预测方法,其特征在于,所述步骤5包括:
步骤5-1:根据用户当前位置对应的经纬度坐标,得到其当前所处的region,并从轨迹模式图中获得候选region列表;
步骤5-2:根据当前时间和当前所处region,对候选region使用评分公式进行打分;
步骤5-3:评分最高的region即作为预测结果输出。
9.一种基于时间规律性的用户轨迹预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‐8任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行如权利要求1‐8任一项所述的基于时间规律性的用户轨迹预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711420735.XA CN108153867B (zh) | 2017-12-25 | 2017-12-25 | 基于时间规律性的用户轨迹预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711420735.XA CN108153867B (zh) | 2017-12-25 | 2017-12-25 | 基于时间规律性的用户轨迹预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108153867A CN108153867A (zh) | 2018-06-12 |
CN108153867B true CN108153867B (zh) | 2019-01-29 |
Family
ID=62465727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711420735.XA Active CN108153867B (zh) | 2017-12-25 | 2017-12-25 | 基于时间规律性的用户轨迹预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108153867B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109041217B (zh) * | 2018-09-21 | 2020-01-10 | 北京邮电大学 | 一种异构网络中的分级移动性预测方法 |
CN111723123B (zh) * | 2019-03-20 | 2023-07-14 | 杭州海康威视数字技术股份有限公司 | 轨迹预测方法、装置、电子设备及存储介质 |
CN110059144B (zh) * | 2019-04-03 | 2021-12-10 | 电子科技大学 | 一种基于卷积神经网络的轨迹属主预测方法 |
CN111797301A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 活动预测方法、装置、存储介质及电子设备 |
CN110852148B (zh) * | 2019-09-23 | 2023-01-24 | 重庆特斯联智慧科技股份有限公司 | 一种基于目标追踪的访客目的地核验方法及系统 |
CN110929914A (zh) * | 2019-10-10 | 2020-03-27 | 重庆特斯联智慧科技股份有限公司 | 一种利用轨迹大数据预测的区域精准布控方法和系统 |
CN111538751B (zh) * | 2020-03-23 | 2021-05-04 | 重庆特斯联智慧科技股份有限公司 | 物联网数据的标签化用户画像生成系统及方法 |
CN111578933B (zh) * | 2020-05-09 | 2022-03-11 | 北京上下文系统软件有限公司 | 一种快速识别用户进入特定地理区域内的方法 |
CN112118535B (zh) * | 2020-08-12 | 2021-08-17 | 深圳技术大学 | 车辆漫游区域预测方法及系统 |
CN112163705B (zh) * | 2020-09-29 | 2022-07-22 | 重庆邮电大学 | 基于cnn+seir和lstm的疫情预测预警方法 |
CN112988936A (zh) * | 2021-03-18 | 2021-06-18 | 中国第一汽车股份有限公司 | 出行轨迹预测方法、装置、计算设备及存储介质 |
CN116466382A (zh) * | 2023-04-24 | 2023-07-21 | 贵州一招信息技术有限公司 | 一种基于gps的高精度实时定位系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408203A (zh) * | 2014-12-18 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 一种预测移动对象轨迹终点的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102509170A (zh) * | 2011-10-10 | 2012-06-20 | 浙江鸿程计算机系统有限公司 | 一种基于历史轨迹数据挖掘的位置预测系统及方法 |
-
2017
- 2017-12-25 CN CN201711420735.XA patent/CN108153867B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408203A (zh) * | 2014-12-18 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 一种预测移动对象轨迹终点的方法 |
Non-Patent Citations (1)
Title |
---|
Time Mode Based Next Position Prediction System;Chongsheng Yu;《IEEE 19th International Conference on High Performance Computing and Communications》;20171220;586-593 |
Also Published As
Publication number | Publication date |
---|---|
CN108153867A (zh) | 2018-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108153867B (zh) | 基于时间规律性的用户轨迹预测方法和装置 | |
CN111612206B (zh) | 一种基于时空图卷积神经网络的街区人流预测方法及系统 | |
CN104462190B (zh) | 一种基于海量空间轨迹挖掘的在线的位置预测方法 | |
CN103593430B (zh) | 一种基于移动对象时空信息轨迹分段聚类的方法 | |
CN107977734B (zh) | 一种时空大数据下基于移动马尔可夫模型的预测方法 | |
CN109670277A (zh) | 一种基于多模态数据融合与多模型集成的旅行时间预测方法 | |
CN106383868A (zh) | 一种基于道路网络的时空轨迹聚类方法 | |
CN106714110A (zh) | 一种Wi‑Fi位置指纹地图自动构建方法及系统 | |
CN109671102A (zh) | 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法 | |
CN107818412A (zh) | 一种基于MapReduce的大规模公交乘客OD并行计算方法 | |
CN108986453A (zh) | 一种基于情境信息的交通状况预测方法、系统及装置 | |
CN106066873A (zh) | 一种基于本体的旅游信息推荐方法 | |
CN110516702B (zh) | 一种基于流数据的离散路径规划方法 | |
CN104346444B (zh) | 一种基于路网反空间关键字查询的最佳选址方法 | |
CN110836675A (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
CN109241227A (zh) | 基于stacking集成学习算法的时空数据预测建模方法 | |
Liu et al. | Behavior2vector: Embedding users’ personalized travel behavior to Vector | |
CN108985488A (zh) | 个体出行目的地预测的方法 | |
CN113888867B (zh) | 一种基于lstm位置预测的车位推荐方法及系统 | |
CN113611115B (zh) | 一种基于路网敏感特征的车辆轨迹聚类方法 | |
Manibardo et al. | A graph-based methodology for the sensorless estimation of road traffic profiles | |
Ajani et al. | Dynamic path planning approaches based on artificial intelligence and machine learning | |
CN111177294B (zh) | 基于车辆轨迹数据求解交叉口中介中心性的方法 | |
Tang | A personalized travel route recommendation model using deep learning in scenic spots intelligent service robots | |
Han | A new intelligent method for travel path recommendation based on improved particle swarm optimisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200716 Address after: Workshop A4 and A6, electronic information industrial park, Gaoxin 7th Road, Donggang District, Rizhao City, Shandong Province Patentee after: Rizhao Ruiyi e-commerce industry Co., Ltd Address before: The middle high tech Zone Ji'nan city Shandong Province Shun Road 250101 Patentee before: SHANDONG University |
|
TR01 | Transfer of patent right |