CN106022527A

CN106022527A - 基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置

Info

Publication number: CN106022527A
Application number: CN201610356019.9A
Authority: CN
Inventors: 邢曙光
Original assignee: Henan Clear Mdt Infotech Ltd
Current assignee: Henan Clear Mdt Infotech Ltd
Priority date: 2016-05-27
Filing date: 2016-05-27
Publication date: 2016-10-12

Abstract

本发明公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置，该方法包括：步骤1，对用户的所有的经纬度轨迹进行瓦片序列化，形式训练数据集；步骤2，利用LSTM循环神经网络对训练数据集进行训练，得到LSTM模型；步骤3：对该用户已知的经纬度发生轨迹，利用LSTM模型计算出各种可能瓦片的概率，取概率最大者，即为该用户的预测瓦片。本发明能提供一种用地图瓦片代替传统的基于纯经纬度轨迹的预测方法，从而能够对经纬度引入的误差在一定程度上进行避免，并且可根据实际预测地理范围精度进行瓦片级别的设定。利用LSTM循环神经网络使得模型具有某种记忆性，能够记住之前已发生的情况。该方法和装置能够提供一种科学的用户轨迹预测的新思路。

Description

基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置

技术领域

本发明涉及轨迹预测领域，尤其涉及一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置。

背景技术

随着移动终端的多样化和移动应用的不断普及，越来越多的人群使用智能终端进行定位和导航。在此背景下，相关的定位服务厂商积累了越来越多的用户定位数据，同时电信运营商也采用蜂窝技术进行定位，但对于用户轨迹的预测研究甚少。用户轨迹预测即已知用户某时点之前的轨迹位置序列，预测该时点之后位置信息。

地图瓦片是web地图中常用的坐标缩放技术，本质上是一种坐标系统。不同级别的瓦片对应不同的缩放级别。如(0，0，0)表示级别为0的瓦片坐标，该瓦片覆盖整个世界范围。当缩放级别为1时，把缩放级别为0时的那张瓦片分割成四个相等的方块，其中坐标为(0，0，1)和(0，1，1)的两块覆盖北半球，坐标为(1，0，1)和(1，1，1)的两块覆盖南半球。瓦片坐标与地理真实坐标一般采用墨卡托投影进行转换。该投影是正轴等角圆柱投影，投影后的经线是均匀分布，纬线从赤道向南北极越来越稀疏。不同地图厂商的瓦片坐标区别只是从墨卡托坐标到瓦片坐标的转换方式不同，不失一般性，以Google地图瓦片坐标为例，Google瓦片的(0，0)坐标始终位于西经180°，北纬85.0511°。从该坐标向东，向南，横纵坐标值均变大。记(x，y，w)为瓦片坐标，x为横坐标，y为纵坐标，w为瓦片级别。经纬度与瓦片的转换公式如下：

其中lat，lon分别代表纬度、经度。

LSTM是一种时间递归神经网络，由于独特的设计结构，LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。

目前关于用户轨迹预测的出发点大都是直接从经纬度或者移动基站的位置出发，利用相关概率模型进行用户的轨迹预测，这些方法存在两个问题，一是定位本身就存在定位精度的问题，GPS定位精度较高，基本在10米以内。基站定位精度较差，一般为100-1000米的定位精度。定位本身的误差使得模型的计算本身就是基于偏差样本进行，因此预测的效果也会大打折扣。二是模型本身，概率模型没有过多的考虑轨迹的连续性问题，某时刻的轨迹不仅仅与上一时刻的位置有关，还与整体的移动方向有关，如一个正在上班路上的上班族不太可能在某个时点之后向其上班路线的反方向移动。即模型要具有某种记忆性，能够记住之前已发生的情况。

发明内容

本发明的目的旨在提出一种在一定程度上解决上述问题的方法。

为了解决上述问题，本发明提供了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法。一方面采用瓦片技术使得定位精度在某个瓦片级别上变得不重要(总能找到一个瓦片级别覆盖其精度范围)，也就是说某时刻的经纬度位置转换为瓦片位置。从而使得原先在经纬度级别上存在的精度误差，在瓦片级别上得以部分消失(如果实际位置与记录位置不在同一级别的某个瓦片上，则误差依然存在)。并且随着瓦片级别的缩小，实际位置与记录位置在同一瓦片的可能性越来越大。比较极端情况下，实际位置和记录位置在一个城市。因此可根据实际的预测精度需要选择合适的瓦片级别。另一方面采用LSTM循环神经网络模型，可利用该模型针对时间序列有某种程度的“记忆性”，使得能够较好的记住之前用户发生的轨迹情况，避免得出与实际情况相悖事件发生的可能性。

本发明解决其技术问题所采用的技术方案

为实现上述目的，本发明公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法，该方法包括：

步骤1，对用户的所有的经纬度轨迹进行瓦片序列化，形式训练数据集；

步骤2，利用LSTM循环神经网络对训练数据集进行训练，得到LSTM模型；

步骤3，对该用户已知的经纬度发生轨迹，利用LSTM模型计算出各种可能瓦片的概率，取概率最大者，即为该用户的预测瓦片。

进一步的，所述步骤1包括：

步骤11，对用户的所有经纬度轨迹进行瓦片化转换，使其转换为瓦片轨迹。记用户轨迹为<UID，T，Lon，Lat>，其中UID为用户ID，T为时间(精确到秒)，Lon为经度，Lat为纬度。利用经纬度与瓦片的转换公式，得到用户的瓦片轨迹，记为<UID，T，(X，Y，W)>，其中X，Y为横纵坐标，W为瓦片级别。W根据需要事先设定；

步骤12，对用户的所有瓦片轨迹进行等时间段离散化，根据事先选定步长，进行已发生瓦片序列集与预测瓦片集的切分，形成训练数据集。

进一步的，所述步骤12包括：

步骤121，选定时间段M分钟，从0点到24点依次等时间段分割，记为<UID，D，P，(X，Y，W)>；D为日期，P为整数；

步骤122，汇总求和每天每时间段P，<X，Y，W>对应的出现频次，取频次最高的瓦片为该时间段用户的驻留瓦片，记为<UID，D，P，(X，Y，W)>；

步骤123，设定步长L，从用户驻留瓦片集中，从第一个时间段1到时间段N，依次取长度为L的连续序列，记为：

<UID，D，i+1，(X，Y，W)>，<UID，D，i+2，(X，Y，W)>，…<UID，D，i+L，(X，Y，W)>，i＝0，1，…N-L-1，组成已发生瓦片序列集，瓦片<UID，D，i+L+1，(X，Y，W)>为对应已发生瓦片序列对应的预测瓦片，即i+L+1时段对应的瓦片，已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID，D，i+L+1，(X，Y，W)>]，i＝0，1，…N-L-1，为预测瓦片集，已发生瓦片序列集和预测瓦片序列集组成训练数据集。

进一步的，所述步骤2包括：

步骤21，设定LSTM循环神经网络模型的第一层输入维度<L，K>，其中K为该用户在训练集中出现的不重复瓦片个数，该模型第一层为LSTM单元；

步骤22，设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层，记为Dense(K)，为了归一化概率引入多分类的softmax函数层；

步骤23，在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性，为了减少网络参数和降低模型复杂度，本发明采用1层LSTM单元作为中间层。)，设定好LSTM循环神经网络的结构和参数后，结合训练数据集进行模型的训练，得到LSTM循环神经网络模型。

进一步的，所述步骤3包括：

步骤31，已知发生的经纬度轨迹序列，根据步骤11、步骤121，步骤122三个步骤，求得已发生的瓦片轨迹序列：

<UID，D，i+1，(X，Y，W)>，<UID，D，i+2，(X，Y，W)>，…<UID，D，i+L，(X，Y，W)>，其中0＝<i<＝N-L-1，i为整数；

步骤32，利用已发生的瓦片轨迹序列，和步骤2中所得到的LSTM循环神经网络模型，计算出所有K个瓦片的发生概率，取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。

为实现上述目的，本发明还公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测装置，该装置包括：

预处理模块，对用户的所有的经纬度轨迹进行瓦片序列化，形式训练数据集；

建模模块，利用LSTM循环神经网络对训练数据集进行训练，得到LSTM模型；

预测模块，对该用户已知的经纬度发生轨迹，利用LSTM模型计算出各种可能瓦片的概率，取概率最大者，即为该用户的预测瓦片。

进一步的，所述预处理模块包括：

瓦片化转换模块，对用户的所有经纬度轨迹进行瓦片化转换，使其转换为瓦片轨迹。记用户轨迹为<UID，T，Lon，Lat>，其中UID为用户ID，T为时间(精确到秒)，Lon为经度，Lat为纬度。利用经纬度与瓦片的转换公式，得到用户的瓦片轨迹，记为<UID，T，(X，Y，W)>，其中X，Y为横纵坐标，W为瓦片级别。W根据需要事先设定；

序列化转换模块，对用户的所有瓦片轨迹进行等时间段离散化，根据事先选定步长，进行已发生瓦片序列集与预测瓦片集的切分，形成训练数据集。

进一步的，所述序列化转换模块包括：

等时段分割模块，选定时间段M分钟，从0点到24点依次等时间段分割，记为<UID，D，P，(X，Y，W)>；D为日期，P为整数；

驻留瓦片生成模块，汇总求和每天每时间段P，<X，Y，W>对应的出现频次，取频次最高的瓦片为该时间段用户的驻留瓦片，记为<UID，D，P，(X，Y，W)>；

训练集生成模块，设定步长L，从用户驻留瓦片集中，从第一个时间段1到时间段N，依次取长度为L的连续序列，记为：

进一步的，所述建模模块包括：

第一层LSTM设定模块，设定LSTM循环神经网络模型的第一层输入维度<L，K>，其中K为该用户在训练集中出现的不重复瓦片个数，该模型第一层为LSTM单元；

输出层全连接设定模块，设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层，记为Dense(K)，为了归一化概率引入多分类的softmax函数层；

中间层LSTM设定模块，在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性，为了减少网络参数和降低模型复杂度，本发明采用1层LSTM单元作为中间层。)，设定好LSTM循环神经网络的结构和参数后，结合训练数据集进行模型的训练，得到LSTM循环神经网络模型。

进一步的，所述预测模块包括：

第一处理模块，已知发生的经纬度轨迹序列，根据预处理模块中的瓦片化转换模块，序列化转换模块中的等时段分割模块，驻留瓦片生成模块三个模块，求得已发生的瓦片轨迹序列<UID，D，i+1，(X，Y，W)>，<UID，D，i+2，(X，Y，W)>，…<UID，D，i+L，(X，Y，W)>，其中0＝<i<＝N-L-1，i为整数；

第二处理模块，利用已发生的瓦片轨迹序列，和建模模块中所得到的LSTM循环神经网络模型，计算出所有K个瓦片的发生概率，取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。

本发明的有益效果为：通过本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置能够对传统的基于纯经纬度的轨迹的预测方法引入的误差进行一定程度上的避免，同时可根据实际预测地理范围精度进行瓦片级别的设定。引入LSTM循环神经网络模型，一定程度上解决了轨迹记忆性问题，即模型要具有某种记忆性，能够记住之前已发生的情况。同时该方法在一定程度上提供了用户轨迹预测的新思路，对于该领域和其他涉及位置信息的预测问题都有一定借鉴意义。

附图说明

图1A是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测方法流程图

图1B是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测装置示意图

图2 LSTM循环神经网络模型结构图

具体实施方式

下面给出本发明的具体实施方式，结合附图对本发明做出详细描述。

图1A是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测方法流程图。如图1A所示，该方法包括：

进一步的，所述步骤1包括：

进一步的，所述步骤12包括：

进一步的，所述步骤2包括：

步骤23，在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性，为了减少网络参数和降低模型复杂度，本发明采用1层LSTM单元作为中间层。)，设定好LSTM循环神经网络的结构和参数后，结合训练数据集进行模型的训练，得到LSTM循环神经网络模型。图2所示即为LSTM循环神经网络模型结构图。

进一步的，所述步骤3包括：

步骤31，已知发生的经纬度轨迹序列，根据步骤11，步骤121，步骤122三个步骤，求得已发生的瓦片轨迹序列：

图1B是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测装置示意图。如图1B所示，该装置包括：

预处理模块100：对用户的所有的经纬度轨迹进行瓦片序列化，形式训练数据集；

建模模块200：利用LSTM循环神经网络对训练数据集进行训练，得到LSTM模型；

预测模块300：对该用户已知的经纬度发生轨迹，利用LSTM模型计算出各种可能瓦片的概率，取概率最大者，即为该用户的预测瓦片。

进一步的，所述预处理模块100包括：

瓦片化转换模块110，对用户的所有经纬度轨迹进行瓦片化转换，使其转换为瓦片轨迹。记用户轨迹为<UID，T，Lon，Lat>，其中UID为用户ID，T为时间(精确到秒)，Lon为经度，Lat为纬度。利用经纬度与瓦片的转换公式，得到用户的瓦片轨迹，记为<UID，T，(X，Y，W)>，其中X，Y为横纵坐标，W为瓦片级别。W根据需要事先设定；

序列化转换模块120，对用户的所有瓦片轨迹进行等时间段离散化，根据事先选定步长，进行已发生瓦片序列集与预测瓦片集的切分，形成训练数据集。

进一步的，所述序列化转换模块120包括：

进一步的，所述建模模块200包括：

第一层LSTM设定模块210，设定LSTM循环神经网络模型的第一层输入维度<L，K>，其中K为该用户在训练集中出现的不重复瓦片个数，该模型第一层为LSTM单元；

输出层全连接设定模块220，设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层，记为Dense(K)，为了归一化概率引入多分类的softmax函数层；

中间层LSTM设定模块230，在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性，为了减少网络参数和降低模型复杂度，本发明采用1层LSTM单元作为中间层。)，设定好LSTM循环神经网络的结构和参数后，结合训练数据集进行模型的训练，得到LSTM循环神经网络模型。图2所示即为LSTM循环神经网络模型结构图。

进一步的，所述预测模块300包括：

第一处理模块310，已知发生的经纬度轨迹序列，根据预处理模块100中的瓦片化转换模块110，序列化转换模块120中的等时段分割模块，驻留瓦片生成模块几个模块，求得已发生的瓦片轨迹序列

第二处理模块320，利用已发生的瓦片轨迹序列，和建模模块200中所得到的LSTM循环神经网络模型，计算出所有K个瓦片的发生概率，取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。

本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下，还可以对以上内容进行各种各样的修改。因此本发明范围并不仅限于以上的说明，而是由权利要求书的范围来确定。

Claims

1.一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法，其特征在于，包括：

2.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法，其特征在于，所述步骤1包括：

3.如权利要求2所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法，其特征在于，所述步骤12包括：

4.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法，其特征在于，所述步骤2包括：

5.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法，其特征在于，所述步骤3中：

步骤31，已知发生的经纬度轨迹序列，根据步骤11、步骤121、步骤122三个步骤，求得已发生的瓦片轨迹序列：

<UID，D，i+1，(X，Y，W)>，<UID，D，i+2，(X，Y，W)>，…<UID，D，i+L，(X，Y，W)>，其中0＝＜i＜＝N-L-1，i为整数；

6.一种基于地图瓦片和LSTM循环神经网络的轨迹预测装置，其特征在于，包括：

7.如权利要求6所述的基于地图瓦片和LSTM循环神经网络的轨迹预测装置，其特征在于所述预处理模块包括：

8.如权利要求7所述的地图瓦片和LSTM循环神经网络的轨迹预测装置，其特征在于，所述序列化转换模块包括：

9.如权利要求6所述的基于地图瓦片和LSTM循环神经网络的轨迹预测装置，其特征在于，所述建模模块包括：

10.如权利要求6所述的基于地图瓦片和LSTM循环神经网络的轨迹预测装置，其特征在于，所述预测模块包括：

第一处理模块，已知发生的经纬度轨迹序列，根据预处理模块中的瓦片化转换模块，序列化转换模块中的等时段分割模块，驻留瓦片生成模块三个模块，求得已发生的瓦片轨迹序列<UID，D，i+1，(X，Y，W)>，<UID，D，i+2，(X，Y，W)>，…<UID，D，i+L，(X，Y，W)>，其中0＝＜i＜＝N-L-1，i为整数；