CN106022527A - 基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置 - Google Patents
基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置 Download PDFInfo
- Publication number
- CN106022527A CN106022527A CN201610356019.9A CN201610356019A CN106022527A CN 106022527 A CN106022527 A CN 106022527A CN 201610356019 A CN201610356019 A CN 201610356019A CN 106022527 A CN106022527 A CN 106022527A
- Authority
- CN
- China
- Prior art keywords
- tile
- lstm
- uid
- neural network
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置,该方法包括:步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;步骤3:对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。本发明能提供一种用地图瓦片代替传统的基于纯经纬度轨迹的预测方法,从而能够对经纬度引入的误差在一定程度上进行避免,并且可根据实际预测地理范围精度进行瓦片级别的设定。利用LSTM循环神经网络使得模型具有某种记忆性,能够记住之前已发生的情况。该方法和装置能够提供一种科学的用户轨迹预测的新思路。
Description
技术领域
本发明涉及轨迹预测领域,尤其涉及一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置。
背景技术
随着移动终端的多样化和移动应用的不断普及,越来越多的人群使用智能终端进行定位和导航。在此背景下,相关的定位服务厂商积累了越来越多的用户定位数据,同时电信运营商也采用蜂窝技术进行定位,但对于用户轨迹的预测研究甚少。用户轨迹预测即已知用户某时点之前的轨迹位置序列,预测该时点之后位置信息。
地图瓦片是web地图中常用的坐标缩放技术,本质上是一种坐标系统。不同级别的瓦片对应不同的缩放级别。如(0,0,0)表示级别为0的瓦片坐标,该瓦片覆盖整个世界范围。当缩放级别为1时,把缩放级别为0时的那张瓦片分割成四个相等的方块,其中坐标为(0,0,1)和(0,1,1)的两块覆盖北半球,坐标为(1,0,1)和(1,1,1)的两块覆盖南半球。瓦片坐标与地理真实坐标一般采用墨卡托投影进行转换。该投影是正轴等角圆柱投影,投影后的经线是均匀分布,纬线从赤道向南北极越来越稀疏。不同地图厂商的瓦片坐标区别只是从墨卡托坐标到瓦片坐标的转换方式不同,不失一般性,以Google地图瓦片坐标为例,Google瓦片的(0,0)坐标始终位于西经180°,北纬85.0511°。从该坐标向东,向南,横纵坐标值均变大。记(x,y,w)为瓦片坐标,x为横坐标,y为纵坐标,w为瓦片级别。经纬度与瓦片的转换公式如下:
其中lat,lon分别代表纬度、经度。
LSTM是一种时间递归神经网络,由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。
目前关于用户轨迹预测的出发点大都是直接从经纬度或者移动基站的位置出发,利用相关概率模型进行用户的轨迹预测,这些方法存在两个问题,一是定位本身就存在定位精度的问题,GPS定位精度较高,基本在10米以内。基站定位精度较差,一般为100-1000米的定位精度。定位本身的误差使得模型的计算本身就是基于偏差样本进行,因此预测的效果也会大打折扣。二是模型本身,概率模型没有过多的考虑轨迹的连续性问题,某时刻的轨迹不仅仅与上一时刻的位置有关,还与整体的移动方向有关,如一个正在上班路上的上班族不太可能在某个时点之后向其上班路线的反方向移动。即模型要具有某种记忆性,能够记住之前已发生的情况。
发明内容
本发明的目的旨在提出一种在一定程度上解决上述问题的方法。
为了解决上述问题,本发明提供了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法。一方面采用瓦片技术使得定位精度在某个瓦片级别上变得不重要(总能找到一个瓦片级别覆盖其精度范围),也就是说某时刻的经纬度位置转换为瓦片位置。从而使得原先在经纬度级别上存在的精度误差,在瓦片级别上得以部分消失(如果实际位置与记录位置不在同一级别的某个瓦片上,则误差依然存在)。并且随着瓦片级别的缩小,实际位置与记录位置在同一瓦片的可能性越来越大。比较极端情况下,实际位置和记录位置在一个城市。因此可根据实际的预测精度需要选择合适的瓦片级别。另一方面采用LSTM循环神经网络模型,可利用该模型针对时间序列有某种程度的“记忆性”,使得能够较好的记住之前用户发生的轨迹情况,避免得出与实际情况相悖事件发生的可能性。
本发明解决其技术问题所采用的技术方案
为实现上述目的,本发明公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法,该方法包括:
步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;
步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;
步骤3,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。
进一步的,所述步骤1包括:
步骤11,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;
步骤12,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。
进一步的,所述步骤12包括:
步骤121,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;
步骤122,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;
步骤123,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。
进一步的,所述步骤2包括:
步骤21,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;
步骤22,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;
步骤23,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。
进一步的,所述步骤3包括:
步骤31,已知发生的经纬度轨迹序列,根据步骤11、步骤121,步骤122三个步骤,求得已发生的瓦片轨迹序列:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;
步骤32,利用已发生的瓦片轨迹序列,和步骤2中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。
为实现上述目的,本发明还公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测装置,该装置包括:
预处理模块,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;
建模模块,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;
预测模块,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。
进一步的,所述预处理模块包括:
瓦片化转换模块,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;
序列化转换模块,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。
进一步的,所述序列化转换模块包括:
等时段分割模块,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;
驻留瓦片生成模块,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;
训练集生成模块,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。
进一步的,所述建模模块包括:
第一层LSTM设定模块,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;
输出层全连接设定模块,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;
中间层LSTM设定模块,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。
进一步的,所述预测模块包括:
第一处理模块,已知发生的经纬度轨迹序列,根据预处理模块中的瓦片化转换模块,序列化转换模块中的等时段分割模块,驻留瓦片生成模块三个模块,求得已发生的瓦片轨迹序列<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;
第二处理模块,利用已发生的瓦片轨迹序列,和建模模块中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。
本发明的有益效果为:通过本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置能够对传统的基于纯经纬度的轨迹的预测方法引入的误差进行一定程度上的避免,同时可根据实际预测地理范围精度进行瓦片级别的设定。引入LSTM循环神经网络模型,一定程度上解决了轨迹记忆性问题,即模型要具有某种记忆性,能够记住之前已发生的情况。同时该方法在一定程度上提供了用户轨迹预测的新思路,对于该领域和其他涉及位置信息的预测问题都有一定借鉴意义。
附图说明
图1A是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测方法流程图
图1B是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测装置示意图
图2 LSTM循环神经网络模型结构图
具体实施方式
下面给出本发明的具体实施方式,结合附图对本发明做出详细描述。
图1A是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测方法流程图。如图1A所示,该方法包括:
步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;
步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;
步骤3,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。
进一步的,所述步骤1包括:
步骤11,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;
步骤12,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。
进一步的,所述步骤12包括:
步骤121,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;
步骤122,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;
步骤123,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。
进一步的,所述步骤2包括:
步骤21,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;
步骤22,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;
步骤23,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。图2所示即为LSTM循环神经网络模型结构图。
进一步的,所述步骤3包括:
步骤31,已知发生的经纬度轨迹序列,根据步骤11,步骤121,步骤122三个步骤,求得已发生的瓦片轨迹序列:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;
步骤32,利用已发生的瓦片轨迹序列,和步骤2中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。
图1B是本发明的基于地图瓦片和LSTM循环神经网络的轨迹预测装置示意图。如图1B所示,该装置包括:
预处理模块100:对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;
建模模块200:利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;
预测模块300:对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。
进一步的,所述预处理模块100包括:
瓦片化转换模块110,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;
序列化转换模块120,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。
进一步的,所述序列化转换模块120包括:
等时段分割模块,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;
驻留瓦片生成模块,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;
训练集生成模块,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。
进一步的,所述建模模块200包括:
第一层LSTM设定模块210,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;
输出层全连接设定模块220,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;
中间层LSTM设定模块230,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。图2所示即为LSTM循环神经网络模型结构图。
进一步的,所述预测模块300包括:
第一处理模块310,已知发生的经纬度轨迹序列,根据预处理模块100中的瓦片化转换模块110,序列化转换模块120中的等时段分割模块,驻留瓦片生成模块几个模块,求得已发生的瓦片轨迹序列
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;
第二处理模块320,利用已发生的瓦片轨迹序列,和建模模块200中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。
本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明范围并不仅限于以上的说明,而是由权利要求书的范围来确定。
Claims (10)
1.一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,包括:
步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;
步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;
步骤3,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。
2.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤1包括:
步骤11,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;
步骤12,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。
3.如权利要求2所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤12包括:
步骤121,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;
步骤122,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;
步骤123,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。
4.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤2包括:
步骤21,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;
步骤22,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;
步骤23,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。
5.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤3中:
步骤31,已知发生的经纬度轨迹序列,根据步骤11、步骤121、步骤122三个步骤,求得已发生的瓦片轨迹序列:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;
步骤32,利用已发生的瓦片轨迹序列,和步骤2中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。
6.一种基于地图瓦片和LSTM循环神经网络的轨迹预测装置,其特征在于,包括:
预处理模块,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;
建模模块,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;
预测模块,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。
7.如权利要求6所述的基于地图瓦片和LSTM循环神经网络的轨迹预测装置,其特征在于所述预处理模块包括:
瓦片化转换模块,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;
序列化转换模块,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。
8.如权利要求7所述的地图瓦片和LSTM循环神经网络的轨迹预测装置,其特征在于,所述序列化转换模块包括:
等时段分割模块,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;
驻留瓦片生成模块,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;
训练集生成模块,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:
<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。
9.如权利要求6所述的基于地图瓦片和LSTM循环神经网络的轨迹预测装置,其特征在于,所述建模模块包括:
第一层LSTM设定模块,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;
输出层全连接设定模块,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;
中间层LSTM设定模块,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。
10.如权利要求6所述的基于地图瓦片和LSTM循环神经网络的轨迹预测装置,其特征在于,所述预测模块包括:
第一处理模块,已知发生的经纬度轨迹序列,根据预处理模块中的瓦片化转换模块,序列化转换模块中的等时段分割模块,驻留瓦片生成模块三个模块,求得已发生的瓦片轨迹序列<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;
第二处理模块,利用已发生的瓦片轨迹序列,和建模模块中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610356019.9A CN106022527A (zh) | 2016-05-27 | 2016-05-27 | 基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610356019.9A CN106022527A (zh) | 2016-05-27 | 2016-05-27 | 基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106022527A true CN106022527A (zh) | 2016-10-12 |
Family
ID=57093973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610356019.9A Pending CN106022527A (zh) | 2016-05-27 | 2016-05-27 | 基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022527A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106502799A (zh) * | 2016-12-30 | 2017-03-15 | 南京大学 | 一种基于长短时记忆网络的主机负载预测方法 |
CN107481270A (zh) * | 2017-08-10 | 2017-12-15 | 上海体育学院 | 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备 |
CN108268597A (zh) * | 2017-12-18 | 2018-07-10 | 中国电子科技集团公司第二十八研究所 | 一种动目标活动概率图谱构建及行为意图识别方法 |
CN108629978A (zh) * | 2018-06-07 | 2018-10-09 | 重庆邮电大学 | 一种基于高维路网和循环神经网络的交通轨迹预测方法 |
CN108648829A (zh) * | 2018-04-11 | 2018-10-12 | 平安科技(深圳)有限公司 | 疾病预测方法及装置、计算机装置及可读存储介质 |
CN108694369A (zh) * | 2017-04-07 | 2018-10-23 | 奥多比公司 | 基于图形图像来预测多个姿势 |
CN108711847A (zh) * | 2018-05-07 | 2018-10-26 | 国网山东省电力公司电力科学研究院 | 一种基于编码解码长短期记忆网络的短期风电功率预测方法 |
CN109299887A (zh) * | 2018-11-05 | 2019-02-01 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及电子设备 |
CN110210604A (zh) * | 2019-05-21 | 2019-09-06 | 北京邮电大学 | 一种终端设备移动轨迹预测方法及装置 |
CN110543543A (zh) * | 2019-09-10 | 2019-12-06 | 苏州大学 | 一种基于多粒度神经网络的用户移动行为预测方法及装置 |
CN110929932A (zh) * | 2019-11-20 | 2020-03-27 | 满江(上海)软件科技有限公司 | 基于区块链的非特定人群流动临时聚集点的预警系统 |
CN110991751A (zh) * | 2019-12-06 | 2020-04-10 | 讯飞智元信息科技有限公司 | 用户生活模式预测方法、装置、电子设备及存储介质 |
CN111795703A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 地图构建方法、装置、存储介质及移动设备 |
CN112925782A (zh) * | 2021-03-12 | 2021-06-08 | 上海海事大学 | 一种基于lstm预测和平滑分析思想的轨迹数据压缩方法 |
CN113240199A (zh) * | 2021-06-07 | 2021-08-10 | 广西民族大学 | 基于dilate_tlstm的港口船舶轨迹预测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101122466A (zh) * | 2006-08-09 | 2008-02-13 | 高德软件有限公司 | 电子地图的轨迹及其视频数据的存储及查询方法 |
CN101464158A (zh) * | 2009-01-15 | 2009-06-24 | 上海交通大学 | 基于gps定位的道路网络栅格数字地图自动生成方法 |
US20100106603A1 (en) * | 2008-10-20 | 2010-04-29 | Carnegie Mellon University | System, method and device for predicting navigational decision-making behavior |
WO2015014773A1 (en) * | 2013-07-29 | 2015-02-05 | Koninklijke Kpn N.V. | Providing tile video streams to a client |
CN104408203A (zh) * | 2014-12-18 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 一种预测移动对象轨迹终点的方法 |
CN105222768A (zh) * | 2014-06-30 | 2016-01-06 | 奇点新源国际技术开发(北京)有限公司 | 一种定位轨迹预测方法及装置 |
CN105551036A (zh) * | 2015-12-10 | 2016-05-04 | 中国科学院深圳先进技术研究院 | 一种深度学习网络的训练方法和装置 |
-
2016
- 2016-05-27 CN CN201610356019.9A patent/CN106022527A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101122466A (zh) * | 2006-08-09 | 2008-02-13 | 高德软件有限公司 | 电子地图的轨迹及其视频数据的存储及查询方法 |
US20100106603A1 (en) * | 2008-10-20 | 2010-04-29 | Carnegie Mellon University | System, method and device for predicting navigational decision-making behavior |
CN101464158A (zh) * | 2009-01-15 | 2009-06-24 | 上海交通大学 | 基于gps定位的道路网络栅格数字地图自动生成方法 |
WO2015014773A1 (en) * | 2013-07-29 | 2015-02-05 | Koninklijke Kpn N.V. | Providing tile video streams to a client |
CN105222768A (zh) * | 2014-06-30 | 2016-01-06 | 奇点新源国际技术开发(北京)有限公司 | 一种定位轨迹预测方法及装置 |
CN104408203A (zh) * | 2014-12-18 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 一种预测移动对象轨迹终点的方法 |
CN105551036A (zh) * | 2015-12-10 | 2016-05-04 | 中国科学院深圳先进技术研究院 | 一种深度学习网络的训练方法和装置 |
Non-Patent Citations (1)
Title |
---|
SHENG FENG等: "Grid-Based Improved Maximum Likelihood Estimation for Dynamic Localization of Mobile Robots", 《INTERNATIONAL JOURNAL OF DISTRIBUTED SENSOR NETWORKS》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106502799A (zh) * | 2016-12-30 | 2017-03-15 | 南京大学 | 一种基于长短时记忆网络的主机负载预测方法 |
CN108694369B (zh) * | 2017-04-07 | 2023-01-10 | 奥多比公司 | 基于图形图像来预测多个姿势 |
CN108694369A (zh) * | 2017-04-07 | 2018-10-23 | 奥多比公司 | 基于图形图像来预测多个姿势 |
CN107481270B (zh) * | 2017-08-10 | 2020-05-19 | 上海体育学院 | 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备 |
CN107481270A (zh) * | 2017-08-10 | 2017-12-15 | 上海体育学院 | 乒乓球目标跟踪和轨迹预测方法、装置、存储介质和计算机设备 |
CN108268597A (zh) * | 2017-12-18 | 2018-07-10 | 中国电子科技集团公司第二十八研究所 | 一种动目标活动概率图谱构建及行为意图识别方法 |
CN108648829A (zh) * | 2018-04-11 | 2018-10-12 | 平安科技(深圳)有限公司 | 疾病预测方法及装置、计算机装置及可读存储介质 |
CN108711847A (zh) * | 2018-05-07 | 2018-10-26 | 国网山东省电力公司电力科学研究院 | 一种基于编码解码长短期记忆网络的短期风电功率预测方法 |
CN108711847B (zh) * | 2018-05-07 | 2019-06-04 | 国网山东省电力公司电力科学研究院 | 一种基于编码解码长短期记忆网络的短期风电功率预测方法 |
CN108629978B (zh) * | 2018-06-07 | 2020-12-22 | 重庆邮电大学 | 一种基于高维路网和循环神经网络的交通轨迹预测方法 |
CN108629978A (zh) * | 2018-06-07 | 2018-10-09 | 重庆邮电大学 | 一种基于高维路网和循环神经网络的交通轨迹预测方法 |
CN109299887A (zh) * | 2018-11-05 | 2019-02-01 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及电子设备 |
CN109299887B (zh) * | 2018-11-05 | 2022-04-19 | 创新先进技术有限公司 | 一种数据处理方法、装置及电子设备 |
CN111795703B (zh) * | 2019-04-09 | 2022-05-17 | Oppo广东移动通信有限公司 | 地图构建方法、装置、存储介质及移动设备 |
CN111795703A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 地图构建方法、装置、存储介质及移动设备 |
CN110210604A (zh) * | 2019-05-21 | 2019-09-06 | 北京邮电大学 | 一种终端设备移动轨迹预测方法及装置 |
CN110210604B (zh) * | 2019-05-21 | 2021-06-04 | 北京邮电大学 | 一种终端设备移动轨迹预测方法及装置 |
CN110543543A (zh) * | 2019-09-10 | 2019-12-06 | 苏州大学 | 一种基于多粒度神经网络的用户移动行为预测方法及装置 |
CN110929932A (zh) * | 2019-11-20 | 2020-03-27 | 满江(上海)软件科技有限公司 | 基于区块链的非特定人群流动临时聚集点的预警系统 |
CN110991751A (zh) * | 2019-12-06 | 2020-04-10 | 讯飞智元信息科技有限公司 | 用户生活模式预测方法、装置、电子设备及存储介质 |
CN112925782A (zh) * | 2021-03-12 | 2021-06-08 | 上海海事大学 | 一种基于lstm预测和平滑分析思想的轨迹数据压缩方法 |
CN112925782B (zh) * | 2021-03-12 | 2024-01-23 | 上海海事大学 | 一种基于lstm预测和平滑分析思想的轨迹数据压缩方法 |
CN113240199A (zh) * | 2021-06-07 | 2021-08-10 | 广西民族大学 | 基于dilate_tlstm的港口船舶轨迹预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022527A (zh) | 基于地图瓦片和lstm循环神经网络的轨迹预测方法和装置 | |
CN111653088B (zh) | 一种车辆出行量预测模型构建方法及预测方法和系统 | |
CN102138079B (zh) | 改善的卫星时钟预测 | |
CN104197945B (zh) | 一种基于低采样率浮动车数据的全局投票地图匹配方法 | |
CN110414732B (zh) | 一种出行未来轨迹预测方法、装置、储存介质及电子设备 | |
CN102004856B (zh) | 高频观测资料实时数据的快速集合卡曼滤波同化方法 | |
CN105206057B (zh) | 基于浮动车居民出行热点区域的检测方法及系统 | |
CN104881472B (zh) | 一种基于网络数据收集的旅游线路景点组合推荐方法 | |
CN103369466B (zh) | 一种地图匹配辅助室内定位方法 | |
CN102332210A (zh) | 基于手机定位数据的实时城市道路交通流数据提取方法 | |
CN110796337B (zh) | 一种评价城市公交站点服务可达性的系统 | |
CN107688906B (zh) | 多方法融合的输电线路气象要素降尺度分析系统及方法 | |
JP2013515974A (ja) | デジタル地図におけるネットワーク生成のための時間および/または正確度に依存した重み | |
CN107193060B (zh) | 一种多路径台风风暴潮快速预测方法及系统 | |
CN104408203A (zh) | 一种预测移动对象轨迹终点的方法 | |
CN105809962A (zh) | 一种基于手机数据的交通出行方式划分的方法 | |
CN109041218B (zh) | 一种预测用户位置的方法和智能硬件 | |
CN104567906A (zh) | 一种基于北斗的城市路网车辆路径规划方法及装置 | |
CN103336894B (zh) | 一种城市容积率自动分区方法 | |
CN112579922B (zh) | 一种基于用户轨迹的兴趣点推荐方法 | |
CN108446324A (zh) | 一种基于长短时记忆网络lstm的gps数据重构方法 | |
CN109933901B (zh) | 一种生态系统服务价值最优化的mcr城市扩张模拟方法 | |
CN111121759A (zh) | 一种基于多层长短期记忆网络的地磁室内定位方法 | |
CN105629197A (zh) | 一种基于接收信号功率信息的辐射源定位方法 | |
CN113988373B (zh) | 基于多通道卷积神经网络的多任务海量用户负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161012 |