CN110928993B

CN110928993B - 基于深度循环神经网络的用户位置预测方法及系统

Info

Publication number: CN110928993B
Application number: CN201911173251.9A
Authority: CN
Inventors: 张旭; 李浡铭; 王迎雪; 刘弋锋
Original assignee: Chongqing University of Post and Telecommunications; China Academy of Electronic and Information Technology of CETC
Current assignee: Chongqing University of Post and Telecommunications; China Academy of Electronic and Information Technology of CETC
Priority date: 2019-11-26
Filing date: 2019-11-26
Publication date: 2023-06-30
Anticipated expiration: 2039-11-26
Also published as: CN110928993A

Abstract

本发明公开了一种基于深度循环神经网络的用户位置预测方法及系统，属于用户移动位置预测领域，所述方法包括：提取出用户的每个轨迹点信息，将用户的每个轨迹点包含的信息元组转化成轨迹点向量表示，将轨迹点向量输入到基于长短期记忆网络LSTM改进的循环神经元、注意力层和SoftMax层，得到预测向量，计算出用户下一步位置的概率分布来预测位置，本发明对GPS数据中所包含的语义信息进行处理，有效的将时空信息输入深度学习模型进行建模，增强历史位置对于用户下一个移动位置的影响，最终得到精准的位置预测结果。

Description

基于深度循环神经网络的用户位置预测方法及系统

技术领域

本发明属于用户移动位置预测领域，特别涉及一种基于深度循环神经网络的用户位置预测方法及系统。

背景技术

随着位置定位技术的发展，人们的移动轨迹得以丰富的保存下来。分析用户的移动轨迹信息，进而预测用户的位置移动，可以进行一些具有意义或巨大商业价值的活动。举个例子，通过分析出行用户的全球定位系统GPS轨迹信息，可以为用户进行路线推荐，位置广告推荐，健康应用服务和城市交通规划。研究用户位置预测可以极大的增强用户的出行体验的好感度和减少社会资源的消耗。人们的轨迹数据不再单纯只记录位置，时间等信息，还有丰富的语义信息，文本描述等。用户使用众多的社交网络媒体时，在记录其移动位置的同时还会记录其社会活动信息，比如位置属性(餐馆，书店)，正在进行的活动属性(打篮球，跳舞，唱歌)。这些语义信息同样对用户下一个位置预测有较大的影响。

循环神经网络RNNs模型最初被设计用于语言模型建模，并取得非常不错的效果。由于轨迹数据也属于序列数据的一种，可以将轨迹数据也输入到RNNs模型中进行序列建模。Zhu等人提出了一种时间-长短期记忆网络Time-LSTM模型，长短期记忆网络LSTM属于一种RNNs的变种，Time-LSTM通过在LSTM神经元中设置时间门，增强了LSTM模型预测的时间关联性。

然而与传统的序列数据不同，GPS轨迹数据中包含有丰富的语义信息，且具有时空特性，用户的移动与空间和时间密切相连。传统的用户位置预测方法，存在没有考虑用户移动的语义方面和用户移动连续性的问题，没有利用轨迹数据中包含的大量的语义信息，没有考虑到历史移动信息对用户下一个位置的影响。

发明内容

本发明为解决上述问题，提出了一种基于深度循环神经网络的用户位置预测方法及系统。本发明使用语句转化向量sen2vec方法将语义信息转化成语义向量，并将地理网格位置和时间戳信息转化成向量，将这三部分进行拼接作为模型的一部分输入。基于长短期记忆网络LSTM对循环神经元进行改进，增加了时间门和距离门，将移动轨迹时间间隔和距离间隔作为另一部分输入。在LSTM层之后加入一个注意力层，通过对基于LSTM改进的循环神经元的输出进行加权计算，增强历史移动位置对用户下一个移动位置的影响。

根据本发明的一个方面，提供一种基于深度循环神经网络的用户位置预测方法，所述方法包括：

步骤1，获取用户的历史全球定位系统GPS轨迹信息，提取出用户的每个轨迹点信息，所述轨迹点信息至少包含用户编号、网格编号、时间信息、语义信息、时间间隔和距离间隔；

步骤2，将用户的每个轨迹点包含的信息元组转化成轨迹点向量表示，得到用户编号向量、网格编号向量、时间信息向量和语义向量，时间间隔和距离间隔仍采用标量表示；

步骤3，将轨迹点向量输入到改进的深度循环神经网络模型中，得到时间窗口中每个时间片的第一隐状态向量h_n，将所述第一隐状态向量h_n输入到注意力层，得到第二隐状态向量

将第二隐状态向量/>

与用户编号向量相加，输入到SoftMax层，得到训练预测向量y_k，通过减小目标函数的损失来训练模型；

步骤4，将待预测用户的前k-1个位置的轨迹点向量输入训练完成的模型，得出目标预测向量y′_k，通过SoftMax计算出概率分布，将概率最大的位置作为用户的预测位置k。

根据本发明的另一方面，提供一种基于深度循环神经网络的用户位置预测系统，所述系统包括：

输入模块，用于获取用户的历史全球定位系统GPS轨迹信息，提取出用户的每个轨迹点信息，所述轨迹点信息至少包含用户编号、网格编号、时间信息、语义信息、时间间隔和距离间隔；

预处理模块，用于将用户的每个轨迹点包含的信息元组转化成轨迹点向量表示，得到用户编号向量、网格编号向量、时间信息向量和语义向量，时间间隔和距离间隔仍采用标量表示；

改进的深度循环神经网络模型模块，包括基于LSTM改进的循环神经元模块，注意力模块，SoftMax模块和训练模块；所述基于LSTM改进的循环神经元模块用于对输入的轨迹点向量进行处理，得到时间窗口中每个时间片的第一隐状态向量h_n；所述注意力模块用于对所述第一隐状态向量h_n进行处理，得到第二隐状态向量

所述SoftMax模块用于将第二隐状态向量/>

与用户编号向量相加后进行处理，得到训练预测向量y_k；所述训练模块用于更新所述改进的深度循环神经网络模型中的参数，通过减小目标函数的损失来训练所述模型；

预测结果输出模块，用于从训练好的所述改进的深度循环神经网络模型模块中接收目标预测向量y′_k，通过SoftMax操作计算出概率分布，将概率最大的位置作为用户的预测位置k，所述目标预测向量y′_k为将待预测用户的前k-1个位置的轨迹点向量输入到训练完成的所述模型模块中计算得到的预测向量。

根据本发明的另一个方面，提供一种计算机设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述的基于深度循环神经网络的用户位置预测方法。

本发明的有益效果在于，提出了一种基于深度循环神经网络的用户位置预测方法及系统，对GPS数据中所包含的语义信息进行处理，体现用户的语义信息对位置移动的影响，表现出用户的个性化移动，有效的将时空信息输入深度学习模型进行建模；增强历史移动位置对用户下一个移动位置的影响，最终得到精准的位置预测结果。

附图说明

图1是本发明实施例提供的一种基于深度循环神经网络的用户位置预测方法流程图；

图2是本发明实施例使用的基于长短期记忆网络LSTM改进的循环神经元的示意图；

图3是本发明实施例中隐层向量输入到注意力层进行计算的流程示意图；

图4是本发明实施例提供的另一种基于深度循环神经网络的用户位置预测方法流程图；

图5是本发明实施例提供的一种基于深度循环神经网络的用户位置预测系统结构图；

图6是本发明实施例提供的一种用于基于深度循环神经网络的用户位置预测的计算机设备结构图。

具体实施方式

下面本发明具体的实施方式进行阐述，来进一步说明本发明的出发点以及相应的技术方案。

图1是本发明实施例提供的一种基于深度循环神经网络的用户位置预测方法流程图，所述方法包括以下步骤：

步骤101，获取用户的历史全球定位系统GPS轨迹信息，提取出用户的每个轨迹点信息，所述轨迹点信息至少包含用户编号、网格编号、时间信息、语义信息、时间间隔和距离间隔；

步骤102，将用户的每个轨迹点包含的信息元组转化成轨迹点向量表示，得到用户编号向量、网格编号向量、时间信息向量和语义向量，时间间隔和距离间隔仍采用标量表示；

优选的，步骤102具体包括以下步骤：

步骤102-1，将网格编号，时间信息，用户编号通过词嵌入方法转化向量表示，得到用户编号向量、网格编号向量、时间信息向量，时间间隔和距离间隔仍为标量表示；

步骤102-2，将语义信息通过语句转向量sen2vec方法转化成语义向量，包括先使用预训练的词向量转化语义信息中的每个单词，根据预训练的词频将每个语义信息的所有单词进行加权处理，再使用主成分分析法对整个语义信息集进行处理，得到每一条语义信息的向量表示；

优选的，所述将语义信息转化成语义向量，具体包括：

对于原始语义信息集合c中的每一条原始语义信息c_k，使用预训练词向量

来代表语义信息中的每一个单词w∈c_k，使用预训练语料库词频作为它的词频统计p(w)，将c中所包含的词向量加权求和并取平均，转化得到中间词向量/>

其中，a是预设的一个不变参数，如a为10的负4次方，词频统计p(w)越大，表示该单词出现的频率越高，对于没有查询到的单词w，设置p(w)＝1，

表示预处理中的中间词向量/>

的集合；

使用主成分分析法PCA对

的集合/>

求得主成分/>

为保持向量的维度不变，获得嵌入向量

其中/>

为/>

的转置；

将

进行线性变换为语义嵌入表示为/>

其中B_c是线性变换的权重矩阵。

步骤102-3，将网格编号向量、时间信息向量和语义向量进行向量连接，作为模型的第一输入部分，将时间间隔和距离间隔作为模型的第二输入部分，将用户编号向量作为模型的第三输入部分。

步骤103，将轨迹点向量输入到改进的深度循环神经网络模型中，得到时间窗口中每个时间片的第一隐状态向量h_n，将所述第一隐状态向量h_n输入到注意力层，得到第二隐状态向量

将第二隐状态向量/>

优选的，步骤103具体包括以下步骤：

步骤103-1，将轨迹点向量输入到改进的深度循环神经网络模型中，通过基于LSTM改进的循环神经元层计算，得到时间窗口中每个时间片的第一隐状态向量h_n，所述基于LSTM改进的循环神经元层中设置有用于接收时间间隔信息和距离间隔信息的时间门和距离门；

图2是本发明实施例使用的基于LSTM改进的循环神经元的示意图，该神经元中加入了时间门和距离门，可以接收时间间隔信息和距离间隔信息。步骤103-1中通过基于LSTM改进的循环神经元层计算，得到时间窗口中每个时间片的第一隐状态向量h_n的具体步骤为：

将网格编号向量，语义向量，时间向量拼接而成向量

两个轨迹点之间的位置间隔Δd_n和时间间隔Δt_n，输入到以下公式群中，计算得到第一隐状态向量h_n：

其中，h_n-1是上一个时间片的隐状态向量，i_n是输入门，f_n是遗忘门，c_n是神经元状态，o_n是输出门，W_i、W_f、

W_o、W_xt、W_xd、W_t、W_d、W_to、W_do、V_i、V_f、/>

V_o是该神经元的输入线性变换矩阵，b_i、b_f、/>

b_o、b_t、b_d是输入线性变换偏移，σ()是激活函数sigmod，⊙表示矩阵元素相乘。

步骤103-2，将第一隐状态向量h_n输入到注意力层进行计算，通过两个额外的注意力权重向量，以及一个注意力深度对第一隐状态向量h_n进行加权计算，获得第二隐状态向量

图3是本发明实施例中隐层向量输入到注意力层进行计算的流程示意图。步骤103-2中，将改进的LSTM的神经元的输出h_n输入注意力层进行计算的具体步骤包括：

通过注意力深度d_r，确定需要进行加权计算的隐层向量

为：

通过两个额外的注意力权重向量W_s1∈R^e*e和W_s2∈R^e*1，计算对齐权重向量α_i：

α_i＝softmax(tanh(HⁱW_s1)W_s2)；

利用注意力深度d_r对隐层向量进行加权计算，获得第二隐状态向量

其中，

R^e*e、R^e*1分别表示维度为d_r*e、e*e、e*1的空间，e为第一隐态向量h_n的维度，α_i ^T为α_i的转置，n为第一隐状态向量的序列号。

步骤103-3，将第二隐状态向量

使用线性变换转化成N维向量o_k，将o_k与用户编号向量相加，输入到SoftMax层进行计算，得到训练预测向量y_k；具体通过以下公式计算得到：

步骤103-4，使用随机梯度下降算法SGD更新所述模型的参数，减小目标函数J的损失来训练所述模型；所述更新模型的参数为更新改进的深度循环神经网络模型的参数，包括基于LSTM改进的循环神经元和注意层公式中的参数；所述目标函数J的公式如下：

其中，l_k+1表示需要预测的位置的网格编号的向量，K表示训练集的总数，y_k为步骤103-3得到的训练预测向量。

步骤104，将待预测用户的前k-1个位置的轨迹点向量输入训练完成的模型，得出目标预测向量y′_k，通过SoftMax算法计算出概率分布，将概率最大的位置作为用户的预测位置k，即时刻k的预测位置。

图4是本发明实施例提供的另一种基于深度循环神经网络的用户位置预测方法流程图，具体步骤包括：

步骤401，清洗并获取用户的历史GPS轨迹信息，确定用户停留点位置序列，将待预测区域划分网格，并将轨迹点经纬度信息替换为网格编号，每个轨迹点包含：网格编号，时间信息，语义信息，时间间隔，距离间隔，用户编号。

步骤402，将每个轨迹点包含的信息元组转化成向量表示，包括：

将网格编号，时间信息，用户编号通过词嵌入方法转化向量表示，时间间隔和距离间隔仍为标量；

将语义信息通过sen2vec方法转化成语义向量，使用预训练的词向量转化语义信息中的每个单词，并根据预训练的词频将每个语义信息的所有单词进行加权处理，再使用主成分分析法对整个语义信息集进行处理，得到每一条语义信息的向量表示。

将网格编号向量，时间信息向量，语义向量进行向量连接，作为一部分输入，时间间隔和距离间隔作为另一部分输入，用户编号向量作为第三部分输入。

步骤403，将处理好的轨迹信息输入到改进的RNNs神经元模型中，得到时间窗口中每个时间片的隐状态向量，具体包括：

采用的改进的RNNs神经元处理网格编号向量，时间信息向量，语义向量，该神经元中加入了时间门和距离门，得到第一隐层状态h_n，所述基于LSTM改进的循环神经元可以接收时间间隔信息和距离间隔信息；

将改进的RNNs神经元的输出h_n输入注意力层进行计算，本发明在RNNs神经元输出h_n后加入了一层注意力层，通过两个额外的注意力权重向量，以及一个注意力深度对隐层向量进行加权计算，获得最终的隐层向量结果

将向量

先使用线性变换转化成N维向量得到o_k，将o_k与用户编号向量(用户编号向量也是N维)相加，输入到softmax层进行计算，得到最终的向量y_k。softmax用于获得预测位置的概率分布。使用随机梯度下降算法(SGD)自动更新参数,减小目标函数的损失训练模型。

步骤404，使用建模好的模型进行预测，将用户前k-1个位置的轨迹信息输入训练好的模型，得出向量o′_k，再通过softmax计算出概率分布，取最大的概率的位置作为预测的用户将要移动到的位置k。

图5是本发明实施例提供的一种基于深度循环神经网络的用户位置预测系统结构图，所述系统包括以下模块：

轨迹信息输入模块510，用于获取用户的历史全球定位系统GPS轨迹信息，提取出用户的每个轨迹点信息，所述轨迹点信息至少包含用户编号、网格编号、时间信息、语义信息、时间间隔和距离间隔；

预处理模块520，用于将用户的每个轨迹点包含的信息元组转化成轨迹点向量表示，得到用户编号向量、网格编号向量、时间信息向量和语义向量，时间间隔和距离间隔仍采用标量表示；

改进的深度循环神经网络模型模块530，包括基于LSTM改进的循环神经元模块531，注意力模块532，SoftMax模块533和训练模块534；所述基于LSTM改进的循环神经元模块531用于对输入的轨迹点向量进行处理，得到时间窗口中每个时间片的第一隐状态向量h_n；所述注意力模块532用于对所述第一隐状态向量h_n进行处理，得到第二隐状态向量

所述SoftMax模块533用于将第二隐状态向量/>

与用户编号向量相加后进行处理，得到训练预测向量y_k；所述训练模块534用于更新所述改进的深度循环神经网络模型中的参数，通过减小目标函数的损失来训练所述模型；

预测结果输出模块540，用于从训练好的所述改进的深度循环神经网络模型中接收目标预测向量y′_k，通过SoftMax计算出概率分布，将概率最大的位置作为用户的预测位置k，所述目标预测向量y′_k为将待预测用户的前k-1个位置的轨迹点向量输入到训练完成的所述模型中计算得到的预测向量。

优选的，所述预处理模块532具体用于：

将网格编号，时间信息，用户编号通过词嵌入方法转化向量表示，得到用户编号向量、网格编号向量、时间信息向量，时间间隔和距离间隔仍为标量表示；

将语义信息通过语句转向量sen2vec方法转化成语义向量，包括先使用预训练的词向量转化语义信息中的每个单词，根据预训练的词频将每个语义信息的所有单词进行加权处理，再使用主成分分析法对整个语义信息集进行处理，得到每一条语义信息的向量表示；

将网格编号向量、时间信息向量和语义向量进行向量连接，作为模型的第一输入部分，将时间间隔和距离间隔作为模型的第二输入部分，将用户编号向量作为模型的第三输入部分。

优选的，所述改进的深度循环神经网络模型模块530具体包括：

基于LSTM改进的循环神经元模块531，用于接收预处理模块生成的轨迹点向量，通过计算得到时间窗口中每个时间片的第一隐状态向量h_n，所述基于LSTM改进的循环神经元模块中设置有用于接收时间间隔信息和距离间隔信息的时间门和距离门；

注意力模块532，用于接收基于LSTM改进的循环神经元模块生成的第一隐状态向量h_n，通过两个额外的注意力权重向量，以及一个注意力深度对第一隐状态向量h_n进行加权计算，获得第二隐状态向量

SoftMax模块533，用于将第二隐状态向量

使用线性变换转化成N维向量o_k，将o_k与用户编号向量相加，进行计算得到训练预测向量y_k；

训练模块534，用于使用随机梯度下降算法SGD更新所述模型的参数，减小目标函数J的损失来训练所述模型。

本发明实施例提供的基于深度循环神经网络的用户位置预测系统中各个模块的部分计算过程和操作步骤，可以参考前述说明的基于深度循环神经网络的用户位置预测方法。

图6是本发明实施例提供的一种计算机设备结构图。如图6所示，该计算机设备包括通过系统总线620连接的处理器610、非易失性存储介质630、内存储器650及网络接口640。其中，计算机设备的非易失性存储介质630存储有操作系统631及计算机可执行指令632，该计算机可执行指令632用于实现本发明实施例中提供的基于深度循环神经网络的用户位置预测方法。该处理器610用于提供计算和控制能力，支撑整个计算机设备的运行。计算机设备中的内存储器650为非易失性存储介质630中的操作系统631及计算机可执行指令632的运行提供环境，网络接口640用于与其它的计算机设备进行网络通信。该计算机设备可以是手机、平板电脑、PC(personal computer)等终端，也可以是服务器等。本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体地计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本发明另外一个实施例中，本发明采用Python程序设计语言，能够在主流计算机平台上运行。本实施列使用的操作系统为CentOS 6.5，要求CPU为Intel i7，内存16GB以上，硬盘空间要求32GB及以上，GPU为NVIDIA GTX 1080Ti，显存11G。本实施例基于PyTorch 1.2框架实施本发明内容，以RMSprop优化算法来更新模型的参数。

数据集采用来自两个大城市的GPS签到数据集，New York City(NY)和LosAngeles(LA)。第一个数据集NY，包含了2011年1月到2012年1月期间，30万条纽约的Foursquare签到数据记录。第二个数据集是LA，包含了2014年8月到2014年11月期间，140万条tweets签到数据记录。我们将城市划分成网格形式，每个网格代表一个位置，比如将LA划分为。在NY数据集上，我们保留了235位用户共计3107条移动序列，在LA数据集上，我们保留了466位用户共计8691条移动序列。

模型中神经元的维度，输入模型产生网格编号向量，时间向量，语义向量的维度都设置为50，用户编号向量的维度设置为10000，时间间隔和距离间隔为标量，单位是秒和米。

对于每个数据集，采取80％的记录作为训练集，20％的记录作为测试集。模型在所有训练数据上执行一遍梯度下降算法被称为一轮，每一轮都会对模型的参数进行更新，最大轮数被设置为500轮。在训练模型的500轮迭代过程中，在测试数据集上取得最小误差的模型及其参数被保存起来。

与本发明进行对比现有技术包括以下四种：

1)MF:最频繁法，根据用户的历史频繁访问位置信息进行预测。

2)LSTM:基础的LSTM方法，仅仅只使用了位置信息和用户编号信息。

3)SERM:基于LSTM的丰富语义神经网络模型，使用词袋模型产生关键词向量增强预测中的语义信息。

4)STGN:时空LSTM门模型，通过在LSTM中加入时间门和距离门，增强模型捕获时空信息的能力。

对比使用的衡量指标包括：(1)准确率Acc@N，表示预测位置出现在预测候选位置数的比例，例如Acc@5就是预测出5个可能位置，测试数据实际位置出现在这个位置上数量除以数据总量；和(2)网络误差δ_d/m，表示所有测试数据预测位置的网格中心和测试数据实际位置的网格中心的平均误差。

如表1所示，给出了在不同的数据集下，本发明与四个现有方法的准确率和网格误差率的对比情况。对于New York City(NY)数据集，用户量User为235位用户，轨迹数量Trajs为3107条移动序列，本方法(由OURS表示)的准确率Acc@1、Acc@5、Acc@10分别为0.2052、0.4487和0.5533，均比现有的四个方法高，且网格距离误差δ_d/m为1419，比现有的四个方法都低；对于Los Angeles(LA)数据集，用户量User为466位用户，轨迹数量Trajs为8691条移动序列，本方法(由OURS表示)的准确率Acc@1、Acc@5、Acc@10、Acc@15和Acc@20，均比现有的四个方法高，且网格距离误差δ_d/m为2341，比现有的四个方法都低。通过以上对比说明，本发明提供的方法可以有效提高预测的准确率和降低网格距离误差。

表1

如表2所示，给出了本发明提供的方法在不同的隐层维度(HiddenSize)下的准确率情况。对于Los Angeles(LA)数据集和New York City(NY)数据集，随着隐层维度从50增加到200，整体上可以增大Acc@1、Acc@5和Acc@10的值，即增大预测的准确率。这说明在满足运算能力要求的情况下，选择合适的隐层维度，可以进一步增大本发明提供方法的预测准确率。

表2

以上的所述乃是本发明的具体实施例及所运用的技术原理，若依本发明的构想所作的改变，其所产生的功能作用仍未超出说明书及附图所涵盖的精神时，仍应属本发明的保护范围。

Claims

1.一种基于深度循环神经网络的用户位置预测方法，其特征在于，包括：

将第二隐状态向量/>

步骤4，将待预测用户的前k-1个位置的轨迹点向量输入训练完成的模型，得出目标预测向量y′_k，通过SoftMax计算出概率分布，将概率最大的位置作为用户的预测位置k；

其中，所述步骤3包括：

步骤301，将轨迹点向量输入到改进的深度循环神经网络模型中，通过基于LSTM改进的循环神经元层计算，得到时间窗口中每个时间片的第一隐状态向量h_n，所述基于LSTM改进的循环神经元层中设置有用于接收时间间隔信息和距离间隔信息的时间门和距离门；

步骤302，将第一隐状态向量h_n输入到注意力层进行计算，通过两个额外的注意力权重向量，以及一个注意力深度对第一隐状态向量h_n进行加权计算，获得第二隐状态向量

2.根据权利要求1所述的方法，其特征在于，所述步骤2包括：

步骤201，将网格编号，时间信息，用户编号通过词嵌入方法转化向量表示，得到用户编号向量、网格编号向量、时间信息向量，时间间隔和距离间隔仍为标量表示；

步骤202，将语义信息通过语句转向量sen2vec方法转化成语义向量，包括先使用预训练的词向量转化语义信息中的每个单词，根据预训练的词频将每个语义信息的所有单词进行加权处理，再使用主成分分析法对整个语义信息集进行处理，得到每一条语义信息的向量表示；

步骤203，将网格编号向量、时间信息向量和语义向量进行向量连接，作为模型的第一输入部分，将时间间隔和距离间隔作为模型的第二输入部分，将用户编号向量作为模型的第三输入部分。

3.根据权利要求2所述的方法，其特征在于，所述将语义信息转化成语义向量，包括：

其中，a是预设的一个不变参数，词频统计p(w)越大，表示该单词出现的频率越高，对于没有查询到的单词w，设置p(w)＝1，

表示预处理中的中间词向量/>

的集合；

使用主成分分析法PCA对

的集合/>

求得主成分/>

为保持向量的维度不变，获得嵌入向量

其中/>

为/>

的转置；

将

进行线性变换为语义嵌入表示为/>

其中B_c是线性变换的权重矩阵。

4.根据权利要求1所述的方法，其特征在于，所述步骤3还包括：

步骤303，将第二隐状态向量

使用线性变换转化成N维向量o_k，将o_k与用户编号向量相加，输入到SoftMax层进行计算，得到训练预测向量y_k；

步骤304，使用随机梯度下降算法SGD更新所述模型的参数，减小目标函数J的损失来训练所述模型。

5.根据权利要求1所述的方法，其特征在于，所述计算得到时间窗口中每个时间片的第一隐状态向量h_n，包括：

将网格编号向量，语义向量，时间向量拼接而成向量

W_o、W_xt、W_xd、W_t、W_d、W_to、W_do、V_i、V_f、/>

V_o是该神经元的输入线性变换矩阵，b_i、b_f、/>

6.根据权利要求1所述的方法，其特征在于，将所述第一隐状态向量h_n输入到注意力层，得到第二隐状态向量

包括：

通过注意力深度d_r，确定需要进行加权计算的隐层向量

为：

α_i＝soft max(tanh(HⁱW_s1)W_s2)；

其中，

7.一种基于深度循环神经网络的用户位置预测系统，其特征在于，包括：

轨迹信息输入模块，用于获取用户的历史全球定位系统GPS轨迹信息，提取出用户的每个轨迹点信息，所述轨迹点信息至少包含用户编号、网格编号、时间信息、语义信息、时间间隔和距离间隔；

所述SoftMax模块用于将第二隐状态向量/>

预测结果输出模块，用于从训练好的所述改进的深度循环神经网络模型模块中接收目标预测向量y′_k，通过SoftMax操作计算出概率分布，将概率最大的位置作为用户的预测位置k，所述目标预测向量y′_k为将待预测用户的前k-1个位置的轨迹点向量输入到训练完成的所述模型模块中计算得到的预测向量；

其中，所述改进的深度循环神经网络模型模块，具体用于：

所述基于LSTM改进的循环神经元模块，用于接收预处理模块生成的轨迹点向量，通过计算得到时间窗口中每个时间片的第一隐状态向量h_n，所述基于LSTM改进的循环神经元模块中设置有用于接收时间间隔信息和距离间隔信息的时间门和距离门；

所述注意力模块，用于接收基于LSTM改进的循环神经元模块生成的第一隐状态向量h_n，通过两个额外的注意力权重向量，以及一个注意力深度对第一隐状态向量h_n进行加权计算，获得第二隐状态向量

8.根据权利要求7所述的系统，其特征在于，所述预处理模块具体用于：

9.根据权利要求7所述的系统，其特征在于，所述改进的深度循环神经网络模型模块具体还用于：

所述SoftMax模块，用于将第二隐状态向量

所述训练模块，用于使用随机梯度下降算法SGD更新所述模型的参数，减小目标函数J的损失来训练所述模型。

10.一种计算机设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1至6任一所述的方法。