CN110570044A

CN110570044A - 基于循环神经网络和注意力机制的下一个地点预测方法

Info

Publication number: CN110570044A
Application number: CN201910872506.4A
Authority: CN
Inventors: 曾骏; 何欣; 唐浩然; 文俊浩
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2019-09-16
Filing date: 2019-09-16
Publication date: 2019-12-13

Abstract

本发明公开了基于循环神经网络和注意力机制的下一个地点预测方法，包括以下步骤：获取所有用户的历史签到数据并按时间先后形成签到序列，根据历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T；根据向量I和向量L计算包含时间戳中用户签到时间和地点ID信息的向量C₀；根据向量C₀计算体现签到序列中各个地点ID位置之间的关系向量X；根据向量X和向量I计算包含用户ID信息和各个地点ID位置之间的关系向量C₁；根据向量C₁分别计算Score_pos和Score_att；根据Score_pos和Score_att的计算结果生成预测列表。有益效果：可以对用户将要去到的下一个地点或者多个地点进行预测。

Description

基于循环神经网络和注意力机制的下一个地点预测方法

技术领域

本发明涉及下一个地点预测方法技术领域，具体来说，涉及基于循环神经网络和注意力机制的下一个地点预测方法。

背景技术

近些年来，越来越多基于位置的社交应用鼓励用户通过签到共享活动。基于此，大量的用户轨迹数据得以积累，这些数据包含空间和时间信息，即用户去了何地，在何时进行了签到。但是，用户对位置的共享具有很强的随机性，用户自身是否乐于签到、时间是否允许签到、情绪变化等，都能在一定程度上影响用户的签到情况。这使得签到数据十分稀疏，有可能用户在某日去了二十余个地点，但只在五个地方进行了签到。

对于一个特定的用户来说，这些离散的签到数据可以按照时间整合为一个序列，该序列能够反映出用户的一个历史访问情况。对这些序列数据进行分析后，研究人员发现用户行为具有随机和多变的特点。研究人员还发现，用户行为在社会和地理信息的影响下，仍存在一定的规律性。挖掘用户轨迹所反映出来的行为习惯与规律，以此作为基础的下一个地点预测研究有着广泛的应用，如城市计算、疾病防控、交通流预测、个性化推荐、摘要总结、语义角色标注。

下一个地点预测广阔的应用前景，吸引着越来越多的研究人员。在过去的十年间，对下一个地点进行预测的方法层出不穷。常用的包括马尔可夫模型、矩阵分解、循环神经网络、贝叶斯模型。基于上述方法，研究人员在进行预测时考虑了时间和空间的规律性。但目前仍存在如下问题：

1、用户总是更愿意在他们最感兴趣的位置签到，这使得签到数据十分稀疏，而且用户的行为习惯会随着时间的变化而发生改变，时间久远的轨迹数据难以用于对用户行为的挖掘。

2、人类的行为受到多种环境因素的影响，诸如天气、情绪等因素，甚至包含一些不可控的情况。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明要解决的技术问题是：如何挖掘序列模式下以及不同上下文因素下各地点之间的关系，以便合理分析各个用户的不同习惯与偏好，更加准确的对用户将要去到的地点进行预测。

为此，本发明采用的具体技术方案如下：

基于循环神经网络和注意力机制的下一个地点预测方法，通过面向用户历史轨迹数据，采用循环神经网络以及自注意力机制对用户行为规律进行挖掘，对下一个地点进行预测的方法，包括以下步骤：

获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T；

根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C₀；

根据所述向量C₀计算体现所述签到序列中各个所述地点ID位置之间的关系向量X；

根据所述向量X和所述向量I计算包含所述用户ID信息和各个所述地点ID位置之间的关系向量C₁；

根据所述向量C₁按照预先设定的法则分别计算Score_pos和Score_att；

根据所述Score_pos和所述Score_att的计算结果生成预测列表。

优选的，在获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T中还包括以下步骤：

对所述签到数据中的所述用户ID进行映射，映射后的向量I可以唯一标识该用户；

对所述签到数据中的所述地点ID进行映射，映射后的向量L反应用户去过的地点；

对所述签到数据中的所述时间戳进行映射，映射后的向量T反应用户在该地点进行签到的时间；

其中，所述时间戳(t₁,t₂，…t_n)，所述地点ID(l₁,l₂，…l_n)和所述用户ID可以分别嵌入实值向量T，L，I中，对于给定的用户，所述向量I，L，T包括该用户一端时间内的行为信息，并在一定程度上能够反映出该用户的行为规律。

优选的，在根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C₀中还包括以下步骤：

将所述向量L和所述向量T进行连接，得到包含用户所到地点和所到地点时间信息的向量C₀，且所述向量C₀包含位置信息和用户访问时间信息；

通过GRU对所述向量C₀进行处理，获取给定用户所述签到序列中各个所述地点ID位置之间的关系。

优选的，在根据所述向量C₀计算体现所述签到序列中各个所述地点ID位置之间的关系向量X中还包括以下步骤：

计算反映出所述签到序列中各个所述地点ID位置之间的关系向量X：

z_t＝σ(W_t·[h_t-1，x_t])；

r_t＝σ(W_r·[h_t-1，x_t])；

c_t＝tanh(W·[r_t*h_t-1,x_t])；

h_t＝(1-z_t)*h_t-1+z_t*c_t；

其中，x_t表示t时刻的输入，h_t-1表示t时刻的网络输出，W表示学习到的权值矩阵，z_t和r_t分别为更新门和复位门，σ表示一个激活函数，c_t表示一种新的隐藏状态，h_t表示网络的输出；

其主要目的是处理稀疏的用户签到数据，在时间跨度很大的情况下，提取出所述签到系列中各个所述地点ID位置之间的关系，该关系在一定程度上反映了用户的偏好，例如，用户喜欢在餐馆吃完午饭后去书店，或者在购物中心购物后去咖啡馆。

优选的，在根据所述向量C₁按照预先设定的法则分别计算Score_pos和Score_att中还包括以下步骤：

基于所述向量C₁计算Score_pos，Score_pos包含每个所述地点ID的得分，即用户会去的概率；

基于所述向量C₁计算Score_att：

score_att(Q,K,V)＝Concat(head1,head2,...,headn)W0Concat(head1,head2,...,headn)W^o；所述Score_att包含的是不同上下文因素的影响下，每个所述地点ID之间的关系，其中，d_k为神经网络隐藏单元的维数，Q、K、V分别是查询、键和值，它们是神经网络前一层的输出；

其中，用户会去到的下一个地点除了受到已去地点的影响外，也受到天气、情绪以及一些其它因素的影响，自注意力中的多头机制能够探索不同上下文因素对用户行为的影响，计算得到的权重矩阵可以帮助网络从不同的表示子空间了解每个位置对于给定用户的重要性。

优选的，在根据所述Score_pos和所述Score_att的计算结果生成预测列表中还包括以下步骤：

根据最终的得分获取排序列表，并在所述排序列表中按照分数由高到低对预测地点进行选择。

本发明的有益效果为：本发明利用历史轨迹信息来捕捉时间与用户已经访问过的位置之间的关系，并且利用自注意力机制从不同的上下文因素发现轨迹中各位置间的关系，通过研究特定用户的历史轨迹信息背后的潜在规律，探索序列的规律性，并发现影响用户行为的因素，与传统的常用预测方法相比，本发明所提的模型在预测精度上取得了更好的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的基于循环神经网络和注意力机制的下一个地点预测方法的步骤说明示意图；

图2是根据本发明实施例的基于循环神经网络和注意力机制的下一个地点预测方法的流程示意图；

图3是根据本发明实施例的基于循环神经网络和注意力机制的下一个地点预测方法中自注意力机制的示意图；

图4是根据本发明实施例的基于循环神经网络和注意力机制的下一个地点预测方法中不同α和β值对预测结果的影响示意图；

图5是根据本发明实施例的基于循环神经网络和注意力机制的下一个地点预测方法中实验效果对比图。

具体实施方式

为进一步说明各实施例，本发明提供有附图，这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理，配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点，图中的组件并未按比例绘制，而类似的组件符号通常用来表示类似的组件。

根据本发明的实施例，提供了基于循环神经网络和注意力机制的下一个地点预测方法。

本发明描述了一种基于循环神经网络和自注意力机制的下一个地点预测方法。利用词嵌入方法将稀疏数据(例如时间戳、位置ID、用户ID)转换向量表示。这些向量会传入一个循环神经网络，目的是对轨迹序列中复杂而长期的依赖关系进行建模。

自注意力机制会分析循环神经网络处理后的结果，理解原始序列中存在的内部联系。自注意力机制最初由Vaswani在2017年提出，用于解决机器翻译的问题。同时，可以捕捉到影响人类行为迁移规律的不同语境因素的重要性。然后，结合历史轨迹信息，对下一位置进行预测。

在本发明中，签到即用户通过基于位置的服务对访问过的地点进行记录。每个签到记录都是唯一的，包括用户ID、时间戳、位置信息，这些信息由经纬度表示。例如，用户t时刻在l位置的第m个签到记录c可以描述为c_m＝(t,l)。

轨迹是指在一个特定的时间窗口w下，签到序列S_u可分为若干个子序列：S_u＝s_w1s_w2…s_wk，每个子序列可由s_wi(i∈{1,2,3…k})：s_w1＝c₁c₂c₃…c_j，s_w2＝c_j+1c_j+2…c_j+m(1<j+m<n)进行表示。窗口w是两个子序列之间的时间间隔,它的值可以设置为一个小时，一天，一个星期等。

下一个位置预测是指给定用户的签到序列S_u＝c₁c₂c₃…c_n，预测他将会去到的地点。即给定S_u，要获得一个预测列表，该列表需要包含c_n+1、c_n+2或更多用户u接下来想访问的位置的概率。

现结合附图和具体实施方式对本发明进一步说明，如图1-5所示，根据本发明实施例的基于循环神经网络和注意力机制的下一个地点预测方法，通过面向用户历史轨迹数据，采用循环神经网络以及自注意力机制对用户行为规律进行挖掘，对下一个地点进行预测的方法，包括以下步骤：

步骤S101，获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T；

具体的，在获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T中还包括以下步骤：

步骤S102，根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C₀；

具体的，在根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C₀中还包括以下步骤：

步骤S103，根据所述向量C₀计算体现所述签到序列中各个所述地点ID位置之间的关系向量X；

具体的，在根据所述向量C₀计算体现所述签到序列中各个所述地点ID位置之间的关系向量X中还包括以下步骤：

z_t＝σ(W_t·[h_t-1，x_t])；

r_t＝σ(W_r·[h_t-1，x_t])；

c_t＝tanh(W·[r_t*h_t-1,x_t])；

h_t＝(1-z_t)*h_t-1+z_t*c_t；

步骤S104，根据所述向量X和所述向量I计算包含所述用户ID信息和各个所述地点ID位置之间的关系向量C₁；

步骤S105，根据所述向量C₁按照预先设定的法则分别计算Score_pos和Score_att；

具体的，在根据所述向量C₁按照预先设定的法则分别计算Score_pos和Score_att中还包括以下步骤：

基于所述向量C₁计算Score_att：

步骤S106，根据所述Score_pos和所述Score_att的计算结果生成预测列表。

具体的，在根据所述Score_pos和所述Score_att的计算结果生成预测列表中还包括以下步骤：

在本实施例中，本发明选择的数据集是Foursquare NY，包含纽约市的签到信息。这些数据收集时间大约为10个月，从2012年4月12日到2013年2月16日。它包含由1083个用户生成的227428条签到数据。每条签到数据都包含有时间和空间信息，时间特征以时间戳表示，空间特征由坐标反映，在数据集中以<经度，纬度>表示。我们删除轨迹少于5条的用户，以及签到次数少于5的地点。

随机选择每个用户70％的轨迹数据作为训练集，其余数据作为测试集。评价指标为accuracy@N，基于公式

计算得到，其中N为预测地点数目。如预测了5个地点，accuracy衡量的就是这5个地点中预测正确的地点数目。

为了评估本发明针对下一个位置预测的准确性，将其与一些流行的方法进行了比较:

Markov：面向用户历史签到数据，基于马尔可夫链对用户的下一个地点进行预测。

RNN：面向用户历史签到数据，基于循环神经网络对下一个地点进行预测。

DeepMove：面向用户历史签到数据，基于循环神经网络和注意力机制对下一个地点进行预测。

最终得分反映了从一个给定位置到其他位置的得分，表示为公式Score＝α·Score_att+β·Score_pos，Score_pos包含每个地方的得分，即用户会去到的概率；Score_att包含的是在不同上下文因素的影响下，每个地点之间的关系。

本发明还设置了不同的α和β值(β＝1-α)以探索两种方法之间的关系。通过计算得到，当α＝0.4，β＝0.6，本发明达到最佳的预测性能。

实验结果显示，本发明相较其它三种常用方法而言，能够更好地对下一个位置进行预测。这是因为，传统的马尔可夫链通过获取用户最后访问的位置序列来构建转换矩阵，但忽略了时间对于用户行为的影响。与马尔可夫模型相比，RNN具有较强的时间特征捕获能力，能够处理离散的签到数据，从整合的序列当中发现地点之间的联系。然而，它可能很少关注用户的历史轨迹。DeepMove对单纯的RNN模型进行了扩展，它从较长的历史轨迹上阐明了人类行为具有周期性，并利用注意机制捕捉用户对某些位置的关注。本发明利用历史轨迹信息来捕捉时间与用户已经访问过的位置之间的关系，并且利用自注意力机制从不同的上下文因素发现轨迹中各位置间的关系。

本发明提出了一种基于循环神经网络和自注意力机制的下一个位置预测方法。通过研究特定用户的历史轨迹信息背后的潜在规律，探索序列的规律性，并发现影响用户行为的因素。本发明在真实的数据集Foursquare NY上进行实验。实验结果表明，与其他三种常用的预测方法相比，本发明所提的模型在预测精度上取得了更好的效果。

综上所述，借助于本发明的上述技术方案，本发明利用历史轨迹信息来捕捉时间与用户已经访问过的位置之间的关系，并且利用自注意力机制从不同的上下文因素发现轨迹中各位置间的关系，通过研究特定用户的历史轨迹信息背后的潜在规律，探索序列的规律性，并发现影响用户行为的因素，与传统的常用预测方法相比，本发明所提的模型在预测精度上取得了更好的效果。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于循环神经网络和注意力机制的下一个地点预测方法，通过面向用户历史轨迹数据，采用循环神经网络以及自注意力机制对用户行为规律进行挖掘，对下一个地点进行预测的方法，其特征在于，包括以下步骤：

根据所述Score_pos和所述Score_att的计算结果生成预测列表。

2.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在获取所有用户的历史签到数据并按时间先后形成签到序列，根据所述历史签到数据中包含的用户ID、地点ID和时间戳计算嵌入向量I，L，T中还包括以下步骤：

3.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在根据所述向量I和所述向量L计算包含所述时间戳中用户签到时间和所述地点ID信息的向量C₀中还包括以下步骤：

4.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在根据所述向量C₀计算体现所述签到序列中各个所述地点ID位置之间的关系向量X中还包括以下步骤：

z_t＝σ(W_t·[h_t-1，x_t])；

r_t＝σ(W_r·[h_t-1，x_t])；

c_t＝tanh(W·[r_t*h_t-1,x_t])；

h_t＝(1-z_t)*h_t-1+z_t*c_t；

其主要目的是处理稀疏的用户签到数据，在时间跨度很大的情况下，提取出所述签到系列中各个所述地点ID位置之间的关系，该关系在一定程度上反映了用户的偏好。

5.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在根据所述向量C₁按照预先设定的法则分别计算Score_pos和Score_att中还包括以下步骤：

基于所述向量C₁计算Score_att：

6.根据权利要求1所述的基于循环神经网络和注意力机制的下一个地点预测方法，其特征在于，在根据所述Score_pos和所述Score_att的计算结果生成预测列表中还包括以下步骤：