CN111754604A

CN111754604A - 出行轨迹相似性确定方法及相关设备

Info

Publication number: CN111754604A
Application number: CN202010583483.8A
Authority: CN
Inventors: 张�杰
Original assignee: OneConnect Financial Technology Co Ltd Shanghai
Current assignee: OneConnect Smart Technology Co Ltd; OneConnect Financial Technology Co Ltd Shanghai
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2020-10-09

Abstract

本发明涉及定位技术领域，提供一种出行轨迹相似性确定方法及相关设备。所述方法获取多个用户的出行轨迹；根据所述多个用户的出行轨迹构建出行轨迹图；采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；用所述多个出行轨迹序列训练出行地点编码模型；用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。本发明可确定多个用户间的出行轨迹的相似性。

Description

出行轨迹相似性确定方法及相关设备

技术领域

本发明涉及定位技术领域，具体涉及一种出行轨迹相似性确定方法、装置、计算机设备及计算机可读存储介质。

背景技术

随着社会的发展，越来越多的设备可用于对用户进行定位并记录用户轨迹。例如，手机可以对用户进行定位并记录用户的出行轨迹信息，包括经纬度、时间等等。出行轨迹数据背后蕴含大量的生活兴趣信息、出行习惯信息等，通过对出行轨迹的分析，可以挖掘出出行轨迹的规律性信息。

针对多个用户来说，可以通过多个用户之间的出行轨迹相似性，分析出多个用户之间有很强的关联关系。比如两个用户经常出现在某几个区域，则可能是朋友。

通常，出行轨迹相似性确定方法在计算多个用户的相似性的时候，均需要比较多个用户的所有轨迹，导致确定多个用户间的出行轨迹相似性的效率不高。

发明内容

鉴于以上内容，有必要提出一种出行轨迹相似性确定方法、装置、计算机设备及计算机可读存储介质，其可以提升确定多个用户间的出行轨迹的相似性的效率。

本申请的第一方面提供一种出行轨迹相似性确定方法，所述方法包括：

获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；

根据所述多个用户的出行轨迹构建出行轨迹图；

采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；

用所述多个出行轨迹序列训练出行地点编码模型；

用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；

根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；

根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。

另一种可能的实现方式中，所述根据所述多个用户的出行轨迹构建出行轨迹图包括：

将所述出行轨迹图初始化为空，所述出行轨迹图是有向拓扑图，所述出行轨迹图的节点表示出行地点；

从所述多个用户的出行轨迹中逐个读取每个用户的出行轨迹，将所述出行轨迹图中不存在的该用户的出行地点加入所述出行轨迹图，所述出行轨迹图中的任意两个节点的有向边的初始权值为0，按照该用户的多个出行地点对应的出行时间的先后顺序逐个读取该用户的每个出行轨迹的多个出行地点，将读取的第n个出行地点确定为第一节点，将读取的第n+1个出行地点确定为第二节点，1≤n<N，N为该用户的出行地点的数量，在所述出行轨迹图中将第一节点指向第二节点的有向边的权值加C，C为预设常数。

另一种可能的实现方式中，所述采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列包括：

初始化所述多个出行轨迹序列的预设数量Q和所述多个出行轨迹序列中的每个出行轨迹序列的长度M；

计算所述出行轨迹图中的每个节点的转移概率；

遍历所述出行轨迹图中的N个节点，根据所述出行轨迹图中的每个节点的转移概率生成Q个以节点n为初始节点、长度为M的出行轨迹序列，得到N*Q个出行轨迹序列，1≤n≤N。

另一种可能的实现方式中，Q取值为1，根据所述出行轨迹图中的每个节点的转移概率生成1个以节点n为初始节点、长度为M的出行轨迹序列包括：

以所述出行轨迹图中的节点n为起点，根据节点n的转移概率矩阵第1次随机游走至节点n₁，根据节点n_i-1的转移概率矩阵第i次随机游走至节点n_i，得到1个以节点n为初始节点、长度为M的出行轨迹序列{n,n₁,n₂,…,n_M-1}，1≤n_i≤N，2≤n≤M-1。

另一种可能的实现方式中，所述出行地点编码模型是Skip-gram模型，所述用所述多个出行轨迹序列训练出行地点编码模型包括：

以预设长度为滑窗长度，以1为步长，从所述多个出行轨迹序列中获取多个出行轨迹子序列；

将每个出行轨迹子序列中的中间的一个节点的向量表示确定为Skip-gram模型的输入样本，将该出行轨迹子序列中的除中间节点以外的剩余节点的向量表示确定为所述输入样本对应的标签；

根据所述输入样本和所述输入样本的标签使用keras优化Skip-gram模型的权值。

另一种可能的实现方式中，所述多个出行轨迹序列中的每个节点的向量表示该节点对应的出行地点的经纬度。

另一种可能的实现方式中，所述根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量包括：

对每个用户的全部出行地点的特征向量计算平均值，得到每个用户的平均特征向量；

计算该用户的全部出行地点的地点顺序向量；

对该用户的平均特征向量和地点顺序向量求和。

本申请的第二方面提供一种出行轨迹相似性确定装置，所述装置包括：

获取模块，用于获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；

构建模块，用于根据所述多个用户的出行轨迹构建出行轨迹图；

生成模块，用于采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；

训练模块，用于用所述多个出行轨迹序列训练出行地点编码模型；

编码模块，用于用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；

第一计算模块，用于根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；

第二计算模块，用于根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。

计算所述出行轨迹图中的每个节点的转移概率；

计算该用户的全部出行地点的地点顺序向量；

对该用户的平均特征向量和地点顺序向量求和。

本申请的第三方面提供一种计算机设备，所述计算机设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现所述出行轨迹相似性确定方法。

本申请的第四方面提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述出行轨迹相似性确定方法。

本发明获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；根据所述多个用户的出行轨迹构建出行轨迹图；采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；用所述多个出行轨迹序列训练出行地点编码模型；用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。根据所述多个用户的出行轨迹训练出行地点编码模型，得到每个出行地点的特征向量，由于所述地点编码模型可以提前训练出，可以加快生成两个给定用户的出行轨迹向量。且采用随机游走方法生成多个出行轨迹序列使得地点编码模型对每个出行地点的表达更准确、更具场景适应性。因此，本发明实现了确定多个用户间的出行轨迹的相似性，提升了确定多个用户间的出行轨迹的相似性的效率。

附图说明

图1是本发明实施例提供的出行轨迹相似性确定方法的流程图。

图2是本发明实施例提供的出行轨迹相似性确定装置的结构图。

图3是本发明实施例提供的计算机设备的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

优选地，本发明的出行轨迹相似性确定方法应用在一个或者多个计算机设备中。所述计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本发明实施例一提供的出行轨迹相似性确定方法的流程图。所述出行轨迹相似性确定方法应用于计算机设备，用于确定多个用户间的出行轨迹的相似性。

如图1所示，所述出行轨迹相似性确定方法包括：

101，获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间。

可以实时接收多个用户携带的定位设备(如手机或手持GPS设备)发送的出行地点和出行地点对应的出行时间。可以根据给定用户的两个出行地点对应的出行时间确定所述给定用户的两个出行地点的先后顺序。

可以从多个用户携带的定位设备中读取用户的出行轨迹。

例如，从用户A的定位设备中读取用户A的出行轨迹为：地点1-201409010800(其中地点1也可以用经纬度表示，201409010800也可以用从1970开始的计算机时间表示)、地点2-201409010900；从用户B的定位设备中读取用户B的出行轨迹为：地点3-201409010830、地点4-201409011000、5-201409011100、地点6-201409011200。

102，根据所述多个用户的出行轨迹构建出行轨迹图。

可以根据所有用户的出行轨迹构建一个出行轨迹图。例如，根据用户A和用户B的出行轨迹构建出行轨迹图。

在一具体实施例中，所述根据所述多个用户的出行轨迹构建出行轨迹图包括：

例如，根据用户A和用户B的出行轨迹构建出行轨迹图，出行轨迹图中的节点包括：地点1、地点2、地点3、地点4、地点5、地点6。地点1指向地点2的权值为1(即预设常数C取值为1)；地点3指向地点4；地点4指向地点5；地点5指向地点6。

103，采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列。

在一具体实施例中，所述采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列包括：

计算所述出行轨迹图中的每个节点的转移概率；

例如，所述出行轨迹图中的三个地点(地点7、地点8和地点9)中的任意两个地点之间的有向边的权值都不为0(即任意两个地点之间都存在双向边)；M取值为3，预设数量Q取值为2，则得到的6个出行轨迹序列可能为：地点7-地点8-地点9(即以地点7为起点的出行轨迹序列)、地点7-地点8-地点7、地点8-地点7-地点9(即以地点8为起点的出行轨迹序列)、地点8-地点7-地点9、地点9-地点7-地点8(即以地点9为起点的出行轨迹序列)、地点9-地点8-地点9。

在一具体实施例中，Q取值为1，根据所述出行轨迹图中的每个节点的转移概率生成1个以节点n为初始节点、长度为M的出行轨迹序列包括：

在一具体实施例中，所述出行轨迹图中的节点n的转移概率根据如下公式确定：

其中，P_n,j表示随机游走过程中节点n的下一个节点为节点j的概率，w_n,i表示所述出行轨迹图中节点n指向节点i的有向边的权值。

104，用所述多个出行轨迹序列训练出行地点编码模型。

所述地点编码模型用于对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量。在训练时，选定一个出行轨迹序列中的一个节点(出行地点)，在该出行轨迹序列中获取该节点的邻节点。以该节点为输入，以邻节点为输出，对所述地点编码模型进行训练。所述地点编码模型可以是神经网络模型。

在一具体实施例中，所述出行地点编码模型是Skip-gram模型，所述用所述多个出行轨迹序列训练出行地点编码模型包括：

例如，在用序列“地点7-地点8-地点9”训练出行地点编码模型时，以地点8的向量表示为输入，以地点7和地点9的向量表示为该序列的标签。其中，序列“地点7-地点8-地点9”为获取的一个出行轨迹子序列。

在另一实施例中，所述多个出行轨迹序列中的每个节点的向量表示该节点对应的出行地点的经纬度。

105，用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；

可以用所述出行地点编码模型对地点7进行编码，得到地点7的特征向量，地点7的特征向量是地点7的唯一表示且反映了多个用户在地点7的轨迹特征。

106，根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量。

每个用户的全部出行地点的特征向量包含了该用户的轨迹信息，可以通过对该用户的全部出行地点综合计算，得到一个可以表征该用户的出行轨迹的向量。

在一具体实施例中，所述根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量包括：

对每个用户的全部出行地点的特征向量计算平均值。

在另一实施例中，所述根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量包括：

计算该用户的全部出行地点的地点顺序向量；

对该用户的平均特征向量和地点顺序向量求和。

例如，一个用户的3个出行地点的特征向量a、b、c，对各个特征向量的对应维度依次求平均值，得到由各个维度的平均值构成的平均特征向量d。计算该用户的全部出行地点的地点顺序向量e，使地点顺序向量e包含该用户的全部出行地点的顺序信息。对该用户的平均特征向量d和地点顺序向量e求和，地点出行轨迹向量f。

107，根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。

在一具体实施例中，所述根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性包括：

计算所述多个用户中的两个给定用户的出行轨迹向量的欧氏距离。

可以根据所述两个给定用户的出行轨迹相似性衡量所述两个给定用户的出行轨迹的相似程度。

所述两个给定用户的出行轨迹相似性越高，所述两个给定用户的出行轨迹的相似程度越高。

例如，用户A和用户B的出行轨迹向量的欧氏距离为num1；用户A和用户C的出行轨迹向量的欧氏距离为num2。num1大于num2，则用户A的出行轨迹与用户B的出行轨迹的相似程度更高。再如，设定预设阈值num3，当num1大于num3时，确定用户A和用户B的出行轨迹相似。

实施例一的出行轨迹相似性确定方法获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；根据所述多个用户的出行轨迹构建出行轨迹图；采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；用所述多个出行轨迹序列训练出行地点编码模型；用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。根据所述多个用户的出行轨迹训练出行地点编码模型，得到每个出行地点的特征向量，由于所述地点编码模型可以提前训练出，可以加快生成两个给定用户的出行轨迹向量。且采用随机游走方法生成多个出行轨迹序列使得地点编码模型对每个出行地点的表达更准确、更具场景适应性。实施例一提升了确定多个用户间的出行轨迹的相似性的效率。

在另一实施例中，所述方法还包括：

获取出行轨迹相似性大于预设相似性的目标用户；根据所述目标用户的出行轨迹确定出行聚集地点。可以获取出行轨迹相似性大于预设相似性的多个目标用户；将所述多个目标用户的出行轨迹中多次重复的出行地点确定为出行聚集地点。

实施例二

图2是本发明实施例二提供的出行轨迹相似性确定装置的结构图。所述出行轨迹相似性确定装置20应用于计算机设备。所述出行轨迹相似性确定装置20用于确定多个用户间的出行轨迹的相似性。

如图2所示，所述出行轨迹相似性确定装置20可以包括获取模块201、构建模块202、生成模块203、训练模块204、编码模块205、第一计算模块206、第二计算模块207。

获取模块201，用于获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间。

可以从多个用户携带的定位设备中读取用户的出行轨迹。

构建模块202，用于根据所述多个用户的出行轨迹构建出行轨迹图。

生成模块203，用于采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列。

计算所述出行轨迹图中的每个节点的转移概率；

训练模块204，用于用所述多个出行轨迹序列训练出行地点编码模型。

编码模块205，用于用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；

第一计算模块206，用于根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量。

对每个用户的全部出行地点的特征向量计算平均值。

计算该用户的全部出行地点的地点顺序向量；

对该用户的平均特征向量和地点顺序向量求和。

第二计算模块207，用于根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。

实施例二的出行轨迹相似性确定装置20获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；根据所述多个用户的出行轨迹构建出行轨迹图；采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；用所述多个出行轨迹序列训练出行地点编码模型；用所述出行地点编码模型对所述多个出行地点中的每个出行地点进行编码，得到每个出行地点的特征向量；根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；根据所述多个用户中的两个给定用户的出行轨迹向量计算所述两个给定用户的出行轨迹相似性。根据所述多个用户的出行轨迹训练出行地点编码模型，得到每个出行地点的特征向量，由于所述地点编码模型可以提前训练出，可以加快生成两个给定用户的出行轨迹向量。且采用随机游走方法生成多个出行轨迹序列使得地点编码模型对每个出行地点的表达更准确、更具场景适应性。实施例二提升了确定多个用户间的出行轨迹的相似性的效率。

在另一实施例中，所述出行轨迹相似性确定装置20还包括确定模块，用于获取出行轨迹相似性大于预设相似性的目标用户；根据所述目标用户的出行轨迹确定出行聚集地点。可以获取出行轨迹相似性大于预设相似性的多个目标用户；将所述多个目标用户的出行轨迹中多次重复的出行地点确定为出行聚集地点。

实施例三

本实施例提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述出行轨迹相似性确定方法实施例中的步骤，例如图1所示的步骤101-107：

101，获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；

102，根据所述多个用户的出行轨迹构建出行轨迹图；

103，采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；

104，用所述多个出行轨迹序列训练出行地点编码模型；

106，根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；

或者，该计算机程序被处理器执行时实现上述装置实施例中各模块的功能，例如图2中的模块201-207：

获取模块201，用于获取多个用户的出行轨迹，每个用户的每个出行轨迹包括多个出行地点和每个出行地点对应的出行时间；

构建模块202，用于根据所述多个用户的出行轨迹构建出行轨迹图；

生成模块203，用于采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列；

训练模块204，用于用所述多个出行轨迹序列训练出行地点编码模型；

第一计算模块206，用于根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量；

实施例四

图3为本发明实施例三提供的计算机设备的示意图。所述计算机设备30包括存储器301、处理器302以及存储在所述存储器301中并可在所述处理器302上运行的计算机程序303，例如出行轨迹相似性确定程序。所述处理器302执行所述计算机程序303时实现上述出行轨迹相似性确定方法实施例中的步骤，例如图1所示的101-107：

102，根据所述多个用户的出行轨迹构建出行轨迹图；

104，用所述多个出行轨迹序列训练出行地点编码模型；

示例性的，所述计算机程序303可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器301中，并由所述处理器302执行，以完成本方法。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序303在所述计算机设备30中的执行过程。例如，所述计算机程序303可以被分割成图2中的获取模块201、构建模块202、生成模块203、训练模块204、编码模块205、第一计算模块206、第二计算模块207，各模块具体功能参见实施例二。

本领域技术人员可以理解，所述示意图3仅仅是计算机设备30的示例，并不构成对计算机设备30的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算机设备30还可以包括输入输出设备、网络接入设备、总线等。

所称处理器302可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器302也可以是任何常规的处理器等，所述处理器302是所述计算机设备30的控制中心，利用各种接口和线路连接整个计算机设备30的各个部分。

所述存储器301可用于存储所述计算机程序303，所述处理器302通过运行或执行存储在所述存储器301内的计算机程序或模块，以及调用存储在存储器301内的数据，实现所述计算机设备30的各种功能。所述存储器301可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备30的使用所创建的数据(比如音频数据等)等。此外，存储器301可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。

所述计算机设备30集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他模块或步骤，单数不排除复数。系统权利要求中陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种出行轨迹相似性确定方法，其特征在于，所述方法包括：

根据所述多个用户的出行轨迹构建出行轨迹图；

用所述多个出行轨迹序列训练出行地点编码模型；

2.如权利要求1所述的出行轨迹相似性确定方法，其特征在于，所述根据所述多个用户的出行轨迹构建出行轨迹图包括：

从所述多个用户的出行轨迹中逐个读取每个用户的出行轨迹，将所述出行轨迹图中不存在的该用户的出行地点加入所述出行轨迹图，所述出行轨迹图中的任意两个节点的有向边的初始权值为0，按照该用户的多个出行地点对应的出行时间的先后顺序逐个读取该用户的每个出行轨迹的多个出行地点，将读取的第n个出行地点确定为第一节点，将读取的第n+1个出行地点确定为第二节点，1≤n＜N，N为该用户的出行地点的数量，在所述出行轨迹图中将第一节点指向第二节点的有向边的权值加C，C为预设常数。

3.如权利要求1所述的出行轨迹相似性确定方法，其特征在于，所述采用随机游走方法根据所述出行轨迹图生成多个出行轨迹序列包括：

计算所述出行轨迹图中的每个节点的转移概率；

4.如权利要求3所述的出行轨迹相似性确定方法，其特征在于，Q取值为1，根据所述出行轨迹图中的每个节点的转移概率生成1个以节点n为初始节点、长度为M的出行轨迹序列包括：

以所述出行轨迹图中的节点n为起点，根据节点n的转移概率矩阵第1次随机游走至节点n₁，根据节点n_i-1的转移概率矩阵第i次随机游走至节点n_i，得到1个以节点n为初始节点、长度为M的出行轨迹序列{n，n₁，n₂，…，n_M-1}，1≤n_i≤N，2≤n≤M-1。

5.如权利要求1所述的出行轨迹相似性确定方法，其特征在于，所述出行地点编码模型是Skip-gram模型，所述用所述多个出行轨迹序列训练出行地点编码模型包括：

6.如权利要求1所述的出行轨迹相似性确定方法，其特征在于，所述多个出行轨迹序列中的每个节点的向量表示该节点对应的出行地点的经纬度。

7.如权利要求1所述的出行轨迹相似性确定方法，其特征在于，所述根据每个用户的全部出行地点的特征向量计算该用户的出行轨迹向量包括：

计算该用户的全部出行地点的地点顺序向量；

对该用户的平均特征向量和地点顺序向量求和。

8.一种出行轨迹相似性确定装置，其特征在于，所述装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器，所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1-7中任一项所述出行轨迹相似性确定方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述出行轨迹相似性确定方法。