CN115170607A

CN115170607A - 出行轨迹生成方法、装置、电子设备及存储介质

Info

Publication number: CN115170607A
Application number: CN202210693211.2A
Authority: CN
Inventors: 吕宜生; 李志帅; 熊刚; 王飞跃
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2022-06-17
Filing date: 2022-06-17
Publication date: 2022-10-11

Abstract

本发明提供一种出行轨迹生成方法、装置、电子设备及存储介质，其中出行轨迹生成方法包括：获取开始标记及语义信息；将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；其中，目标生成对抗网络模型是基于样本出行轨迹数据对初始生成对抗网络模型进行训练后得到的；样本出行轨迹数据包括真实出行轨迹及真实出行轨迹对应的样本语义信息。通过目标生成对抗网络模型，可以生成大量的、与真实出行轨迹接近且包含语义信息的目标模拟出行轨迹，能够提高模拟出行轨迹的真实性及可用性。

Description

出行轨迹生成方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种出行轨迹生成方法、装置、电子设备及存储介质。

背景技术

随着人工智能技术的发展，基于人工智能技术模拟人类出行轨迹愈发成为业界备受重视的课题。出行轨迹蕴含了关于人类出行的时空轨迹及其与城市环境交互的丰富信息。海量的时空轨迹的理解和发掘有助于提升优化基于位置的服务，如发现城市功能区、探究流行病传播过程等。因此，模拟人类出行轨迹已成为解决复杂交通系统、智慧城市中知识处理与发现等相关问题的有效手段。

然而在相关技术中，模拟生成的人类出行轨迹的真实性程度较低，从而导致模拟生成的轨迹可用性不足。因此，如何生成真实性程度高的人类出行轨迹是目前业界亟待解决的重要课题。

发明内容

针对现有技术存在的问题，本发明实施例提供一种出行轨迹生成方法、装置、电子设备及存储介质。

本发明提供一种出行轨迹生成方法，包括：

获取开始标记及语义信息；

将所述开始标记及所述语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；

其中，所述目标生成对抗网络模型是基于样本出行轨迹数据对初始生成对抗网络模型进行训练后得到的；所述样本出行轨迹数据包括真实出行轨迹及所述真实出行轨迹对应的样本语义信息。

可选地，在所述基于样本出行轨迹数据对初始生成对抗网络模型进行训练之前，所述方法还包括：

对所述真实出行轨迹进行预处理，得到真实出行轨迹序列，其中，所述真实出行轨迹序列携带所述开始标记和结束标记。

可选地，所述基于样本出行轨迹数据对初始生成对抗网络模型进行训练，包括：

利用所述开始标记和所述样本语义信息对所述生成器进行预训练，在完成预训练的情况下，得到所述生成器生成的模拟出行轨迹序列，并将所述模拟出行轨迹序列转化为第一图像；

将所述真实出行轨迹序列转化为第二图像，并基于所述第一图像、所述第二图像及所述样本语义信息对所述初始生成对抗网络模型的判别器进行预训练，在完成预训练的情况下，得到所述判别器输出的判别结果；

将所述判别结果作为奖励值，并基于所述奖励值对所述生成器和所述判别器进行交替对抗训练，直至所述判别器达到训练完成条件，其中，所述奖励值用于表征出行轨迹序列的真实性程度。

可选地，所述利用所述开始标记和所述样本语义信息对所述生成器进行预训练，在完成预训练的情况下，得到所述生成器生成的模拟出行轨迹序列，包括：

将所述开始标记及所述样本语义信息输入所述生成器，得到所述生成器模拟生成的第一轨迹点，其中，所述第一轨迹点为所述开始标记对应的下一位置的轨迹点，所述第一轨迹点携带有样本语义信息；

将所述开始标记和所述第一轨迹点作为历史轨迹序列，并将所述历史轨迹序列输入至所述生成器进行循环迭代，直至出现所述结束标记，得到所述生成器模拟生成的所述模拟出行轨迹序列。

可选地，所述生成器包括嵌入层、掩码多头注意力层；

所述将所述开始标记及所述样本语义信息输入所述生成器，得到所述生成器模拟生成的第一轨迹点，包括：

将所述开始标记及所述样本语义信息输入所述嵌入层，生成所述开始标记对应的第一特征向量和所述样本语义信息对应的第二特征向量；

将所述第一特征向量输入所述掩码多头注意力层进行掩码处理，生成掩码后的第一特征向量；将所述第二特征向量进行拼接处理和线性处理，生成处理后的第二特征向量；

基于所述掩码后的第一特征向量以及所述处理后的第二特征向量，模拟生成所述第一轨迹点。

可选地，所述基于所述奖励值对所述生成器和所述判别器进行交替对抗训练，直至所述判别器达到训练完成条件，包括：

在所述生成器和所述判别器进行交替对抗训练的过程中，基于策略梯度算法，根据所述奖励值调整所述生成器的参数，直至所述判别器的损失值达到预设阈值。

本发明还提供一种出行轨迹生成装置，包括：

获取模块，用于获取开始标记及语义信息；

生成模块，用于将所述开始标记及所述语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述出行轨迹生成方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述出行轨迹生成方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述出行轨迹生成方法。

本发明提供的出行轨迹生成方法、装置、电子设备及存储介质，通过利用包括真实出行轨迹及样本语义信息的样本出行轨迹数据对初始生成对抗网络模型进行训练生成目标生成对抗网络模型；然后将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，可以生成大量的、与真实出行轨迹接近且包含语义信息的目标模拟出行轨迹，从而能够提高模拟出行轨迹的真实性及可用性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的出行轨迹生成方法的流程示意图之一；

图2是本发明提供的出行轨迹生成方法的流程示意图之二；

图3是本发明提供的初始生成对抗网络模型训练过程示意图；

图4是本发明提供的出行轨迹生成装置的结构示意图；

图5是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，人类出行轨迹的研究愈发受到人们的重视，出行轨迹蕴含了关于人类出行的时空轨迹及其与城市环境交互的丰富信息。海量的出行轨迹的理解和发掘有助于提升优化基于位置的服务，如发现城市功能区、探究流行病传播过程等。

但是，在对出行轨迹进行发掘时也面临着严峻的挑战：一方面，泛在的城市传感器源源不断地获取着海量的居民移动轨迹，但是这些实际数据只是城市出行系统中“涌现”的一部分内容，并没有覆盖实际系统中的所有场景，也就是说这些数据是不完备的；另一方面，由于商业保密性以及个人隐私保护等资源壁垒与需求的存在，不同领域的轨迹数据无法共享，导致研究中往往存在着数据供应不足甚至无数据可用的尴尬。总之，轨迹数据的不完备性以及低可用性极大地阻碍了数据驱动相关工作的研究。

因此，模拟人类出行轨迹为上述困境提供了可行的解决方案，学习模拟和生成高质量的人类出行轨迹已经成为城市规划、交通仿真等多个研究领域共同关注的焦点。

模拟人类出行轨迹的目标是生成大量的、与实际数据时空模式接近且互为补充的虚拟轨迹，数据拥有者可以发布共享这些虚拟数据，从而避免了敏感信息泄露等隐患。

然而在相关技术中，模拟生成的人类出行轨迹的真实性程度较低，并且，在模拟生成人类出行轨迹时，例如出行方式和出行意图等高层级的语义信息鲜有被考虑在内。

基于上述问题，本发明提供了一种出行轨迹生成方法，从而能够提高模拟出行轨迹的真实性及可用性。

下面结合图1-图3对本发明提供的出行轨迹生成方法进行详细说明。

参见图1，图1是本发明提供的出行轨迹生成方法的流程示意图之一，具体包括步骤101-步骤102。

步骤101、获取开始标记及语义信息。

本发明的执行主体可以是具有出行轨迹生成功能的任何电子设备，例如可以为智能手机、智能手表、台式电脑、手提电脑等任何一种。

在本实施例中，首先需要获取开始标记及语义信息。

具体地，开始标记B_s用于生成目标模拟出行轨迹，该开始标记是一个特殊符号，表示目标模拟出行轨迹从此开始生成。

相应地，语义信息表征目标模拟出行轨迹在语义层面的含义，例如，目标模拟出行轨迹对应的语义信息可以是出行方式(例如步行、自行车、摩托车、出租车、公共交通工具、骑车、其他等等)、出行意图(例如教育、健康、休闲、吃饭、接人、购物、回家、工作、其他等等)。

在实际应用中，开始标记以及语义信息可以从出行轨迹生成模型的训练样本集中获取(例如下文提及的目标生成对抗网络模型的样本出行轨迹数据)，也可以从远端服务器中获取，也可以人工输入开始标记及语义信息。本发明对开始标记及语义信息的获取方式不做限定。

步骤102、将所述开始标记及所述语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；

也就是说，在本实施例中，在获取到开始标记及语义信息之后，便将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，进而能够得到该生成器输出的包含语义信息的目标模拟出行轨迹。

需要说明的是，利用包括真实出行轨迹及真实出行轨迹对应的样本语义信息对初始生成对抗网络模型进行训练，初始生成对抗网络模型的生成器会尽可能的生成与真实出行轨迹接近的、且包含其语义信息的模拟出行轨迹，相应地，初始生成对抗网络模型的判别器会尽可能地判别该模拟出行轨迹是否为真实出行轨迹。通过对生成器和判别器进行交替对抗训练，最终生成器会生成真实性程度高、且包含语义信息的模拟出行轨迹。

在实际应用中，将开始标记及语义信息输入至目标生成对抗网络模型中，目标生成对抗网络模型的生成器便会模拟生成包含语义信息的目标模拟出行轨迹。出行轨迹拥有者可以发布共享这些目标模拟出行轨迹，从而避免了敏感信息泄露等隐患，为真实出行轨迹的不完备性以及低可用性问题提供了可行的解决方案，有助于提升优化基于位置的服务，如发现城市功能区、探究流行病传播过程等。

本发明提供的出行轨迹生成方法，通过利用包括真实出行轨迹及真实出行轨迹对应的样本语义信息的样本出行轨迹数据对初始生成对抗网络模型进行训练生成目标生成对抗网络模型；然后将开始标记及语义信息输入至目标生成对抗网络模型，可以生成大量的、与真实出行轨迹接近且包含语义信息的目标模拟出行轨迹，从而能够提高模拟出行轨迹的真实性及可用性。

可选地，在本发明实施例一种可能的实现方式中，在所述基于样本出行轨迹数据对初始生成对抗网络模型进行训练之前，还包括以下步骤：

对所述真实出行轨迹进行预处理，得到真实出行轨迹序列，其中，所述真实出行轨迹序列携带所述开始标记B_s和结束标记E_s。

在本实施例中，在基于样本出行轨迹数据对初始生成对抗网络模型进行训练之前，还需要对样本轨迹数据中的真实出行轨迹进行预处理，进而得到真实出行轨迹序列。

具体地，首先需要从指定范围的研究区域中获取真实出行轨迹，其中，研究区域的指定范围可以通过经度、纬度进行表示，例如，研究区域的指定范围可以为北纬45.33°至北纬45.70°；东经-73.80°至东经-73.35°。

然后将指定范围的研究区域划分为N*N个网格，例如，可以将指定范围为北纬45.33°至北纬45.70°；东经-73.80°至东经-73.35°的研究区域划分为96*96(即N＝96)的网格。并将网格内的真实出行轨迹的每一个由经度和纬度表示的轨迹点(lon_i，lat_i)转换为网格坐标(x，y)。

具体地，将真实出行轨迹的每一个轨迹点转换为网格坐标，可以通过以下公式(1)、(2)实现：

其中，lat_max表示研究区域的最大纬度，例如lat_max为45.70°；lat_min表示研究区域的最小纬度，例如lat_min为45.33°；lon_max表示研究区域的最大经度，例如lon_max为-73.35°；lon_min表示研究区域的最小经度，例如lon_min为-73.80°；

表示上取整操作；N表示研究区域边长网格数。

在将真实出行轨迹的每一个轨迹点(lon_i，lat_i)转换为网格坐标(x，y)之后，需要将每一个轨迹点的网格坐标转换为网格标识，并由网格标识组成真实出行轨迹序列，同时，还需要为真实出行轨迹序列的头部和尾部分别插入一个开始标记B_s和结束标记E_s，其中，每一个网格标识对应真实出行轨迹序列中的一个元素。

具体地，将每一个轨迹点的网格坐标转换为网格标识l，可以通过以下公式(3)实现：

l＝x×N+y (3)

在上述实施方式中，在基于样本出行轨迹数据对初始生成对抗网络模型进行训练之前，通过对真实出行轨迹数据进行预处理，从而能够生成携带开始标记和结束标记的真实出行轨迹序列，该真实出行轨迹序列更好的反映了真实出行轨迹中人类活动范围、出行距离等空间特性，利用该真实出行轨迹序列对初始生成对抗网络模型进行训练，能够提升生成对抗网络模型生成模拟出行轨迹的真实性及可用性。

可选地，在发明实施例一种可能的实现方式中，所述基于样本出行轨迹数据对初始生成对抗网络模型进行训练，具体可以通过以下方式实现：

在本实施例中，首先需要基于样本出行轨迹数据，亦即基于真实出行轨迹及真实出行轨迹对应的样本语义信息对初始生成对抗网络模型的生成器进行预训练，其中，生成器用于生成模拟出行虚拟轨迹序列，亦即“假”的移动轨迹。

具体地，首先利用真实出行轨迹序列的开始标记以及真实出行轨迹序列对应的样本语义信息(例如出行方式、出行意图等)对初始生成对抗网络模型的生成器进行预训练，在完成预训练的情况下，得到生成器生成的模拟出行轨迹序列。

在实际应用中，在生成器完成预训练的情况下，生成器在生成模拟出行轨迹序列的同时还会通过学习样本出行轨迹数据生成模拟出行轨迹序列对应的时间戳，以表示模拟出行轨迹序列所对应的时间信息。

可以理解的是，对生成器进行预训练最初的输入由两部分组成，第一部分为真实出行轨迹序列的开始标记；第二部分为真实出行轨迹对应的样本语义信息。也就是说，生成器生成的模拟出行轨迹序列不仅与位置相关，也与语义信息相关。

在生成模拟出行轨迹序列之后，需要根据实际空间坐标，利用位置-图像转换函数将模拟出行轨迹序列转换为二维图像(亦即第一图像)，以便于直观的展示生成模拟出行轨迹序列的空间形态，进而辅助判别器更全面地衡量模拟出行轨迹序列的空间特性。

具体地，利用位置-图像转换函数将模拟出行轨迹序列转换为第一图像，可以通过以下公式(4)、(5)实现：

n＝l％N (5)

其中，(m，n)表示第一图像的像素点坐标；l表示网格标识；％表示取余数操作；

表示下取整操作；N表示研究区域边长网格数。

在实际应用中，可以将第一图像的像素点坐标对应的像素值设置为“0”、将第一图像的背景的像素值设置为“255”，从而实现将模拟出行轨迹序列转换为第一图像。

在初始生成对抗网络模型的生成器预训练完成后，还需要根据实际空间坐标，利用位置-图像转换函数将真实出行轨迹序列转换为第二图像(具体转换方式可以通过上述公式(4)、(5)实现)，然后将第一图像作为负样本(即“假”的移动轨迹)，将第二图像作为正样本(即“真”的移动轨迹)，并将第一图像、第二图像以及各自图像对应的样本语义信息输入至初始生成对抗网络模型的判别器D进行预训练，在判别器预训练完成的情况下，从而得到判别器输出的判别结果，其中，判别器是一个二元分类器，负责评估出行轨迹的“真”或“假”；判别器输出的判别结果可以是区间为0-1的值，“0”表示出行轨迹序列为“假”；“1”表示出行轨迹序列为“真”；判别结果越趋近于“0”，表示出行轨迹序列为“假”的可能性越高；判别结果越趋近于“1”，表示出行轨迹序列为“真”的可能性越高。

在得到判别器输出的判别结果之后，需要将判别结果作为奖励值，并将奖励值反馈给生成器，从而使生成器与判别器基于奖励值进行交替对抗训练。

由于判别器不仅需要通过出行轨迹的空间特性来衡量其真实性，还要判别在当前语义信息下生成出行轨迹的合理性。因此，在对判别器进行预训练时，判别器的输入S＝[s₁,s₂,...,s_j]除了需要代表负样本的第一图像以及代表正样本的第二图像之外，还需要第一图像以及第二图像各自对应的样本语义信息，其中，j表示输入至判别器的样本数量。

实际应用中，首先需要将第一图像、第二图像输入至判别器的卷积层，具体地，该卷积层包括3*3、5*5、7*7三种尺寸的卷积核，再对卷积层输出的特征图进行填充，进而得到第一图像、第二图像对应的特征图，其中，对特征图进行填充的目的是为了使第一图像、第二图像对应的特征图的维度相同。

在得到第一图像、第二图像对应的特征图之后，需要利用高速公路网络(HighwayNetwork)进行特征提取，进而得到第一图像、第二图像对应的特征表达。具体地，利用高速公路网络进行特征提取具体可以通过以下公式(6)、(7)实现：

E＝H(f,W_H)×G(f,W_G)+f×(1-G(f,W_G)) (6)

G(f,W_G)＝σ(W_G×f+b) (7)

其中，E表示第一图像、第二图像对应的特征表达；H(f,W_H)表示基于一图像、第二图像表示的轨迹特征f经过卷积层(CNN)输出的结果；G(f,W_G)表示基于轨迹特征f按公式(7)式计算得到的结果；W_H、W_G、b表示可学习权重；σ表示sigmoid激活函数。

在将第一图像、第二图像输入至判别器的卷积层的同时，还需要将第一图像以及第二图像各自对应的样本语义信息输入至判别器的嵌入层生成第一图像以及第二图像各自对应的密集表达，然后再经过线性层并利用修正线性单元(Rectified Linear Unit，ReLU)进行激活函数处理，进而生成第一图像以及第二图像的样本语义信息对应的隐特征表示。

最后，判别器拼接第一图像、第二图像对应的特征表达以及样本语义信息对应的隐特征表示，并加入线性层以及softmax层使得判别器输出的特征维度与二分类任务相匹配，最终判别器预训练完成，并输出判别结果。

然后将判别结果作为奖励值，对生成器和判别器进行交替对抗训练，直至判别器达到训练完成条件。

在上述实施方式中，通过将模拟出行轨迹序列转化为第一图像；将真实出行轨迹序列转化为第二图像，并基于第一图像、第二图像及样本语义信息对初始生成对抗网络模型的判别器进行预训练，可以使判别器不仅可以判别出行轨迹在空间特性上的真实性，还可以判别在当前语义信息下生成出行轨迹的合理性，进而能够提升生成对抗网络模型生成模拟出行轨迹的真实性及可用性。

在本发明实施例一种可能的实现方式中，所述利用所述开始标记和所述样本语义信息对所述生成器进行预训练，在完成预训练的情况下，得到所述生成器生成的模拟出行轨迹序列，具体可以通过以下方式实现：

在本实施例中，首先需要将开始标记及样本语义信息输入生成器，得到生成器模拟生成的携带有样本语义信息的第一轨迹点l₁，其中第一轨迹点为开始标记对应的下一位置的轨迹点。在实际应用中，生成器在生成第一轨迹点之外，还生成有第一轨迹点对应的时间戳，该时间戳为第一轨迹点所对应的时间信息，且该时间戳是生成器通过学习样本出行轨迹数据生成的。

在生成第一轨迹点之后，便将开始标记及第一轨迹点作为历史轨迹序列。

也就是说，在生成第一轨迹点之后，将该第一轨迹点作为历史轨迹点添加至开始标记之后，进而生成历史轨迹序列，其中，历史轨迹序列可以表示为[B_s,l₁]。

在生成历史轨迹序列之后，便将历史轨迹序列输入至生成器进行循环迭代，直至出现结束标记表示生成器生成完成，进而得到生成器模拟生成的模拟出行轨迹序列，其中，模拟出行轨迹序列可以表示为[B_s,l₁,...,l_t-1,l_t,...,E_s]，其中，l_t表示将历史轨迹序列输入至生成器进行第t次迭代后生成的轨迹点所对应的网格标识。

也就是说，在生成历史轨迹序列[B_s,l₁]之后，先将历史轨迹序列输入至生成器，从而得到循环更新的历史轨迹序列[B_s,l₁,l₂]，然后将循环更新的历史轨迹序列输入至生成器进行迭代，直至出现结束标记E_s进而得到生成器模拟生成的模拟出行轨迹序列[B_s,l₁,...,l_t-1,l_t,...,E_s]。

在上述实施方式中，利用真实出行轨迹对应的开始标记及样本语义信息对初始生成对抗网络模型的生成器进行预训练，从而可以使生成器生成能够反映活动范围、出行距离等空间特性，并且含有语义信息的模拟出行轨迹序列，从而能够提升生成对抗网络模型生成模拟出行轨迹的真实性及可用性。

在本申请实施例一种可能的实现方式中，所述生成器包括嵌入层、掩码多头注意力层；

所述将所述开始标记及所述样本语义信息输入所述生成器，得到所述生成器模拟生成的第一轨迹点，具体可以通过以下方式实现：

在本实施例中，首先将真实出行轨迹对应的开始标记及样本语义信息输入至生成器的嵌入层(Embedding)，得到开始标记对应的第一特征向量X₁和样本语义信息对应的第二特征向量X₂。

具体地，需要将第一特征向量X₁输入掩码多头注意力层，以建模第一特征向量X₁内部的相关性；同时对第一特征向量X₁进行掩码处理，并且利用ReLU进行激活函数处理，进而生成掩码后的第一特征向量；其中，对第一特征向量X₁进行掩码处理的目的是为了防止在对生成器进行序列到序列的模型训练的过程中产生标签泄露的问题。

在实际应用中，将第一特征向量X₁输入掩码多头注意力层进行掩码处理，生成掩码后的第一特征向量，具体可以通过以下公式(8)、(9)实现：

MHA(Q,K,V)＝concat(head₁,...,head_h)W^o (8)

其中，MHA表示掩码多头注意力层；head表示掩码多头注意力层中的注意力头；h表示注意力头的数目；Q、K、V分别被称为查询、键和值，表示经过嵌入表示后的第一特征向量X₁的三种不同的线性变换，其中，

d_k表示K的维度特征；Mask表示掩码操作，其作用是将矩阵中的上三角元素替换为负无穷；W^o、W^q、W^k、W^v为可学习矩阵。

在将第一特征向量输入掩码多头注意力层进行掩码处理，生成掩码后的第一特征向量的同时，还需要将第二特征向量X₂进行拼接处理和线性处理，生成处理后的第二特征向量X₂。

具体地，将样本语义信息输入嵌入层生成第二特征向量X₂，其目的是为了将离散的样本语义信息(例如出行方式、出行意图)通过嵌入层得到对应的高维特征表示。

在实际应用中，需要将第二特征向量X₂进行拼接处理，然后经过线性层进行线性处理，最后还需要利用ReLU进行激活函数处理，最终生成处理后的第二特征向量。

在生成掩码后的第一特征向量以及处理后的第二特征向量之后，便基于掩码后的第一特征向量以及处理后的第二特征向量，模拟生成第一轨迹点。

具体地，需要将掩码后的第一特征向量作为新的查询Q′,将处理后的第二特征向量的样本语义信息(例如出行方式、出行意图)作为键值对K′和V′，再次输入未掩码的多头注意力层进行计算，亦即，通过计算Q′与K′的相似性分数对V′加权求和来融合当前设定类型的出行方式和出行意图特征，得到目标输出向量。

然后将该目标输出向量经过线性层和softmax层进行处理，最终输出开始标记对应的下一个轨迹点在研究区域对应的网格标记中各位置的概率分布，并将概率最大的网格标识确定为第一轨迹点。考虑到计算效率问题，在实际应用中将时间戳以半小时步长离散化，并通过取输出概率最大值对应索引得到第一轨迹点对应的时间戳。

在上述实施方式中，通过将开始标记及样本语义信息输入生成器，从而可以模拟生成携带有样本语义信息的第一轨迹点，基于第一轨迹点可以使生成器生成能够反映活动范围、出行距离等空间特性，并且含有语义信息的模拟出行轨迹序列，从而能够提升生成对抗网络模型生成模拟出行轨迹的真实性及可用性。

在发明实施例一种可能的实现方式中，所述基于所述奖励值对所述生成器和所述判别器进行交替对抗训练，直至所述判别器达到训练完成条件，具体可以通过以下方式实现：

首先需要说明的是，在本实施例中，基于样本出行轨迹数据对初始生成对抗网络模型进行训练，具体可以分为预训练阶段和对抗训练阶段。

其中，在预训练阶段，首先以序列到序列的方式对生成器进行训练，亦即，将开始标记或者历史轨迹序列的前t-1时间步的特征作为输入，预测第t时间步的轨迹点，并通过最小化预测样本和真实样本的交叉熵损失，调节生成器的参数，从而实现对生成器的预训练。

然后对判别器进行预训练，亦即将生成器生成的模拟出行轨迹序列转换为第一图像，并将其标记为“0”作为负样本；将真实出行轨迹转换成第二图像，并将其标记为“1”作为正样本；输入的正负样本乱序混合，通过交叉熵损失，调节判别器的参数，从而实现对判别器的预训练。

在对抗训练阶段，对生成器和判别器进行交替对抗训练，并确保每次至更新二者之一。亦即，在利用基于第一图像表示的模拟出行轨迹序列以及基于第二图像表示的真实出行轨迹序列对判别器进行预训练，得到用于表征出行轨迹真实性程度的奖励值之后，将奖励值反馈给生成器，从而优化生成器的参数，再利用优化后的生成器调整判别器，直至判别器的损失值达到预设阈值。

判别器的损失函数为交叉熵损失函数，判别器损失值的预设阈值可以为0.5；当判别器的损失值稳定于0.5时，表示判别器无法判别模拟出行轨迹序列与真实出行轨迹序列的真实性程度，即表示初始生成对抗网络模型训练结束。

需要说明的是，为了减小方差，模拟轨迹序列是生成器进行K次模拟生成的，因此，在生成器生成模拟轨迹序列的过程中，会产生K条模拟轨迹。以判别器D对K条模拟轨迹的评估结果的均值作为奖励值R_t，具体地，奖励值R_t可以通过以下公式(10)表示：

其中，x_j表示判别器D的输入，包括基于图像表示的出行轨迹及属性信息(即时间戳及语义信息(例如出行方式、出行意图))。

在实际应用中，在生成器和判别器进行交替对抗训练的过程中，可以基于策略梯度算法，根据奖励值调整生成器参数，亦即，生成器参数θ的更新过程由损失函数的误差反向传播实现，该损失函数可看作是由奖励值R_t微调的负对数似然。具体地，可以通过以下公式(11)实现：

其中，

表示生成器参数θ的导数，

α表示学习率；p_θ(l_t|s_t)表示在t时间步的状态s_t下，从生成器输出l_t的概率，l_t表示将历史轨迹序列输入至生成器进行第t次迭代后生成的轨迹点所对应的网格标识。

参见图2，图2是本发明提供的出行轨迹生成方法的流程示意图之二，具体包括步骤201-步骤206。

步骤201、获取样本出行轨迹数据，其中，样本出行轨迹数据包括真实出行轨迹及真实出行轨迹对应的样本语义信息。

步骤202、对真实出行轨迹进行预处理，得到真实出行轨迹序列，其中，真实出行轨迹序列携带开始标记和结束标记。

步骤203、利用开始标记和样本语义信息对初始生成对抗网络模型的生成器进行预训练，在完成预训练的情况下，得到生成器生成的模拟出行轨迹序列，并将模拟出行轨迹序列转化为第一图像。

步骤204、将真实出行轨迹序列转化为第二图像，并基于第一图像、第二图像及样本语义信息对初始生成对抗网络模型的判别器进行预训练，在完成预训练的情况下，得到判别器输出的判别结果，并将判别结果作为奖励值，其中，奖励值用于表征出行轨迹序列的真实性程度。

步骤205、在生成器和判别器进行交替对抗训练的过程中，基于策略梯度算法，根据奖励值调整生成器的参数，直至判别器的损失值达到预设阈值，得到目标生成对抗网络模型。

步骤206、将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹。

需要说明的是，目标生成对抗网络模型输出的包含语义信息的目标模拟出行轨迹不仅能够反映出人类出行活动范围、出行距离等空间特性，还能够反映出活动区域的访问量。此外，语义信息(例如出行方式、出行意图)使得模拟出行轨迹具有更高的可用性，为其广泛应用带来了可能。

为了便于理解，参见图3，图3是本发明提供的初始生成对抗网络模型训练过程示意图，具体包括步骤一至步骤四。

步骤一、将开始标记或历史访问位置[B_s,l₁,...,l_t-1](即上文提及的历史轨迹序列)、样本语义信息(例如出行方式为步行；出行意图为上学)输入至初始生成对抗网络模型的生成器，对生成器进行预训练，生成当前轨迹点l_t及对应的时间戳。

具体地，首先，将开始标记或历史访问位置输入可学习的嵌入层进行嵌入表示，从而得到对应的隐特征表示(亦即上文提及的第一特征向量)；然后再输入至掩码多头注意力层，并利用ReLU激活函数进行激活处理，生成掩码后的第一特征向量。

同时，将样本语义信息(出行方式、出行意图)输入可学习的嵌入层进行嵌入表示，从而得到各自对应的高维特征表示(即上文提及的第二特征向量)；然后再将第二特征向量进行拼接、并经过线性层进行线性处理以及利用ReLU激活函数进行激活处理，生成处理后的第二特征向量。

然后将掩码后的第一特征向量作为新的查询Q′,将处理后的第二特征向量的样本语义信息(出行方式、出行意图)作为键值对K′和V′，再次输入未掩码的多头注意力层，利用多头注意力机制进行计算，得到目标输出向量。

然后将该目标输出向量经过线性层和softmax层进行处理，最终输出开始标记或历史访问位置对应的下一个轨迹点在研究区域对应的网格标记中各位置的概率分布(即下一轨迹点位置的概率分布)，将概率最大的网格标识进行采样，从而生成当前轨迹点l_t及对应的时间戳8:00am，进而基于开始标记或历史访问位置[B_s,l₁,...,l_t-1]，生成当前位置序列[B_s,l₁,...,l_t]。

步骤二、模拟执行模块将当前位置序列[B_s,l₁,...,l_t]及样本语义信息(出行方式：步行；出行意图：上学)输入生成器进行K次循环迭代(亦即模拟执行K次，生成K条模拟轨迹序列，每条轨迹中阴影区域表示模拟生成的历史出行轨迹序列，白色区域表示模拟生成的出行轨迹序列)，直至出现结束标记E_s表示生成器生成完成，得到生成器模拟生成的完整的模拟出行轨迹序列，并利用位置-图像转换算法将完整的模拟出行轨迹序列转换为第一图像。

同时，利用位置-图像转换算法将携带有样本语义信息的真实出行轨迹序列转换为第二图像，其中，第二图像中的网格区域表示真实出行轨迹序列。

步骤三、利用第一图像、第二图像输入至初始生成对抗网络模型的判别器，对判别器进行预训练，得到判别器生成的奖励值。

具体地，将生成器生成的第一图像作为假样本；将第二图像作为真样本输入判别器中的卷积层，该卷积层包括3*3、5*5、7*7三种尺寸的卷积核，进而得到第一图像、第二图像对应的特征图。

在得到第一图像、第二图像对应的特征图之后，需要利用高速公路网络(HighwayNetwork)进行特征提取，进而得到第一图像、第二图像对应的特征表达。

同时，将第一图像、第二图像各自对应的样本语义信息输入至判别器的嵌入层生成第一图像以及第二图像各自对应的密集表达，然后再经过线性层以及利用ReLU进行激活函数处理，进而生成第一图像以及第二图像的样本语义信息对应的隐特征表示。

最后，判别器拼接第一图像、第二图像对应的特征表达以及样本语义信息对应的隐特征表示，并加入线性层以及softmax层使得判别器输出的特征维度与二分类任务相匹配，最终判别器输出出行轨迹的真实性分数，并将该真实性分数作为奖励值。

步骤四、在生成器和判别器进行交替对抗训练的过程中，基于策略梯度算法，根据奖励值调整生成器的参数，直至判别器的损失值达到预设阈值，得到目标生成对抗网络模型。

下面对本发明提供的出行轨迹生成装置进行描述，下文描述的出行轨迹生成装置与上文描述的出行轨迹生成方法可相互对应参照。参见图4，图4是本发明提供的出行轨迹生成装置400的结构示意图。

获取模块401，用于获取开始标记及语义信息；

生成模块402，用于将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；

其中，目标生成对抗网络模型是基于样本出行轨迹数据对初始生成对抗网络模型进行训练后得到的；样本出行轨迹数据包括真实出行轨迹及真实出行轨迹对应的样本语义信息。

本发明提供的出行轨迹生成装置，通过利用包括真实出行轨迹及真实出行轨迹对应的样本语义信息的样本出行轨迹数据对初始生成对抗网络模型进行训练生成目标生成对抗网络模型；然后将开始标记及语义信息输入至目标生成对抗网络模型，可以生成大量的、与真实出行轨迹接近且包含语义信息的目标模拟出行轨迹，从而能够提高模拟出行轨迹的真实性及可用性。

可选地，生成模块402，进一步用于：

对真实出行轨迹进行预处理，得到真实出行轨迹序列，其中，真实出行轨迹序列携带开始标记和结束标记。

可选地，生成模块402，进一步用于：

利用开始标记和样本语义信息对生成器进行预训练，在完成预训练的情况下，得到生成器生成的模拟出行轨迹序列，并将模拟出行轨迹序列转化为第一图像；

将真实出行轨迹序列转化为第二图像，并基于第一图像、第二图像及样本语义信息对初始生成对抗网络模型的判别器进行预训练，在完成预训练的情况下，得到判别器输出的判别结果；

将判别结果作为奖励值，并基于奖励值对生成器和判别器进行交替对抗训练，直至判别器达到训练完成条件，其中，奖励值用于表征出行轨迹序列的真实性程度。

可选地，生成模块402，进一步用于：

将开始标记及样本语义信息输入生成器，得到生成器模拟生成的第一轨迹点，其中，第一轨迹点为开始标记对应的下一位置的轨迹点，第一轨迹点携带有样本语义信息；

将开始标记和第一轨迹点作为历史轨迹序列，并将历史轨迹序列输入至生成器进行循环迭代，直至出现结束标记，得到生成器模拟生成的模拟出行轨迹序列。

可选地，生成器包括嵌入层、掩码多头注意力层；

生成模块402，进一步用于：

将开始标记及样本语义信息输入嵌入层，生成开始标记对应的第一特征向量和样本语义信息对应的第二特征向量；

将第一特征向量输入掩码多头注意力层进行掩码处理，生成掩码后的第一特征向量；将第二特征向量进行拼接处理和线性处理，生成处理后的第二特征向量；

基于掩码后的第一特征向量以及处理后的第二特征向量，模拟生成第一轨迹点。

可选地，生成模块402，进一步用于：

在生成器和判别器进行交替对抗训练的过程中，基于策略梯度算法，根据奖励值调整生成器的参数，直至判别器的损失值达到预设阈值。

图5是本发明提供的电子设备500的结构示意图，如图5所示，该电子设备可以包括：处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540，其中，处理器510，通信接口520，存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令，以执行出行轨迹生成方法，该方法包括：获取开始标记及语义信息；将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；其中，目标生成对抗网络模型是基于样本出行轨迹数据对初始生成对抗网络模型进行训练后得到的；样本出行轨迹数据包括真实出行轨迹及真实出行轨迹对应的样本语义信息。

此外，上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的出行轨迹生成方法，该方法包括：获取开始标记及语义信息；将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；其中，目标生成对抗网络模型是基于样本出行轨迹数据对初始生成对抗网络模型进行训练后得到的；样本出行轨迹数据包括真实出行轨迹及真实出行轨迹对应的样本语义信息。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的出行轨迹生成方法，该方法包括：获取开始标记及语义信息；将开始标记及语义信息输入至目标生成对抗网络模型的生成器中，输出包含语义信息的目标模拟出行轨迹；其中，目标生成对抗网络模型是基于样本出行轨迹数据对初始生成对抗网络模型进行训练后得到的；样本出行轨迹数据包括真实出行轨迹及真实出行轨迹对应的样本语义信息。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种出行轨迹生成方法，其特征在于，包括：

获取开始标记及语义信息；

2.根据权利要求1所述的出行轨迹生成方法，其特征在于，在所述基于样本出行轨迹数据对初始生成对抗网络模型进行训练之前，所述方法还包括：

3.根据权利要求2所述的出行轨迹生成方法，其特征在于，所述基于样本出行轨迹数据对初始生成对抗网络模型进行训练，包括：

4.根据权利要求3所述的出行轨迹生成方法，其特征在于，所述利用所述开始标记和所述样本语义信息对所述生成器进行预训练，在完成预训练的情况下，得到所述生成器生成的模拟出行轨迹序列，包括：

5.根据权利要求4所述的出行轨迹生成方法，其特征在于，所述生成器包括嵌入层、掩码多头注意力层；

6.根据权利要求3所述的出行轨迹生成方法，其特征在于，所述基于所述奖励值对所述生成器和所述判别器进行交替对抗训练，直至所述判别器达到训练完成条件，包括：

7.一种出行轨迹生成装置，其特征在于，包括：

获取模块，用于获取开始标记及语义信息；

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述出行轨迹生成方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述出行轨迹生成方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述出行轨迹生成方法。