CN115034459A

CN115034459A - 一种行人轨迹时间序列预测方法

Info

Publication number: CN115034459A
Application number: CN202210610525.1A
Authority: CN
Inventors: 王克浩; 钱汉涛; 刘克中; 陈默子; 曾旭明; 马杰
Original assignee: Wuhan University of Technology WUT
Current assignee: Wuhan University of Technology WUT
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2022-09-09

Abstract

本发明涉及一种行人轨迹时间序列预测方法，该方法包括：获取待预测行人轨迹数据，将所述待预测行人轨迹数据进行预处理；根据预处理后的所述待预测行人轨迹数据，建立行人拓扑图；根据所述行人拓扑图，将预处理后的所述待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；基于预设的时间卷积网络模型，根据所述行人空间交互信息，确定行人的预测轨迹。本发明提供的一种行人轨迹时间序列预测方法、装置、设备及存储介质，将待预测行人轨迹数据进行加权聚合，得到行人的空间交互信息，考虑了空间上同一时刻行人社会交互关系，提高了预测的准确性，通过时间卷积网络预测行人轨迹，实现不同时间步上行人轨迹的并行运算。

Description

一种行人轨迹时间序列预测方法

技术领域

本发明涉及行人轨迹预测技术领域，尤其涉及一种行人轨迹时间序列预测方法。

背景技术

时间序列预测一直是数据分析领域中的一个重大课题，现如今在交通流量预测，金融市场行情分析、天气预报、视频帧预测等等各个方面都有着广泛的应用场景。其中，由于人类自我意识的复杂性，人类行为预测除了受到周围环境的影响外，人与人之间的社会交互的不确定性占据了主导因素，导致预测难度远远大于其他应用场景，因此行人轨迹预测方法在自动驾驶，智能交通领域中成为了现在研究的重点。如今，随着自动驾驶和路径规划技术的发展，预测动态场景中行人或其他具有社会属性的物体的运动轨迹已成为亟待解决技术难题。由于行人在一定范围内的行走路径会受周围环境的变化而发生路径重规划，如何通过合理的方式来模拟行人在行走过程中的互相影响是一个值得深入探索的问题。

随着深度神经网络的快速发展，循环神经网络(Recurrent Neural Network,RNN)及其变体模型在许多时间序列预测任务中得到了广泛的应用，因此现有行人轨迹预测方法大都通过RNN的序列式数据推理来自动学习行人交互，不需要附加手工定义规则，通过社会池化层来共享空间上相邻行人轨迹序列的神经元隐藏状态，可以自动学习同一时刻行人轨迹坐标之间发生的社会意识相互影响。但行人轨迹预测与其他实体预测的单一决策不同，行人的行为决策具有多样性，这类方法并没有很好地学习到人类行走的多模态属性。

现有许多方法对编码行人空间交互信息的网格池化层的池化范围进行细粒度分区，或者对使用对称函数聚合相邻行人隐藏状态的聚合方式有了较为成功的改进，但这些方法在本质上还是按照既定的规则将所有行人当作一个整体提取社会交互，忽略了被预测行人对预测场景中其他行人轨迹的关注度的差异，生成的行人社会交互特征表示在原理上不具有可解释性，并且没有进一步挖掘行人社会交互的拓扑结构信息。此外，现有的大多数技术都使用基于序列的时序生成模型来获得预测轨迹，这些方法不能实现并行计算，将会消耗大量计算成本。这对于例如自动驾驶等实时性要求特别高的场景来说是一个巨大的缺陷。

发明内容

有鉴于此，有必要提供一种行人轨迹时间序列预测方法，用以解决现有技术中行人轨迹预测决策单一，忽略了行人之间社会交互的问题。

为达到上述技术目的，本发明采取了以下技术方案：

第一方面，本发明提供了一种行人轨迹时间序列预测方法，包括：

获取待预测行人轨迹数据，将待预测行人轨迹数据进行预处理；

根据预处理后的待预测行人轨迹数据，建立行人拓扑图；

根据行人拓扑图，将预处理后的待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；

基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹。

优选的，根据预处理后的待预测行人轨迹数据，建立行人拓扑图，包括：

根据预处理后的待预测行人轨迹数据，建立行人社会交互图；

对行人社会交互图的节点嵌入向量，得到每个行人的拓扑结构信息；

根据拓扑结构信息，建立行人拓扑图。

优选的，根据拓扑结构信息，建立行人拓扑图，包括：

根据拓扑结构信息，计算每个嵌入节点的嵌入向量之间的欧式距离；

根据满足预设条件的嵌入向量的欧式距离，建立行人拓扑图；行人拓扑图包括节点的表示向量。

优选的，根据行人拓扑图，将预处理后的待预测行人轨迹数据进行加权聚合，得到行人空间交互信息，包括：

根据行人拓扑图，聚合满足预设条件的嵌入向量的欧式距离，迭代更新表示向量，得到聚合特征向量；

根据嵌入向量、表示向量和聚合特征向量，分别计算嵌入向量的注意力系数、表示向量的注意力系数和聚合特征向量的注意力系数；

根据嵌入向量的注意力系数、表示向量的注意力系数和聚合特征向量的注意力系数进行加权聚合，得到行人空间交互信息。

优选的，根据嵌入向量的注意力系数、表示向量的注意力系数和聚合特征向量的注意力系数进行加权聚合，得到行人空间交互信息，包括：

将嵌入向量的注意力系数、表示向量的注意力系数和聚合特征向量的注意力系数分别进行归一化处理，得到归一化后的嵌入向量的注意力系数、归一化后的表示向量的注意力系数和归一化后的聚合特征向量的注意力系数；

将归一化后的嵌入向量的注意力系数、归一化后的表示向量的注意力系数和归一化后的聚合特征向量的注意力系数进行加权平均，得到目标注意力系数；

根据目标注意力系数和行人拓扑图，得到行人空间交互信息。

优选的，基于时间预设的卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹，包括：

根据行人空间交互信息和表示向量，确定行人时间交互信息；

基于预设的时间卷积网络模型，根据行人空间交互信息和行人时间交互信息，确定行人的预测轨迹。

优选的，基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹，之后还包括：

在预设时间步长内，对预测轨迹的双变量高斯分布进行采样，得到采样结果；

根据采样结果，确定预测轨迹的平均位移误差和最终位移误差。

第二方面，本发明还提供了一种行人轨迹时间序列预测装置包括：

数据处理模块，用于获取待预测行人轨迹数据，将待预测行人轨迹数据进行预处理；

拓扑建立模块，用于根据预处理后的待预测行人轨迹数据，建立行人拓扑图；

加权聚合模块，用于根据行人拓扑图，将预处理后的待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；

轨迹预测模块，用于基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹。

第三方面，本发明还提供了一种电子设备，包括存储器和处理器，其中，

存储器，用于存储程序；

处理器，与存储器耦合，用于执行存储器中存储的程序，以实现上述任一种实现方式中的行人轨迹时间序列预测方法中的步骤。

第四方面，本发明还提供了一种计算机可读存储介质，用于存储计算机可读取的程序或指令，程序或指令被处理器执行时，能够实现上述任一种实现方式中的行人轨迹时间序列预测方法中的步骤。

采用上述实施例的有益效果是：本发明提供的一种行人轨迹时间序列预测方法，根据待预测行人轨迹数据，建立行人拓扑图，并将待预测行人轨迹数据进行加权聚合，得到了行人空间的交互信息，考虑了空间域上同一时刻行人社会交互关系，提高了预测的准确性，并通过时间卷积网络模型，对行人轨迹的时间序列进行预测，减小了模型参数，实现了不同时间步上行人轨迹的并行运算。

附图说明

图1为本发明提供的行人轨迹时间序列预测方法的一实施例的流程示意图；

图2为本发明提供的t时刻预测场景内行人运动状态的一实施例的状态示意图；

图3为本发明提供的卷积时间网络模型的一实施例的模型架构图；

图4为本发明提供的行人轨迹时间序列预测装置的一实施例的结构示意图；

图5为本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图来具体描述本发明的优选实施例，其中，附图构成本申请一部分，并与本发明的实施例一起用于阐释本发明的原理，并非用于限定本发明的范围。

在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明提供了一种行人轨迹时间序列预测方法，以下分别进行说明。

请参阅图1，图1为本发明提供的行人轨迹时间序列预测方法的一实施例的流程示意图，本发明的一个具体实施例，公开了一种行人轨迹时间序列预测方法，包括：

S101、获取待预测行人轨迹数据，将待预测行人轨迹数据进行预处理；

S102、根据预处理后的待预测行人轨迹数据，建立行人拓扑图；

S103、根据行人拓扑图，将预处理后的待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；

S104、基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹。

在本发明具体的实施例中，步骤S101获取的待预测行人轨迹数据包含了待预测的空间范围内的全部行人的轨迹数据，每个行人的行走方向将会受到当前场景内其他行人运动状态的影响，行人会根据当前时刻周围行人的位置以及过去周围行人行走的历史轨迹来决定自己下一时刻的移动轨迹，以免发生碰撞。

同一时刻预测场景内所有行人构成一个完全连接图的前提是预测场景中的每一个行人对其路径决策都受到其他所有行人的历史轨迹的影响。显然，这是不符合实际情况的，请参阅图2，图2为本发明提供的t时刻预测场景内行人运动状态的一实施例的状态示意图，在t时刻，行人A在行走过程中基本上不会考虑到身后行人D对自身行进路线影响，在前方的行人B和行人C才在行人A考虑的范围之中。对于此情况，在构建社会交互网络的时候应该将行人A和行人D之间的连接去掉，即邻接矩阵中

简单来说，每个行人只会与其前方的其他行人发生社会交互。对待预测行人轨迹数据进行预处理，以免非必要因素对预测结果产生不利影响。

在本发明具体的实施例中，步骤S102通过预处理后的待预测行人轨迹数据，建立行人拓扑图，行人拓扑图反应了行人与行人之间，行人与环境之间可能的交互关系，建立行人拓扑图后，对行人与周围环境的关系一目了然，方便对行人的状态进行描述，有利于确定行人之间的状态，在后续中更容易对行人的轨迹路线进行预测。

在本发明具体的实施例中，步骤S103根据行人拓扑图，对行人的空间状态进行加权聚合，对行人的各种空间状态进行统一，确定行人的空间交互信息，考虑了空间域上同一时刻行人社会交互关系，提高了预测的准确性。

在本发明具体的实施例中，步骤S104将预设步长内行人的空间交互信息作为时间卷积网络模型的输入，通过时间卷积网络模型，得到行人的轨迹预测，时间卷积网络模型只需要输入行人的空间交互信息，就能够并行处理每条预测轨迹，减小了模型参数，实现了不同时间步上行人轨迹的并行运算。时间卷积网络模型可以大规模并行处理，因此在训练和验证时网络的速度都会更快，可以通过增加层数、改变膨胀系数和滤波器的大小改变感受野，历史信息长短上更加灵活，且避免了梯度弥散和梯度爆炸的问题，且训练时占用的内存更少，尤其是对于长序列。

与现有技术相比，本实施例提供的一种行人轨迹时间序列预测方法，根据待预测行人轨迹数据，建立行人拓扑图，并将待预测行人轨迹数据进行加权聚合，得到了行人空间的交互信息，考虑了空间域上同一时刻行人社会交互关系，提高了预测的准确性，并通过时间卷积网络模型，对行人轨迹的时间序列进行预测，减小了模型参数，实现了不同时间步上行人轨迹的并行运算。

在本发明的一些实施例中，根据预处理后的待预测行人轨迹数据，建立行人拓扑图，包括：

根据拓扑结构信息，建立行人拓扑图。

在上述实施例中，同一预测场景内，在t时刻所有行人之间的社会交互可以由图数据来表示：

其中，

是节点集合，代表t时刻预测场景内的所有行人；

是边的集合，代表t时刻行人之间社会交互的连接关系；

是节点的特征表示的集合，代表t时刻行人的坐标信息。图

中的每个行人

都表示为坐标向量

所有行人的坐标向量构成一个矩阵X_t∈R^N ^×2。行人社会交互的网络拓扑结构由邻接矩阵

表示，如果行人

和行人

之间存在社会交互，则

若不存在社会交互，则

每个行人所有社会交互数目构成一个度矩阵

其中

是行人

的度。(·)^T是向量或矩阵的转置。

由于行人之间的社会交互是不对称的，不能简单的将同一时刻预测场景内所有行人构成一个完全连接图，即邻接矩阵

在这种情况下，每一个行人都与其他行人有社会交互，因此，对于每一个行人来说，社会交互图

中的节点结构信息都是相同的。

为了筛选每个行人前方的其他行人，首先必须知道行人的运动方向。在本发明中，行人轨迹预测模型的输入只有所有观察时刻的行人的坐标信息，因此将相邻两个时间步之间的位移方向近似当作行人的行走方向。对于t时刻行人

的行走方向可以用位移表示为：

然后，根据t时刻预测场景内的其他行人

的坐标与t时刻行人

的坐标的差值可以得到其他行人

对于行人

的相对位置方向：

由此，可以计算出预测场景内所有其他行人

的相对位置方向

与行人

行走方向

之间的夹角，用余弦值表示为：

根据经验，人眼视角的余弦值大概为-0.2，因此，将夹角值

的行人

考虑在行人

的视野范围内，即令邻接矩阵A_t中的元素

代表行人

的社会属性影响了行人

的未来路径决策，否则

由此可得邻接矩阵：

A_t是一个非全连接的有向邻接矩阵，代表了t时刻预测场景内每一个行人与其他行人的社会交互的拓扑结构都是不同的，在这种情况下使用图神经网络来提取行人之间的空间交互信息才有意义。将由邻接矩阵A_t构成的非全连接图称为行人社会交互图，即非同质化社会网络图，同样由

表示。

在得到非同质化社会网络图后，可以在此基础上进行空间域上的行人社会交互提取。若简单利用现有的图神经网络提取行人社会交互，会存在行人社会网络拓扑结构提取不充分的缺陷，以及对不同预测场景的行人轨迹数据的适应性较差。在本发明中，使用改进后的图神经网络对行人社会交互网络图进行处理。

首先在t时刻的非同质化社会网络图

上，利用节点嵌入方法来提取

中每个行人

的社会拓扑结构信息：

其中，f代表节点嵌入方法；

代表t时刻行人

的嵌入向量。为了找到具有相似拓扑结构的远程节点，需要能够捕获节点在图中的全局相似性的节点嵌入方法，由此可以得到每个节点全局结构信息的具体表示。对于不同的行人轨迹预测场景，可以使用不同的节点嵌入方法，以提高对不同轨迹数据的适应性。

在本发明的一些实施例中，根据拓扑结构信息，建立行人拓扑图，包括：

在上述实施例中，首先，在非同质化社会网络图中，利用所有行人嵌入向量

之间的相似性为每个行人

搜寻远距离相似节点。对于图

中每个中心节点，定义t时刻行人

的高阶拓扑邻域

是一个节点集合，其中每个节点的嵌入向量

在一定范围内与中心节点的嵌入向量

相似：

其中，

量化不同节点嵌入向量之间的相似性，表示节点嵌入向量

和

之间的欧式距离；ε表示预先设定的相似阈值，将距离

与阈值ε进行比较，距离

小于阈值ε对应的节点集合就是t时刻行人

的高阶行人拓扑邻域

对于行人预测场景，将高阶拓扑邻域

的大小定义为非同质化社会网络图

的每个行人的平均度数n。找到与中心行人

的节点嵌入向量

的欧式距离最接近的n个其他行人

的嵌入向量

那么这n个行人

就是中心行人

的高阶拓扑邻域

因此

又可以进一步表示为：

其中，TOP_n(·)表示在非同质化社会网络图中查找节点嵌入向量与中心节点的节点嵌入向量最相似的前n个节点。

找到节点嵌入向量距离中心节点的节点嵌入向量最小的前n个节点，构成每个行人的高阶行人拓扑邻域。根据每个高阶行人拓扑邻域

中节点的连接关系，可以得到一个新的邻接矩阵

其中b_ij＝1代表节点

否则b_ij＝0。可以由此构建预测场景内行人的高阶拓扑社会网络图：

其中高阶拓扑社会网络图的边集合ε′_t＝{e₁,e₂,…,e_T}由

导出，可以看出

与

的差异在于节点连接关系的不同。

在本发明的一些实施例中，根据行人拓扑图，将预处理后的待预测行人轨迹数据进行加权聚合，得到行人空间交互信息，包括：

在上述实施例中，得到每个节点的高阶拓扑邻域之后，要对高阶拓扑社会网络图

中每个节点的拓扑邻居进行聚合操作。对于图

中每个t时刻行人

聚合其高阶拓扑邻域

中所有节点

的表示向量

以迭代地更新节点

的表示向量

第l次迭代过程表示为：

其中

有许多方法可以聚合拓扑邻域中的节点表示，其中最原始的方法是消息传递。消息传递算法是一种作用于图数据的模型，基本原理是将图中每个节点和每条边的表示向量初始化为节点和边的输入特征，然后每个节点重复地将其当前表示向量传递给其邻居节点，并聚合来自其邻居传递过来的消息。经过一定数量的传递与聚合步骤后，模型为每个节点输出一个稳定的表示，用公式表示为：

其中M_l-1是消息函数；U_l-1是节点更新函数；

是节点

和

之间的边特征，如果

和

之间存在连接边，则

否则

还有一些常见的聚合方法，例如平均池聚合：

和最大池聚合：

还可以采用GCN或GAT在高阶拓扑社会网络图

上进行节点聚合操作。作为神经网络，GNN的变体模型可以更好地拟合具有复杂模式信息的高阶拓扑图，提取远距离相似拓扑节点的信息，GCN和GAT的基本框架表示为：

等式(15)表示GCN中第l层网络的体系结构，等式(16)、(17)表示GAT中第l层网络的体系结构，模型网络总层数设为L，则0≤l≤L。

代表与行人

社交结构相似的高阶行人

在网络中第l层的聚合表示，

类似。GCN和GAT的输入为

是t时刻的行人坐标向量。W^t,l-1代表第l层网络的可学习参数矩阵。等式(15)中的

表示行人

的高阶拓扑邻域

的大小，即与行人

产生社会交互的其他行人数目；σ(·)表示网络的激活函数。在等式(17)中，

表示行人

与高阶拓扑邻域

中的行人

之间的注意力系数；‖表示向量的拼接操作；δ(·)表示一个映射函数，例如单层前馈神经网络，能够将高维向量映射为一个实数。通过对高阶拓扑邻域

的聚合操作，对于预测场景中的每个行人，可以得到社会拓扑图中的相似社交结构的高阶行人的聚合特征向量，即网络最后一层的输出

为了方便将其记为

即聚合特征向量。

将聚合高阶行人拓扑图的方法模块化，对于不同的行人轨迹预测场景，可以使用不同的高阶邻域聚合方法，以提高对不同轨迹数据的适应性。

对于t时刻的每个行人

得到了相似高阶行人的聚合特征向量

嵌入向量

接下来利用图注意力机制将这些信息与行人的坐标信息融合加权，用以在非同质化社交网络图

上进行邻域聚合操作。首先，对于每个行人

有坐标向量

是模型第1层的输入，将其记为

计算模型第L层(0≤l≤L)行人表示向量

和

之间的注意力系数

其中，‖表示向量拼接操作；W^t,l是可学习参数矩阵；δ(·)表示一个映射函数；

表示在图

中行人

的邻域。同样，对于相似高阶行人的聚合特征向量

计算其注意力系数

其中

对于社交网络图信息

计算其注意力系数

其中

是模型第l层网络节点

的图拓扑信息嵌入向量。

包含了中心节点嵌入向量

与其相邻节点嵌入向量

之间拓扑结构差异的权重。除了使用神经网络获得注意力系数

外，还可以计算节点嵌入向量

和

之间的相似度作为注意力系数

例如，采用Jaccard相似性来获得注意力系数

在大多数情况下，使用广义Jaccard系数来计算嵌入向量间的相似度：

其中

是对应于每个节点

的节点嵌入方法采样的邻域范围所构成的子图，若采样范围是k阶邻域，则子图由

的所有k跳邻居节点以及节点之间的连接边组成。

代表向量

的第p个元素。

其次，有一些节点嵌入方法的输出形式不是向量，而是一个矩阵。如果节点嵌入输出的是矩阵的形式，利用神经网络方法计算其注意力系数

如下：

其中，

代表节点嵌入输出的矩阵；reshape(·)代表将矩阵按行首尾拼接转换为向量的转换函数。

还可以将矩阵

和

之间的相似度作为注意力系数

例如，采用

和

之间的距离范数计算相似度：

其中

是矩阵

第m行第n列的元素；

表示矩阵距离的1范数，除此之外也可以使用2范数或无穷范数等方法来计算注意力系数

在得到了这三个注意力系数

和

之后，将其分别归一化，得到：

其中LeakyReLU(·)是一个激活函数。

和

是归一化后的注意力系数。对于注意力系数

有两种情况，第一种情况是使用神经网络方法计算得到的注意力系数

则

的标准化方式与上述相同：

第二种情况是将节点嵌入之间的相似度作为注意力系数

则不需要激活函数，那么

的标准化结果如下：

在本发明的一些实施例中，根据嵌入向量的注意力系数、表示向量的注意力系数和聚合特征向量的注意力系数进行加权聚合，得到行人空间交互信息，包括：

在上述实施例中，将这三个归一化后的注意力系数

和

加权平均，得到最终的注意力系数：

其中，b^t,l(·)、c^t,l(·)和d^t,l(·)是传递函数；

是最终的注意力系数，将其应用于图

上的行人邻域加权聚合，得到：

其中σ(·)是激活函数；

是模型第l层的输出。将多头操作应用于图注意力机制，得到：

其中，

是第k个注意力系数，总共有K个注意力机制要考虑；W^t,k(l-1)是模型第l层网络中第k个注意力机制的可学习参数矩阵。最后，得到了模型最后一层的输出

代表了t时刻行人

与预测场景中的其他行人之间的空间交互信息。

因此，本发明中采用拓展的注意力机制对中心节点进行加权聚合提取每个先验时刻行人的社会交互的时间复杂度与三个可变组件有关，为：

T(n)＝O(K(NSS′+3MS′)+aggregation)； (32)

其中K是注意力机制的数目，N是要处理的非同质化社会交互图中的节点数目，M是图中的边数，S是输入节点特征的维数，S′是输出节点表示的维数，aggregation是高阶拓扑邻域聚合操作的时间复杂度。

本发明中提取行人交互信息算法通过挖掘社交拓扑图中的结构信息和高阶相似行人的正信息，能够对每个行人邻域中的不同行人施加不同的权重，这能体现中心行人对周围行人的关注的重要性不同。也就是说当中心行人在行走时，对于该行人前方的行人，其关注度是不同的，比如离该行人越近的行人或者在视野正前方的行人，对他们的关注度就应越大。因此本发明能够很好地模拟实际场景中行人的社会交互。

在本发明的一些实施例中，基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹，包括：

在上述实施例中，利用时间卷积网络(Temporal Convolutional Networks,TCN)在时间域上提取预测场景中所有行人的时间交互信息。对于t时刻非同质化社会网络图

中的所有行人，有空间交互

将其堆叠成矩阵，有：

对于所有先验观测时间步数0≤t≤t_obs，有

将其堆叠成三维矩阵：

矩阵H就是TCN的输入。对于传统的基于循环神经网络(RNN)的行人轨迹预测模型，每个行人分别独立地拥有一个LSTM模块，整个模型总共有N个LSTM模块。每个模块串行化输入空间交互序列

并串行化输出预测轨迹

计算效率十分低下。在本发明中，采用TCN来提取每条行人轨迹的时间相关信息，可以直接将行人轨迹矩阵H作为输入，能够并行处理每条预测轨迹，这正是与基于RNN的模型的不同之处。

请参阅图3，图3为本发明提供的卷积时间网络模型的一实施例的模型架构图，由图3可知，TCN由多层卷积神经网络(CNN)堆叠组成，设每个行人的社会交互向量

的长度为P，因此输入矩阵H的维度大小为t_obs×P×N。将时间维度t_obs作为CNN的特征通道，对于TCN的第一层，有：

其中Conv 2d(·)表示CNN网络；(t_obs,t_pred)表示CNN的输入维度大小是t_obs，输出维度大小是t_pred；H¹表示第一层TCN的输出。对于TCN的第l层网络(2≤l≤L)，有：

TCN的输出记为H^L，其大小为：t_pred×P×N，也是本发明中行人轨迹预测模型的最终输出。第2层到第L层TCN网络采用残差连接机制，可以扩大网络的感受野，增大对不同时间步行人表征的学习范围。因此TCN这种特殊的多层CNN网络结构可以高效地充分融合观测时间维度上的行人特征表示，生成预测轨迹，并且参数规模远远小于LSTM网络。

在本发明的一些实施例中，基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹，之后还包括：

行人

在t时刻的预测向量为H^L，将其简化记为：

在本步骤，首先讨论模型的损失函数。为了模拟行人轨迹模式的多样性，生成多模态轨迹，根据gravce假设，行人

在时刻t的轨迹坐标服从双变量高斯分布：

其中，

是轨迹坐标

高斯分布的均值向量；

是轨迹坐标

高斯分布的标准差向量；

是轨迹坐标

高斯分布的协方差。将预测轨迹矩阵H^L第二维度P的大小设置为5，则输出向量

的5个维度的值是

分别对应于轨迹坐标

服从的双变量高斯分布的5个参数。因此可以用最大似然估计来构建模型的损失函数：

其中，W是模型的所有可训练参数；P(x|y)代表条件概率。通过最小化似然损失，可以得到最终的模型参数。

在得到训练完毕的模型后，需要对模型的输出轨迹预测效果进行评估。首先，为了得到预测轨迹在每个预测时间步的实际坐标，要从模型输出的双变量高斯分布进行采样：

其中。sample(·)代表采样函数。对所有预测时间步1≤t≤t_pred进行采样，就可以得到每个行人的预测轨迹。接下来，采用平均位移误差(Average Displacement Error，ADE)和最终位移误差(Final Displacement Error，FDE)来量化预测效果：

平均位移误差是预测场景中所有行人在每个预测时间步的预测轨迹坐标与实际轨迹坐标欧式距离的平均值，代表预测轨迹与实际轨迹的整体符合程度。最终位移误差是预测场景中所有行人在最后一个预测时间步的预测轨迹坐标与实际轨迹坐标欧式距离的平均值，代表预测轨迹在最终时刻与实际轨迹的偏离程度。

为了更好实施本发明实施例中的行人轨迹时间序列预测方法，在行人轨迹时间序列预测方法基础之上，对应的，请参阅图4，图4为本发明提供的行人轨迹时间序列预测装置的一实施例的结构示意图，本发明实施例提供了一种行人轨迹时间序列预测装置400，包括：

数据处理模块401，用于获取待预测行人轨迹数据，将待预测行人轨迹数据进行预处理；

拓扑建立模块402，用于根据预处理后的待预测行人轨迹数据，建立行人拓扑图；

加权聚合模块403，用于根据行人拓扑图，将预处理后的待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；

轨迹预测模块404，用于基于预设的时间卷积网络模型，根据行人空间交互信息，确定行人的预测轨迹。

这里需要说明的是：上述实施例提供的装置400可实现上述各方法实施例中描述的技术方案，上述各模块或单元具体实现的原理可参见上述方法实施例中的相应内容，此处不再赘述。

请参阅图5，图5为本发明实施例提供的电子设备的结构示意图。基于上述行人轨迹时间序列预测方法，本发明还相应提供了一种行人轨迹时间序列预测设备，行人轨迹时间序列预测设备可以是移动终端、桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该行人轨迹时间序列预测设备包括处理器510、存储器520及显示器530。图5仅示出了电子设备的部分组件，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

存储器520在一些实施例中可以是行人轨迹时间序列预测设备的内部存储单元，例如行人轨迹时间序列预测设备的硬盘或内存。存储器520在另一些实施例中也可以是行人轨迹时间序列预测设备的外部存储设备，例如行人轨迹时间序列预测设备上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器520还可以既包括行人轨迹时间序列预测设备的内部存储单元也包括外部存储设备。存储器520用于存储安装于行人轨迹时间序列预测设备的应用软件及各类数据，例如安装行人轨迹时间序列预测设备的程序代码等。存储器520还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中，存储器520上存储有行人轨迹时间序列预测程序540，该行人轨迹时间序列预测程序540可被处理器510所执行，从而实现本申请各实施例的行人轨迹时间序列预测方法。

处理器510在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器520中存储的程序代码或处理数据，例如执行行人轨迹时间序列预测方法等。

显示器530在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。显示器530用于显示在行人轨迹时间序列预测设备的信息以及用于显示可视化的用户界面。行人轨迹时间序列预测设备的部件510-530通过系统总线相互通信。

在一实施例中，当处理器510执行存储器520中行人轨迹时间序列预测程序540时实现如上的行人轨迹时间序列预测方法中的步骤。

本实施例还提供了一种计算机可读存储介质，其上存储有行人轨迹时间序列预测程序，该行人轨迹时间序列预测程序被处理器执行时实现以下步骤：

根据预处理后的待预测行人轨迹数据，建立行人拓扑图；

综上，本实施例提供的一种行人轨迹时间序列预测方法，根据待预测行人轨迹数据，建立行人拓扑图，并将待预测行人轨迹数据进行加权聚合，得到了行人空间的交互信息，考虑了空间域上同一时刻行人社会交互关系，提高了预测的准确性，并通过时间卷积网络模型，对行人轨迹的时间序列进行预测，减小了模型参数，实现了不同时间步上行人轨迹的并行运算。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种行人轨迹时间序列预测方法，其特征在于，包括：

获取待预测行人轨迹数据，将所述待预测行人轨迹数据进行预处理；

根据预处理后的所述待预测行人轨迹数据，建立行人拓扑图；

根据所述行人拓扑图，将预处理后的所述待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；

基于预设的时间卷积网络模型，根据所述行人空间交互信息，确定行人的预测轨迹。

2.根据权利要求1所述的行人轨迹时间序列预测方法，其特征在于，所述根据预处理后的所述待预测行人轨迹数据，建立行人拓扑图，包括：

根据预处理后的所述待预测行人轨迹数据，建立行人社会交互图；

对所述行人社会交互图的节点嵌入向量，得到每个行人的拓扑结构信息；

根据所述拓扑结构信息，建立行人拓扑图。

3.根据权利要求2所述的行人轨迹时间序列预测方法，其特征在于，所述根据所述拓扑结构信息，建立行人拓扑图，包括：

根据所述拓扑结构信息，计算每个嵌入节点的所述嵌入向量之间的欧式距离；

根据满足预设条件的嵌入向量的欧式距离，建立行人拓扑图；所述行人拓扑图包括节点的表示向量。

4.根据权利要求3所述的行人轨迹时间序列预测方法，其特征在于，所述根据所述行人拓扑图，将预处理后的所述待预测行人轨迹数据进行加权聚合，得到行人空间交互信息，包括：

根据所述行人拓扑图，聚合所述满足预设条件的嵌入向量的欧式距离，迭代更新所述表示向量，得到聚合特征向量；

根据所述嵌入向量、所述表示向量和所述聚合特征向量，分别计算所述嵌入向量的注意力系数、所述表示向量的注意力系数和所述聚合特征向量的注意力系数；

根据所述嵌入向量的注意力系数、所述表示向量的注意力系数和所述聚合特征向量的注意力系数进行加权聚合，得到行人空间交互信息。

5.根据权利要求4所述的行人轨迹时间序列预测方法，其特征在于，所述根据所述嵌入向量的注意力系数、所述表示向量的注意力系数和所述聚合特征向量的注意力系数进行加权聚合，得到行人空间交互信息，包括：

将所述嵌入向量的注意力系数、所述表示向量的注意力系数和所述聚合特征向量的注意力系数分别进行归一化处理，得到归一化后的所述嵌入向量的注意力系数、归一化后的所述表示向量的注意力系数和归一化后的所述聚合特征向量的注意力系数；

将归一化后的所述嵌入向量的注意力系数、归一化后的所述表示向量的注意力系数和归一化后的所述聚合特征向量的注意力系数进行加权平均，得到目标注意力系数；

根据所述目标注意力系数和所述行人拓扑图，得到行人空间交互信息。

6.根据权利要求3所述的行人轨迹时间序列预测方法，其特征在于，所述基于预设的时间卷积网络模型，根据所述行人空间交互信息，确定行人的预测轨迹，包括：

根据所述行人空间交互信息和所述表示向量，确定行人时间交互信息；

基于预设的时间卷积网络模型，根据所述行人空间交互信息和所述行人时间交互信息，确定行人的预测轨迹。

7.根据权利要求6所述的行人轨迹时间序列预测方法，其特征在于，所述基于预设的时间卷积网络模型，根据所述行人空间交互信息，确定行人的预测轨迹，之后还包括：

在预设时间步长内，对所述预测轨迹的双变量高斯分布进行采样，得到采样结果；

根据所述采样结果，确定所述预测轨迹的平均位移误差和最终位移误差。

8.一种行人轨迹时间序列预测装置，其特征在于，包括：

数据处理模块，用于获取待预测行人轨迹数据，将所述待预测行人轨迹数据进行预处理；

拓扑建立模块，用于根据预处理后的所述待预测行人轨迹数据，建立行人拓扑图；

加权聚合模块，用于根据所述行人拓扑图，将预处理后的所述待预测行人轨迹数据进行加权聚合，得到行人空间交互信息；

轨迹预测模块，用于基于预设的时间卷积网络模型，根据所述行人空间交互信息，确定行人的预测轨迹。

9.一种电子设备，其特征在于，包括存储器和处理器，其中，

所述存储器，用于存储程序；

所述处理器，与所述存储器耦合，用于执行所述存储器中存储的所述程序，以实现上述权利要求1至7中任一项所述行人轨迹时间序列预测方法中的步骤。

10.一种计算机可读存储介质，其特征在于，用于存储计算机可读取的程序或指令，所述程序或指令被处理器执行时，能够实现上述权利要求1至7中任一项所述行人轨迹时间序列预测方法中的步骤。