WO2020191642A1

WO2020191642A1 - 轨迹预测方法及装置、存储介质、驾驶系统与车辆

Info

Publication number: WO2020191642A1
Application number: PCT/CN2019/079780
Authority: WO
Inventors: 崔健; 陈晓智
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2019-03-27
Filing date: 2019-03-27
Publication date: 2020-10-01
Also published as: CN111316286A

Abstract

提供了一种轨迹预测方法及装置、存储介质、驾驶系统与车辆。该方法通过获取待预测对象所在区域的全局语义数据与全局轨迹数据（S202），然后，融合全局语义数据与全局轨迹数据，得到全局融合数据（S204），从而，提取全局融合数据中的特征，得到全局特征（S206），进而，利用训练好的轨迹预测模型处理全局特征，得到待预测对象的目标轨迹（S208）。该方法能够结合全局数据实现对运动对象的轨迹预测，具备较高的预测准确率，并在一定程度上降低意外事故的发生概率。

Description

轨迹预测方法及装置、存储介质、驾驶系统与车辆

技术领域

本发明涉及智能交通技术领域，尤其涉及一种轨迹预测方法及装置、存储介质、驾驶系统与车辆。

背景技术

随着智能交通领域的发展，对运动对象的运动轨迹的预测算法在路径规划领域具备重大意义。通过对运动对象的运动轨迹进行预测，能够在已知运动对象未来可能的运动轨迹的情况下进行路径规划，有利于防止碰撞等意外情况的发生。

目前的轨迹预测算法一般以运动对象自身的运动数据为基础，根据运动对象所属类别确定运动对象适用的运动模型，并利用该运动模型处理运动对象自身的运动数据，之后，再通过后处理的方式整合区域语义信息，即可预测出待预测对象的运动轨迹。

现有的轨迹预测算法以运动对象自身的运动数据为基础，无法从全局出发进行轨迹预测，这容易导致不同运动对象的预测轨迹出现交叉，进而导致以此为依据的路径规划或调度发生碰撞等意外事故，存在较大的安全隐患。

发明内容

本发明实施例提供一种轨迹预测方法及装置、存储介质、驾驶系统与车辆，能够结合全局数据实现对运动对象的轨迹预测，具备较高的预测准确率，并在一定程度上降低意外事故的发生概率。

第一方面，本发明实施例提供了一种轨迹预测方法，包括：

获取待预测对象所在区域的全局语义数据与全局轨迹数据；

融合所述全局语义数据与所述全局轨迹数据，得到全局融合数据；

提取所述全局融合数据中的特征，得到全局特征；

利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹。

第二方面，本发明实施例提供了一种轨迹预测装置，包括：

获取模块，用于获取待预测对象所在区域的全局语义数据与全局轨迹数据；

融合模块，用于融合所述全局语义数据与所述全局轨迹数据，得到全局融合数据；

特征提取模块，用于提取所述全局融合数据中的特征，得到全局特征；

预测模块，用于利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹。

第三方面，本发明实施例提供了一种轨迹预测装置，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如第一方面所述的方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，

所述计算机程序被处理器执行以实现如第一方面所述的方法。

第五方面，本发明实施例提供了一种驾驶系统，包括：

轨迹预测装置，用于执行如第一方面所述的方法；

运动控制器，用于根据所述目标轨迹控制被控制对象运动。

一种可能的设计中，所述被控制对象与所述待预测对象为不同对象。

第六方面，本发明实施例提供了一种车辆，包括：

如第二方面或第三方面所述的轨迹预测装置，用于执行如第一方面所述的方法。

第七方面，本发明实施例提供了一种车辆，包括：

如第五方面所述的驾驶系统。

第八方面，本发明实施例提供了一种无人飞行器的控制装置，包括：

如第五方面所述的驾驶系统。

本发明实施例所提供的技术方案，通过对待预测对象所在区域的全局语义数据与全局轨迹数据进行获取与处理，能够得到该区域的全局特征，进而，利用训练好的轨迹预测模型对全局特征进行处理，即可得到待预测对象的目标轨迹，换言之，本发明实施例所提供的技术方案从全局语义和全局轨迹出发，在预测一个待预测对象的轨迹时，考虑该区域内的全部运动对象，并结合该区域的全局语义数据，以实现对该区域内任一运动对象的轨迹预测，相较于仅考虑单一的待预测对象的预测方法，本方案具备较高的预测准确率，并且，当以此为依据执行后续的路径规划或调度，也能够在一定程度上降低意外事故的发生概率，具备更高的安全性。

附图说明

图1为本发明实施例提供的一种轨迹预测场景的俯视示意图；

图2为本发明实施例提供的一种轨迹预测方法的流程示意图；

图3为本发明实施例提供的另一种轨迹预测方法的流程示意图；

图4为本发明实施例提供的另一种轨迹预测方法的流程示意图；

图5为本发明实施例提供的循环神经网络模型的循环单元结构示意图；

图6为本发明实施例提供的循环神经网络模型的模型架构示意图；

图7为本发明实施例提供的长短期记忆网络模型的模型架构示意图；

图8为本发明实施例提供的另一种轨迹预测方法的流程示意图；

图9为本发明实施例提供的一种轨迹预测装置的功能方块图；

图10为本发明实施例提供的一种轨迹预测装置的实体结构示意图；

图11为本方面实施例提供的一种驾驶系统的架构示意图；

图12为本发明实施例提供的一种车辆的架构示意图；

图13为本发明实施例提供的另一种车辆的架构示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

首先对本发明所涉及的名词进行解释：

运动对象：是指能够实现轨迹移动的生物或物体。本发明实施例所涉及到的运动对象可以包括但不限于：车辆、动物、人、机器人与无人飞行器中的至少一种。其中，车辆可以为无人驾驶车辆，如无人地面车辆(Unmanned Ground Vehicle，UGV)，或者，处于自动驾驶模式的私家车辆或公交车辆等。

待预测对象：待预测目标轨迹的一个或多个运动对象。其中，多个是指两个或两个以上，后续涉及该概念，不再赘述。

语义对象：是指区域中各个语义概念上的对象。请参考图1所示场景，该场景中的语义对象包括：车辆、车道线、车道。可知，图1仅用以示例，在实际的轨迹预测场景中，语义对象的语义类别还包括多种，如：树木、障碍物、栏杆、指示牌、人、动物等，本发明实施例对于各语义对象的语义类别无特殊限定。

长短期记忆网络(Long Short Term Memory，LSTM)模型：是循环神经网络(Recurrent Neural Network，RNN)的一种变种模型，相较于RNN模型，LSTM具备更长的时间依赖建模能力。

本发明实施例所提供的技术方案具体的应用场景为：针对运动对象的轨迹预测场景。

进一步的，本发明实施例所提供的技术方案还可以具体应用于路径规划场景，此时，可根据预测出的轨迹，来实现对某一个或多个运动对象的路径规划。

此外，本发明实施例所提供的技术方案还可以具体应用于车辆调度场景。例如，通过对其他不可调度车辆或对象的轨迹预测，来实现对可调度车辆的调度。

如背景技术所述，现有的轨迹预测方法仅是针对单独的一个运动对象，当确定该运动对象的类别后，则通过该类别对应的运动模型，对该运动对象自身的运动数据进行处理，从而，预测出该运动对象的运动轨迹。一方面，这种预测方式受制于对象类别的限制，需要准确判断出运动对象的类别，才能够以该类别对应的运动模型得到较为准确的预测结果；另一方面，这种预测方式仅依赖于运动对象本身的运动数据，并未从全局角度结合当前运动环境、其他运动对象的运动情况进行综合分析，这种未考虑运动对象所在区域内的其他运动或非运动的对象，极有可能预测出的两个同一类别的运动对象的轨迹相交，从而，若以此为依据进行路径规划或对象调度，极有可能发生碰撞等意外事故，存在较大的安全性风险。

基于此，本发明实施例提供的技术方案，旨在解决现有技术的如上技术问题，并提出如下解决思路：综合考虑待预测对象所在区域的全局数据，包括全局语义数据与全局轨迹数据，据此得到全局特征，并以全局特征作为轨迹预测模型的输入，来获取待预测对象的目标轨迹。

基于这种设计，本发明实施例所提供的轨迹预测方法可以具体执行于某一运动对象的内置处理器或所持的终端设备中，或者，也可以具体执行于云端或后台服务器。

举例说明。在一种可能的场景中，自动驾驶车辆的第一处理器可自行规划行驶路线，而该自动驾驶车辆的第二处理器用于执行本方案所提供的轨迹预测方法，并用于将预测到的轨迹输入第一内置理器，以便于第一处理器可根据预测出的轨迹进行后续的路径规划。其中，第一处理器和第二处理器可以为同一处理器，或者，也可以为不同处理器，例如，可以为高级驾驶辅助系统(Advanced Driving Assistant System，ADAS)中的一个或两个处理器；以及，第一处理器和第二处理器可以为车辆的总控制器中的一部分，或者，也可以为控制该无人驾驶车辆行驶的后台总服务器或云端服务器。

下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本发明的实施例进行描述。

实施例一

本发明实施例提供了一种轨迹预测方法。请参考图2-图4，其中，图2示出了本发明实施例提供的一种轨迹预测方法的流程示意图，图3示出了本发明式实施例提供的轨迹预测方法在一种具体的应用场景下的实现流程示意图，图4为图3所示流程的一种具体实现方式。

如图2所示，该方法包括如下步骤：

S202，获取待预测对象所在区域的全局语义数据与全局轨迹数据。

如前所述，待预测对象为一种运动对象，其可以包括但不限于如下至少一种：车辆、动物、人、机器人与无人飞行器。此外，本发明实施例中对待预测对象的数目无特别限定，可以为一个或多个。

其中，全局语义数据用于描述待预测对象所在区域中各对象的语义类别，此时，各运动对象或非运动对象均作为语义对象，具备各自的语义类别。全局轨迹数据用于描述该区域中各运动对象的历史运动坐标。可知，在具体实现时，全局轨迹数据可以包括至少一帧的历史运动坐标。

图3示出了以图1所示场景为例时，本方案的实现流程示意图。如图3所示，该行驶场景中包含3个语义，分别是：车辆、车道与车道线时，此时，需要在该场景中获取的全局语义数据，也就是各语义对象的语义数据；以及，还需要获取该场景的全局轨迹数据，也就是各运动对象：车辆1(作为待预测对象)、车辆2和车辆3的轨迹数据。

需要说明的是，图3仅为示意性的，在具体的实现场景中，全局轨迹数据与全局语义数据的表现形式不局限于单个获取的方式，可作为整体数据被获取到。

在如图4所示的一种实现场景中，各运动对象的轨迹数据可以通过LSTM模型来实现，后续具体说明。

S204，融合所述全局语义数据与所述全局轨迹数据，得到全局融合数据。

具体的，如图3所示，融合模块用于将每一帧对应的全局语义数据与全局轨迹数据进行融合，得到各帧的全局融合数据。

S206，提取所述全局融合数据中的特征，得到全局特征。

如图3所示，特征提取模块用于在全局融合数据中提取出全局特征。在如图4所示的一种实现场景中，该步骤可以通过卷积神经网络(Convolutional Neural Networks，CNN)模型来实现，后续具体说明。

S208，利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹。

本发明采用训练好的轨迹预测模型来预测运动对象的运动轨迹，此时，该轨迹预测模型的输入为全局特征，输出为运动对象的运动轨迹。

具体而言，本发明实施例所提供的轨迹预测模型可以包括但不限于：如下至少一种：LSTM模型、多层感知器(Multi-Layer Perception，MLP)；其中，所述多层感知器包括：RNN模型、门控循环单元(gated recurrent neural network，GRU)模型。例如，图4所示的实现场景中，即通过LSTM模型来实现轨迹预测，此时，Y＝LSTM(feature)，其中，Y表示目标轨迹，feature表示全局特征。

请参考图5-7，其中，图5示出了RNN模型中一个循环单元的设计逻辑，图6示出了RNN模型的模型架构示意图，图7示出了LSTM模型的模型架构示意图。

RNN模型作为一种时序建模的有效手段，相比于普通的神经网络，如图5所示，其区别主要在于将上一帧的输出或者中间状态作为当前帧的输入，以实现对历史消息及时序关系的融合。将如图5所示的循环单元在时间展开后，即可得到如图6所示的RNN模型。如图6所示，RNN模型可以实现时序建模。因此，可以通过RNN模型来实现本方案中的轨迹预测步骤。

如图7所示，在LSTM模型中的每一个重复模块中均包含4个交互层，这4个交互层以特殊的方式进行交互，使得上一帧的输出或者中间状态作为当前帧的输入，从而，相比于图6所示的RNN模型，LSTM模型具备更优异的时间依赖建模能力。此外，考虑到针对轨迹的预测与运动对象的历史数据具备较强的时间关联关系，因此，采用LSTM模型来实现轨迹预测可得到更为接近实际发展的轨迹预测结果。

通过前述设计，本发明实施例所提供的技术方案能够从全局数据出发，实现对任一待预测对象的轨迹预测，相较于仅以待预测对象自身的运动数据出发的轨迹预测方式，本方案具备较高的预测准确率，并且，当以此为依据执行后续的路径规划或调度，也能够在一定程度上降低意外事故的发生概率，具备更高的安全性。

以下，对图2所示方法的实现方式进行具体说明。

S202包含两方面全局数据的获取：全局语义数据与全局轨迹数据。这两种全局数据的获取方式可以参考图8所示流程。

一方面，如图8所示，获取全局语义数据的方式可以包括如下步骤：

S202-12，获取所述待预测对象所在区域的全局区域图像。

该全局区域图像可以为实时获取到的图像，实时获取到的图像具备更高的及时性，以此得到的全局语义数据也更为准确。具体而言，实时获取方式可以包括但不限于：通过图像采集设备实时采集图像。其中，图像采集设备可以为该轨迹预测装置(轨迹预测方法的执行主体)的一部分；或者，与该轨迹预测装置具备实时地数据交互。举例说明，若该轨迹预测装置可以为车辆的主控制器中的处理器A，则图像采集设备可以为车辆黑匣子中的摄像头，其可以将采集到的图像直接输入处理器A；或者，图像采集设备可以为区域内设置的摄像头，如道路上或路边设置的摄像头，此时，处理器A可以向该区域内摄像头或该区域内摄像头的后台服务器实时请求并接收全局区域图像。

除实时获取的方式之外，还可以通过调用已采集数据的方式来获取全局语义数据。具体的，一种实现场景中，可以获取高精度地图中关于该区域的全局区域图像；另一种实现场景中，可以获取其他处理器或存储器中已采集到的该区域的全局区域图像。并且，这种实现方式只能获取到该区域的环境信息，如道路、指示牌、车道线等非运动对象的非实时数据，而无法获取到实时场景中的运动对象的运动情况，因此，在以此方式实现本方案时，仅适用于针对单一待预测对象的轨迹预测，而无法结合其他运动对象的轨迹实现综合预测，预测准确率较弱。

需要说明的是，本发明实施例中后续进行处理的图像为俯视图像，因此，若以前述实现方式获取到的并非俯视图像时，还需要对采集到的图像进行俯视投影，以得到满足后续处理需要的俯视图像。

一种可能的设计中，本发明实施例所涉及到的俯视图像可以具体表现为：数字正射影像(Digital Orthophoto Map，DOM)图像。

此外，为了便于处理，还可以进一步个性化设置“待预测对象所在区域”的区域形状或尺寸，本发明实施例对此无特别限定。具体的，可以以待预测对象为中心，获取俯视图一定长宽尺寸的矩形区域为其所在区域，例如，可以获取如图1(或图3)所示的长为W、宽为H的矩形区域的图像。又例如，还可以将待预测对象所在的整条道路作为待预测对象所在区域。

S202-14，对所述全局区域图像中的各像素分别进行语义识别，得到各像素的语义类别。

一种可能的设计中，可以通过深度学习来实现对各像素的语义识别。若通过该方式实现，需要在执行该步骤之前，利用预设的像素样本数据，对像素语义识别模型进行深度学习，以得到满足应用需求(可通过对损失函数的定义实现)的像素语义识别模型。如此，在执行该步骤时，仅需将全局区域图像输入该像素语义识别模型，该像素语义识别模型的输出即为各像素的语义类别。

另一种可能的设计中，还可以各像素的像素值为依据，将各像素的像素值分别与各语义类别对应的像素区间进行比较，从而，针对任一像素值，将该像素值落入的像素区间对应的语义类别，作为该像素对应的语义类别。其中，各语义类别与像素区间之间的对应关系，可以通过自定义方式预设。

S202-16，根据各像素的语义类别，对所述全局区域图像进行语义标注，得到所述全局语义信息。

由于各像素的语义类别已经确定，在执行该步骤时，可根据各像素的语义类别，对所述全局区域图像进行语义分割，得到多个语义对象；从而，对对各语义对象分别进行语义标注，得到所述全局语义信息。

其中，语义标注仅用于区分各对象的语义类别，可以任意可区分方式来进行标注。例如，可以通过不同的颜色来标识各语义对象。或者，如图1(或图3)所示，可以通过不同的底纹来标识各语义对象。可知，经过标识后，具备同样标识的语义对象为同一类语义对象。

此时，需要说明的是，在不同的实现场景中，与该待预测对象所属类别相同的其他运动对象的标注方式，可以与待预测对象的标注方式相同，也可以不同。如图1所示，当待预测对象为车辆1时，该待预测对象所在区域还包括同一类别的运动对象：车辆2与车辆3。此时，若通过第一轨迹预测模型(第一轨迹预测模型用于预测所述待预测对象的目标轨迹，后续详述实现方式)来实现S208步骤时，如图1所示，需要将车辆1与车辆2、车辆3进行区分标识，车辆1具备一种标识，车辆2与车辆3为另一种标识。或者，若通过第二轨迹预测模型(第二轨迹预测模型用于预测所述区域中全部运动对象的运动轨迹，后续详述实现方式)来实现S208步骤时，则无需对同一类别的运动对象进行区分标识，车辆1、车辆2与车辆3可使用同一种标识方式进行标识(同种标识的方式图1未示出)。

以及，在执行语义标注时，还可以进一步自定义划分网格，每个网格可以包括一个或多个像素点，其划分方式可以通过预设的分辨率来实现。例如，可以将图1所示的全局区域图像划分为长度为20cm的正方形网格，如此，在执行后续的语义标注时，仅需要对网格进行标注即可。当网格包含多个像素点时，划分网格的实现方式有利于降低标记量，提高了处理效率。

除前述实现方式之外，图8所述的S202-14与S202-16步骤还可以通过一个神经网络模型来实现。也就是，在执行S202-14之前，训练语义识别模型，如此，将S202-12步骤获取到的全局区域图像输入该语义识别模型，该语义识别模型的输出即为标注了语义类别的全局区域图像，也就得到了全局语义数据。

针对前述涉及到的语义识别模型、像素语义识别模型的类别无特别限定，采用CNN模型或其他神经网络模型均可实现，而二者的样本数据则需要根据模型的输入和输出做不同的标注何设计，不再赘述。

另一方面，如图8所示，获取全局轨迹数据的方式可以包括如下步骤：

S202-22，获取所述待预测对象所在区域内各运动对象的轨迹点集，所述轨迹点集由所述运动对象的坐标点按照时序顺序集合而成。

该步骤用于获取当前区域中的各运动对象的轨迹点集，其中，每个轨迹点集由该运动对象的多个坐标点构成，为了便于处理，可以将各运动对象的坐标点转换为同一个坐标系下的坐标点。例如，可以将各轨迹点集中的坐标点转换为以图1所示的矩形区域的两条直角边构成的直角坐标系中的坐标点，每个坐标点的表现形式为(X，Y)，而每个运动对象的轨迹点集可表示为{(X _i，Y _i)}，其中i用于表示个坐标点的时序顺序。

具体而言，在具体实现时，可通过获取每个运动对象在以当前时刻为终点的时间区间内的坐标点构成前述坐标点集。其中，时间区间的长度可根据需要预设，例如，可以获取当前时刻前3s内各运动对象的轨迹点集。

需要说明的是，该步骤中，轨迹点集可以是该执行主体主动监测到的，也可以是通过向其他处理器或采集装置请求数据得到的。例如，若执行主体为车辆1的主控制器中的处理器A，则本车辆1的坐标点可以通过自身的定位器，如GPS，采集得到，由本车辆1的定位器将采集到的坐标数据发送给处理器A，由处理器A进行坐标转换，得到本车辆1的轨迹点集；而其他车辆的轨迹点集则可以通过向其他处理器请求的方式得到，例如，若与其他车辆存在通信，可分别向其他车辆获取其轨迹点集；又例如，可以向该区域的路面监视器获取其他车辆的轨迹点集；此外，也可以通过自身采集其他车辆的图像并计算与自身的间距的方式，计算获取到其他车辆的轨迹点集。实现方式可以有多种，不再赘述。

此外，该轨迹点集的数据源(或直接采集源)与前述S202-12中全局区域图像的数据源(或直接采集源)可以不同。

S202-24，对各运动对象的所述轨迹点集进行编码处理，得到各运动对象的轨迹特征。

该步骤也可以通过神经网络模型来实现，将前述S202-22得到的各运动对象的轨迹点集(例如，各运动对象在3s内的轨迹点集)输入编码模型(一种训练好的神经网络模型，例如，可采用如图4所示的LSTM模型)，该编码模型的输出即为各运动对象的轨迹特征(encoder)。

具体的，针对任一运动对象而言，其轨迹特征可以表现为：encoder＝LSTM{(X _i，Y _i)}。其中，轨迹特征(encoder)的长度可以假设为C，C的取值一般为预设经验值。

S202-26，根据各运动对象的所述轨迹特征，构建轨迹张量，以作为所述全局轨迹数据。

基于S202-24步骤中获取到的各运动对象的轨迹特征，该步骤可以构建一个轨迹张量(tensor)，其尺寸为C*H*W，将各运动对象的轨迹特征(encoder)对应存放至该tensor中即可。具体的，针对任一运动对象，将该运动对象的encoder对应存储在该运动对象的中心位置。一种可能的设计中，也可按照图1所示方式，在tensor中划分网格，如此，该运动对象的中心位置位于该Tensor中的哪一个网格，就将该运动对象的encoder对应存储在该网格中即可。

通过如图8所示的实现方式，可以实现对全局语义数据与全局轨迹数据的获取。如前所述的实现方式中，全局语义数据可以表现为一个W*H的图像，而全局轨迹数据则表现为一个尺寸为C*H*W的tensor，因此，在执行S204所述的融合步骤时，可将二者融合为一个尺寸为(C+1)*H*W的融合tensor。该融合tensor可具体表示为：tensor((C+1)*H*W)。

基于前述步骤得到的全局融合数据，只需要再对该全局融合数据进行特征提取，即可得到包含待预测对象在内的全局特征。具体实现时，也可以通过神经网络模型实现。也就是，利用训练好的特征提取模型处理所述融合信息，得到所述全局特征。其中，本发明实施例所涉及到的特征提取模型至少包括：如图4所示的卷积神经网络(Convolutional Neural Networks，CNN)模型。与前述利用神经网络模型实现数据处理的方式类似，需要在执行该步骤之前，利用特征提取样本对该CNN模型进行训练。模型训练过程不再赘述。

同样的，在执行S208之前，也需要完成针对轨迹预测模型的训练学习。在具体的实现场景中，一般在执行本方案之前即完成轨迹预测模型(以及前述各实现方式中所涉及到的神经网络模型)的训练，以便于实时高效地实现轨迹预测，这种实现方式具备较高的实时性，有利于在实时实现轨迹预测，进而近似实时地实现路径规划或调度。

在具体实现轨迹预测模型的训练时，可以训练出根据全局特征预测某一单一运动对象(待预测对象)的第一轨迹预测模型。针对待预测对象而言，这种单一预测方式具备更快的处理效率，有利于实时场景下的路径规划和调度。

或者，也可以训练出根据全局特征预测区域内包含的全部运动对象的第二轨迹预测模型。其中，当利用第二轨迹预测模型处理全局特征时，将所述全局特征输入所述第二轨迹预测模型，获取所述第二轨迹预测模型输出的所述区域中全部运动对象的运动轨迹，并将所述全部运动对象中的所述待预测对象的运动轨迹，作为所述目标轨迹即可。这种全局预测方式能够一次性输出区域内全部运动对象的运动轨迹，有利于全局调度的实现，也有利于降低调度或路径规划过程中意外事故的发生概率，提高安全性。

此外，还可以训练出根据全局特征预测区域内包含的多个(非全部)运动对象的第三轨迹预测模型，模型训练方式及S208的实现方式同上，不再赘述。

综上，基于所训练出的轨迹预测模型的设计不同，本发明实施例所提供的技术方案不仅能实现针对单一运动对象的轨迹预测，还能够实现多个运动对象的轨迹预测。且如上所述的轨迹预测模型对对象类别无依赖，通过上述训练好的轨迹预测模型，可实现对任意类别的运动对象的轨迹预测，具备更高的灵活性，还可适用于具备多类对象的场景中的轨迹预测。

此外，在一些特殊的实现场景中，也可以如现有实现方式，分别为各类运动对象分别训练各自对应的轨迹预测模型。也就是，本发明实施例所提供的技术方案也可针对各类别的运动对象实现个性化预测。其中，为各类运动对象分别训练各自的轨迹预测模型时，样本数据为该类别对象的相关数据。

如前所述，通过前述各实现方式得到的待预测对象的目标轨迹之后，即可利用该目标轨迹作进一步处理。

一种可能的设计中，可以根据所述目标轨迹，为所述待预测对象进行运动规划。也就是，根据该待预测对象的预测轨迹来实现进一步的路径规划。

另一种可能的设计中，可以根据所述目标轨迹，为其他运动对象进行运动规划。也就是，在为其他某一个或多个运动对象进行路径规划的过程中，可以根据该待预测对象的预测轨迹来规划路线，以避免和该待预测对象发生碰撞或其他安全事故。

进而，根据规划好的运动路径，实现运动对象的调度。

可以理解的是，上述实施例中的部分或全部步骤或操作仅是示例，本申请实施例还可以执行其它操作或者各种操作的变形。此外，各个步骤可以按照上述实施例呈现的不同的顺序来执行，并且有可能并非要执行上述实施例中的全部操作。

实施例二

基于上述实施例一所提供的轨迹预测方法，本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。

本发明实施例提供了一种轨迹预测装置，请参考图9，该轨迹预测装置600，包括：

获取模块61，用于获取待预测对象所在区域的全局语义数据与全局轨迹数据；

融合模块62，用于融合所述全局语义数据与所述全局轨迹数据，得到全局融合数据；

特征提取模块63，用于提取所述全局融合数据中的特征，得到全局特征；

预测模块64，用于利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹。

一种可能的设计中，所述获取模块61，具体用于：

获取所述待预测对象所在区域的全局区域图像；

对所述全局区域图像中的各像素分别进行语义识别，得到各像素的语义类别；

根据各像素的语义类别，对所述全局区域图像进行语义标注，得到所述全局语义信息。

其中，所述获取模块61，还进一步具体用于：

根据各像素的语义类别，对所述全局区域图像进行语义分割，得到多个语义对象；

对各语义对象分别进行语义标注，得到所述全局语义信息。

本发明实施例所涉及到的所述全局区域图像为数字正射影像DOM图像。

另一种可能的设计中，所述获取模块61，具体用于：

获取所述待预测对象所在区域内各运动对象的轨迹点集，所述轨迹点集由所述运动对象的坐标点按照时序顺序集合而成；

对各运动对象的所述轨迹点集进行编码处理，得到各运动对象的轨迹特征；

根据各运动对象的所述轨迹特征，构建轨迹张量，以作为所述全局轨迹数据。

一种可能的设计中，所述融合模块63，具体用于：

利用训练好的特征提取模型处理所述融合信息，得到所述全局特征。

其中，本发明实施例所涉及到的所述特征提取模型至少包括：卷积神经网络CNN模型。

本发明实施例所涉及到的所述轨迹预测模型包括如下至少一种：长短期记忆网络LSTM模型、多层感知器MLP；

其中，所述多层感知器包括：循环神经网络RNN模型、门控循环单元GRU模型。

一种可能的设计中，所述轨迹预测模型为第一轨迹预测模型，所述第一轨迹预测模型用于预测所述待预测对象的目标轨迹。

另一种可能的设计中，所述轨迹预测模型为第二轨迹预测模型，所述第二轨迹预测模型用于预测所述区域中全部运动对象的运动轨迹；此时，预测模块64，具体用于：

将所述全局特征输入所述第二轨迹预测模型，获取所述第二轨迹预测模型输出的所述区域中全部运动对象的运动轨迹，并将所述全部运动对象中的所述待预测对象的运动轨迹，作为所述目标轨迹。

本发明实施例中，所述待预测对象包括如下至少一种：车辆、动物、人、机器人与无人飞行器。

此外，一种或可能的设计中，轨迹预测装置600还可以包括：

规划模块(图9未示出)，用于根据所述目标轨迹，为所述待预测对象进行运动规划。

图9所示实施例的轨迹预测装置600可用于执行上述方法实施例的技术方案，其实现原理和技术效果可以进一步参考方法实施例中的相关描述，可选的，该轨迹预测装置600可以是终端设备或后台服务器等。

应理解以上图9所示轨迹预测装置600的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块以软件通过处理元件调用的形式实现，部分模块通过硬件的形式实现。例如，预测模块64可以为单独设立的处理元件，也可以集成在轨迹预测装置600中，例如终端的某一个芯片中实现，此外，也可以以程序的形式存储于轨迹预测装置600的存储器中，由轨迹预测装置600的某一个处理元件调用并执行以上各个模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，ASIC)，或，一个或多个微处理器(digital singnal processor，DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)等。再如，当以上某个模块通过处理元件调度程序的形式实现时，该处理元件可以是通用处理器，例如中央处理器(Central Processing Unit，CPU)或其它可以调用程序的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，SOC)的形式实现。

并且，本发明实施例提供了一种轨迹预测装置，请参考图10，该轨迹预测装置600，包括：

存储器610；

处理器620；以及

计算机程序；

其中，计算机程序存储在存储器610中，并被配置为由处理器620执行以实现如上述实施例所述的方法。

其中，轨迹预测装置600中处理器620的数目可以为一个或多个，处理器620也可以称为处理单元，可以实现一定的控制功能。所述处理器620可以是通用处理器或者专用处理器等。在一种可选地设计中，处理器620也可以存有指令，所述指令可以被所述处理器620运行，使得所述轨迹预测装置600执行上述方法实施例中描述的轨迹预测方法。

在又一种可能的设计中，轨迹预测装置600可以包括电路，所述电路可以实现前述方法实施例中发送或接收或者通信的功能。

可选地，所述轨迹预测装置600中存储器610的数目可以为一个或多个，存储器610上存有指令或者中间数据，所述指令可在所述处理器620上被运行，使得所述轨迹预测装置600执行上述方法实施例中描述的方法。可选地，所述存储器610中还可以存储有其他相关数据。可选地处理器620中也可以存储指令和/或数据。所述处理器620和存储器610可以单独设置，也可以集成在一起。

此外，如图10所示，在该轨迹预测装置600中还设置有收发器630，其中，所述收发器630可以称为收发单元、收发机、收发电路、或者收发器等，用于与测试设备或其他终端设备进行数据传输或通信，在此不再赘述。

如图10所示，存储器610、处理器620与收发器630通过总线连接并通信。

若该轨迹预测装置600用于实现对应于图2中的方法时，例如，可以由收发器630获取全局语义数据与全局轨迹数据。而处理器620用于完成相应的确定或者控制操作，可选的，还可以在存储器610中存储相应的指令。各个部件的具体的处理方式可以参考前述实施例的相关描述。

此外，本发明实施例提供了一种可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行以实现如实施例一所述的方法。

此外，本发明实施例提供了一种驾驶系统，请参考图11，该驾驶系统800包括：

轨迹预测装置600，用于执行如实施例一中任一实现方式所述的方法；

运动控制器810，用于根据所述轨迹预测装置获取到的目标轨迹控制被控制对象运动。

其中，被控制对象与待预测对象为同一对象。例如，一种可能的设计中，车辆对自身的轨迹预测及路线规划场景中，运动控制器可根据轨迹预测装置600预测出的自身的目标轨迹，来实现对自身行驶路线的规划；以及，进一步地，可实现对被控制对象的自动运动，也就是，实现自动驾驶。

此外，被控制对象与待预测对象可以为不同对象。以前述场景为例，车辆可以对路面上与自身较为接近的其他车辆进行轨迹预测，以便于在执行自身的运动控制时，能够尽量避免与其他车辆或运动障碍物(车辆、人、动物等)的碰撞，以降低安全事故的发生概率，有利于提高安全性。

在另一具体的实现场景中，运动控制器810亦可将轨迹预测装置600获取到的目标轨迹进行输出，以便于用户在驾驶或控制被控制对象运动时，可以将该目标轨迹作为参考。尤其是在多个对象的场景中，通过对其他多个待预测对象进行目标轨迹的预测，更有利于提高多对象场景中的控制安全。

具体而言，被控制对象可以包括但不限于如下至少一种：车辆、动物、人、机器人与无人飞行器。此外，本发明实施例中对被控制对象的数目无特别限定，可以为一个或多个。例如，运动控制器可以为车辆的行驶控制器，也可以为无人飞行器的飞行控制器等，不再赘述。

此外，本发明实施例提供了一种车辆。

请参考图12，该车辆900包括：

轨迹预测装置600，用于执行如实施例一中任一实现方式所述的方法。

或者，如图13所示，该车辆900包括：

如图11所示的驾驶系统800。

此外，本发明实施例还提供了一种无人飞行器的控制装置。

一种可能的设计中，该无人飞行器的控制装置，包括：

另一设计中，该无人飞行器的控制装置，包括：

驾驶系统800。

具体的，无人飞行器与无人飞行器的控制装置可以独立设计，也可以组合设计(该控制装置设置于无人飞行器内部)，本发明实施例对此无特别限定。

可知，车辆与无人飞行器的控制装置为可承载前述轨迹预测装置的被控制对象，如前说书，除此之外，还进一步包括机器人或机器玩具等，不再赘述。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

由于本实施例中的各模块能够执行实施例一所示的方法，本实施例未详细描述的部分，可参考对实施例一的相关说明。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种轨迹预测方法，其特征在于，包括：

获取待预测对象所在区域的全局语义数据与全局轨迹数据；

融合所述全局语义数据与所述全局轨迹数据，得到全局融合数据；

提取所述全局融合数据中的特征，得到全局特征；

利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹。
根据权利要求1所述的方法，其特征在于，所述获取待预测对象所在区域的全局语义数据，包括：

获取所述待预测对象所在区域的全局区域图像；

对所述全局区域图像中的各像素分别进行语义识别，得到各像素的语义类别；

根据各像素的语义类别，对所述全局区域图像进行语义标注，得到所述全局语义信息。
根据权利要求2所述的方法，其特征在于，所述根据各像素的语义类别，对所述全局区域图像进行语义标注，得到所述全局语义信息，包括：

根据各像素的语义类别，对所述全局区域图像进行语义分割，得到多个语义对象；

对各语义对象分别进行语义标注，得到所述全局语义信息。
根据权利要求2或3所述的方法，其特征在于，所述全局区域图像为数字正射影像DOM图像。
根据权利要求1所述的方法，其特征在于，所述获取待预测对象所在区域的全局轨迹数据，包括：

获取所述待预测对象所在区域内各运动对象的轨迹点集，所述轨迹点集由所述运动对象的坐标点按照时序顺序集合而成；

对各运动对象的所述轨迹点集进行编码处理，得到各运动对象的轨迹特征；

根据各运动对象的所述轨迹特征，构建轨迹张量，以作为所述全局轨迹数据。
根据权利要求1-3、5中任一项所述的方法，其特征在于，所述提取所述全局融合数据中的特征，得到全局特征，包括：

利用训练好的特征提取模型处理所述融合信息，得到所述全局特征。
根据权利要求6所述的方法，其特征在于，所述特征提取模型至少包括：卷积神经网络CNN模型。
根据权利要求1所述的方法，其特征在于，所述轨迹预测模型包括如下至少一种：长短期记忆网络LSTM模型、多层感知器MLP；

其中，所述多层感知器包括：循环神经网络RNN模型、门控循环单元GRU模型。
根据权利要求1或8所述的方法，其特征在于，所述轨迹预测模型为第一轨迹预测模型，所述第一轨迹预测模型用于预测所述待预测对象的目标轨迹。
根据权利要求1或8所述的方法，其特征在于，所述轨迹预测模型为第二轨迹预测模型，所述第二轨迹预测模型用于预测所述区域中全部运动对象的运动轨迹；

所述利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹，包括：

将所述全局特征输入所述第二轨迹预测模型，获取所述第二轨迹预测模型输出的所述区域中全部运动对象的运动轨迹，并将所述全部运动对象中的所述待预测对象的运动轨迹，作为所述目标轨迹。
根据权利要求1所述的方法，其特征在于，所述待预测对象包括如下至少一种：车辆、动物、人、机器人与无人飞行器。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述目标轨迹，为所述待预测对象进行运动规划。
一种轨迹预测装置，其特征在于，包括：

获取模块，用于获取待预测对象所在区域的全局语义数据与全局轨迹数据；

融合模块，用于融合所述全局语义数据与所述全局轨迹数据，得到全局融合数据；

特征提取模块，用于提取所述全局融合数据中的特征，得到全局特征；

预测模块，用于利用训练好的轨迹预测模型处理所述全局特征，得到所述待预测对象的目标轨迹。
一种轨迹预测装置，其特征在于，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求1至12任一项所述的方法。
一种计算机可读存储介质，其特征在于，其上存储有计算机程序，

所述计算机程序被处理器执行以实现如权利要求1至12任一项所述的方法。
一种驾驶系统，其特征在于，包括：

轨迹预测装置，用于执行如权利要求1至12任一项所述的方法；

运动控制器，用于根据所述轨迹预测装置获取到的目标轨迹控制被控制对象运动。
一种车辆，其特征在于，包括：

如权利要求16所述的驾驶系统。