WO2021134169A1

WO2021134169A1 - 一种轨迹预测方法及相关设备

Info

Publication number: WO2021134169A1
Application number: PCT/CN2019/129820
Authority: WO
Inventors: 刘亚林; 宋晓琳; 施惠杰; 曹昊天
Original assignee: 华为技术有限公司
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2021-07-08
Also published as: CN112805730A; EP4074563A1; EP4074563A4

Abstract

一种轨迹预测方法，应用于人工智能领域下的自动驾驶，包括获取目标对象的姿态信息和历史运动轨迹信息(201)；基于所述姿态信息获取表示所述目标对象行为意图的目标信息(202)；以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹(203)。该方法将行人的行为意图作为行人轨迹预测的输入特征，可以减小行人轨迹的预测误差，提高行人轨迹的预测性能。

Description

一种轨迹预测方法及相关设备

技术领域

本申请涉及人工智能领域，尤其涉及一种轨迹预测方法及相关设备。

背景技术

随着经济的发展和人民生活水平的提高，汽车保有量逐年增长，导致了交通拥堵和交通事故的发生。为提高车辆驾驶的安全性，目前已将自动驾驶技术应用于车辆中，以实现车辆的自动驾驶。

车辆在自动驾驶过程中，需要对附近的行人的轨迹进行预测，现常用的行人轨迹预测方法有根据行人的历史轨迹信息进行行人的轨迹预测。然而行人的行走行为存在很多主观因素，因此上述基于行人的历史轨迹信息来预测行人未来的预测轨迹的方法的预测效果较差。

发明内容

本申请提供了一种轨迹预测方法及相关设备，将行人的行为意图作为行人轨迹预测的输入特征，可以减小行人轨迹的预测误差，提高行人轨迹的预测性能。

第一方面，本申请提供了一种轨迹预测方法，包括：获取目标对象的姿态信息和历史运动轨迹信息；基于所述姿态信息获取表示所述目标对象行为意图的目标信息；以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。

在第一方面的一种可选设计中，所述行为意图至少包括如下的一种：

由移动状态变为静止状态、保持移动状态、由静止状态变为移动状态、由第一移动状态变为第二移动状态。

在第一方面的一种可选设计中，所述目标对象包括多个骨架节点，所述姿态信息包括每个骨架节点在多个时刻的骨架节点位置。

在第一方面的一种可选设计中，所述目标对象包括第一骨架节点，所述姿态信息包括第一骨架节点位置、第二骨架节点位置和第三骨架节点位置，所述第一骨架节点位置为所述目标对象的第一骨架节点在第一时刻的位置，所述第三骨架节点位置为所述目标对象的第一骨架节点在第三时刻的位置，所述第二骨架节点位置对应于所述目标对象的第一骨架节点在第二时刻的位置，所述第一时刻、所述第二时刻和所述第三时刻为在时间维度上依次相邻的时刻，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。

在第一方面的一种可选设计中，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置。

在第一方面的一种可选设计中，所述方法还包括：

对所述每个骨架节点在多个时刻的骨架节点位置进行时刻上的间隔采样，得到处理后的姿态信息，所述处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

在第一方面的一种可选设计中，所述方法还包括：

对所述每个骨架节点在多个时刻的骨架节点位置进行归一化处理，得到归一化处理后的姿态信息，所述归一化处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

在第一方面的一种可选设计中，所述基于所述姿态信息获取表示所述目标对象行为意图的目标信息，包括：

以所述姿态信息为输入，通过循环神经网络模型，得到表示所述目标对象行为意图的目标信息。

在第一方面的一种可选设计中，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置位于所述预设坐标系中的预设位置。

其中，第一轨迹点位置可以是多个历史轨迹位置中的初始轨迹位置，或者是时间上最靠后的历史轨迹位置。预设坐标系中的预设位置可以是预设坐标系中的坐标原点，或者是预设坐标系中其他任意预设的坐标位置。

在第一方面的一种可选设计中，所述历史轨迹点位置为相对于地面的位置。

在第一方面的一种可选设计中，所述以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹，包括：

以所述目标信息和所述历史轨迹信息为输入，通过循环神经网络模型，得到所述目标对象的预测轨迹。

第二方面，本申请提供了一种执行设备，包括：

获取模块，用于获取目标对象的姿态信息和历史运动轨迹信息；

基于所述姿态信息获取表示所述目标对象行为意图的目标信息；

预测模块，用于以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。

在第二方面的一种可选设计中，所述行为意图至少包括如下的一种：

在第二方面的一种可选设计中，所述目标对象包括多个骨架节点，所述姿态信息包括每个骨架节点在多个时刻的骨架节点位置。

在第二方面的一种可选设计中，所述目标对象包括第一骨架节点，所述姿态信息包括第一骨架节点位置、第二骨架节点位置和第三骨架节点位置，所述第一骨架节点位置为所述目标对象的第一骨架节点在第一时刻的位置，所述第三骨架节点位置为所述目标对象的第一骨架节点在第三时刻的位置，所述第二骨架节点位置对应于所述目标对象的第一骨架节点在第二时刻的位置，所述第一时刻、所述第二时刻和所述第三时刻为在时间维度上依次相邻的时刻，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。

在第二方面的一种可选设计中，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置。

在第二方面的一种可选设计中，还包括：

采样模块，用于对所述每个骨架节点在多个时刻的骨架节点位置进行时刻上的间隔采样，得到处理后的姿态信息，所述处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

在第二方面的一种可选设计中，还包括：

归一化模块，用于对所述每个骨架节点在多个时刻的骨架节点位置进行归一化处理，得到归一化处理后的姿态信息，所述归一化处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

在第二方面的一种可选设计中，所述获取模块，具体用于：

在第二方面的一种可选设计中，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置位于所述预设坐标系中的预设位置。

在第二方面的一种可选设计中，所述历史轨迹点位置为相对于地面的位置。

在第二方面的一种可选设计中，所述预测模块，具体用于：

以所述目标信息和所述历史轨迹信息为输入，通过循环神经网络模型，得到输出向量；

将所述输出向量映射为所述目标对象的预测轨迹。

第三方面，本发明实施例提供了一种终端设备，包括存储器、通信接口及与所述存储器和通信接口耦合的处理器；所述存储器用于存储指令，所述处理器用于执行所述指令，所述通信接口用于在所述处理器的控制下与其他设备进行通信；其中，所述处理器执行所述指令时执行上述第一方面或第一方面可能的实施例中所描述的方法。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储了用于车辆控制的程序代码。所述程序代码包括用于执行上述第一方面或第一方面可能的实施例中所描述的方法的指令。

第五方面，提供了一种包括指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面或第一方面可能的实施例中所描述的方法。

本申请实施例提供了一种轨迹预测方法，包括获取目标对象的姿态信息和历史运动轨迹信息；基于所述姿态信息获取表示所述目标对象行为意图的目标信息；以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。通过上述方式，将行人的行为意图作为行人轨迹预测的输入特征，可以减小行人轨迹的预测误差，提高行人轨迹的预测性能，能够解决现有技术中行人运动轨迹预测不准确的问题，从而提高了车辆控制的安全性。

附图说明

图1A为人工智能主体框架的一种结构示意图；

图1B为本申请的一种可能的终端设备的结构示意图；

图1C为本申请的又一种可能的终端设备的结构示意图；

图1D为本申请实施例的一种可能的场景示意图；

图2为本申请实施例提供的一种轨迹预测方法的实施例示意图；

图3为本申请实施例提供的一种行人行为意图的示意；

图4为本申请实施例提供的一种历史轨迹信息处理示意；

图5为本申请实施例提供的一种混淆矩阵的示意；

图6为本实施例中所涉及的终端设备的一种可能的结构示意图；

图7为本申请实施例提供的另一种终端设备700的结构示意；

图8为本申请实施例提供的执行设备的一种结构示意图；

图9为本申请实施例提供的芯片的一种结构示意图。

具体实施方式

本申请实施例提供了一种轨迹预测方法方法及相关设备，用于减小行人轨迹的预测误差，提高行人轨迹的预测性能。

下面结合附图，对本申请的实施例进行描述。本领域普通技术人员可知，随着技术的发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

首先对人工智能系统总体工作流程进行描述，请参见图1A，图1A示出的为人工智能主体框架的一种结构示意图，下面从“智能信息链”(水平轴)和“IT价值链”(垂直轴)两个维度对上述人工智能主题框架进行阐述。其中，“智能信息链”反映从数据的获取到处理的一列过程。举例来说，可以是智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。在这个过程中，数据经历了“数据—信息—知识—智慧”的凝练过程。“IT价值链”从人智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程，反映人工智能为信息技术产业带来的价值。

(1)基础设施

基础设施为人工智能系统提供计算能力支持，实现与外部世界的沟通，并通过基础平台实现支撑。通过传感器与外部沟通；计算能力由智能芯片(CPU、NPU、GPU、ASIC、FPGA等硬件加速芯片)提供；基础平台包括分布式计算框架及网络等相关的平台保障和支持，可以包括云存储和计算、互联互通网络等。举例来说，传感器和外部沟通获取数据，这些数据提供给基础平台提供的分布式计算系统中的智能芯片进行计算。

(2)数据

基础设施的上一层的数据用于表示人工智能领域的数据来源。数据涉及到图形、图像、语音、文本，还涉及到传统设备的物联网数据，包括已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。

(3)数据处理

数据处理通常包括数据训练，机器学习，深度学习，搜索，推理，决策等方式。

其中，机器学习和深度学习可以对数据进行符号化和形式化的智能信息建模、抽取、预处理、训练等。

推理是指在计算机或智能系统中，模拟人类的智能推理方式，依据推理控制策略，利用形式化的信息进行机器思维和求解问题的过程，典型的功能是搜索与匹配。

决策是指智能信息经过推理后进行决策的过程，通常提供分类、排序、预测等功能。

(4)通用能力

对数据经过上面提到的数据处理后，进一步基于数据处理的结果可以形成一些通用的能力，比如可以是算法或者一个通用系统，例如，翻译，文本的分析，计算机视觉的处理，语音识别，图像的识别等等。

(5)智能产品及行业应用

智能产品及行业应用指人工智能系统在各领域的产品和应用，是对人工智能整体解决方案的封装，将智能信息决策产品化、实现落地应用，其应用领域主要包括：智能终端、智能制造、智能交通、智能家居、智能医疗、智能安防、自动驾驶、平安城市等。

下面将结合本发明的附图，对本发明实施例中的技术方案进行详细描述。

首先，介绍本申请适用的终端设备的结构示意图。如图1B示出本申请的一种可能的终端设备的结构示意图。如图1B，该终端设备包括环境感知模块102、规划决策模块104以及控制处理模块106。其中，所述环境感知模块102主要通过外围系统(如传感器、摄像头等)采集障碍物信息、终端设备所处的周围环境信息以及终端设备所在车辆的行驶信息。所述障碍物信息包括但不限于障碍物的地理位置、障碍物的运动速度、障碍物的运动方向、障碍物的运动加速度、障碍物的运动方向的方差、障碍物的运动速度的方差等信息。所述障碍物包括但不限于车辆、行人、有生命的活体障碍物以及无生命的障碍物等等。本申请将以所述障碍物为行人为例，具体阐述本申请所涉及的一些实施例。

所述周围环境信息包括但不限于地图信息、天气信息、路口类型、车道线、车道数量、道路是否拥塞、车流速度、车流加速度以及终端设备与障碍物之间的距离等等信息。

所述行驶信息包括但不限于车辆的地理位置、行驶速度、行驶方向、行驶加速度、车辆与障碍物之间的距离等等。所述终端设备包括但不限于汽车、火车、货车、小轿车等车辆以及安装在车辆上的通讯设备，如车载设备等。

所述规划决策模块104包括行为预测模块和规划模块。其中，所述行为预测模块主要用于根据环境感知模块所采集的上述信息预测障碍物的行为意图(如，本申请后文所述的行人的行为结果)以及该行为意图对应的运动轨迹(即障碍物轨迹)。所述规划模块用于在保证安全的前提下，根据所述行为意图获得对应的控制策略，以便后续利用该控制策略控制车辆进行安全行驶。所述控制策略为用户侧或终端设备侧预先自定义设置的，或者根据所述行为意图生成的，具体在下文中进行详述。所述控制策略用于指示对所述车辆进行相应车辆参数的调整，以实现车辆安全驾驶。

所述控制处理模块用于根据所述规划决策模块所获得的控制策略，对所述车辆进行相应地控制和调整，以避免车辆与障碍物发生碰撞。例如对车辆的方向盘转角、行驶速度、是否制动刹车、是否按压加速踏板等车辆参数进行控制。关于如何根据所述行人的行为结果(即行为意图)控制所述车辆的安全行驶，具体将在下文进行详细阐述。

如图1C示出本申请的又一种可能的终端设备的结构示意图。如图1C所示，终端设备100可包括：基带芯片110、存储器115，包括一个或多个计算机可读存储介质、射频(RF)模块116、外围系统117。这些部件可在一个或多个通信总线114上通信。

外围系统117主要用于实现终端设备110和用户(如行人)/外部环境之间的交互功能，主要包括终端100的输入输出装置。具体实现中，外围系统117可包括：触摸屏控制器118、摄像头控制器119、音频控制器120以及传感器管理模块121。其中，各个控制器可与各自对应的外围设备，例如触摸屏123、摄像头124、音频电路125以及传感器126，耦合。在一些实施例中，传感器126中的手势传感器可用于接收用户输入的手势控制操作。传感器126中的速度传感器可用于采集终端设备自身的行驶速度或用于采集环境中障碍物的运动速度等。触摸屏123可作为提示装置，主要用于通过屏幕显示、投影等方式来提示障碍物，例如在行人横穿马路时通过显示屏显示文字的方式来提示行人加速行走等。可选的，外围系统117还可包括灯光、显示器等其他提示装置，以用于车辆与行人之间的交互提示，避免车辆与行人发生碰撞。需要说明的，外围系统117还可以包括其他I/O外设。

基带芯片110可集成包括：一个或多个处理器111、时钟模块112以及电源管理模块113。集成于基带芯片110中的时钟模块112主要用于为处理器111产生数据传输和时序控制所需要的时钟。集成于基带芯片110中的电源管理模块113主要用于为处理器111、射频模块116以及外围系统提供稳定的、高精确度的电压。

射频(RF)模块116用于接收和发送射频信号，主要集成了终端100的接收器和发射器。射频(RF)模块116通过射频信号与通信网络和其他通信设备通信。具体实现中，射频(RF)模块116可包括但不限于：天线系统、RF收发器、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC芯片、SIM卡和存储介质等。在一些实施例中，可在单独的芯片上实现射频(RF)模块116。

存储器115与处理器111耦合，用于存储各种软件程序和/或多组指令。具体实现中，存储器115可包括高速随机存取的存储器，并且也可包括非易失性存储器，例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。存储器115可以存储操作系统，例如ANDROID，IOS，WINDOWS，或者LINUX等嵌入式操作系统。存储器115还可以存储网络通信程序，该网络通信程序可用于与一个或多个附加设备，一个或多个终端设备，一个或多个终端设备进行通信等。

其次，介绍本申请适用的一种可能的场景示意图。如图1D，在车辆往来的道路上，行人位于道路边缘的P1点位置，为防止车辆与行人发生碰撞，此时车辆需预测行人的运动轨迹，并基于预测的运动轨迹来控制自身的安全行驶，以避免与行人发生碰撞。例如，若预测行人P1点后的运动轨迹是运动轨迹b(横穿道路)，则可控制所述车辆减速行驶、甚至刹车等待等，以避让行人。又如，若预测行人P1点后的运动轨迹是运动轨迹a沿道路直行或在P1点停止，则可不需对车辆进行任何控制操作，也不会发生车辆和行人的碰撞。

在本申请人提出本申请的过程中发现：现有技术中预测行人的的运动轨迹是基于行人的历史轨迹信息，预测的结果并不准确，进而导致车辆控制的可靠性和安全性不高。为解决上述问题，本申请提出相应地的轨迹预测方法。下面进行详细阐述。

参照图2，图2为本申请实施例提供的一种轨迹预测方法的实施例示意图，如图2示出的那样，本申请实施例提供的一种轨迹预测方法，包括：

201、获取目标对象的姿态信息和历史运动轨迹信息。

以目标对象为行人为例，本申请实施例中，终端设备可以通过外围系统(例如传感器、摄像头等)获取的姿态信息。其中所述的姿态信息可用于预测行人即将出现的行为意图。本申请实施例中，终端设备可以以所述姿态信息为输入，通过循环神经网络，得到表示所述目标对象行为意图的目标信息。

本申请实施例中，可以获取目标对象的姿态信息，其中，所述目标对象包括多个骨架节点，所述姿态信息包括每个骨架节点在多个时刻的骨架节点位置。

本申请实施例中，可以首先获取行人的视频流，对获取到的视频流进行视频处理，进行卷积神经网络(convolutional neural networks，CNN)骨架拟合以获取多个时刻(换一种表述：视频流中的多个帧)的行人的骨架信息(下文也可以称为骨架像素坐标序列)，其中，行人每一时刻的骨架信息可以包括多个骨架节点位置，具体的，姿态信息可以表示为：

(x ₁,y ₁,x ₂,y ₂,…,x _i,y _i,…)；

其中i为骨架节点索引，(x _i,y _i)分别为索引为i的骨架节点在视频流中的像素横坐标和像素纵坐标。需要说明的是，在一种实施例中，考虑到头部关节点丢失概率比较大，可以对与行人头部关节点相关的骨架信息进行剔除处理。

需要说明的是，骨架节点可以为例如肘关节、踝关节等人体关节，这里并不限定骨架节点的种类。

示例性的，在获取到的12帧视频流中识别出某一行人，对视频流进行CNN骨架拟合以获取骨架信息，其中获取到的骨架信息为：X＝(X ₁,…,X _i,…,X ₁₂)；其中，X _i为第i时刻行人各个骨架节点位置，X _i＝(x ₁,y ₁,x ₂,y ₂,…,x _k,y _k,…x ₁₂,y ₁₂),k为骨架节点索引。

即，本申请实施例中，终端设备获取到目标对象的每个骨架节点在多个时刻的骨架节点位置。

可选的，在一种实施例中，所述目标对象包括第一骨架节点，所述姿态信息包括第一骨架节点位置、第二骨架节点位置和第三骨架节点位置，所述第一骨架节点位置为所述目标对象的第一骨架节点在第一时刻的位置，所述第三骨架节点位置为所述目标对象的第一骨架节点在第三时刻的位置，所述第二骨架节点位置对应于所述目标对象的第一骨架节点在第二时刻的位置，所述第一时刻、所述第二时刻和所述第三时刻为在时间维度上依次相邻的时刻，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。特别的，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置。

本申请实施例中，对于获取到的视频流中，某一帧或者多个帧的骨架信息丢失的情况，可以利用前后帧骨架节点位置进行插值补充处理，插值方式可以为对前后帧对应的骨架节点的骨架节点位置取平均值或者是其他运算作为丢失的骨架节点位置。

具体的，姿态信息包括目标对象的第一骨架节点在第一时刻的第一骨架节点位置、第二时刻的第二骨架节点位置以及第三时刻的第三骨架节点位置，例如第一骨架节点可以为行人肘关节节点，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。例如，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置，即第二骨架节点位置为对前后帧对应的骨架节点的骨架节点位置(第一骨架节点位置和第三骨架节点位置)取平均值得到的。

示例性的，在A时刻，行人的骨架信息为：

XA _i＝(x _A1,y _A1,x _A2,y _A2,…,x _Ak,y _Ak,…x _A12,y _A12)；

在B时刻，行人的骨架信息为：

X _Bi＝(x _B1,y _B1,x _B3,y _B3,…,x _Bk,y _Bk,…x _B12,y _B12)；

在C时刻，行人的骨架信息为：

X _Ci＝(x _C1,y _C1,x _C2,y _C2,…,x _Ck,y _Ck,…x _C12,y _C12)；

可见，在B时刻，肘关节的骨架信息中缺失了一帧骨架节点位置：(x _B2,y _B2)，为了补充缺失的骨架节点位置(x _B2,y _B2)，可以参照前后帧的肘关节的骨架节点位置(x _A2,y _A2)以及(x _C2,y _C2)，特别的，可以按照如下公式补充缺失的骨架节点位置：

可选的，在一种实施例中，终端设备可以对所述每个骨架节点在多个时刻的骨架节点位置进行时刻上的间隔采样，得到处理后的姿态信息，所述处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

示例性的，本实施例中可以对所述姿态信息在多个时刻上进行等间隔采样，设(x ₁，y ₁，x ₂，y ₂，…，x _i，y _i，…x _n，y _n)为某一骨架节点的骨架像素坐标序列，其中n可以为偶数，(x _i,y _i)为第i时刻的该骨架节点的骨架像素坐标，可以通过t＝2的等间隔采样，则，骨架像素坐标序列变为(x ₁,y ₁,x ₃,y ₃,…,x _n-1,y _n-1)。

本申请实施例中，为了克服采集的视频帧在像素较低且部分帧行人尺度较小时，由于不同行为意图类别骨架信息之间差异不明显而导致行人行为意图预测精度大幅下降的问题，可以对所述姿态信息在多个时刻上进行等间隔采样，来扩大不同行为意图类别骨架信息之间的差异。

可选的，在一种实施例中，终端设备可以对所述每个骨架节点在多个时刻的骨架节点位置进行归一化处理，得到归一化处理后的姿态信息，所述归一化处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

示例性的，可以对每一骨架节点的时序序列进行如下的内部归一化：

其中，x _min为某节点在该段序列像素横(纵)坐标的最小值，x _max为某节点在该段序列像素横(纵)坐标的最大值。

本申请实施例中，为了克服采集的视频帧在像素较低且部分帧行人尺度较小时，由于不同行为意图类别骨架信息之间差异不明显而导致行人行为意图预测精度大幅下降的问题，可以对骨架信息进行序列内部归一化处理，以扩大不同类别骨架信息差异，从而提高行人意图的预测性能。

本申请实施例中，还可以获取到目标对象的历史运动轨迹信息，特别的，行人的历史运动轨迹信息可以由车辆传感器(如毫米波雷达等)采集得到。行人的历史运动轨迹信息中行人的轨迹坐标形式可以为(x ₁,y ₁,x ₂,y ₂,…,x _i,y _i,…)，其中(x _i,y _i)是第i时刻的行人位置坐标。

可选的，在一种实施例中，可选的，在一种实施例中，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置为所述多个时刻中的初始时刻的轨迹点位置，所述第一轨迹点位置位于所述预设坐标系中的预设位置。特别的，所述历史轨迹点位置为相对于地面的位置。

本申请实施例中，可以对原始行人的历史轨迹通过预处理得到新坐标系下的历史轨迹点位置。具体的，终端设备获取到的历史轨迹点位置可以是和车辆之间的相对位移产生的移动轨迹，为解决行人轨迹受到车辆运动干扰的问题，还原行人的真实历史轨迹坐标，可以将车辆运动位移加入到行人原始轨迹中，即对行人的历史轨迹进行车辆位移补偿，得到相对于地面的历史轨迹信息。

本申请实施例中，为提升行人轨迹的预测精度，可以以行人轨迹预测起点为参考原点进行行人轨迹坐标变换，具体的，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置可以为所述多个时刻中的初始时刻的轨迹点位置，也可以为所述多个时刻中的最后一个时刻的轨迹点位置，这里并不限定，所述第一轨迹点位置位于所述预设坐标系中的预设位置，其中预设位置可以为预设坐标系的原点(0,0)。

示例性的，可以参照图4，图4为本申请实施例提供的一种历史轨迹信息处理示意，如图4示出的那样，O ₁为车辆的坐标参考系原点，0 ₂为行人的初始时刻的轨迹点位置，行人的历史轨迹信息可以在以O ₂点为坐标原点的坐标系中表示。

特别的，为减少传感器采集噪声对行人轨迹的影响，还可以对获取到的行人历史轨迹信息进行轨迹平滑处理。

202、基于所述姿态信息获取表示所述目标对象行为意图的目标信息。

本申请实施例中，终端设备可以以所述姿态信息为输入，通过循环神经网络模型，得到表示所述目标对象行为意图的目标信息。其中，循环神经网络模型可以是长短期记忆网络(long short-term memory，LSTM)或门控循环单元GRU，接下来以循环神经网络模型为长短期记忆网络LSTM为例进行说明。

关于LSTM：

LSTM算法是一种特定形式的循环神经网络(recurrent neural network，RNN)，而RNN是一系列能够处理序列数据的神经网络的总称。RNN还有许多变形，例如双向RNN(bidirectional RNN)等。然而，RNN在处理长期依赖(时间序列上距离较远的节点)时会遇到巨大的困难，因为计算距离较远的节点之间的联系时会涉及雅可比矩阵的多次相乘，这会带来梯度消失(经常发生)或者梯度膨胀(较少发生)的问题，为了解决该问题，最广泛的就是门限RNN(Gated RNN)，而LSTM就是门限RNN中最著名的一种。有漏单元通过设计连接间的权重系数，从而允许RNN累积距离较远节点间的长期联系；而门限RNN则泛化了这样的思想，允许在不同时刻改变该系数，且允许网络忘记当前已经累积的信息。LSTM就是这样的门限RNN。LSTM通过增加输入门限，遗忘门限和输出门限，使得自循环的权重是变化的，这样，在模型参数固定的情况下，不同时刻的积分尺度可以动态改变，从而避免了梯度消失或者梯度膨胀的问题。

本申请实施例中，行人作为重要的交通参与者，其行为意图以及未来出现位置的预测对智能车辆的前方风险评估具有十分重要的意义。具体的，终端设备可以基于获取到的目标对象的姿态信息，判断出与该姿态信息对应的行人具有何种行为意图，其中，所述行为意图可以至少包括如下的一种：由移动状态变为静止状态(stopping)、保持移动状态(crossing)、由静止状态变为移动状态(starting)、由第一移动状态变为第二移动状态(bending)，其中，第一移动状态可以理解为在一定的区域内移动(例如车道边缘附近的人行道上移动)，第二移动状态可以理解为进入到车道区域(例如横穿车道)。接下来分别对各个行为意图进行详细的描述：

一、由移动状态变为静止状态(stopping)：

本申请实施例中，行人的行为意图可以是由移动状态变为静止状态，其中，移动状态可以理解为行人将从人行道移动至车道边缘，静止状态可以理解为行人当移动至车道边缘时将停止移动，参照图3，图3为本申请实施例提供的一种行人行为意图的示意，如图3示出的那样，针对于由移动状态变为静止状态(stopping)的行为意图，行人可以向车道边缘行走，当行走至道路边缘时，停止移动。

二、保持移动状态(crossing)：

本申请实施例中，行人的行为意图可以是保持移动状态(crossing)，其中，移动状态可以理解为行人将保持持续性的移动，例如从人行道移动至车道边缘并持续移动以行走至车道区域，如图3示出的那样，针对于保持移动状态(crossing)的行为意图，行人可以从人行道移动至车道，并横穿过车道。

三、由静止状态变为移动状态(starting)：

本申请实施例中，行人的行为意图可以是由静止状态变为移动状态(starting)，其中，静止状态可以理解为行人在某一区域(例如位于人行道一侧的车道边缘)处于静止状态，移动状态可以理解为行人将从上述某一区域开始移动(例如行走至车道区域)，如图3示出的那样，针对于由静止状态变为移动状态(starting)的行为意图，行人可以从车道边缘开始行走，并横穿过车道。

四、由第一移动状态变为第二移动状态(bending)：

本申请实施例中，行人的行为意图可以是由第一移动状态变为第二移动状态(bending)，其中，第一移动状态可以理解为在某一区域内移动(例如车道边缘附近移动)，第二移动状态可以理解为进入到车道区域(例如行走至车道区域)，如图3示出的那样，针对于由第一移动状态变为第二移动状态(bending)的行为意图，行人可以从车道边缘徘徊，然后横穿通过车道。

示例性的，以所述行为意图包括由移动状态变为静止状态、保持移动状态、由静止状态变为移动状态、由第一移动状态变为第二移动状态四种行为意图为例：

LSTM网络的输入为预处理过后的行人骨架节点信息序列(姿态信息)。在LSTM网络中，通过对预处理后的骨架节点信息序列进行计算，得到如下的骨架序列特征向量，即：

out＝(0 ₁,0 ₂,0 ₃,0 ₄)；

其中(0 ₁,0 ₂,0 ₃,0 ₄)分别代表该骨架节点信息序列经过LSTM网络得到的关于四种行人的行为意图(由静止状态变为移动状态bending，保持移动状态crossing，由静止状态变为移动状态starting，由移动状态变为静止状态stopping)的分向量。通过softmax函数将上述骨架序列特征向量out转化为关于四种行人的行为意图的概率分布P＝(p ₁,p ₂,p ₃,p ₄),示例性的，通过softmax函数得到概率分布P的表达式可以为如下公式：

其中o _i为骨架特征向量out中关于第i类意图的分向量，P _i是该骨架序列特征向量属于第i类意图的概率。取概率分布(p ₁,p ₂,p ₃,p ₄)中概率最大项的行为意图类别作为目标对象的行为意图。

本申请实施例中，终端设备可以基于所述姿态信息获取表示所述目标对象行为意图的目标信息。其中目标信息可以是表示目标对象行为意图的标识或者是其他可以唯一指示行为意图的信息。

本申请实施例中，在训练用于预测行人的行为意图的LSTM网络时，可以采用损失采用交叉熵，即通过如下损失函数进行LSTM网络的训练：

其中，p(x)和q(x)可以分别代表输入x的真实概率分布和预测概率分布。预测概率分布和真实概率分布越接近，损失越小。需要说明的是，以上损失函数仅为一种示意，并不构成对本申请的限定。

203、以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。

本申请实施例中，终端设备在获取到表示所述目标对象行为意图的目标信息和历史运动轨迹信息之后，可以将所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。

具体的，本申请实施例中，终端设备可以以所述目标信息和所述历史轨迹信息为输入，通过循环神经网络模型，得到所述目标对象的预测轨迹。接下来以循环神经网络为LSTM网络为例进行说明：

LSTM网络的输入为历史轨迹信息和目标信息，上述输入信息经LSTM网络的编码层转化为编码层的输出向量out _b,LSTM网络的解码层将编码层的输出向量out _b映射为行人的预测轨迹，预测轨迹可以包括预测的轨迹坐标，例如预测轨迹可以为(x ₁,y ₁,x ₂,y ₂,…,x _i,y _i,…x _p,y _p),其中(x _i,y _i)是未来第i时刻预测的行人的位置坐标,p为预测未来轨迹的时刻长度。

本申请实施例中，在训练用于预测行人的轨迹的LSTM网络时可以采用均方误差(mean square error，MSE)作为损失函数，示例性的，均方误差的表达式可以为如下函数：

以上损失函数仅为一种示意，并不构成对本申请的限定。

示例性的，接下来描述一个行人轨迹预测的实例：

设历史时刻长度为32(2s)，未来时刻长度为16(1s)，对行人视频流进行CNN骨架拟合以获取行人的骨架节点信息序列，骨架信息序列为X＝(X ₁,…,X _i,…,X ₃₂)；其中，X _i为第i时刻行人各个骨架节点位置，X _i＝(x ₁,y ₁,x ₂,y ₂,…,x _k,y _k,…x ₁₂,y ₁₂),k为骨架节点索引。

对丢失的行人骨架信息进行如上述实施例描述的插值补充处理，对该序列的行人骨架信息进行如上述实施例描述的t＝2的间隔采样处理，对该序列的行人骨架信息序列进行如上述实施例描述的序列内部归一化处理。

该预处理过后的行人骨架信息序列需经过训练好的LSTM行人意图识别模型来得到预测的行人意图。该LSTM行人意图识别模型可以为单层LSTM模型，输入数据维度为(batch_size，32，24)，其中batch_size为批处理的数据量，在该实施例中batch_size可以等于1，32为骨架特征的历史时刻长度，24为每个时刻的骨架特征维度，该模型在219个测试样本下的预测准确率为95.43％，得到的混淆矩阵如图5所示，图5为本申请实施例提供的一种混淆矩阵的示意。预处理后的骨架信息序列经LSTM行人意图预测网络得到的输出为行人意图预测概率分布P＝(p ₁,p ₂,p ₃,p ₄)，取概率分布(p ₁,p ₂,p ₃,p ₄)中概率最大项的行为意图类别作为目标对象的行为意图。本实施例中的骨架信息序列经过意图识别模型得到的行为意图类别为3(其中，bending表示为1，crossing表示为2，starting表示为3， stopping表示为4)。

接下来，对与行人骨架信息序列对应的行人历史轨迹信息进行车辆位移补偿、轨迹平滑处理、轨迹坐标变换后得到新坐标系下的行人历史坐标Y＝(x ₁,y ₁,x ₂,y ₂,…,x _k,y _k,…x ₃₂,y ₃₂) _。

预测的表示行人行为意图的目标信息intention和对应的预处理后的行人历史轨迹信息一起作为训练好的LSTM行人轨迹预测模型的输入。历史轨迹信息和目标信息intention的联合输入形式可以为(x ₁,y ₁,intention,…,x _i,y _i,intention,…x ₃₂,y ₃₂,intention)，因此输入数据维度为(batch_size，32，3)，其中batch_size为批处理的数据量，在该实施例中batch_size＝1，32为轨迹信息的历史时刻长度，3为每个时刻的坐标和意图特征的数据维度。输入的意图特征信息和历史轨迹信息经过LSTM的编码过程得到编码层的输出向量out _b,LSTM网络的解码层将编码层的输出向量out _b映射为行人的预测轨迹，由此得到该行人未来16个时刻的预测位置坐标。预测的行人未来16个时刻的位置坐标可以如表1所示。

表1：某starting意图的行人预测未来轨迹坐标

时刻	1	2	3	4	…	13	14	15	16
X(m)	-0.0650	-0.1377	-0.2089	-0.2784	…	-0.9294	-1.0080	-1.0872	-1.1668
Y(m)	-0.0016	-0.0068	-0.0049	-0.0014	…	0.0098	0.0144	0.0196	0.0255

本实施例可以以平均绝对误差MAE来衡量轨迹预测模型的预测性能，具体的，取测试样本数M取值为1，则16个时刻对应的平均绝对误差MAE如表2所示。

表2：行人轨迹预测平均绝对误差

时刻	1	2	3	4	…	13	14	15	16
MAE(m)	0.0158	0.0496	0.0899	0.1133	…	0.1398	0.1416	0.1599	0.1796

本申请实施例提供了一种轨迹预测方法，包括获取目标对象的姿态信息和历史运动轨迹信息；基于所述姿态信息获取表示所述目标对象行为意图的目标信息；以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。通过上述方式，将行人的行为意图作为行人轨迹预测的输入特征之一，可以减小行人轨迹的预测误差，提高行人轨迹的预测性能，能够解决现有技术中行人运动轨迹预测不准确的问题，从而提高了车辆控制的安全性。

上述主要从终端设备的角度出发对本发明实施例提供的方案进行了介绍。可以理解的是，终端设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。结合本发明中所公开的实施例描述的各示例的单元及算法步骤，本发明实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明实施例的技术方案的范围。

本发明实施例可以根据上述方法示例对终端设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本发明实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

在采用集成的单元的情况下，图6示出了上述实施例中所涉及的终端设备的一种可能的结构示意图。终端设备600包括：获取模块601，用于获取目标对象的姿态信息和历史运动轨迹信息；基于所述姿态信息获取表示所述目标对象行为意图的目标信息；预测模块602，用于以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。

可选的，所述行为意图至少包括如下的一种：由移动状态变为静止状态、保持移动状态、由静止状态变为移动状态、由第一移动状态变为第二移动状态。

可选的，所述目标对象包括多个骨架节点，所述姿态信息包括每个骨架节点在多个时刻的骨架节点位置。

可选的，所述目标对象包括第一骨架节点，所述姿态信息包括第一骨架节点位置、第二骨架节点位置和第三骨架节点位置，所述第一骨架节点位置为所述目标对象的第一骨架节点在第一时刻的位置，所述第三骨架节点位置为所述目标对象的第一骨架节点在第三时刻的位置，所述第二骨架节点位置对应于所述目标对象的第一骨架节点在第二时刻的位置，所述第一时刻、所述第二时刻和所述第三时刻为在时间维度上依次相邻的时刻，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。

可选的，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置。

可选的，终端设备600还包括：采样模块，用于对所述每个骨架节点在多个时刻的骨架节点位置进行时刻上的间隔采样，得到处理后的姿态信息，所述处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

可选的，终端设备600还包括：归一化模块，用于对所述每个骨架节点在多个时刻的骨架节点位置进行归一化处理，得到归一化处理后的姿态信息，所述归一化处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。

可选的，所述获取模块601，具体用于：以所述姿态信息为输入，通过长短期记忆网络LSTM，得到表示所述目标对象行为意图的目标信息。

可选的，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置为所述多个时刻中的初始时刻的轨迹点位置，所述第一轨迹点位置位于所述预设坐标系中的预设位置。

可选的，所述历史轨迹点位置为相对于地面的位置。

可选的，所述预测模块602，具体用于：以所述目标信息和所述历史轨迹信息为输入，通过循环神经网络模型，得到输出向量；将所述输出向量映射为所述目标对象的预测轨迹。

可选的，终端设备600还可以包括存储单元，用于存储终端设备600的程序代码和数据。

本申请实施例中，上述预测模块601可以集成在处理模块中，其中，处理模块可以是处理器或控制器，例如可以是中央处理器(central processing unit，CPU)，通用处理器，数字信号处理器(digital signal processor，DSP)，专用集成电路(application-specific integrated circuit，ASIC)，现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

参照图7，图7为本申请实施例提供的另一种终端设备700的结构示意。

参阅图7所示，该终端设备700包括：处理器712、通信接口713、存储器77。可选地，终端设备700还可以包括总线714。其中，通信接口713、处理器712以及存储器77可以通过总线714相互连接；总线714可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。所述总线714可以分为地址总线、数据总线、控制总线等。为便于表示，图7B中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

其中，处理器712可以执行如下步骤：

获取目标对象的姿态信息和历史运动轨迹信息；

以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。

可选的，所述行为意图至少包括如下的一种：

可选的，处理器712可以执行如下步骤：

可选的，所述历史轨迹点位置为相对于地面的位置。

可选的，处理器712可以执行如下步骤：

将所述输出向量映射为所述目标对象的预测轨迹。

上述图7所示的终端设备的具体实现还可以对应参照前述所述实施例的相应描述，此处不再赘述。

接下来介绍本申请实施例提供的一种执行设备，请参阅图8，图8为本申请实施例提供的执行设备的一种结构示意图。其中，执行设备800上可以部署有图6或图7对应实施例中所描述的终端设备，用于实现图6和图7对应实施例中终端设备的功能。具体的，执行设备800包括：接收器801、发射器802、处理器803和存储器804(其中执行设备800中的处理器803的数量可以一个或多个，图8中以一个处理器为例)，其中，处理器803可以包括应用处理器8031和通信处理器8032。在本申请的一些实施例中，接收器801、发射器802、处理器803和存储器804可通过总线或其它方式连接。

存储器804可以包括只读存储器和随机存取存储器，并向处理器803提供指令和数据。存储器804的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory，NVRAM)。存储器804存储有处理器和操作指令、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集，其中，操作指令可包括各种操作指令，用于实现各种操作。

处理器803控制执行设备的操作。具体的应用中，执行设备的各个组件通过总线系统耦合在一起，其中总线系统除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都称为总线系统。

上述本申请实施例揭示的方法可以应用于处理器803中，或者由处理器803实现。处理器803可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器803中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器803可以是通用处理器、数字信号处理器(digital signal processing，DSP)、微处理器或微控制器，还可进一步包括专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field-programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。该处理器803可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器804，处理器803读取存储器804中的信息，结合其硬件完成上述方法的步骤。

接收器801可用于接收输入的数字或字符信息，以及产生与执行设备的相关设置以及功能控制有关的信号输入。发射器802可用于通过第一接口输出数字或字符信息；发射器802还可用于通过第一接口向磁盘组发送指令，以修改磁盘组中的数据。

本申请实施例中还提供一种包括计算机程序产品，当其在计算机上运行时，使得计算机执行如前述图6或图7所示实施例描述的方法中终端设备所执行的步骤。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有用于进行信号处理的程序，当其在计算机上运行时，使得计算机执行如前述图6或图7所示实施例描述的方法中终端设备所执行的步骤。

本申请实施例提供的执行设备或终端设备具体可以为芯片，芯片包括：处理单元和通信单元，所述处理单元例如可以是处理器，所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令，以使执行设备内的芯片执行上述图2所示实施例描述的轨迹预测方法。可选地，所述存储单元为所述芯片内的存储单元，如寄存器、缓存等，所述存储单元还可以是所述无线接入设备端内的位于所述芯片外部的存储单元，如只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)等。

具体的，请参阅图9，图9为本申请实施例提供的芯片的一种结构示意图，所述芯片可以表现为神经网络处理器NPU 900，NPU 900作为协处理器挂载到主CPU(Host CPU)上，由Host CPU分配任务。NPU的核心部分为运算电路，通过控制器904控制运算电路903提取存储器中的矩阵数据并进行乘法运算。

在一些实现中，运算电路903内部包括多个处理单元(Process Engine，PE)。在一些实现中，运算电路903是二维脉动阵列。运算电路903还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中，运算电路903是通用的矩阵处理器。

举例来说，假设有输入矩阵A，权重矩阵B，输出矩阵C。运算电路从权重存储器902中取矩阵B相应的数据，并缓存在运算电路中每一个PE上。运算电路从输入存储器901中取矩阵A数据与矩阵B进行矩阵运算，得到的矩阵的部分结果或最终结果，保存在累加器(accumulator)908中。

统一存储器906用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器(Direct Memory Access Controller，DMAC)905，DMAC被搬运到权重存储器902中。输入数据也通过DMAC被搬运到统一存储器906中。

BIU为Bus Interface Unit即，总线接口单元910，用于AXI总线与DMAC和取指存储器(Instruction Fetch Buffer，IFB)909的交互。

总线接口单元910(Bus Interface Unit，简称BIU)，用于取指存储器909从外部存储器获取指令，还用于存储单元访问控制器905从外部存储器获取输入矩阵A或者权重矩阵B的原数据。

DMAC主要用于将外部存储器DDR中的输入数据搬运到统一存储器906或将权重数据搬运到权重存储器902中或将输入数据数据搬运到输入存储器901中。

向量计算单元907包括多个运算处理单元，在需要的情况下，对运算电路的输出做进一步处理，如向量乘，向量加，指数运算，对数运算，大小比较等等。主要用于神经网络中非卷积/全连接层网络计算，如Batch Normalization(批归一化)，像素级求和，对特征平面进行上采样等。

在一些实现中，向量计算单元907能将经处理的输出的向量存储到统一存储器906。例如，向量计算单元907可以将线性函数和/或非线性函数应用到运算电路903的输出，例如对卷积层提取的特征平面进行线性插值，再例如累加值的向量，用以生成激活值。在一些实现中，向量计算单元907生成归一化的值、像素级求和的值，或二者均有。在一些实现中，处理过的输出的向量能够用作到运算电路903的激活输入，例如用于在神经网络中的后续层中的使用。

控制器904连接的取指存储器(instruction fetch buffer)909，用于存储控制器904使用的指令；

统一存储器906，输入存储器901，权重存储器902以及取指存储器909均为On-Chip存储器。外部存储器私有于该NPU硬件架构。

其中，上述任一处提到的处理器，可以是一个通用中央处理器，微处理器，ASIC，或一个或多个用于控制上述第一方面方法的程序执行的集成电路。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，训练设备，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、训练设备或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、训练设备或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的训练设备、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

Claims

一种轨迹预测方法，其特征在于，所述方法包括：

获取目标对象的姿态信息和历史运动轨迹信息；

基于所述姿态信息获取表示所述目标对象行为意图的目标信息；

以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。
根据权利要求1所述的方法，其特征在于，所述行为意图至少包括如下的一种：

由移动状态变为静止状态、保持移动状态、由静止状态变为移动状态、由第一移动状态变为第二移动状态。
根据权利要求1或2所述的方法，其特征在于，所述目标对象包括多个骨架节点，所述姿态信息包括每个骨架节点在多个时刻的骨架节点位置。
根据权利要求3所述的方法，其特征在于，所述目标对象包括第一骨架节点，所述姿态信息包括第一骨架节点位置、第二骨架节点位置和第三骨架节点位置，所述第一骨架节点位置为所述目标对象的第一骨架节点在第一时刻的位置，所述第三骨架节点位置为所述目标对象的第一骨架节点在第三时刻的位置，所述第二骨架节点位置对应于所述目标对象的第一骨架节点在第二时刻的位置，所述第一时刻、所述第二时刻和所述第三时刻为在时间维度上依次相邻的时刻，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。
根据权利要求4所述的方法，其特征在于，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置。
根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

对所述每个骨架节点在多个时刻的骨架节点位置进行时刻上的间隔采样，得到处理后的姿态信息，所述处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。
根据权利要求3至5任一所述的方法，其特征在于，所述方法还包括：

对所述每个骨架节点在多个时刻的骨架节点位置进行归一化处理，得到归一化处理后的姿态信息，所述归一化处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。
根据权利要求1至7任一所述的方法，其特征在于，所述基于所述姿态信息获取表示所述目标对象行为意图的目标信息，包括：

以所述姿态信息为输入，通过循环神经网络模型，得到表示所述目标对象行为意图的目标信息。
根据权利要求1至8任一所述的方法，其特征在于，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置位于所述预设坐标系中的预设位置。
根据权利要求9所述的方法，其特征在于，所述历史轨迹点位置为相对于地面的位置。
根据权利要求1至10任一所述的方法，其特征在于，所述以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹，包括：

以所述目标信息和所述历史轨迹信息为输入，通过循环神经网络模型，得到所述目标对象的预测轨迹。
一种执行设备，其特征在于，包括：

获取模块，用于获取目标对象的姿态信息和历史运动轨迹信息；

基于所述姿态信息获取表示所述目标对象行为意图的目标信息；

预测模块，用于以所述目标信息和所述历史轨迹信息为输入，通过轨迹预测模型，得到所述目标对象的预测轨迹。
根据权利要求12所述的执行设备，其特征在于，所述行为意图至少包括如下的一种：

由移动状态变为静止状态、保持移动状态、由静止状态变为移动状态、由第一移动状态变为第二移动状态。
根据权利要求12或13所述的执行设备，其特征在于，所述目标对象包括多个骨架节点，所述姿态信息包括每个骨架节点在多个时刻的骨架节点位置。
根据权利要求14所述的执行设备，其特征在于，所述目标对象包括第一骨架节点，所述姿态信息包括第一骨架节点位置、第二骨架节点位置和第三骨架节点位置，所述第一骨架节点位置为所述目标对象的第一骨架节点在第一时刻的位置，所述第三骨架节点位置为所述目标对象的第一骨架节点在第三时刻的位置，所述第二骨架节点位置对应于所述目标对象的第一骨架节点在第二时刻的位置，所述第一时刻、所述第二时刻和所述第三时刻为在时间维度上依次相邻的时刻，所述第二骨架节点位置与所述第一骨架节点位置和/或第三骨架节点位置有关。
根据权利要求15所述的执行设备，其特征在于，所述第二骨架节点位置为所述第一骨架节点位置和所述第三骨架节点位置的中心位置。
根据权利要求14或15所述的执行设备，其特征在于，还包括：

采样模块，用于对所述每个骨架节点在多个时刻的骨架节点位置进行时刻上的间隔采样，得到处理后的姿态信息，所述处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。
根据权利要求14至16任一所述的执行设备，其特征在于，还包括：

归一化模块，用于对所述每个骨架节点在多个时刻的骨架节点位置进行归一化处理，得到归一化处理后的姿态信息，所述归一化处理后的姿态信息用于获取表示所述目标对象行为意图的目标信息。
根据权利要求12至18任一所述的执行设备，其特征在于，所述获取模块，具体用于：

以所述姿态信息为输入，通过循环神经网络模型，得到表示所述目标对象行为意图的目标信息。
根据权利要求12至19任一所述的执行设备，其特征在于，所述历史轨迹信息包括多个时刻的历史轨迹点位置，每个时刻对应一个历史轨迹点位置，其中，所述多个时刻的历史轨迹点位置基于预设坐标系来表示，所述多个时刻的历史轨迹点位置包括第一轨迹点位置，所述第一轨迹点位置位于所述预设坐标系中的预设位置。
根据权利要求20所述的执行设备，其特征在于，所述历史轨迹点位置为相对于地面的位置。
根据权利要求12至21任一所述的执行设备，其特征在于，所述预测模块，具体用于：

以所述目标信息和所述历史轨迹信息为输入，通过循环神经网络模型，得到所述目标对象的预测轨迹。
一种终端设备，其特征在于，包括存储器、通信接口及与所述存储器和通信接口耦合的处理器；所述存储器用于存储指令，所述处理器用于执行所述指令，所述通信接口用于在所述处理器的控制下与目标车辆进行通信；其中，所述处理器执行所述指令时执行如上权利要求1-11中任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述方法。