CN117707166A

CN117707166A - 一种环卫车路径规划决策方法及系统

Info

Publication number: CN117707166A
Application number: CN202311732124.4A
Authority: CN
Inventors: 任良才; 何柳; 高警卫
Original assignee: Jiangsu XCMG Guozhong Laboratory Technology Co Ltd
Current assignee: Jiangsu XCMG Guozhong Laboratory Technology Co Ltd
Priority date: 2023-12-14
Filing date: 2023-12-14
Publication date: 2024-03-15

Abstract

本发明公开了一种环卫车路径规划决策方法及系统，方法包括：在环卫车作业过程中，获取待清扫垃圾的坐标点、环卫车的位置信息以及动态障碍物的历史状态数据和环境数据；根据待清扫垃圾的坐标点和环卫车的位置信息，生成多个环卫车规划信息；环卫车规划信息包括规划轨迹点坐标、横摆角速度和作业意图；根据动态障碍物的历史状态数据和环境数据，生成动态障碍物轨迹预测信息；动态障碍物轨迹预测信息包括至少一个动态障碍物预测轨迹、意图以及对应的概率；基于动态障碍物轨迹预测信息，利用博弈论方法，从多个环卫车规划信息中确定最终的环卫车路径规划决策结果。使得无人环卫车在作业时尽可能节省资源，并且提高环卫车的安全性及作业效率。

Description

一种环卫车路径规划决策方法及系统

技术领域

本发明属于智能车辆技术领域，涉及一种环卫车路径规划决策方法及系统。

背景技术

环卫产业作为城市的基础建设，以及居民赖以生存的物质条件，亟需智能化转型。自动驾驶赋能，为城市环卫转型升级注入新动力。

自动驾驶环卫车集人工智能、机器视觉、图像识别、精准定位等多种人工智能技术于一体，充分发挥物联网、云计算、大数据等信息化网络平台作用，能够根据实时感知的环境信息，预测周边事物和行人的行为和意图，从而自主制定最优的行为决策并进一步完成路径规划，顺利完成道路清扫保洁、垃圾清运转运任务。

为了提升决策规划模块的预见性以合理应对环境变化，需要给决策规划模块提供未来一段时间的环境变化趋势，主要就是周边交通参与者未来一段时间可能的运动状态，即需要对周围障碍物未来行为与轨迹做预测。决策规划问题是自动驾驶中非常关键的一步，决策是否合理直接决定了自动驾驶车辆智能等级。

当前的决策规划基本为基于商用车及乘用车的决策规划系统，但是环卫车在作业时，相较于自车的舒适性，更注重资源使用情况和作业完成效率，因此针对环卫车设计单独的决策系统是未来环卫车的自动驾驶的发展趋势。

发明内容

目的：为了克服现有技术中存在的不足，本发明提供一种环卫车路径规划决策方法及系统，使得无人环卫车在作业时尽可能节省资源，并且提高环卫车的安全性及作业效率。

技术方案：为解决上述技术问题，本发明采用的技术方案为：

第一方面，提供一种环卫车路径规划决策方法，包括：

在环卫车作业过程中，获取待清扫垃圾的坐标点、环卫车的位置信息以及动态障碍物的历史状态数据和环境数据；其中，所述历史状态信息用于表示所述目标障碍物在历史时间段内的真实行为状态，所述环境信息用于表示所述目标障碍物在所述历史时间段内的真实环境情况；

根据待清扫垃圾的坐标点和环卫车的位置信息，生成多个环卫车规划信息；其中，所述环卫车规划信息包括规划轨迹点坐标、横摆角速度和作业意图；

根据动态障碍物的历史状态数据和环境数据，生成动态障碍物轨迹预测信息；其中所述动态障碍物轨迹预测信息包括至少一个动态障碍物预测轨迹、意图以及对应的概率；

基于动态障碍物轨迹预测信息，利用博弈论方法，从多个环卫车规划信息中确定最终的环卫车路径规划决策结果。

在一些实施例中，所述状态数据包括动态障碍物坐标以及速度、加速度和横摆角速度中的至少一项。

在一些实施例中，根据动态障碍物的历史状态数据和环境数据，生成动态障碍物轨迹预测信息，包括：

将动态障碍物的历史状态数据和环境数据输入障碍物轨迹预测模型，生成动态障碍物轨迹预测信息；

其中所述障碍物轨迹预测模型利用多组数据通过机器学习训练得到，所述多组数据中的每组数据均包括：样本数据和预测得到的动态障碍物轨迹信息。

在一些实施例中，将动态障碍物的历史状态数据和环境数据输入障碍物轨迹预测模型，生成动态障碍物轨迹预测信息，包括：

环境数据经过mobilenetV3网络特征提取得到环境特征；

动态障碍物的状态数据经过状态编码器特征提取得到状态特征；

将环境特征和状态特征进行特征拼接处理得到中间特征向量；

将中间特征向量输入预测解码器，得到动态障碍物轨迹预测信息。

进一步地，在经过mobilenetV3网络特征提取之前，还包括：将环境数据进行栅格化转化为栅格图片；其中所述环境数据包括电子地图数据、目标车辆数据、目标障碍物数据、目标场景数据和交通指示灯数据中的一项或多项。

在一些实施例中，所述障碍物轨迹预测模型的训练方法包括：

获取动态障碍物的历史状态数据和环境数据，形成历史状态数据集T＝{T1,T2,...,Tt,...,Tn}和环境数据集X＝{X1,X2,...,Xt,...,Xn}，以及动态障碍物真实轨迹数据集，作为训练数据集；其中所述Tt表示动态障碍物在t时刻的状态数据，Xt表示动态障碍物在t时刻的环境信息；

利用采用梯度下降算法，将所述训练数据集输入待训练的障碍物轨迹预测模型进行训练，直至达到预设条件，得到训练好的障碍物轨迹预测模型。

进一步地，所述障碍物轨迹预测模型的训练过程中，计算预测时段内障碍物预测轨迹相对真实轨迹的均方误差MSE，期望最大化真实轨迹在混合概率密度中的概率，将概率联合分布的最大似然函数作为损失函数，采用梯度下降算法进行训练，当均方误差不再下降时停止训练。

在一些实施例中，基于动态障碍物轨迹预测信息，利用博弈论方法，从多个环卫车规划信息中确定最终当前时刻的环卫车规划信息，包括：

根据动态障碍物轨迹预测信息与环卫车规划信息，进行信息交互转换成规划轨迹谱，规划轨迹谱依次通过多层感知机编码和解码筛选出收益最高的规划轨迹点坐标、横摆角速度及对应的作业意图，作为最终的环卫车路径规划决策结果。其中所述收益是基于安全、快速、效率三个方面综合计算得到的。安全是首要需求，即不能撞车；快速指的是使障碍物尽快通过路口；效率指在行驶路线中应包含待清扫作业的坐标位置，即为更快速的完成清扫作业。

基于此，两辆车的路口博弈在数学上可以看作一个有约束的多目标规划问题。即，将不同轨迹组合的情况下，使获得的收益“Ω”达到最大。

第二方面，提供一种环卫车路径规划决策系统，包括存储器和处理器，存储器用于存储指令，所述指令用于控制所述处理器进行操作，以执行根据上述的环卫车路径规划决策方法。

第三方面，提供一种环卫车，包括所述的环卫车路径规划决策系统。

有益效果：本发明提供的一种环卫车路径规划决策方法及系统，具有以下优点：

(1)；针对环卫车单独设计，本系统基于待作业区生成规划路径，充分提升了环卫车作业效率；

(2)设计多种行驶路径，提升路径选择合理性；

(3)对动态障碍物进行轨迹预测，考虑了动态障碍物的未来轨迹的碰撞可能，提升了环卫车的安全性；

(4)加入了和动态障碍物的交互信息，进一步提升了决策合理性。

附图说明

图1为本发明实施例的环卫车路径规划决策方法流程示意图；

图2为本发明实施例中障碍物轨迹预测模块网络模型示意图；

图3为本发明实施例中环卫车路径规划决策网络示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

在本发明的描述中，若干的含义是一个以上，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本发明的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

实施例1

如图1所示，一种环卫车路径规划决策方法，包括：

在一些实施例中，如图2所示，将动态障碍物的历史状态数据和环境数据输入障碍物轨迹预测模型，生成动态障碍物轨迹预测信息，包括：

环境数据经过mobilenetV3网络特征提取得到环境特征；

在一些实施例中，基于python语言，结合openCV库，使用Tensorflow框架搭建mobilenetV3神经网络模型，首先采集连续帧的城市道路上的车辆及其对应地图信息等作为训练数据，将所有环境数据图片统一为224x224大小的尺寸。

在一些具体实施例中，状态数据和环境数据以相同的采样频率进行采集。进一步地，还包括将状态数据及环境数据处理为[0,1]范围内的特征向量用于训练模型。输入由过去τ秒内的环境信息渲染的栅格图片、状态向量组成。对预测特征向量进行谱聚类，以正则化原始损失函数，并对新的损失函数进行反向传播，以改进长期预测。

环境数据通过mobilenetV3提取特征后得到的环境特征经过全局平均池化后展开成1列，与状态数据经过全连接后的参数合并后再经过多层感知机，得到障碍物的预测输出。

在一些实施例中，对于待预测动态障碍物而言，模型输入包括栅格化信息及其历史状态信息。其中使用10帧历史信息，时间步长为0.1s。栅格化信息维数为：224×224×(3+(10+1)×2)，224为栅格图片的尺寸，10为历史10帧，1为当前帧，目标车和周围障碍物各占一个通道，3为地图的三通道图片。状态输入包括待预测障碍物10帧历史状态数据，维数为3×(10+1)，同理，为10帧历史数据加1帧当前数据的速度、加速度、横摆角速度信息。

模型的输出为5模态的动态障碍物预测轨迹、意图、概率。预测轨迹时长为7s，时间步长0.1s。以默认状态为例，模型整体输出参数维数为：5×(70×2+1+1)。

进一步地，所述障碍物轨迹预测模型的训练过程中，计算预测时段内障碍物预测轨迹相对真实轨迹的均方误差MSE，期望最大化真实轨迹在混合概率密度中的概率，将概率联合分布的最大似然函数作为损失函数，设置指数衰减学习率Lr为0.001，采用梯度下降算法进行训练，当均方误差不再下降时停止训练。

在一些实施例中，如图3所示，为本发明实施例中环卫车路径规划决策网络示意图，黑色实心圆点代表环卫车，白色圆点代表待清扫垃圾，每张图片为环卫车在作业时不同的规划轨迹(different planning trajectories)与动态障碍物的预测轨迹交互的情况，道路上的驾车者倾向于最大化他们在各种因素影响下的效用，对于环卫车来说即为安全性和高效性。在动态环境下，环卫车可能会改变当前的策略使自己的收益最大化，可以假设，环卫车使用不同策略，当环卫车与行人碰撞时，即为收益最小的情况，通过设计不同的行驶路线和对应的作业意图，设计不同的策略，使环卫车在不发生碰撞的情况下，最大效率的完成清扫作业。

确定环卫车在行为中获得的效用值，显示不同策略会受到驾驶期望速度、车道选择和交通条件的影响，并给出效用近似公式。

根据动态障碍物的预测轨迹、意图、概率，与输入的规划信息的交互信息，转换成规划轨迹谱(Spectrum Of Τ planning trajectories，灰色矩形条，每个矩形条组合代表了一种规划轨迹与障碍物的预测轨迹的特征向量)，通过多层感知机解码，筛选出最优的，即为收益最高的7s规划轨迹点坐标、横摆角速度及对应的作业意图信息。

输入及输出的规划信息包括轨迹点70×3+1+1，同样为7s共70个路点下的x、y坐标、横摆角速度及一维的意图。

这种交互过程是由一个非合作博弈描述的，该博弈假设具有完全信息，这意味着驾驶员了解彼此所采用的所有策略和收益矩阵。为了估计矩阵，可以通过测量碰撞概率(TTC)和前进时间来计算收益的值。

使用障碍物的轨迹预测信息与规划轨迹经过全连接后的参数合并后输入博弈论解码器，对输出的行为预测及轨迹预测信息与自车规划信息进行博弈交互，进一步调整行为预测及轨迹预测信息和自车规划信息。

本发明的决策过程创新在于：

第一，与其他车型不同，本系统的规划轨迹针对环卫车进行设计，生成方式为基于待清扫作业的坐标生成的多种行驶路径。环卫车与其他车型，尤其与乘用车不同，环卫车更加注重清扫作业效率，而舒适性、体感等则相对不重要，因此在路径规划时，应首先考虑如何提升环卫车的作业效率及安全性。

第二，判断环卫车的不同规划轨迹与障碍物是否存在冲突。我们选择一个指标来描述这个冲突，这个指标就叫作“冲突时间差”，即两辆车到达冲突点的时间差值。该差值越小，就越有可能相撞，如为零则相撞，如差值很大，则代表在完全不同的时刻通过交叉点，定不会相撞。

第三，如果存在冲突，如何提前避免。在这个部分要考虑的因素很多，为了保证安全，当两辆车存在冲突时，需要用一个算法保证它们最后不相撞。因此，二者通过路口可以看成一个博弈问题。博弈包括三个要素。

要素一：对象，要存在博弈双方，此处的对象是环卫车和行人以及其他障碍车辆等交通参与者。

要素二：策略，忽略具体的油门、刹车等不同操作，用不同的规划轨迹来作为各种操作的表现形式，不同的轨迹构成了策略。

要素三：收益，需要定义博弈的收益。我们在模型里定义了三种收益，即安全、快速、效率。安全是首要需求，即不能撞车；快速指的是使障碍物尽快通过路口；效率指在行驶路线中应包含待清扫作业的坐标位置，即为更快速的完成清扫作业。

基于此，两辆车的路口博弈在数学上可以看作一个有约束的多目标规划问题。即，将不同轨迹组合的情况下，使获得的收益“Ω”达到最大。根据不同的策略筛选出最终受益最大的轨迹，即为最终的规划轨迹。

实施例2

基于实施例1，本实施例提供了一种环卫车路径规划决策系统，包括存储器和处理器，存储器用于存储指令，所述指令用于控制所述处理器进行操作，以执行实施例1所述的环卫车路径规划决策方法。

实施例3

基于实施例1，本实施例提供了一种环卫车，包括上述的环卫车路径规划决策系统。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种环卫车路径规划决策方法，其特征在于，包括：

2.根据权利要求1所述的环卫车路径规划决策方法，其特征在于，所述状态数据包括动态障碍物坐标以及速度、加速度和横摆角速度中的至少一项。

3.根据权利要求1所述的环卫车路径规划决策方法，其特征在于，根据动态障碍物的历史状态数据和环境数据，生成动态障碍物轨迹预测信息，包括：

4.根据权利要求3所述的环卫车路径规划决策方法，其特征在于将动态障碍物的历史状态数据和环境数据输入障碍物轨迹预测模型，生成动态障碍物轨迹预测信息，包括：

环境数据经过mobilenetV3网络特征提取得到环境特征；

5.根据权利要求4所述的环卫车路径规划决策方法，其特征在于，在经过mobilenetV3网络特征提取之前，还包括：将环境数据进行栅格化转化为栅格图片；其中所述环境数据包括电子地图数据、目标车辆数据、目标障碍物数据、目标场景数据和交通指示灯数据中的一项或多项。

6.根据权利要求3所述的环卫车路径规划决策方法，其特征在于，所述障碍物轨迹预测模型的训练方法包括：

7.根据权利要求6所述的环卫车路径规划决策方法，其特征在于，所述障碍物轨迹预测模型的训练过程中，计算预测时段内障碍物预测轨迹相对真实轨迹的均方误差MSE，期望最大化真实轨迹在混合概率密度中的概率，将概率联合分布的最大似然函数作为损失函数，采用梯度下降算法进行训练，当均方误差不再下降时停止训练。

8.根据权利要求1所述的环卫车路径规划决策方法，其特征在于，基于动态障碍物轨迹预测信息，利用博弈论方法，从多个环卫车规划信息中确定最终当前时刻的环卫车规划信息，包括：

根据动态障碍物轨迹预测信息与环卫车规划信息，进行信息交互转换成规划轨迹谱，规划轨迹谱依次通过多层感知机编码和解码筛选出收益最高的规划轨迹点坐标、横摆角速度及对应的作业意图，作为最终的环卫车路径规划决策结果。

9.一种环卫车路径规划决策系统，其特征在于，包括存储器和处理器，存储器用于存储指令，所述指令用于控制所述处理器进行操作，以执行根据权利要求1-8任一项所述的环卫车路径规划决策方法。

10.一种环卫车，其特征在于，包括权利要求9所述的环卫车路径规划决策系统。