CN115657674B

CN115657674B - 一种基于图神经网络的分布式路径规划方法及装置

Info

Publication number: CN115657674B
Application number: CN202211318248.3A
Authority: CN
Inventors: 李金澎; 苏志远; 仇乙愉; 汪朝林
Original assignee: Bao Kai Shanghai Intelligent Logistics Technology Co ltd
Current assignee: Bao Kai Shanghai Intelligent Logistics Technology Co ltd
Priority date: 2022-10-26
Filing date: 2022-10-26
Publication date: 2023-05-05
Anticipated expiration: 2042-10-26
Also published as: CN115657674A

Abstract

本发明提供一种基于图神经网络的分布式路径规划方法及装置，所述方法的步骤包括：获取本机器人的传感器在当前时刻所感知到的场景中的临近机器人；获取临近机器人的历史轨迹参数集；将全部临近机器人的历史轨迹参数集共同构建为参数矩阵，将参数矩阵输入到预设的神经网络模型的第一处理模块中，由第一处理模块输出第一矩阵；基于当前场景中的多种场景参数构建复合图像，将所述复合图像输入到预设神经网络模型的第二处理模块中，由第二处理模块输出第二矩阵；将第一矩阵和第二矩阵进行拼接得到联合矩阵，输入到预设神经网络模型的联合处理模块中，所述联合处理模块输出本机器人下一时刻所执行的动作。

Description

一种基于图神经网络的分布式路径规划方法及装置

技术领域

本发明涉及机器人策略调度技术领域，尤其涉及一种基于图神经网络的分布式路径规划方法及装置。

背景技术

路径规划方法通常分为集中式和分布式两种方法，集中式规划方法需要事先由中央控制器收集环境信息和各机器人状态数据，它可以同时为所有机器人规划出可行无碰撞路径。

随着技术的发展，去中心化越来越流行。分布式算法的主要特征是路径方案不再由控制中心计算得到，每一个机器人都具有自主规划路径和避障的能力，它们可以通过传感器和处理器感知周边环境信息，实时做出自身的运动控制。在分布式路径规划的前提下，各机器人可以独立获取环境信息并自主做出决策，进而减轻中央控制器的运算负荷。如动态A-star重规划算法，每个机器人根据全局地图制定单机器人可行路径。

但传统的A-star重规划算法往往仅能将场景中的所有障碍物作为固定的障碍物规划路线，包括将场景中的其他机器人也作为固定的障碍物，当在行走过程中与其他机器人发生冲突时，再度获取全局地图重新根据A-star算法得到可行路径，直至到达终点，现有的路径规划算法不能将场景中的其他机器人作为移动的障碍物，无法对场景中其他机器人路线进行分析，导致其他机器人容易在运行过程中阻挡本机器人。

发明内容

鉴于此，本发明的实施例提供了一种基于图神经网络的分布式路径规划方法，以消除或改善现有技术中存在的一个或更多个缺陷。

本发明的一个方面提供了一种基于图神经网络的分布式路径规划方法，所述方法的步骤包括：

获取本机器人的传感器在当前时刻所感知到的场景中的临近机器人；

获取每个临近机器人的历史轨迹参数集，所述历史轨迹参数集为每个临近机器人由起点位置行驶至当前位置的过程中在预设的基础图像中经过的坐标点的集合；

将全部临近机器人的历史轨迹参数集共同构建为参数矩阵，将参数矩阵输入到预设的神经网络模型的第一处理模块中，所述第一处理模块包括全连接层、偏置层和归一化层，由第一处理模块输出第一矩阵；

基于当前场景中的多种场景参数构建复合图像，将所述复合图像输入到预设神经网络模型的第二处理模块中，所述第二处理模块包括卷积层、归一化层、偏置层和最大池化层，由第二处理模块输出第二矩阵；

将第一矩阵和第二矩阵进行拼接得到联合矩阵，将所述联合矩阵输入到预设神经网络模型的联合处理模块中，所述联合处理模块包括全连接层和偏置层，所述联合处理模块输出本机器人下一时刻所执行的动作。

采用上述方案，本方案首先相较于常用的分布式算法具有更高的调度效率，在大部分情况可以让机器人在指定时间内到达目的地，本方案可扩展性较强，一旦神经网络训练完成后，可将其直接应用于全新的环境中，而无需再次训练，除此之外，本方案将场景中的其他机器人作为移动的障碍物，通过第一处理模块对邻近机器人的历史轨迹进行分析，完成对场景中其他机器人的路线分析，降低其他机器人在运行过程中阻挡本机器人的概率。

在本发明的一些实施方式中，所述第一处理模块的结构为顺序连接的多个第一子模块和一个第二子模块，所述第一子模块的结构为顺序连接的全连接层和偏置层，所述第二子模块的结构为归一化层；所述第二处理模块包括三个第三子模块和两个第四子模块，每个第四子模块均设置在两个第三子模块之间，所述第三子模块的结构为顺序连接的卷积层、归一化层、偏置层和最大池化层，所述第四子模块的结构为顺序连接的卷积层、归一化层和偏置层。

在本发明的一些实施方式中，所述联合处理模块至少包括两个第五子模块和一个第六子模块，所述第六子模块设置在两个第五子模块之间，所述第五子模块的结构为顺序连接的全连接层和偏置层，所述第六子模块的结构为顺序连接的图神经网络层和偏置层。

在本发明的一些实施方式中，所述动作包括前进、后退、左转行驶、右转行驶和等待，在所述联合处理模块输出本机器人下一时刻所执行的动作的步骤中，所述联合处理模块输出对应各个预设动作的参数，输出最大的参数对应的预设动作为本机器人下一时刻所执行的动作。

在本发明的一些实施方式中，所述当前场景中的多种场景参数包括当前场景中固定障碍物的位置，所述基于当前场景中的多种场景参数构建复合图像的步骤包括，基于固定障碍物构建的第一通道图；

所述当前场景中的多种场景参数还包括本机器人的当前位置与目标位置，所述基于当前场景中的多种场景参数构建复合图像的步骤包括，基于本机器人的当前位置与目标位置的相对位置构建第二通道图；

将所述第一通道图和第二通道图作为复合图像的两个通道，构建复合图像。

在本发明的一些实施方式中，所述当前场景中的多种场景参数还包括本机器人的传感器在当前时刻所感知到的场景中的临近机器人的位置，若所述当前场景中的多种场景参数还包括本机器人的传感器在当前时刻所感知到的场景中的临近机器人的位置，则所述基于当前场景中的多种场景参数构建复合图像的步骤包括基于临近机器人的位置构建第三通道图；

将所述第一通道图、第二通道图和第三通道图作为复合图像的三个通道，构建复合图像。

在本发明的一些实施方式中，所述基于固定障碍物构建的第一通道图的步骤包括，在机器人所在场景预设的基础图像中标记固定障碍物所在的像素点，将该像素点的像素值修改为第一像素值，得到第一通道图。

在本发明的一些实施方式中，所述基于本机器人的当前位置与目标位置的相对位置构建第二通道图的步骤包括：

标记本机器人的当前位置在所在场景预设的基础图像中对应的像素点，将该像素点的像素值修改为第二像素值；

基于机器人当前在基础图像中的位置和预设的感知范围确定机器人在基础图像中的感知空间；

若目标位置处于所述感知空间范围内，则将目标位置在基础图像中对应像素点的像素值修改为第二像素值，得到第二通道图；

若目标位置未处于所述感知空间范围内，则建立本机器人当前在基础图像中的位置与所述目标位置的连线，将该连线中机器人当前在基础图像中的位置作为固定端另一端沿直线延伸，将延伸至基础图像边缘处的像素点的像素值修改为第二像素值，得到第二通道图。

在本发明的一些实施方式中，所述基于临近机器人的位置构建第三通道图的步骤包括，在本机器人所在场景预设的基础图像中标记本机器人当前所感知到的临近机器人所在位置的像素点，将该像素点的像素值修改为第三像素值，得到第三通道图。

本发明还提供一种基于图神经网络的分布式路径规划装置，该装置包括计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如前所述方法所实现的步骤。

本发明的附加优点、目的，以及特征将在下面的描述中将部分地加以阐述，且将对于本领域普通技术人员在研究下文后部分地变得明显，或者可以根据本发明的实践而获知。本发明的目的和其它优点可以通过在说明书以及附图中具体指出并获得。

本领域技术人员将会理解的是，能够用本发明实现的目的和优点不限于以上具体所述，并且根据以下详细说明将更清楚地理解本发明能够实现的上述和其他目的。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1为本发明基于图神经网络的分布式路径规划方法一种实施方式的示意图；

图2为预设的神经网络模型的结构示意图；

图3为三个通道图的示意图；

图4为机器人工作环境示意图；

图5为为第二通道图的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施方式和附图，对本发明做进一步详细说明。在此，本发明的示意性实施方式及其说明用于解释本发明，但并不作为对本发明的限定。

在此，还需要说明的是，为了避免因不必要的细节而模糊了本发明，在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤，而省略了与本发明关系不大的其他细节。

应该强调，术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在，但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。

在此，还需要说明的是，如果没有特殊说明，术语“连接”在本文不仅可以指直接连接，也可以表示存在中间物的间接连接。

现有技术介绍

在集中式规划方法中最先进的是基于冲突的搜索算法(CBS)，它采用两级搜索过程来确保最终可行解是最优解。起初，在低级搜索阶段为各个机器人独立查找最优路径，在高级搜索层面使用约束树解决各机器人之间的路径冲突。但是当机器人数量过多时，CBS会在处理冲突路径时耗费大量时间，并且在有些场景下会出现难以满足时限要求的现象。

现有的A*算法，当机器人在行走过程中与其他机器人发生冲突时，再度获取全局地图重新根据A*算法得到可行路径，直至到达终点。最优交互碰撞避免算法(OptimalReciprocalCollisionAvoidance，ORCA)则是根据相邻机器人的相对位置和速度不断调整自身运动姿态，以防止机器人之间在驶向终点过程中发生碰撞。但两种算法都存在调度效率较低的问题，当机器人数量较少时尚能完成任务，而如果机器人数量不断增多，极容易引发死锁问题。

为解决以上问题，如图1所示，本发明提出一种基于图神经网络的分布式路径规划方法，所述方法的步骤包括：

步骤S100，获取本机器人的传感器在当前时刻所感知到的场景中的临近机器人；

在本发明的一些实施方式中，所述传感器可以为激光传感器或雷达传感器等。

步骤S200，获取每个临近机器人的历史轨迹参数集，所述历史轨迹参数集为每个临近机器人由起点位置行驶至当前位置的过程中在预设的基础图像中经过的坐标点的集合；

所述预设的基础图像中每个像素点的像素值均为初始像素值。

步骤S300，将全部临近机器人的历史轨迹参数集共同构建为参数矩阵，将参数矩阵输入到预设的神经网络模型的第一处理模块中，所述第一处理模块包括全连接层、偏置层和归一化层，由第一处理模块输出第一矩阵；

在具体实施过程中，在获取每个临近机器人的历史轨迹参数集的步骤中，若当前时刻是t，则需要获取每个临近机器人的t、t-1、…t-s时刻的历史路径信息。当获取邻近机器人的历史轨迹参数集时，最多不能获取超过n个机器人的数据。若本机器人感知到大于n个机器人时，仅采集与自身相隔最近的n个机器人的数据信息；若本机器人感知到的机器人数量不足n时，则用预设的特征值进行填充，以保证向量数据的尺寸不发生变化。

预设的特征值可以为-1，补充的坐标点为(-1，-1)。

在具体实施过程中，将多个所述临近机器人的历史轨迹参数集中的坐标点共同构建为参数矩阵，将所述参数矩阵输入到预设的神经网络模型中，神经网络模型可以根据历史的路径进行分析，避免本机器人在未来的行进过程中与其他邻近机器人的碰撞。

采用上述方案，本方案的第一处理模块设置有归一化层，归一化层可以让在前面处理后的特征数据变换为以0为均值、1为方差的数据分布，这样可以增强该方法的泛化性。由于向量数据输入时输入的是历史路径的坐标，在经过全连接层和偏置层后仍然会和原数据具有一定的相关性，这样会导致神经网络在小地图训练好后，在大地图中表现稍差，而使用归一化层后，可以让最终输出保持一样的数据分布(都是以0为均值、1为方差)，这样的话让最终输出仅和与周围机器人相对位置有关，而与具体所在的绝对位置无关，进而增强方法的泛化性。

步骤S400，基于当前场景中的多种场景参数构建复合图像，将所述复合图像输入到预设神经网络模型的第二处理模块中，所述第二处理模块包括卷积层、归一化层、偏置层和最大池化层，由第二处理模块输出第二矩阵；

在本发明的一些实施方式中，所述场景参数包括当前场景中固定障碍物的位置、本机器人的当前位置与目标位置。

采用上述方案，本方案可通过复合图像确定向目标位置行进的方向和场景中障碍物的位置，方便在避开障碍物的同时向目标位置行进。

步骤S500，将第一矩阵和第二矩阵进行拼接得到联合矩阵，将所述联合矩阵输入到预设神经网络模型的联合处理模块中，所述联合处理模块包括全连接层和偏置层，所述联合处理模块输出本机器人下一时刻所执行的动作。

本方案在执行过程中，机器人每个时刻均采集当前的参数，计算得到下一刻要执行的动作，本方案每个时刻均能快速分析执行方案，降低死锁情况的可能。

在具体实施过程中，本发明中收集环境信息时获取了本机器人感知范围内其他机器人的历史轨迹参数集，所以在经过全连接层和图神经网络层处理后，机器人可以分析并预测出周围机器人在下一时刻的运动动向，从而可以有效避免机器人之间发生碰撞。

在具体实施过程中，每个机器人上装有传感器，能够感知周围一定区间范围内的环境情况。由于基础图像采用二维栅格的形式进行建模，所以本发明设定每个机器人的感知范围呈现正方形。如果视野大小设定为7，且当前机器人所处位置坐标是(13,12)，那么则表示该机器人有能力感知x坐标位于[10,17]区间且y坐标位于[9,15]区间内的环境信息。

为了将环境信息输入到神经网络中，本发明将图片数据简化为二进制图像。复合图像的每个通道图像的大小设定为(感知范围大小+2)×(感知范围大小+2)。

在本发明的一些实施方式中，其中最外层图像用于表示终点向量数据。

第三通道图主要反应视野内其他机器人的位置关系，假设当前机器人的坐标是(13,12)，且在感知范围内的其他机器人分别位于(10,9)、(10,13)、(13,9)和(14,15)，那么最终构造的图像信息。

如图2所示，在本发明的一些实施方式中，所述第一处理模块的结构为顺序连接的多个第一子模块和一个第二子模块，所述第一子模块的结构为顺序连接的全连接层和偏置层，所述第二子模块的结构为归一化层；所述第二处理模块包括三个第三子模块和两个第四子模块，每个第四子模块均设置在两个第三子模块之间，所述第三子模块的结构为顺序连接的卷积层、归一化层、偏置层和最大池化层，所述第四子模块的结构为顺序连接的卷积层、归一化层和偏置层。

如图2所示，在本发明的一些实施方式中，所述联合处理模块至少包括两个第五子模块和一个第六子模块，所述第六子模块设置在两个第五子模块之间，所述第五子模块的结构为顺序连接的全连接层和偏置层，所述第六子模块的结构为顺序连接的图神经网络层和偏置层。

如图2所示，在具体实施过程中，所述预设的神经网络模型各层的参数为：

第一处理模块的第一个全连接层的参数为inputFeatures＝60,outputFeatures＝128；

第一处理模块的第二个全连接层的参数为inputFeatures＝128,outputFeatures＝64；

第一处理模块的第三个全连接层的参数为inputFeatures＝64,outputFeatures＝32；

第二处理模块的第一个卷积层的参数为kernelSize＝3×3,filters＝32,stride＝(1,1)；

第二处理模块的第二个卷积层的参数为kernelSize＝3×3,filters＝32,stride＝(1,1)；

第二处理模块的第三个卷积层的参数为kernelSize＝3×3,filters＝64,stride＝(1,1)；

第二处理模块的第四个卷积层的参数为kernelSize＝3×3,filters＝64,stride＝(1,1)；

第二处理模块的第五个卷积层的参数为kernelSize＝3×3,filters＝128,stride＝(1,1)；

归一化层的参数为eps＝1e-05,momentum＝0.1；

图神经网络层参数为inputFeatures＝160,outputFeatures＝128,filter_taps＝3；

最大池化层参数为kernelSize＝2,stride＝2；

联合处理模块的第一个卷积层的参数为inputFeatures＝128,outputFeatures＝128；

联合处理模块的第二个卷积层的参数为inputFeatures＝128,outputFeatures＝5。

如图3、5所示，在本发明的一些实施方式中，所述当前场景中的多种场景参数包括当前场景中固定障碍物的位置，所述基于当前场景中的多种场景参数构建复合图像的步骤包括，基于固定障碍物构建的第一通道图；

采用上述方案，所述第一通道图反映了机器人在场景中的固定障碍物的情况，将固定障碍物的情况输入到模型中，便于机器人进行避障。

在具体实施过程中，所述机器人的感知范围可以为长宽分别为6*6、7*7或8*8等的矩形范围，所述机器人的感知空间可以为以机器人当前位置为重心点长宽分别为6*6、7*7或8*8等的矩形在二维图像中所形成的范围，所述二维图像可以为基础图像。

在具体实施过程中，第二通道图反应当前机器人的终点方位，如果终点位于当前感知空间范围内，那么其位置将会正常显示在图像中。若终点位于感知空间范围外，则将终点所处的位置进行投影计算，使之呈现在最外层的网格上。如图3、5所示，当终点位于视野的右上方时，连接当前机器人和终点位置构造一条直线，然后将其投影到最外层的网格上。

采用上述方案，所述第二通道图基于机器人当前在基础图像中的位置与所述目标位置，若目标位置处于所述感知空间范围内，则机器人能够精准感知到目标位置，将目标位置在基础图像中对应像素点的像素值修改为第二像素值，提高机器人的行进精准度；若目标位置未处于所述感知空间范围内，则机器人无法精准定位目标位置，建立机器人当前在基础图像中的位置与所述目标位置的连线确认机器人的行进方向，当目标位置进入感知空间再精准定位提高处理效率。

如图3所示，在本发明的一些实施方式中，所述基于临近机器人的位置构建第三通道图的步骤包括，在本机器人所在场景预设的基础图像中标记本机器人当前所感知到的临近机器人所在位置的像素点，将该像素点的像素值修改为第三像素值，得到第三通道图。

在本发明的一些实施方式中，所述第一像素值、第二像素值和第三像素值可以为相同的数值也可以为不同的数值。

采用上述方案，所述第三通道图反映了在当前时间点临近机器人的位置，将其他机器人的位置输入到模型中，便于对临近机器人进行避障。

本发明所提出的神经网络架构包含卷积层、池化层、偏置层等，当机器人将自身传感器所收集到的数据放入到神经网络中时，可以得到在下一时刻应该执行的动作指令。该路径规划方法由于仅需要局部环境信息，所以可以以分布式的方式部署到各机器人上。该方法稳定性较好，可以在规定时间内将所有机器人从起点导航至终点。除此之外，该方法的扩展性较强，即便在调度的过程中机器人数量和所处环境出现动态变化时，仍能保持较好的调度效果。

在具体实施过程中，以仓储物流业为例，机器人工作环境示意图如图4所示，地面上布置有表示位置信息的二维码，机器人在行走的过程中根据地面的二维码确定当前所处位置。任何一个机器人在每个时刻可以执行五种动作：向上、向下、向左、向右、等待。每个机器人都会有一个任务起点和终点，它首先需要在任务起点拿起料箱，之后在指定时间内行驶到终点处再将料箱放下。在冲突方面，除了机器人在行驶中要避免常见的边冲突和顶点冲突发生外，机器人之间的边缘碰撞同样被禁止发生；

本发明提出的算法中每个机器人将会根据周边环境独立做出动作抉择，而无需像集中式一样由控制中心进行统一调度。为确保能够做出合理决策，在每一个动作指令执行完成后，机器人将主动收集环境信息并根据神经网络的特征数据生成下一步的动作指令。在此过程中需要收集的环境信息主要包含视野范围内的障碍物信息、其他机器人历史路径和决策信息。每个机器人上装有传感器，能够感知周围一定区间范围内的环境情况；

为了进一步提取环境特征，需要对不同类型的信息采用不同的编码方式。在本文中，将可以瞬时观测到的信息编码成三通道的复合图像，将需要持续观测的历史路径信息编码成向量数据。

本方案的有益效果包括：

1、分布式控制可以有效降低调度时间，但常用的分布式调度算法存在调度效率低、有可能发生死锁等现象，本发明算法扩展性强，完成神经网络训练后，可将其移植到多台机器人上，并且调度效率并不会随着机器人数量的变化发生大幅度降低；

2、本申请由于采用了图神经网络，相较于其他路径规划算法取得了更好的调度效果，可以达到机器人之间即便没有发送合作请求的情况下仍能呈现隐形协同的效果。除此之外，该分布式算法在指定数量的机器人下完成训练后可将其用于不同数量的场景中，实用性强、鲁棒性好；

3、本申请算法将多种信息进行融合，能够快速、准确地判断出应该做出的动作，该算法的扩展性较强，神经网络训练完成之后，可将其应用于具有不同数量机器人的场地。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时以实现前述基于图神经网络的分布式路径规划方法所实现的步骤。该计算机可读存储介质可以是有形存储介质，诸如随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、软盘、硬盘、可移动存储盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。

本领域普通技术人员应该可以明白，结合本文中所公开的实施方式描述的各示例性的组成部分、系统和方法，能够以硬件、软件或者二者的结合来实现。具体究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。当以硬件方式实现时，其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时，本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。

需要明确的是，本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见，这里省略了对已知方法的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本发明的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本发明的精神后，做出各种改变、修改和添加，或者改变步骤之间的顺序。

本发明中，针对一个实施方式描述和/或例示的特征，可以在一个或更多个其它实施方式中以相同方式或以类似方式使用，和/或与其他实施方式的特征相结合或代替其他实施方式的特征。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图神经网络的分布式路径规划方法，其特征在于，所述方法的步骤包括：

基于当前场景中的多种场景参数构建复合图像；

所述当前场景中的多种场景参数包括当前场景中固定障碍物的位置，所述基于当前场景中的多种场景参数构建复合图像的步骤包括，基于固定障碍物构建的第一通道图；所述当前场景中的多种场景参数还包括本机器人的当前位置与目标位置，所述基于当前场景中的多种场景参数构建复合图像的步骤包括，基于本机器人的当前位置与目标位置的相对位置构建第二通道图；将所述第一通道图和第二通道图作为复合图像的两个通道，构建复合图像；

所述基于固定障碍物构建的第一通道图的步骤包括，在机器人所在场景预设的基础图像中标记固定障碍物所在的像素点，将该像素点的像素值修改为第一像素值，得到第一通道图；

所述基于本机器人的当前位置与目标位置的相对位置构建第二通道图的步骤包括：标记本机器人的当前位置在所在场景预设的基础图像中对应的像素点，将该像素点的像素值修改为第二像素值；基于机器人当前在基础图像中的位置和预设的感知范围确定机器人在基础图像中的感知空间；若目标位置处于所述感知空间范围内，则将目标位置在基础图像中对应像素点的像素值修改为第二像素值，得到第二通道图；若目标位置未处于所述感知空间范围内，则建立本机器人当前在基础图像中的位置与所述目标位置的连线，将该连线中机器人当前在基础图像中的位置作为固定端另一端沿直线延伸，将延伸至基础图像边缘处的像素点的像素值修改为第二像素值，得到第二通道图；

所述当前场景中的多种场景参数还包括本机器人的传感器在当前时刻所感知到的场景中的临近机器人的位置，若所述当前场景中的多种场景参数还包括本机器人的传感器在当前时刻所感知到的场景中的临近机器人的位置，则所述基于当前场景中的多种场景参数构建复合图像的步骤包括基于临近机器人的位置构建第三通道图；将所述第一通道图、第二通道图和第三通道图作为复合图像的三个通道，构建复合图像；

所述基于临近机器人的位置构建第三通道图的步骤包括，在本机器人所在场景预设的基础图像中标记本机器人当前所感知到的临近机器人所在位置的像素点，将该像素点的像素值修改为第三像素值，得到第三通道图；

将所述复合图像输入到预设神经网络模型的第二处理模块中，所述第二处理模块包括卷积层、归一化层、偏置层和最大池化层，由第二处理模块输出第二矩阵；

2.根据权利要求1所述的基于图神经网络的分布式路径规划方法，其特征在于，所述第一处理模块的结构为顺序连接的多个第一子模块和一个第二子模块，所述第一子模块的结构为顺序连接的全连接层和偏置层，所述第二子模块的结构为归一化层；所述第二处理模块包括三个第三子模块和两个第四子模块，每个第四子模块均设置在两个第三子模块之间，所述第三子模块的结构为顺序连接的卷积层、归一化层、偏置层和最大池化层，所述第四子模块的结构为顺序连接的卷积层、归一化层和偏置层。

3.根据权利要求1所述的基于图神经网络的分布式路径规划方法，其特征在于，所述联合处理模块至少包括两个第五子模块和一个第六子模块，所述第六子模块设置在两个第五子模块之间，所述第五子模块的结构为顺序连接的全连接层和偏置层，所述第六子模块的结构为顺序连接的图神经网络层和偏置层。

4.根据权利要求1所述的基于图神经网络的分布式路径规划方法，其特征在于，所述动作包括前进、后退、左转行驶、右转行驶和等待，在所述联合处理模块输出本机器人下一时刻所执行的动作的步骤中，所述联合处理模块输出对应各个预设动作的参数，输出最大的参数对应的预设动作为本机器人下一时刻所执行的动作。

5.一种基于图神经网络的分布式路径规划装置，其特征在于，该装置包括计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有计算机指令，所述处理器用于执行所述存储器中存储的计算机指令，当所述计算机指令被处理器执行时该装置实现如权利要求1-4任一项所述方法所实现的步骤。