CN116499468B - 一种机器人路径规划方法、电子设备以及存储介质 - Google Patents

一种机器人路径规划方法、电子设备以及存储介质 Download PDF

Info

Publication number
CN116499468B
CN116499468B CN202310761994.8A CN202310761994A CN116499468B CN 116499468 B CN116499468 B CN 116499468B CN 202310761994 A CN202310761994 A CN 202310761994A CN 116499468 B CN116499468 B CN 116499468B
Authority
CN
China
Prior art keywords
convolution
map
result
sampling
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310761994.8A
Other languages
English (en)
Other versions
CN116499468A (zh
Inventor
阚震
李劲松
王韶晨
陈子扬
秦家虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202310761994.8A priority Critical patent/CN116499468B/zh
Publication of CN116499468A publication Critical patent/CN116499468A/zh
Application granted granted Critical
Publication of CN116499468B publication Critical patent/CN116499468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • G01C21/206Instruments for performing navigational calculations specially adapted for indoor navigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Image Analysis (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供了一种机器人路径规划方法、电子设备以及存储介质。该方法包括:基于机器人所处的配置空间、初始状态和目的地区域,构建用于解决机器人路径规划问题的任务实例模型;根据任务实例模型,将机器人所处的配置空间编码成二维环境地图,并将机器人的起始坐标和目的地坐标编码成任务点地图;利用训练完成的轻量化预测神经网络处理任务点地图和二维环境地图,得到引导地图;利用混合采样规划器对二维环境地图进行均匀采样,对引导地图进行有偏采样,并基于采样结果执行随机生成树搜索算法,生成机器人的行驶路径。本发明同时还提供了一种轻量化预测神经网络的训练方法。

Description

一种机器人路径规划方法、电子设备以及存储介质
技术领域
本发明涉及机器人移动控制技术领域,特别涉及一种机器人路径规划方法、电子设备以及存储介质。
背景技术
随着机器人技术的不断发展,移动机器人逐渐应用于办公室、医院和家庭等场景,这些应用场景面临的一个基本任务是在复杂环境中规划从初始位置到目的地的无碰撞路径,其中规划的实时性还有计算资源的损耗尤其是在低成本的商用平台始终是一个不容忽视的问题。
现有技术中,基于采样的路径规划算法一般采用全局空间随机采样的方式,遍历整个空间直到获取可行路径,尽管概率完备但是面临着搜索效率低收敛慢等技术问题;基于学习的路径规划方法由于引入了深度神经网络,这些方法通常需要相当大的计算资源和存储空间,因此很难部署在资源受限的机器人系统上,此外网络的推理时间也会影响到机器人的实时性。
发明内容
鉴于上述问题,本发明提供了一种机器人路径规划方法、电子设备以及存储介质,以期至少能够解决上述问题之一。
根据本发明的第一个方面,提供了一种机器人路径规划方法,包括:
基于机器人所处的配置空间、初始状态和目的地区域,构建用于解决机器人路径规划问题的任务实例模型;
根据任务实例模型,将机器人所处的配置空间编码成二维环境地图,并将机器人的起始坐标和目的地坐标编码成任务点地图;
利用训练完成的轻量化预测神经网络处理任务点地图和二维环境地图,得到引导地图,其中,引导地图用于预测机器人从起始点到目标点之间的可行区域;
利用混合采样规划器对二维环境地图进行均匀采样,对引导地图进行有偏采样,并基于采样结果执行随机生成树搜索算法,生成机器人的行驶路径。
根据本发明的实施例,上述训练完成的轻量化预测神经网络包括由编码器和解码器构成的U形轻量级骨干网络;
其中,编码器包括特征融合模块、多个普通卷积层、多个最大池化层以及多个用于特征提取的混洗单元,解码器包括多个逆卷积层和多个3×3深度可分离卷积层;
其中,混洗单元包括由深度可分离卷积层和普通卷积层按照特定排列方式所构成的标准模块和降采样模块。
根据本发明的实施例,上述利用训练完成的轻量化预测神经网络处理任务点地图和二维环境地图,得到引导地图包括:
利用编码器的多个普通卷积层和多个最大池化层对任务点地图进行多轮次的特征提取操作,得到多个任务点特征图;
利用特征融合模块通过多个并行的空洞卷积层处理二维环境地图,得到具有不同扩展比率的多个初始特征图;
利用特征融合模块将具有不同扩展比率的多个初始特征图进行融合,得到多尺度融合特征图;
利用标准模块和降采样模块分别先后对多尺度融合特征图进行多轮次通道混洗操作,得到多个混洗特征图;
将多个混洗特征图与多个任务点特征图进行拼接操作,得到多个混洗拼接特征图;
利用解码器对多个混洗拼接特征图进行反卷积解码操作,得到多个解码特征图;
利用解码器通过跳跃连接方式将属于同一层次的混洗拼接特征图和解码特征图进行合并,并基于合并结果得到引导地图。
根据本发明的实施例,上述利用标准模块和降采样模块分别先后对多尺度融合特征图进行多轮次通道混洗操作,得到多个混洗特征图包括:
利用标准模块对一部分的多尺度融合特征图进行多次标准卷积处理,得到标准卷积处理结果;
利用标准模块将另一部分的多尺度融合特征图与标准卷积处理结果进行合并,得到标准合并结果;
利用标准模块对标准合并结果进行通道混洗,得到标准混洗特征图;
利用降采样模块的第一分支对一部分的标准混洗特征图进行多次降采样卷积处理,得到第一降采样卷积处理结果;
利用降采样模块的第二分支对另一部分的标准混洗特征图进行多次降采样卷积处理,得到第二降采样卷积处理结果,其中,降采样模块的第二分支在卷积层构成上与降采样模块的第一分支不同;
将第一降采样卷积处理结果与二降采样卷积处理结果进行合并,得到降采样合并结果;
利用降采样模块对降采样合并结果进行通道混洗,得到降采样混洗特征图。
经过标准模块和降采样模块多轮次卷积操作、合并操作以及通道混洗操作,得到多个混洗特征图。
根据本发明的实施例,上述利用标准模块对一部分的多尺度融合特征图进行多次标准卷积处理,得到标准卷积处理结果包括:
利用标准模块的初始1×1普通卷积层对多尺度融合特征图进行初次卷积操作,并将卷积操作的结果分别进行初次归一化处理操作和初次激活处理操作,得到初次处理结果;
利用标准模块的3×3深度可分离卷积层对初次处理结果进行二次卷积操作,并将二次卷积操作的结果进行二次归一化处理操作,得到二次处理结果;
利用标准模块的最终1×1普通卷积层对二次处理结果进行最终卷积操作,并将最终卷积操作的结果分别进行最终归一化处理操作和最终激活处理操作,得到标准卷积处理结果。
根据本发明的实施例,上述利用降采样模块的第二分支对另一部分的标准混洗特征图进行多次降采样卷积处理,得到第二降采样卷积处理结果包括:
利用第二分支的3×3深度可分离卷积层对标准混洗特征图进行初次卷积操作,得到深度可分离卷积结果;
将深度可分离卷积结果进行归一化处理操作,并利用第二分支的1×1普通卷积层对归一化处理结果进行二次卷积操作,得到二次卷积结果;
对二次卷积结果分别进行二次归一化处理操作和激活处理操作,得到第二降采样卷积处理结果。
根据本发明的实施例,上述利用混合采样规划器对二维环境地图进行均匀采样,对引导地图进行有偏采样,并基于采样结果执行随机数搜索算法,生成机器人的行驶路径包括:
生成用于表征采样状态的随机数,并将随机数与预设的超参数偏置因子进行比较;
在随机数小于超参数偏置因子情况下,利用混合采样规划器对二维环境地图进行均匀采样,得到均匀采样结果;
在随机数大于或等于超参数偏置因子情况下,利用混合采样规划器对引导地图进行有偏采样,得到有偏采样结果;
迭代进行随机数生成操作、比较操作以及采样操作,直到满足第一预设条件,得到采样结果,其中,采样结果用于延拓展路径生成树的状态节点;
基于路径生成树,直到路径生成树的状态节点拓展到预设目标节点,生成所述机器人的行驶路径。
根据本发明的第二个方面,提供了一种轻量化预测神经网络的训练方法,应用于机器人路径规划方法,包括:
利用轻量化预测神经网络的特征融合模块对二维环境地图样本先后进行卷积与合并处理操作,得到多尺度融合特征图;
利用轻量化预测神经网络的编码器对多尺度融合特征图和任务点地图样本先后进行拼接、卷积、合并以及通道混洗操作,得到混洗拼接特征图;
利用轻量化预测神经网络的解码器对混洗拼接特征图进行反卷积解码操作,并将反卷积解码结果与混洗拼接特征图进行合并,得到预测用的引导地图;
利用判别器处理预测用的引导地图和具有真值标签的真实引导地图,得到判别结果,其中,判别器基于Patch-GAN结构进行构建,判别器包括基于空间注意力和通道注意力的注意力模块;
基于判别结果,利用预设的损失函数优化轻量化预测神经网络的参数;
迭代进行上述操作,直到满足第二预设条件,得到训练完成的轻量化预测神经网络。
根据本发明的第三个方面,提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述机器人路径规划方法和轻量化预测神经网络的训练方法。
根据本发明的第四个方面,提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述机器人路径规划方法和轻量化预测神经网络的训练方法。
本发明提供的上述机器人路径规划方法基于训练完成的轻量化预测神经网络和混合采样规划器,能够利用神经网络生成规划任务匹配的引导地图,并通过混合采样方式提高传统方法在规划空间内的搜索效率。相较于现有技术,本发明提供的上述机器人路径规划方法具有高效、便捷、准确度高、计算复杂度低等优点。同时,由于本发明提供的上述机器人路径规划方法采用的是轻量化预测神经网络,所以本发明所提供的机器人路径规划方法能够很方便地部署到移动平台端,大大降低了软硬件的使用成本。
附图说明
图1是根据本发明实施例的机器人路径规划方法的流程图;
图2是根据本发明实施例的基于轻量化预测神经网络和混合采样规划器的机器人路径规划架构的示意图;
图3是根据本发明实施例的轻量化预测神经网络的结构示意图;
图4是根据本发明实施例的获取引导地图的流程图;
图5是根据本发明实施例的获取多个混洗特征图的流程图;
图6是根据本发明实施例的获取标准卷积处理结果的流程图;
图7是根据本发明实施例获取第二降采样卷积处理结果的流程图;
图8是根据本发明实施例的生成机器人的行驶路径的流程图;
图9(a)是根据本发明实施例的混合采样规划器的标准模块数据处理流程图;
图9(b)是根据本发明实施例的混合采样规划器的降采样模块数据处理流程图;
图10是根据本发明实施例的轻量化预测神经网络的训练方法的流程图;
图11是根据本发明实施例的适于实现机器人路径规划方法和轻量化预测神经网络的训练方法的电子设备的方框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
机器人路径规划方法现有技术中有基于采样的路径规划算法和基于学习的路径规划方法。其中,基于采样的路径规划算法作为一类成熟可靠的运动轨迹方法,广泛应用于机器人复杂环境的导航中,如轮式机器人,双足机器人等。比较有代表性的算法有快速探索随机树(Rapidly-exploring Random Tree,以下简称RRT)及其变种(以下简称RRT)。RRT和RRT/>会在移动机器人所处的在状态空间内进行随机采样,从起点开始构建状态搜索树,通过对采样点进行碰撞检测或者路径优化(如果是RRT/>)等操作,从而构造出一条从起点到终点的可行路径或者最优路径(如果是RRT/>)。该类算法一般采用全局空间随机采样的方式,遍历整个空间直到获取可行路径,尽管概率完备但是面临着搜索效率低收敛慢等问题。基于学习的路径规划方法是一种集成深度学习和传统规划方法的新技术,得益于其智能性,越来越多地被用于机器人系统的路径规划。常见的方法包括利用强化学习(ReinforcementLearning, 以下简称RL)对机器人和环境之间的交互进行模拟,以解决实时路径规划问题,但是方法更多的用于局部规划,对于全局规划问题仍有难度。监督学习(SupervisedLearning)也常被用来指导移动机器人规划过程或直接生成可行的路径。其中卷积神经网络(Convolutional neural networks, 以下简称CNNs)也被广泛用于路径规划。例如利用条件变分自动编码器(Conditional Variational Autoencoder, 以下简称CVAE)用于从专家数据集中生成路径的潜在分布区域,并用作RRT/RRT/>中的模块,进行规划。但由于引入了深度神经网络,这些方法通常需要相当大的计算资源和存储空间,因此很难部署在资源受限的机器人系统上,此外网络的推理时间也会影响到机器人的实时性。
针对现有技术中存在的诸多技术问题,本发明采用了训练完成的轻量化预测神经网络来解决复杂神经网络计算复杂度高、低成本可部署性差等问题。其中,轻量化神经网络是一种主要针对移动平台从而实现硬件友好型的神经网络。常用的轻量化神经网络的技术有:蒸馏、剪枝、更轻的网络架构设计等。其中网络架构设计可以从根源上解决参数过多运算占用过大等问题。比较有代表性的是ShuffleNet网络,通过引入新的卷积方式和数据通道混洗操作,实现了更小的尺寸和更快的运算。
图1是根据本发明实施例的机器人路径规划方法的流程图。
如图1所示,上述机器人路径规划方法包括操作S110~操作S140。
在操作S110,基于机器人所处的配置空间、初始状态和目的地区域,构建用于解决机器人路径规划问题的任务实例模型。
任务实例模型表示了与全局路径规划相关的三元组,其中,/>表示移动机器人所处的配置空间,/>是机器人初始状态,/>是机器人目的地区域。
在操作S120,根据任务实例模型,将机器人所处的配置空间编码成二维环境地图,并将机器人的起始坐标和目的地坐标编码成任务点地图。
将图像转化为计算机系统可以识别的三通道数据;二维平面图和任务点图/>由以/>表示,C是图像的通道数,H是图像的长度的像素点个数,W是图像宽度的像素点个数,此处有/>
在操作S130,利用训练完成的轻量化预测神经网络处理任务点地图和二维环境地图,得到引导地图,其中,引导地图用于预测机器人从起始点到目标点之间的可行区域。
在操作S140,利用混合采样规划器对二维环境地图进行均匀采样,对引导地图进行有偏采样,并基于采样结果执行随机生成树搜索算法,生成机器人的行驶路径。
本发明提供的上述机器人路径规划方法基于训练完成的轻量化预测神经网络和混合采样规划器,能够利用神经网络生成规划任务匹配的引导地图,并通过混合采样方式提高传统方法在规划空间内的搜索效率。相较于现有技术,本发明提供的上述机器人路径规划方法具有高效、便捷、准确度高、计算复杂度低等优点。同时,由于本发明提供的上述机器人路径规划方法采用的是轻量化预测神经网络,所以本发明所提供的机器人路径规划方法能够很方便地部署到移动平台端,大大降低了软硬件的使用成本。
下面结合附图2以及具体实时方式,对上述机器人路径规划方法的优点做进一步详细地说明。
图2是根据本发明实施例的基于轻量化预测神经网络和混合采样规划器的机器人路径规划架构的示意图。
为了得到高效且计算复杂度低的路径规划方法,本发明设计了如图2所示的机器人快速路径规划框架,将传统的基于采样的路径规划算法和特定神经网络相结合,针对任务实例,设计了一种混合采样规划器,从而完成机器人快速反应规划任务。
如图2所示,对机器人所处的环境进行抽象,构建用于规划问题的任务实例模型。利用轻量化预测神经网络生成引导地图,经过混合采样规划器(或混合采样器)进行混合采样经过规划器处理后,得到机器人的快速路径规划方案。
基于采样的路径规划算法包括快速扩展随机树算法及其变种,是一个在状态空间内进行随机采样,从起点开始构建状态搜索树,结合障碍检测等约束条件,直到树的节点延伸至目标点或达到的采样次数的路径规划算法。任务实例用于描述需要解决的特定规划任务,是一个三元组,由机器人所处的配置空间、初始状态和目标区域组成。特定神经网络用于生成任务实例对应的引导地图,该引导地图用于预测起始点到目标点之间的可行区域,网络包括轻量化特征提取、多尺度特征融合和双分支输入结构。混合采样规划器用于规划从起始点到目标点之间的有效或者最优路径,包括两种不同的状态采样模式,一是基于全局地图的均匀采样,二是基于引导地图的有偏好的采样,混合采样的优点在于可以减少搜索时间。
图2所示的基于轻量化预测神经网络和混合采样规划器的路径规划架构包括建立全局路径规划问题的任务实例模型;编码规划任务信息,将机器人所在的配置空间表示为二维平面图,并将规划任务的起始坐标和目的地坐标标注为任务点图;将任务实例送入轻量化生成网络中得到和对应的引导地图;根据确定的起始坐标点和目的地坐标,执行混合采样规划算法,实现全局规划任务的快速路径生成;其中,任务实例模型是基于三元组描述移动机器人所需要执行的任务信息,包括机器人所在的状态空间,起始坐标以及目的地区域。
根据本发明的实施例,上述训练完成的轻量化预测神经网络包括由编码器和解码器构成的U形轻量级骨干网络;其中,编码器包括特征融合模块、多个普通卷积层、多个最大池化层以及多个用于特征提取的混洗单元,解码器包括多个逆卷积层和多个3×3深度可分离卷积层;其中,混洗单元包括由深度可分离卷积层和普通卷积层按照特定排列方式所构成的标准模块和降采样模块。
图3是根据本发明实施例的轻量化预测神经网络的结构示意图。
如图3所示,轻量化预测神经网络是一个卷积神经网络生成器,它从成功的规划经验中进行监督学习,同时利用判别器评估生成器产生的图像效果。将任务实例输入训练好网络,预测从起点到终点的前瞻性规划区域即指导地图。对于训练完成的轻量化预测神经网络,由环境地图/>和任务点地图/>构成的条件对作为输入/>,同时网络包括轻量级特征提取模块和新颖的卷积单元,所得到预测区域即引导地图/>
具体来说,轻量化预测神经网络包括一个基本的U形的轻量级骨干网络,一种典型的编码器-解码器结构,编码器包含五个特征提取层,解码器是一个上采样网络。编码网络将由深度可分离卷积(Depthwise seperable convolution, 以下简称DWConv)和1×1普通卷积(Convolution,以下简称Conv)组成的混洗(Shuffle)单元作为编码路径中的基本特征提取器,其中混洗单元包括标准模块和降采样模块。
图4是根据本发明实施例的获取引导地图的流程图。
如图4所示,上述利用训练完成的轻量化预测神经网络处理任务点地图和二维环境地图,得到引导地图包括操作S410~操作S470。
在操作S410,利用编码器的多个普通卷积层和多个最大池化层对任务点地图进行多轮次的特征提取操作,得到多个任务点特征图。
在操作S420,利用特征融合模块通过多个并行的空洞卷积层处理二维环境地图,得到具有不同扩展比率的多个初始特征图。
在操作S430,利用特征融合模块将具有不同扩展比率的多个初始特征图进行融合,得到多尺度融合特征图。
在操作S440,利用标准模块和降采样模块分别先后对多尺度融合特征图进行多轮次通道混洗操作,得到多个混洗特征图。
在操作S450,将多个混洗特征图与多个任务点特征图进行拼接操作,得到多个混洗拼接特征图。
在操作S460,利用解码器对多个混洗拼接特征图进行反卷积解码操作,得到多个解码特征图。
在操作S470,利用解码器通过跳跃连接方式将属于同一层次的混洗拼接特征图和解码特征图进行合并,并基于合并结果得到引导地图。
下面结合具体实施例进一步详细地说明训练完成的轻量化预测神经网络在处理二维环境地图和任务点地图的过程。
混洗单元的标准模块中,输入特征被分成两个分支。一半的输入数据依次通过1×1 Conv层,3×3DWConv层和1×1Conv层,另一半的数据则保持不变,将两路数据合并再进行通道混洗操作,输出特征图。混洗单元的降采样块中,一半的输入数据依次通过3×3DWConv层和1×1Conv层,另一半的数据则通过1×1 Conv层,3×3 DWConv层和1×1Conv层,随后合并(Concat)两个分支输出的特征图执行信道混洗操作,最后输出给网络的下一层结构。
在解码路径中,采用跳跃连接方式对当前特征图和编码网络中的同一层特征图进行合并,此外两个3×3DWConv和逆卷积(ConvTranspose2d)被交错堆叠作为上采样层基本模块。因此,由于整个混洗单元和DWConv较低的参数,在保持输出质量的同时,降低了整个网络的计算成本。
轻量化预测神经网络中的多尺度特征融合用于解决网络参数量减小导致预测区域的质量下降的问题。主干网络在环境地图的输入后面引入了一个融合模块,使用4个并行的空洞卷积(Atrous Convolution),卷积核的尺寸大小为3×3,但具有不同的扩张比率,分别为1、2、3、5,得到相应的特征图。融合模块随后四个特征图合并(Concat)为一个多尺度特征图。扩张卷积可以在不使用过多参数的情况下增加特征提取的感受视野,可以更好的捕获环境地图的障碍物信息。
轻量化预测神经网络中的双分支输入结构中,除主干网络外还引入了一条支路用于对任务点地图进行特征提取。该分支中,共有四层,每层由普通卷积和最大池化操作组成,卷积操作之后,任务点特征图被送入骨干网络中,并与同一级的环境特征图进拼接(Concat)操作。
图5是根据本发明实施例的获取多个混洗特征图的流程图。
如图5所示,上述利用标准模块和降采样模块分别先后对多尺度融合特征图进行多轮次通道混洗操作,得到多个混洗特征图包括操作S510~操作S580。
在操作S510,利用标准模块对一部分的多尺度融合特征图进行多次标准卷积处理,得到标准卷积处理结果。
在操作S520,利用标准模块将另一部分的多尺度融合特征图与标准卷积处理结果进行合并,得到标准合并结果。
在操作S530,利用标准模块对标准合并结果进行通道混洗,得到标准混洗特征图。
在操作S540,利用降采样模块的第一分支对一部分的标准混洗特征图进行多次降采样卷积处理,得到第一降采样卷积处理结果。
在操作S550,利用降采样模块的第二分支对另一部分的标准混洗特征图进行多次降采样卷积处理,得到第二降采样卷积处理结果,其中,降采样模块的第二分支在卷积层构成上与降采样模块的第一分支不同。
在操作S560,将第一降采样卷积处理结果与二降采样卷积处理结果进行合并,得到降采样合并结果。
在操作S570,利用降采样模块对降采样合并结果进行通道混洗,得到降采样混洗特征图。
在操作S580,经过标准模块和降采样模块多轮次卷积操作、合并操作以及通道混洗操作,得到多个混洗特征图。
图6是根据本发明实施例的获取标准卷积处理结果的流程图。
如图6所示,上述利用标准模块对一部分的多尺度融合特征图进行多次标准卷积处理,得到标准卷积处理结果包括操作S610~操作S630。
在操作S610,利用标准模块的初始1×1普通卷积层对多尺度融合特征图进行初次卷积操作,并将卷积操作的结果分别进行初次归一化处理操作和初次激活处理操作,得到初次处理结果。
在操作S620,利用标准模块的3×3深度可分离卷积层对初次处理结果进行二次卷积操作,并将二次卷积操作的结果进行二次归一化处理操作,得到二次处理结果。
在操作S630,利用标准模块的最终1×1普通卷积层对二次处理结果进行最终卷积操作,并将最终卷积操作的结果分别进行最终归一化处理操作和最终激活处理操作,得到标准卷积处理结果。
图7是根据本发明实施例获取第二降采样卷积处理结果的流程图。
如图7所示,上述利用降采样模块的第二分支对另一部分的标准混洗特征图进行多次降采样卷积处理,得到第二降采样卷积处理结果包括操作S710~操作S730。
在操作S710,利用第二分支的3×3深度可分离卷积层对标准混洗特征图进行初次卷积操作,得到深度可分离卷积结果。
在操作S720,将深度可分离卷积结果进行归一化处理操作,并利用第二分支的1×1普通卷积层对归一化处理结果进行二次卷积操作,得到二次卷积结果。
在操作S730,对二次卷积结果分别进行二次归一化处理操作和激活处理操作,得到第二降采样卷积处理结果。
图8是根据本发明实施例的生成机器人的行驶路径的流程图。
如图8所示,上述利用混合采样规划器对二维环境地图进行均匀采样,对引导地图进行有偏采样,并基于采样结果执行随机数搜索算法,生成机器人的行驶路径包括操作S810~操作S850。
在操作S810,生成用于表征采样状态的随机数,并将随机数与预设的超参数偏置因子进行比较。
在操作S820,在随机数小于超参数偏置因子情况下,利用混合采样规划器对二维环境地图进行均匀采样,得到均匀采样结果。
在操作S830,在随机数大于或等于超参数偏置因子情况下,利用混合采样规划器对引导地图进行有偏采样,得到有偏采样结果。
在操作S840,迭代进行随机数生成操作、比较操作以及采样操作,直到满足第一预设条件,得到采样结果,其中,采样结果用于延拓展路径生成树的状态节点。
在操作S850,基于路径生成树,直到路径生成树的状态节点拓展到预设目标节点,生成机器人的行驶路径。
下面结合附图9、表1以及具体实施例进一步详细说明混合采样规划器进行混合采样的过程。
图9(a)是根据本发明实施例的混合采样规划器的标准模块数据处理流程图。
图9(b)是根据本发明实施例的混合采样规划器的降采样模块数据处理流程图。
如图9所示,混合采样规划器包括标准模块和降采样模块。该混合采样规划器(或混合采样器)包括全局均匀采样模式和基于引导地图的有偏采样模式,算法流程图如图9所示,采样器按一定概率选取以上两种模式,以得到规划算法中的用于构造搜索树的状态节点。有偏采样模式可以将状态集中在引导地图指示的区域,这样可以使得规划算法偏向目标节点展开最优路径的搜索,进一步减少搜索次数和时间。采样器中引入了一个超参数偏置因子(BiasFactor),每次执行采样过程中算法会生成一个随机数,如果小于BiasFactor就采取全局均匀采样,反之则采取有偏采样,这种切换可以平衡混合采样规划器的效率和探索,也确保概率的完整性。
表1显示了混合采样的伪代码。
图10是根据本发明实施例的轻量化预测神经网络的训练方法的流程图。
如图10所示,上述一种轻量化预测神经网络的训练方法,应用于机器人路径规划方法包括操作S1010~操作1060。
在操作S1010,利用轻量化预测神经网络的特征融合模块对二维环境地图样本先后进行卷积与合并处理操作,得到多尺度融合特征图。
在操作S1020,利用轻量化预测神经网络的编码器对多尺度融合特征图和任务点地图样本先后进行拼接、卷积、合并以及通道混洗操作,得到混洗拼接特征图。
在操作S1030,利用轻量化预测神经网络的解码器对混洗拼接特征图进行反卷积解码操作,并将反卷积解码结果与混洗拼接特征图进行合并,得到预测用的引导地图。
在操作S1040,利用判别器处理预测用的引导地图和具有真值标签的真实引导地图,得到判别结果,其中,判别器基于Patch-GAN结构进行构建,判别器包括基于空间注意力和通道注意力的注意力模块。
训练生成网络的判别器基于Patch-GAN结构进行改进,训练过程中,环境地图和任务点以及生成的引导地图或者真实区域被送到一个四层卷积网络中,其中每层由卷积+激活函数+池化操作组成,最后输出一个1或0的矩阵。在判别器中,引入了注意模块CBAM以确保网络局部重点特征。
在操作S1050,基于判别结果,利用预设的损失函数优化轻量化预测神经网络的参数。
在操作S1060,迭代进行上述操作,直到满足第二预设条件,得到训练完成的轻量化预测神经网络。
本发明的基于深度神经网络和全局路径规划算法,用于解决移动机器人操作中的快速路径规划问题。
本发明的优点与积极效果为:提出了一种基于学习的轻量化的路径规划方法,针对所需解决的全局规划问题,设计了专有的神经网络,生成对应的引导地图,该网络具有模型小推理速度快的优势,在移动机器人平台上实现更加友好。基于引导地图的混合采样规划算法适用于探索空间过大,环境复杂的场合中,能够加快移动机器人的路径生成效率。与传统的路径规划方法相比,该方法能够快速规划出起点到终点间的可行路径或者最优路径,计算复杂度低,规划效率高。
本发明提供了一种用于移动平台,基于轻量级神经网络的路径规划架构,可以为机器人全局规划任务快速设计出从初始点到目标点的最优轨迹。将基于采样的路径规划算法和最新的轻量化网络结合,用于提高规划方法中的采样效率,减少任务规划的计算时间,同时有利于在低计算资源的移动平台端上部署。针对路径规划任务,引入了生成网络,并设计了高效的任务特征提取和融合模块,将给定的规划问题实例转化为匹配的引导地图,随后采用混合采样规划算法,将经典算法的采样空间范围约束在引导地图所指示的区域内,减少状态冗余点,实现更高效的路径规划策略。与传统的基于采样的规划算法相比,该方法能够更快收敛到最优的路径;与一般的深度神经网络相比,保证性能的同时,所提出的网络具有更小的参数和模型大小。
图11是根据本发明实施例的适于实现机器人路径规划方法和轻量化预测神经网络的训练方法的电子设备的方框图。
如图11所示,根据本发明实施例的电子设备1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本发明实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有电子设备1100操作所需的各种程序和数据。处理器 1101、ROM 1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM1103中的程序来执行根据本发明实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM 1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在一个或多个存储器中的程序来执行根据本发明实施例的方法流程的各种操作。
根据本发明的实施例,电子设备1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。电子设备1100还可以包括连接至I/O接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本发明实施例的方法。
根据本发明的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本发明的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种机器人路径规划方法,其特征在于,包括:
基于所述机器人所处的配置空间、初始状态和目的地区域,构建用于解决机器人路径规划问题的任务实例模型;
根据所述任务实例模型,将所述机器人所处的配置空间编码成二维环境地图,并将所述机器人的起始坐标和目的地坐标编码成任务点地图;
利用训练完成的轻量化预测神经网络处理所述任务点地图和所述二维环境地图,得到引导地图,其中,所述引导地图用于预测所述机器人从起始点到目标点之间的可行区域;
利用混合采样规划器对所述二维环境地图进行均匀采样,对所述引导地图进行有偏采样,并基于采样结果执行随机生成树搜索算法,生成所述机器人的行驶路径;
其中,所述训练完成的轻量化预测神经网络包括由编码器和解码器构成的U形轻量级骨干网络;
其中,所述编码器包括特征融合模块、多个普通卷积层、多个最大池化层以及多个用于特征提取的混洗单元,所述解码器包括多个逆卷积层和多个33深度可分离卷积层;
其中,所述混洗单元包括由深度可分离卷积层和普通卷积层按照特定排列方式所构成的标准模块和降采样模块;
其中,利用训练完成的轻量化预测神经网络处理所述任务点地图和所述二维环境地图,得到引导地图包括:
利用所述编码器的多个普通卷积层和多个最大池化层对所述任务点地图进行多轮次的特征提取操作,得到多个任务点特征图;
利用所述特征融合模块通过多个并行的空洞卷积层处理所述二维环境地图,得到具有不同扩展比率的多个初始特征图;
利用所述特征融合模块将所述具有不同扩展比率的多个初始特征图进行融合,得到多尺度融合特征图;
利用所述标准模块和所述降采样模块分别先后对所述多尺度融合特征图进行多轮次通道混洗操作,得到多个混洗特征图;
将所述多个混洗特征图与所述多个任务点特征图进行拼接操作,得到多个混洗拼接特征图;
利用所述解码器对所述多个混洗拼接特征图进行反卷积解码操作,得到多个解码特征图;
利用所述解码器通过跳跃连接方式将属于同一层次的所述混洗拼接特征图和所述解码特征图进行合并,并基于合并结果得到所述引导地图;
其中,利用混合采样规划器对所述二维环境地图进行均匀采样,对所述引导地图进行有偏采样,并基于采样结果执行随机生成树搜索算法,生成所述机器人的行驶路径包括:
生成用于表征采样状态的随机数,并将所述随机数与预设的超参数偏置因子进行比较;
在所述随机数小于所述超参数偏置因子情况下,利用所述混合采样规划器对所述二维环境地图进行均匀采样,得到均匀采样结果;
在所述随机数大于或等于所述超参数偏置因子情况下,利用所述混合采样规划器对所述引导地图进行有偏采样,得到有偏采样结果;
迭代进行随机数生成操作、比较操作以及采样操作,直到满足第一预设条件,得到所述采样结果,其中,所述采样结果用于延拓展路径生成树的状态节点;
基于所述路径生成树,直到所述路径生成树的状态节点拓展到预设目标节点,生成所述机器人的行驶路径。
2.根据权利要求1所述的方法,其特征在于,利用所述标准模块和所述降采样模块分别先后对所述多尺度融合特征图进行多轮次通道混洗操作,得到多个混洗特征图包括:
利用所述标准模块对一部分的多尺度融合特征图进行多次标准卷积处理,得到标准卷积处理结果;
利用所述标准模块将另一部分的多尺度融合特征图与所述标准卷积处理结果进行合并,得到标准合并结果;
利用所述标准模块对所述标准合并结果进行通道混洗,得到标准混洗特征图;
利用所述降采样模块的第一分支对一部分的所述标准混洗特征图进行多次降采样卷积处理,得到第一降采样卷积处理结果;
利用所述降采样模块的第二分支对另一部分的所述标准混洗特征图进行多次降采样卷积处理,得到第二降采样卷积处理结果,其中,所述降采样模块的第二分支在卷积层构成上与所述降采样模块的第一分支不同;
将所述第一降采样卷积处理结果与所述二降采样卷积处理结果进行合并,得到降采样合并结果;
利用所述降采样模块对所述降采样合并结果进行通道混洗,得到降采样混洗特征图;
经过所述标准模块和所述降采样模块多轮次卷积操作、合并操作以及通道混洗操作,得到所述多个混洗特征图。
3.根据权利要求2所述的方法,其特征在于,利用所述标准模块对一部分的多尺度融合特征图进行多次标准卷积处理,得到标准卷积处理结果包括:
利用所述标准模块的初始11普通卷积层对所述多尺度融合特征图进行初次卷积操作,并将卷积操作的结果分别进行初次归一化处理操作和初次激活处理操作,得到初次处理结果;
利用标准模块的33深度可分离卷积层对所述初次处理结果进行二次卷积操作,并将二次卷积操作的结果进行二次归一化处理操作,得到二次处理结果;
利用所述标准模块的最终11普通卷积层对所述二次处理结果进行最终卷积操作,并将最终卷积操作的结果分别进行最终归一化处理操作和最终激活处理操作,得到标准卷积处理结果。
4.根据权利要求2所述的方法,其特征在于,利用所述降采样模块的第二分支对另一部分的所述标准混洗特征图进行多次降采样卷积处理,得到第二降采样卷积处理结果包括:
利用所述第二分支的33深度可分离卷积层对所述标准混洗特征图进行初次卷积操作,得到深度可分离卷积结果;
将所述深度可分离卷积结果进行归一化处理操作,并利用所述第二分支的11普通卷积层对归一化处理结果进行二次卷积操作,得到二次卷积结果;
对所述二次卷积结果分别进行二次归一化处理操作和激活处理操作,得到所述第二降采样卷积处理结果。
5.一种轻量化预测神经网络的训练方法,应用于权利要求1-4任一项所述的方法,其特征在于,包括:
利用所述轻量化预测神经网络的特征融合模块对二维环境地图样本先后进行卷积与合并处理操作,得到多尺度融合特征图;
利用所述轻量化预测神经网络的编码器对所述多尺度融合特征图和任务点地图样本先后进行拼接、卷积、合并以及通道混洗操作,得到混洗拼接特征图;
利用所述轻量化预测神经网络的解码器对所述混洗拼接特征图进行反卷积解码操作,并将反卷积解码结果与所述混洗拼接特征图进行合并,得到预测用的引导地图;
利用判别器处理所述预测用的引导地图和具有真值标签的真实引导地图,得到判别结果,其中,所述判别器基于Patch-GAN结构进行构建,所述判别器包括基于空间注意力和通道注意力的注意力模块;
基于所述判别结果,利用预设的损失函数优化所述轻量化预测神经网络的参数;
迭代进行上述操作,直到满足第二预设条件,得到训练完成的轻量化预测神经网络。
6.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~5中任一项所述的方法。
7.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~5中任一项所述的方法。
CN202310761994.8A 2023-06-27 2023-06-27 一种机器人路径规划方法、电子设备以及存储介质 Active CN116499468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310761994.8A CN116499468B (zh) 2023-06-27 2023-06-27 一种机器人路径规划方法、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310761994.8A CN116499468B (zh) 2023-06-27 2023-06-27 一种机器人路径规划方法、电子设备以及存储介质

Publications (2)

Publication Number Publication Date
CN116499468A CN116499468A (zh) 2023-07-28
CN116499468B true CN116499468B (zh) 2023-10-20

Family

ID=87320579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310761994.8A Active CN116499468B (zh) 2023-06-27 2023-06-27 一种机器人路径规划方法、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN116499468B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10641610B1 (en) * 2019-06-03 2020-05-05 Mapsted Corp. Neural network—instantiated lightweight calibration of RSS fingerprint dataset
CN115112141A (zh) * 2022-06-24 2022-09-27 重庆长安汽车股份有限公司 一种车辆路径规划方法、系统、电子设备及存储介质
CN116022657A (zh) * 2023-01-06 2023-04-28 徐工集团工程机械股份有限公司建设机械分公司 路径规划方法、装置和起重机

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577538B2 (en) * 2006-07-14 2013-11-05 Irobot Corporation Method and system for controlling a remote vehicle

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10641610B1 (en) * 2019-06-03 2020-05-05 Mapsted Corp. Neural network—instantiated lightweight calibration of RSS fingerprint dataset
CN115112141A (zh) * 2022-06-24 2022-09-27 重庆长安汽车股份有限公司 一种车辆路径规划方法、系统、电子设备及存储介质
CN116022657A (zh) * 2023-01-06 2023-04-28 徐工集团工程机械股份有限公司建设机械分公司 路径规划方法、装置和起重机

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jingsong Li ; Xin Hu ; Xiaotong Luo ; Shaorong Wang.《Equipment-oriented Intelligent Model and Implementation System Designed for Data Management in Power System》.《2021 6th Asia Conference on Power and Electrical Engineering (ACPEE)》.2021,全文. *
Ran Duan ; Yanhui Guo ; Peng Lu.《Object Pose Estimation for UAV Navigation Using an End-to-end Lightweight CNN》.《2021 China Automation Congress (CAC)》.2021,全文. *

Also Published As

Publication number Publication date
CN116499468A (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
Nguyen et al. Help, anna! visual navigation with natural multimodal assistance via retrospective curiosity-encouraging imitation learning
EP3814865B1 (en) Self-aware visual-textual co-grounded navigation agent
JP6810415B2 (ja) 自律走行自動車のレベル4を満たすために領域のクラスに応じてモードを切り換えてグリッドセルごとに重み付けコンボリューションフィルタを利用した監視用イメージセグメンテーション方法及び装置、並びにそれを利用したテスト方法及びテスト装置
CN112686281A (zh) 基于时空注意力和多级lstm信息表达的车辆轨迹预测方法
CN111461325B (zh) 一种用于稀疏奖励环境问题的多目标分层强化学习算法
Devo et al. Deep reinforcement learning for instruction following visual navigation in 3D maze-like environments
Bhattacharyya et al. Ssl-lanes: Self-supervised learning for motion forecasting in autonomous driving
CN115358413A (zh) 一种点云多任务模型的训练方法、装置及电子设备
Zhang et al. Explainable multimodal trajectory prediction using attention models
CN111860771A (zh) 一种应用于边缘计算的卷积神经网络计算方法
CN113269133A (zh) 一种基于深度学习的无人机视角视频语义分割方法
CN116503446A (zh) 目标驱动和分布热力图输出的多模态车辆轨迹预测方法
Ou et al. GPU-based global path planning using genetic algorithm with near corner initialization
US10650279B1 (en) Learning method and learning device for heterogeneous sensor fusion by using merging network which learns non-maximum suppression
CN114355915B (zh) 一种基于深度强化学习的agv路径规划
CN113239629B (zh) 一种轨迹空间行列式点过程的强化学习探索和利用的方法
CN116499468B (zh) 一种机器人路径规划方法、电子设备以及存储介质
Kargar et al. Increasing the efficiency of policy learning for autonomous vehicles by multi-task representation learning
CN111582101B (zh) 一种基于轻量化蒸馏网络的遥感图像目标检测方法及系统
CN117292128A (zh) 一种基于stdc网络的图像实时语义分割方法及装置
Miki et al. Solving traveling salesman problem with image-based classification
Xu et al. Context-aware timewise vaes for real-time vehicle trajectory prediction
CN115423093A (zh) 任务迁移方法、电子设备及计算机存储介质
CN111539292B (zh) 一种用于具现化场景问答任务的动作决策模型及方法
CN111881981A (zh) 一种基于掩膜编码的单阶段实例分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant