CN114167865A - 一种基于对抗生成网络与蚁群算法的机器人路径规划方法 - Google Patents

一种基于对抗生成网络与蚁群算法的机器人路径规划方法 Download PDF

Info

Publication number
CN114167865A
CN114167865A CN202111456479.6A CN202111456479A CN114167865A CN 114167865 A CN114167865 A CN 114167865A CN 202111456479 A CN202111456479 A CN 202111456479A CN 114167865 A CN114167865 A CN 114167865A
Authority
CN
China
Prior art keywords
map
matrix
environment
ant
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111456479.6A
Other languages
English (en)
Other versions
CN114167865B (zh
Inventor
唐卓
王啸
曹嵘晖
纪军刚
尹旦
宋柏森
朱纯霞
赵环
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Shenzhen Zhengtong Electronics Co Ltd
Original Assignee
Hunan University
Shenzhen Zhengtong Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University, Shenzhen Zhengtong Electronics Co Ltd filed Critical Hunan University
Priority to CN202111456479.6A priority Critical patent/CN114167865B/zh
Publication of CN114167865A publication Critical patent/CN114167865A/zh
Application granted granted Critical
Publication of CN114167865B publication Critical patent/CN114167865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,包括:获取当前环境中的环境数据,并将环境数据转换为环境矩阵Gmap,获取机器人的起始目标点和结束目标点,并将生成的环境矩阵Gmap转换为领接矩阵Mmap;将机器人起始目标点坐标和结束目标点坐标与环境矩阵Gmap输入训练好的对抗生成网络GAN中,以得到在环境矩阵Gmap中存在最优路径的可行区域,根据环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行更新,根据更新后地图初始信息素并使用改进的蚁群算法获取机器人的最优规划路径。本发明能够解决现有蚁群算法存在的初始搜索的盲目性与收敛速度慢的技术问题。

Description

一种基于对抗生成网络与蚁群算法的机器人路径规划方法
技术领域
本发明属于智能优化技术领域,更具体地,涉及一种基于对抗生成网络优化蚁群算法的机器人路径规划方法。
背景技术
机器人路径规划是指在优化距离、时间或能量等性能准则的同时,寻找一条从起始状态到目标状态的最佳无碰撞路径。
现有的机器人路径规划方法主要包括蚁群算法、快速扩展随机数(Rapidly-exploring Random Trees,简称RRT)算法、以及A*算法。其中,蚁群算法是一种基于状态转移概率和信息素更新机制的模拟蚁群觅食过程的智能算法,其作为仿生算法,具有分布计算、信息正反馈和启发式搜索的特征,属于进化算法中的一种启发式全局优化算法,相较于传统的路径规划算法,在求解性能上,蚁群算法具有很强的鲁棒性和搜索较好解的能力,将蚁群算法应用在机器人路径规划问题中,形成基于蚁群算法的多智能体强化学习路径规划方法,将有效提升路径规划问题的求解效率与精度;RRT算法具体是通过抽样来在已知的地图上建立无向图,进而通过搜索方法寻找相对最优的路径;A*算法具体是是一种静态路网中求解最短路径最有效的直接搜索方法,也是许多其他问题的常用启发式算法。
然而,上述现有的机器人路径规划方法均存在一些不可忽略的技术问题:第一、上述第一种路径规划方法蚁群算法是典型的概率算法,算法中的参数设定通常由实验方法确定,导致方法的优化性能与人的经验密切相关,很难使算法性能最优化。尽管随着模型迭代次数的增加,蚁群算法总能寻找到一条最优解,但是传统蚁群算法采用初始信息素均匀分布策略,因此能见度(即两点间欧氏距离的倒数)是蚁群在初期状态转换过程中的唯一根据,各节点的搜索概率差异较小,使得蚁群的初始搜索范围为全局搜索。因此,在面对机器人路径规划的实际应用时,蚁群在初始搜索时不可避免地要花时间搜索“可行性低的节点”,导致初始搜索的盲目性与收敛速度慢等问题;第二、上述第二种路径规划方法RRT算法,虽然只要路径存在,且规划的时间足够长,就一定能确保找到一条路径解,但如果规划器的参数设置不合理(如搜索次数限制太少、采样点过少等),就可能找不到解;第三、上述第三种路径规划方法A*算法的空间增长是指数级别的并且其作为一种直接搜索方法,不对地图进行任何预处理,导致算法效率存在瓶颈
发明内容
针对现有技术的以上缺陷或改进需求,本发明公开了一种基于对抗生成网络优化蚁群算法的机器人路径规划方法,其目的在于,解决现有蚁群算法存在的初始搜索的盲目性与收敛速度慢的技术问题,以及现有RRT算法与A*算法存在的不对地图进行预处理直接搜索导致的效率瓶颈的技术问题,以及现有蚁群算法存在的可能陷入局部最优的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,包括以下步骤:
(1)获取当前环境中的环境数据,并将环境数据转换为环境矩阵Gmap,获取机器人的起始目标点和结束目标点,并将生成的环境矩阵Gmap转换为领接矩阵Mmap
(2)将步骤(1)得到的机器人起始目标点坐标和结束目标点坐标与环境矩阵Gmap输入训练好的对抗生成网络GAN中,以得到在环境矩阵Gmap中存在最优路径的可行区域;
(3)根据步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行更新,根据更新后地图初始信息素并使用改进的蚁群算法获取机器人的最优规划路径。
优选地,步骤(1)具体包括以下子步骤:
(1-1)探测环境地图中的障碍物,并对该环境地图进行栅格化,以得到栅格化后的环境地图;
(1-2)针对步骤(1-1)得到的栅格化后的环境地图,获取每个障碍节点(存在障碍物的节点)和可行节点(不存在障碍物的节点)的坐标,所有障碍节点的坐标、可行节点的坐标、以及机器人的起始目标点坐标和结束目标点坐标一起,构成新的环境地图;
(1-3)对步骤(1-2)得到的环境地图中的可行节点与障碍节点分别进行标记,以生成环境矩阵Gmap,其包括N个元素,其中N为自然数;
(1-4)根据步骤(1-3)得到环境矩阵Gmap中各个节点之间的通行代价将该环境矩阵Gmap转化为领接矩阵Mmap
优选地,步骤(1-4)中领接矩阵Mmap为N×N的矩阵,该邻接矩阵中的第i行第j列元素表示节点i到节点j的通行代价,两两节点间相邻或者构成对角,则表示可以通行,其对应的代价分别设定为1和
Figure BDA0003387858410000031
不可通行的代价记为0,其中i和j都∈[1,N]。
优选地,步骤(2)中的对抗生成网络是通过以下步骤训练得到的:
(2-1)获取训练对抗生成网络所需要的数据集,并将该数据集划分为训练集和测试集;
(2-2)初始化对抗生成网络的参数,以得到初始化后的对抗生成网络;
(2-3)将步骤(2-1)获取的训练集输入到步骤(2-2)初始化后的对抗生成网络中,以得到对抗生成网络的损失函数值LossG
(2-4)重复迭代上述步骤(2-3),直到对抗生成网络的损失函数值LossG最小为止,从而得到训练好的对抗生成网络模型。
优选地,步骤(2-1)具体为,通过在真实应用场景中随机选取多组机器人的起始目标点和结束目标点,构建环境地图,采用与步骤(1)相同的方式得到相应的起始目标点坐标和结束目标点坐标、环境矩阵Gmap与领接矩阵Mmap,在该环境矩阵上多次运行快速扩展随机树算法以得到路径,将多次运行算法得到的所有路径进行堆叠,以得到路径选择区域,将带有路径选择区域的所有环境地图按照1:1的比例划分为训练集和测试集,即随机划分50%作为训练集,剩余的50%作为测试集;
优选地,步骤(2-2)中,权重参数的初始值是使用标准差为0.1的截断式正态分布输出的随机值,偏置参数的初始值设为0,初始学习率lr=0.0003,采用阶梯性的学习策略,步长stepsize=200,权重gamma=0.1,即每200轮(epoch)将学习率乘以0.1。
优选地,步骤(2-3)中的损失函数等于:
LossG=α1logDmap(G(z,m,p),m)+α2logDpoint(G(z,m,p),p)
其中,α1与α2为动态交叉系数,设定k为超参数,α1与α2的计算方式如下式:
Figure BDA0003387858410000041
Figure BDA0003387858410000042
两个鉴别器Dmap与Dpoint的损失函数分别为:
Figure BDA0003387858410000043
Figure BDA0003387858410000044
其中u表示训练集中通过RRT算法得到的真实路径选择区域,m表示训练集中的环境矩阵Gmap,p表示训练集中机器人的起始目标点和结束目标点,z表示训练集中的样本噪声,G(z,m,p)表示对抗生成网络的输入为z、m与p时所生成的图像。
优选地,步骤(3)包括以下子步骤:
(3-1)根据步骤(1)中的机器人起始目标点和结束目标点与环境矩阵Gmap和领接矩阵Mmap,初始化蚁群算法的地图矩阵Gmap,蚁群的种群数量K=60,蚂蚁当前编号k=1,最大迭代次数tmax=400,第t轮迭代的地图信息素矩阵τ(t),并初始化蚂蚁当前位置sk与K个蚂蚁的历史位置矩阵L1~K为空,sk表示第k只蚂蚁当前在环境矩阵Gmap中的位置,历史位置矩阵Lk表示第k只蚂蚁在环境矩阵Gmap中的历史轨迹,其中k∈[1,蚁群的种群数量K],t∈[0,tmax];
(3-2)根据步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行优化,以得到优化后的地图初始信息素作为当前地图信息素矩阵;
(3-3)将第k只蚂蚁置于机器人起始目标点,以得到第k只蚂蚁的当前位置sk,清空第k只蚂蚁的历史位置矩阵Lk,并将第k只蚂蚁的当前位置sk添加到历史位置矩阵Lk
(3-4)采用轮盘赌法的状态转移机制对步骤(3-3)得到的第k只蚂蚁的当前位置sk进行更新,以得到更新后的第k只蚂蚁当前位置sk,并将更新后的sk添加到历史位置矩阵Lk
其中,轮盘赌法的状态转移机制的状态转移概率如下式:
Figure BDA0003387858410000051
Figure BDA0003387858410000052
为第k只蚂蚁从环境矩阵Gmap中的节点i移动到j的转移概率,
Figure BDA0003387858410000061
为环境矩阵Gmap中的节点i和j间蚂蚁的能见度,dij为环境矩阵Gmap中的节点i和j间的欧式距离,τij(t)为t时刻两点间的信息素浓度,allowedk为第k只蚂蚁尚未访问的邻居节点集合,α表示信息素启发因子,β表示能见度启发因子;
(3-5)判断第k只蚂蚁是否达到结束目标点或陷入死胡同,若未到达机器人结束目标点且未陷入死胡同则返回步骤(3-4);若陷入死胡同则在第k只蚂蚁的历史位置矩阵Lk中删除第k只蚂蚁当前位置sk,将当前位置sk退回到历史位置矩阵Lk中上一步的位置,并将当前的死胡同节点的状态转移概率
Figure BDA0003387858410000062
置0后转至步骤(3-5);若已达到机器人结束目标点则进入步骤(3-6)。
(3-6)判断蚂蚁当前编号k是否到达蚁群的种群数量K,若是则进入步骤(3-7),否则设置k=k+1,并返回步骤(3-3);。
(3-7)根据环境矩阵Gmap和领接矩阵Mmap计算K个蚂蚁的历史位置矩阵L1~K中的路径长度,选择路径长度最小的蚂蚁历史位置矩阵Lbs作为第t代蚁群寻优的最优路径。
(3-8)根据步骤(3-7)确定的第t代蚁群寻优的最优路径,采用改进的蚁群信息素更新公式对当前地图信息素矩阵τ(t)进行更新,以得到更新后的地图信息素矩阵τ(t+1)作为当前地图信息素矩阵。
(3-9)判断当前迭代次数t是否到达最大迭代次数tmax,若为到达则设置迭代次数t=t+1,设置蚂蚁当前编号k=1。并返回步骤(3-3),否则至步骤(3-10)。
(3-10)依据步骤(3-7)得到的每一代蚁群寻优的最优路径,选择选择路径长度最小的路径作为全局最优解,输出机器人的路径规划的全局最优解。
优选地,步骤(3-2)是按照如下式所示:
Figure BDA0003387858410000071
其中GGAN表示步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域,τij(0)表示从环境矩阵Gmap中的节点i与j之间的地图初始信息素,即第0代的地图信息素,λ表示初始信息素增强系数,其取值范围是1到2。
优选地,步骤(3-8)中蚁群信息素更新公式如下:
τij(t+1)=(1-ρ)τij(t)+Δτij
Figure BDA0003387858410000072
其中,
Figure BDA0003387858410000073
为环境矩阵Gmap中的节点i与j之间邻居节点集中障碍物的占比率,e(t)=1/exp(ωt-1)为自适应增强因子,ω为[0,1]的可选系数,ρ表示挥发系数,
Figure BDA0003387858410000074
表示最优路径信息素增量。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
1、本发明由于采用了步骤(2),其预先生成地图中存在最优路径的可行区域,提高蚁群初期搜索方向的导向性,因此能够解决现有蚁群算法存在的初始搜索的盲目性与收敛速度慢的技术问题;
2、本发明由于采用了步骤(2)与步骤(3),选择蚁群算法作为机器人路径规划的基础算法,利用训练好的对抗生成网络模型来生成一个存在最优路径的可行区域指导蚁群初期搜索方向,有效提升路径规划问题的求解效率与精度,因此能够解决现有RRT算法与A*算法存在的不对地图进行预处理直接搜索导致的效率瓶颈的技术问题;
3、本发明由于采用了步骤(3-8),其在蚁群算法的信息素更新过程中增加可随环境变化自适应调整的衰减因子,提高蚁群搜索的随机性,并引入随机状态转移参数,避免陷入局部最优,因此能够解决现有蚁群算法存在的可能陷入局部最优的技术问题。
附图说明
图1是本发明基于对抗生成网络优化蚁群算法的机器人路径规划方法的流程图;
图2是本发明使用的的对抗生成网络的模型结构图;
图3是本发明基于对抗生成网络优化蚁群算法的机器人路径规划方法的细化流程图;
图4是本发明环境地图的示意图;
图5是本发明方法的步骤(1-3)处理后生成的环境矩阵Gmap的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明的基本思路在于,采用一种基于对抗生成网络(GAN)的算法,利用训练好的对抗生成网络模型来生成一个存在最优路径的可行区域,该区域可产生非均匀的采样分布,指导基于蚁群算法的路径规划在更有效地探索状态空间内进行搜索。将环境图像与起始和结束目标点作为对抗生成网络的输入,网络拟合输出路径规划过程中可能存在的可行或最优路径的区域图。增强该区域内各点的初始信息素浓度,提高蚁群初期搜索方向的导向性,在环境中增加可随环境变化自适应调整的衰减因子,提高蚁群搜索的随机性,并引入随机状态转移参数,避免陷入局部最优,实现局部最优与全局最优之间的平衡,这将有效改进传统蚁群算法初始搜索的盲目性,提高算法的收敛速度。
如图1和图3所示,本发明提供了一种基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,包括以下步骤:
(1)获取当前环境中的环境数据,并将环境数据转换为环境矩阵Gmap,获取机器人的起始目标点和结束目标点,并将生成的环境矩阵Gmap转换为领接矩阵Mmap
进一步地,步骤(1)具体包括以下子步骤:
(1-1)探测环境地图中的障碍物,并对该环境地图进行栅格化,以得到栅格化后的环境地图;
(1-2)针对步骤(1-1)得到的栅格化后的环境地图,获取每个障碍节点(存在障碍物的节点)和可行节点(不存在障碍物的节点)的坐标,所有障碍节点的坐标、可行节点的坐标、以及机器人的起始目标点坐标和结束目标点坐标一起,构成新的环境地图;
(1-3)对步骤(1-2)得到的环境地图中(如图5所示)的可行节点(在图5中为白色)与障碍节点(在图5中为灰色)分别进行标记,以生成环境矩阵Gmap,其包括N个元素(其中N为自然数);
具体而言,本步骤是将可行节点标记为0,将障碍节点标记为1。
图4的环境地图,经过本步骤(1-3)的处理后,生成如图5所示的环境矩阵Gmap
(1-4)根据步骤(1-3)得到环境矩阵Gmap中各个节点之间的通行代价将该环境矩阵Gmap转化为领接矩阵Mmap
具体而言,本步骤中环境矩阵Gmap中有N个元素,则领接矩阵Mmap为N×N的矩阵,该邻接矩阵中的第i行第j列元素表示节点i到节点j(其中i和j都∈[1,N])的通行代价,两两节点间相邻或者构成对角,则表示可以通行,其对应的代价分别设定为1和
Figure BDA0003387858410000091
不可通行的代价记为0。
(2)将步骤(1)得到的机器人起始目标点坐标和结束目标点坐标与环境矩阵Gmap输入训练好的对抗生成网络(GenerativeAdversarialNetworks,简称GAN)中(如图2所示),以得到在环境矩阵Gmap中存在最优路径的可行区域;
进一步地,步骤(2)中的对抗生成网络是通过以下步骤训练得到的:
(2-1)获取训练对抗生成网络所需要的数据集,并将该数据集划分为训练集和测试集;
具体而言,本步骤通过在真实应用场景中随机选取多组机器人的起始目标点和结束目标点,构建环境地图(例如,在真实应用场景下,采集500组具备不同障碍节点的地图环境,每种环境选取20组机器人的起始目标点和结束目标点),采用与上述步骤(1)相同的方式得到相应的起始目标点坐标和结束目标点坐标、环境矩阵Gmap与领接矩阵Mmap,在该环境矩阵上多次运行快速扩展随机树算法(Rapidly-exploring Random Trees,简称RRT)以得到路径,将多次运行算法得到的所有路径进行堆叠,以得到路径选择区域,将带有路径选择区域的所有环境地图(500×20组)按照1:1的比例划分为训练集和测试集,即随机划分50%作为训练集,剩余的50%作为测试集,重复划分10次,以减少随机误差。
(2-2)初始化对抗生成网络的参数,以得到初始化后的对抗生成网络;
具体而言,权重参数的初始值是使用标准差为0.1的截断式正态分布输出的随机值,偏置参数的初始值设为0,初始学习率lr=0.0003,采用阶梯性的学习策略,步长stepsize=200,权重gamma=0.1,即每200轮(epoch)将学习率乘以0.1;
(2-3)将步骤(2-1)获取的训练集输入到步骤(2-2)初始化后的对抗生成网络中,以得到对抗生成网络的损失函数值LossG
为了增加对抗生成网络定位起始点与目标点的能力,采用两个鉴别器Dmap与Dpoint鉴别器分别判断网络输出的可行区域与环境地图和初始与结束状态的匹配程度。
针对两种鉴别器Dmap与Dpoint,将对抗生成网络的条件变量拆分为ymap与ypoint即输入为m(环境矩阵Gmap)与p(机器人的起始目标点和结束目标点),生成的图像可以表示为G(z,m,p)。分别定义两个鉴别器的损失函数如下式:
Figure BDA0003387858410000111
Figure BDA0003387858410000112
其中u表示训练集中通过RRT算法得到的真实路径选择区域,m表示训练集中的环境矩阵Gmap,p表示训练集中机器人的起始目标点和结束目标点,z表示训练集中的样本噪声。
对于生成器G,定义其损失函数如下式:
LossG=α1logDmap(G(z,m,p),m)+α2logDpoint(G(z,m,p),p)
其中,由于起始状态和目标状态占用图像中的小像素,生成器G可能会忽略它们的语义信息。为了提高生成器G对起始状态和目标状态的关注,设计了动态交叉系数α1与α2,赋予其较大的损失权重。设定超参数k(其取值为k=3),α1与α2的计算方式如下式:
Figure BDA0003387858410000113
Figure BDA0003387858410000114
(2-4)重复迭代上述步骤(2-3),直到对抗生成网络的损失函数值LossG最小为止,从而得到训练好的对抗生成网络模型;
本步骤执行完毕后,最终训练出在给定机器人的起始目标点和结束目标点和环境地图所生成的环境矩阵Gmap的条件下,能够生成非均匀采样的可行区域的对抗生成网络模型。
(3)根据步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行更新,根据更新后地图初始信息素并使用改进的蚁群算法(其中将步骤(1)中的机器人起始目标点和结束目标点与环境矩阵Gmap和领接矩阵Mmap作为蚁群算法的输入)获取机器人的最优规划路径。
进一步地,步骤(3)包括以下子步骤:
(3-1)根据步骤(1)中的机器人起始目标点和结束目标点与环境矩阵Gmap和领接矩阵Mmap,初始化蚁群算法的地图矩阵Gmap,蚁群的种群数量K=60,蚂蚁当前编号k=1(表示第1只蚂蚁),最大迭代次数tmax=400,第t轮迭代的地图信息素矩阵τ(t)(其中t∈[0,tmax]),并初始化蚂蚁当前位置sk与K个蚂蚁的历史位置矩阵L1~K为空,sk表示第k只蚂蚁当前在环境矩阵Gmap中的位置,历史位置矩阵Lk表示第k只蚂蚁在环境矩阵Gmap中的历史轨迹,其中k∈[1,蚁群的种群数量K],;
(3-2)根据步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行优化,以得到优化后的地图初始信息素作为当前地图信息素矩阵;
具体而言,本步骤是如下式所示:
Figure BDA0003387858410000121
其中GGAN表示步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域,τij(0)表示从环境矩阵Gmap中的节点i与j之间的地图初始信息素(即第0代的地图信息素),λ表示初始信息素增强系数,其取值范围是1到2,优选为1.5。
(3-3)将第k只蚂蚁置于机器人起始目标点,以得到第k只蚂蚁的当前位置sk,清空第k只蚂蚁的历史位置矩阵Lk,并将第k只蚂蚁的当前位置sk添加到历史位置矩阵Lk
(3-4)采用轮盘赌法的状态转移机制对步骤(3-3)得到的第k只蚂蚁的当前位置sk进行更新,以得到更新后的第k只蚂蚁当前位置sk,并将更新后的sk添加到历史位置矩阵Lk
其中,轮盘赌法的状态转移机制的状态转移概率如下式:
Figure BDA0003387858410000131
Figure BDA0003387858410000132
为第k只蚂蚁从环境矩阵Gmap中的节点i移动到j的转移概率,
Figure BDA0003387858410000133
为环境矩阵Gmap中的节点i和j间蚂蚁的能见度,dij为环境矩阵Gmap中的节点i和j间的欧式距离,τij(t)为t时刻两点间的信息素浓度,allowedk为第k只蚂蚁尚未访问的邻居节点集合,α表示信息素启发因子,其取值为2,β表示能见度启发因子,其取值为7。
(3-5)判断第k只蚂蚁是否达到结束目标点或陷入死胡同,若未到达机器人结束目标点且未陷入死胡同则返回步骤(3-4);若陷入死胡同则在第k只蚂蚁的历史位置矩阵Lk中删除第k只蚂蚁当前位置sk,将当前位置sk退回到历史位置矩阵Lk中上一步的位置,并将当前的死胡同节点的状态转移概率
Figure BDA0003387858410000134
置0后转至步骤(3-5);若已达到机器人结束目标点则进入步骤(3-6)。
(3-6)判断蚂蚁当前编号k是否到达蚁群的种群数量K,若是则进入步骤(3-7),否则设置k=k+1,并返回步骤(3-3);。
(3-7)根据环境矩阵Gmap和领接矩阵Mmap计算K个蚂蚁的历史位置矩阵L1~K中的路径长度,选择路径长度最小的蚂蚁历史位置矩阵Lbs作为第t代蚁群寻优的最优路径。
(3-8)根据步骤(3-7)确定的第t代蚁群寻优的最优路径,采用改进的蚁群信息素更新公式对当前地图信息素矩阵τ(t)进行更新,以得到更新后的地图信息素矩阵τ(t+1)作为当前地图信息素矩阵。
考虑到机器人需避开障碍物完成行径动作,采用一种随障碍物数量自适应的衰减因子,作为路段信息素增量的权重系数,改进的蚁群信息素更新公式如下:
τij(t+1)=(1-ρ)τij(t)+Δτij
Figure BDA0003387858410000141
其中,
Figure BDA0003387858410000142
为环境矩阵Gmap中的节点i与j之间邻居节点集中障碍物的占比率,e(t)=1/exp(ωt-1)为自适应增强因子,ω为[0,1]的可选系数,其取值为0.1,ρ表示挥发系数,其取值为0.6,
Figure BDA0003387858410000143
表示最优路径信息素增量。
(3-9)判断当前迭代次数t是否到达最大迭代次数tmax,若为到达则设置迭代次数t=t+1,设置蚂蚁当前编号k=1。并返回步骤(3-3),否则至步骤(3-10)。
(3-10)依据步骤(3-7)得到的每一代蚁群寻优的最优路径,选择选择路径长度最小的路径作为全局最优解,输出机器人的路径规划的全局最优解。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,包括以下步骤:
(1)获取当前环境中的环境数据,并将环境数据转换为环境矩阵Gmap,获取机器人的起始目标点和结束目标点,并将生成的环境矩阵Gmap转换为领接矩阵Mmap
(2)将步骤(1)得到的机器人起始目标点坐标和结束目标点坐标与环境矩阵Gmap输入训练好的对抗生成网络GAN中,以得到在环境矩阵Gmap中存在最优路径的可行区域;
(3)根据步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行更新,根据更新后地图初始信息素并使用改进的蚁群算法获取机器人的最优规划路径。
2.根据权利要求1所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(1)具体包括以下子步骤:
(1-1)探测环境地图中的障碍物,并对该环境地图进行栅格化,以得到栅格化后的环境地图;
(1-2)针对步骤(1-1)得到的栅格化后的环境地图,获取每个障碍节点和可行节点的坐标,所有障碍节点的坐标、可行节点的坐标、以及机器人的起始目标点坐标和结束目标点坐标一起,构成新的环境地图;
(1-3)对步骤(1-2)得到的环境地图中的可行节点与障碍节点分别进行标记,以生成环境矩阵Gmap,其包括N个元素,其中N为自然数;
(1-4)根据步骤(1-3)得到环境矩阵Gmap中各个节点之间的通行代价将该环境矩阵Gmap转化为领接矩阵Mmap
3.根据权利要求1或2所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(1-4)中领接矩阵Mmap为N×N的矩阵,该邻接矩阵中的第i行第j列元素表示节点i到节点j的通行代价,两两节点间相邻或者构成对角,则表示可以通行,其对应的代价分别设定为1和
Figure FDA0003387858400000021
不可通行的代价记为0,其中i和j都∈[1,N]。
4.根据权利要求1至3中任意一项所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(2)中的对抗生成网络是通过以下步骤训练得到的:
(2-1)获取训练对抗生成网络所需要的数据集,并将该数据集划分为训练集和测试集;
(2-2)初始化对抗生成网络的参数,以得到初始化后的对抗生成网络;
(2-3)将步骤(2-1)获取的训练集输入到步骤(2-2)初始化后的对抗生成网络中,以得到对抗生成网络的损失函数值LossG
(2-4)重复迭代上述步骤(2-3),直到对抗生成网络的损失函数值LossG最小为止,从而得到训练好的对抗生成网络模型。
5.根据权利要求4所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(2-1)具体为,通过在真实应用场景中随机选取多组机器人的起始目标点和结束目标点,构建环境地图,采用与步骤(1)相同的方式得到相应的起始目标点坐标和结束目标点坐标、环境矩阵Gmap与领接矩阵Mmap,在该环境矩阵上多次运行快速扩展随机树算法以得到路径,将多次运行算法得到的所有路径进行堆叠,以得到路径选择区域,将带有路径选择区域的所有环境地图按照1:1的比例划分为训练集和测试集,即随机划分50%作为训练集,剩余的50%作为测试集;
6.根据权利要求4所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(2-2)中,权重参数的初始值是使用标准差为0.1的截断式正态分布输出的随机值,偏置参数的初始值设为0,初始学习率lr=0.0003,采用阶梯性的学习策略,步长stepsize=200,权重gamma=0.1,即每200轮将学习率乘以0.1。
7.根据权利要求4所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(2-3)中的损失函数等于:
LossG=α1logDmap(G(z,m,p),m)+α2logDpoint(G(z,m,p),p)
其中,α1与α2为动态交叉系数,设定k为超参数,α1与α2的计算方式如下式:
Figure FDA0003387858400000031
Figure FDA0003387858400000032
两个鉴别器Dmap与Dpoint的损失函数分别为:
Figure FDA0003387858400000033
Figure FDA0003387858400000034
其中u表示训练集中通过RRT算法得到的真实路径选择区域,m表示训练集中的环境矩阵Gmap,p表示训练集中机器人的起始目标点和结束目标点,z表示训练集中的样本噪声,G(z,m,p)表示对抗生成网络的输入为z、m与p时所生成的图像。
8.根据权利要求1所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(3)包括以下子步骤:
(3-1)根据步骤(1)中的机器人起始目标点和结束目标点与环境矩阵Gmap和领接矩阵Mmap,初始化蚁群算法的地图矩阵Gmap,蚁群的种群数量K=60,蚂蚁当前编号k=1,最大迭代次数tmax=400,第t轮迭代的地图信息素矩阵τ(t),并初始化蚂蚁当前位置sk与K个蚂蚁的历史位置矩阵L1~K为空,sk表示第k只蚂蚁当前在环境矩阵Gmap中的位置,历史位置矩阵Lk表示第k只蚂蚁在环境矩阵Gmap中的历史轨迹,其中k∈[1,蚁群的种群数量K],t∈[0,tmax];
(3-2)根据步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域对蚁群算法的地图初始信息素进行优化,以得到优化后的地图初始信息素作为当前地图信息素矩阵;
(3-3)将第k只蚂蚁置于机器人起始目标点,以得到第k只蚂蚁的当前位置sk,清空第k只蚂蚁的历史位置矩阵Lk,并将第k只蚂蚁的当前位置sk添加到历史位置矩阵Lk
(3-4)采用轮盘赌法的状态转移机制对步骤(3-3)得到的第k只蚂蚁的当前位置sk进行更新,以得到更新后的第k只蚂蚁当前位置sk,并将更新后的sk添加到历史位置矩阵Lk
其中,轮盘赌法的状态转移机制的状态转移概率如下式:
Figure FDA0003387858400000041
Figure FDA0003387858400000042
为第k只蚂蚁从环境矩阵Gmap中的节点i移动到j的转移概率,
Figure FDA0003387858400000043
为环境矩阵Gmap中的节点i和j间蚂蚁的能见度,dij为环境矩阵Gmap中的节点i和j间的欧式距离,τij(t)为t时刻两点间的信息素浓度,allowedk为第k只蚂蚁尚未访问的邻居节点集合,α表示信息素启发因子,β表示能见度启发因子;
(3-5)判断第k只蚂蚁是否达到结束目标点或陷入死胡同,若未到达机器人结束目标点且未陷入死胡同则返回步骤(3-4);若陷入死胡同则在第k只蚂蚁的历史位置矩阵Lk中删除第k只蚂蚁当前位置sk,将当前位置sk退回到历史位置矩阵Lk中上一步的位置,并将当前的死胡同节点的状态转移概率
Figure FDA0003387858400000051
置0后转至步骤(3-5);若已达到机器人结束目标点则进入步骤(3-6)。
(3-6)判断蚂蚁当前编号k是否到达蚁群的种群数量K,若是则进入步骤(3-7),否则设置k=k+1,并返回步骤(3-3);。
(3-7)根据环境矩阵Gmap和领接矩阵Mmap计算K个蚂蚁的历史位置矩阵L1~K中的路径长度,选择路径长度最小的蚂蚁历史位置矩阵Lbs作为第t代蚁群寻优的最优路径。
(3-8)根据步骤(3-7)确定的第t代蚁群寻优的最优路径,采用改进的蚁群信息素更新公式对当前地图信息素矩阵τ(t)进行更新,以得到更新后的地图信息素矩阵τ(t+1)作为当前地图信息素矩阵。
(3-9)判断当前迭代次数t是否到达最大迭代次数tmax,若为到达则设置迭代次数t=t+1,设置蚂蚁当前编号k=1。并返回步骤(3-3),否则至步骤(3-10)。
(3-10)依据步骤(3-7)得到的每一代蚁群寻优的最优路径,选择选择路径长度最小的路径作为全局最优解,输出机器人的路径规划的全局最优解。
9.根据权利要求8所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,
步骤(3-2)是按照如下式所示:
Figure FDA0003387858400000052
其中GGAN表示步骤(2)得到的环境矩阵Gmap中存在最优路径的可行区域,τij(0)表示从环境矩阵Gmap中的节点i与j之间的地图初始信息素,即第0代的地图信息素,λ表示初始信息素增强系数,其取值范围是1到2。
10.根据权利要求8所述的基于对抗生成网络优化蚁群算法启发式搜索的机器人路径规划方法,其特征在于,步骤(3-8)中蚁群信息素更新公式如下:
τij(t+1)=(1-ρ)τij(t)+Δτij
Figure FDA0003387858400000061
其中,
Figure FDA0003387858400000062
为环境矩阵Gmap中的节点i与j之间邻居节点集中障碍物的占比率,e(t)=1/exp(ωt-1)为自适应增强因子,ω为[0,1]的可选系数,ρ表示挥发系数,
Figure FDA0003387858400000063
表示最优路径信息素增量。
CN202111456479.6A 2021-12-02 2021-12-02 一种基于对抗生成网络与蚁群算法的机器人路径规划方法 Active CN114167865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111456479.6A CN114167865B (zh) 2021-12-02 2021-12-02 一种基于对抗生成网络与蚁群算法的机器人路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111456479.6A CN114167865B (zh) 2021-12-02 2021-12-02 一种基于对抗生成网络与蚁群算法的机器人路径规划方法

Publications (2)

Publication Number Publication Date
CN114167865A true CN114167865A (zh) 2022-03-11
CN114167865B CN114167865B (zh) 2023-09-22

Family

ID=80482541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111456479.6A Active CN114167865B (zh) 2021-12-02 2021-12-02 一种基于对抗生成网络与蚁群算法的机器人路径规划方法

Country Status (1)

Country Link
CN (1) CN114167865B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114779792A (zh) * 2022-06-20 2022-07-22 湖南大学 基于模仿与强化学习的医药机器人自主避障方法及系统
CN114781966A (zh) * 2022-04-08 2022-07-22 重庆大学 物流配送路径规划方法、装置、设备及存储介质
CN115562265A (zh) * 2022-09-29 2023-01-03 哈尔滨理工大学 一种基于改进a*算法的移动机器人路径规划方法
CN117075615A (zh) * 2023-09-27 2023-11-17 苏州大学 一种机器人路径规划方法、装置及计算机可读存储介质
WO2024168938A1 (zh) * 2023-02-15 2024-08-22 大连理工大学 针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
US20070212677A1 (en) * 2004-11-22 2007-09-13 Odyssey Thera, Inc. Identifying off-target effects and hidden phenotypes of drugs in human cells
CN109282815A (zh) * 2018-09-13 2019-01-29 天津西青区瑞博生物科技有限公司 一种动态环境下基于蚁群算法的移动机器人路径规划方法
CN109945881A (zh) * 2019-03-01 2019-06-28 北京航空航天大学 一种蚁群算法的移动机器人路径规划方法
CN110097185A (zh) * 2019-03-29 2019-08-06 北京大学 一种基于生成对抗网络的优化模型方法及应用
CN112766103A (zh) * 2021-01-07 2021-05-07 国网福建省电力有限公司泉州供电公司 一种机房巡检方法及装置
CN113253732A (zh) * 2021-06-01 2021-08-13 湖南大学 一种激光清洗路径规划方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070212677A1 (en) * 2004-11-22 2007-09-13 Odyssey Thera, Inc. Identifying off-target effects and hidden phenotypes of drugs in human cells
US20060229896A1 (en) * 2005-04-11 2006-10-12 Howard Rosen Match-based employment system and method
CN109282815A (zh) * 2018-09-13 2019-01-29 天津西青区瑞博生物科技有限公司 一种动态环境下基于蚁群算法的移动机器人路径规划方法
CN109945881A (zh) * 2019-03-01 2019-06-28 北京航空航天大学 一种蚁群算法的移动机器人路径规划方法
CN110097185A (zh) * 2019-03-29 2019-08-06 北京大学 一种基于生成对抗网络的优化模型方法及应用
CN112766103A (zh) * 2021-01-07 2021-05-07 国网福建省电力有限公司泉州供电公司 一种机房巡检方法及装置
CN113253732A (zh) * 2021-06-01 2021-08-13 湖南大学 一种激光清洗路径规划方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LINGWU MENG ETAL.: "Multi-Colony Ant Algorithm Using Both Generative Adversarial Nets and Adaptive Stagnation Avoidance Strategy", 《IEEE ACCESS》, pages 53250 - 53260 *
LINGWU MENG;XIAOMING YOU;SHENG LIU: "Multi-colony Collaborative Ant Optimization Algorithm Based on Cooperative Game mechanism", 《 IEEE ACCESS》, pages 1 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114781966A (zh) * 2022-04-08 2022-07-22 重庆大学 物流配送路径规划方法、装置、设备及存储介质
CN114781966B (zh) * 2022-04-08 2024-04-12 重庆大学 物流配送路径规划方法、装置、设备及存储介质
CN114779792A (zh) * 2022-06-20 2022-07-22 湖南大学 基于模仿与强化学习的医药机器人自主避障方法及系统
CN114779792B (zh) * 2022-06-20 2022-09-09 湖南大学 基于模仿与强化学习的医药机器人自主避障方法及系统
CN115562265A (zh) * 2022-09-29 2023-01-03 哈尔滨理工大学 一种基于改进a*算法的移动机器人路径规划方法
CN115562265B (zh) * 2022-09-29 2024-01-05 哈尔滨理工大学 一种基于改进a*算法的移动机器人路径规划方法
WO2024168938A1 (zh) * 2023-02-15 2024-08-22 大连理工大学 针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络
CN117075615A (zh) * 2023-09-27 2023-11-17 苏州大学 一种机器人路径规划方法、装置及计算机可读存储介质
CN117075615B (zh) * 2023-09-27 2024-07-19 苏州大学 一种机器人路径规划方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN114167865B (zh) 2023-09-22

Similar Documents

Publication Publication Date Title
CN114167865A (zh) 一种基于对抗生成网络与蚁群算法的机器人路径规划方法
CN109945881B (zh) 一种蚁群算法的移动机器人路径规划方法
CN108036790B (zh) 一种障碍环境下基于蚁蜂算法的机器人路径规划方法及系统
CN109839110B (zh) 一种基于快速随机搜索树的多目标点路径规划方法
CN110375761A (zh) 基于增强蚁群优化算法的无人驾驶车辆路径规划方法
CN112987799B (zh) 一种基于改进rrt算法的无人机路径规划方法
CN112269382B (zh) 一种机器人多目标路径规划方法
CN113985888A (zh) 一种基于改进蚁群算法的叉车路径规划方法及系统
CN115560774B (zh) 一种面向动态环境的移动机器人路径规划方法
CN112947591A (zh) 基于改进蚁群算法的路径规划方法、装置、介质及无人机
CN106372766A (zh) 用于电磁干扰环境中的无人机路径规划方法
CN115129064A (zh) 基于改进萤火虫算法与动态窗口法融合的路径规划方法
CN114662638A (zh) 基于改进人工蜂群算法的移动机器人路径规划方法
Bai et al. Design and Simulation of a Collision-free Path Planning Algorithm for Mobile Robots Based on Improved Ant Colony Optimization.
CN114815801A (zh) 一种基于策略-价值网络及mcts的自适应环境路径规划方法
CN114237282A (zh) 面向智慧化工业园区监测的无人机飞行路径智能规划方法
CN117522078A (zh) 无人系统集群环境耦合下的可迁移任务规划方法及系统
CN113778090A (zh) 基于蚁群优化和prm算法的移动机器人路径规划方法
CN113063419A (zh) 一种无人机路径规划方法及系统
CN117420824A (zh) 一种基于具有学习能力的智能蚁群算法的路径规划方法
CN112486185A (zh) 在未知环境下基于蚁群和vo算法的路径规划方法
CN115630566B (zh) 一种基于深度学习和动力约束的资料同化方法和系统
Gao et al. Competitive self-organizing neural network based UAV path planning
CN116088492A (zh) 一种基于sma-aco算法的机器人路径规划方法
CN112598153A (zh) 一种基于天牛须搜索算法的旅行商问题求解方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant