CN107368076A - 一种智能环境下机器人运动路径深度学习控制规划方法 - Google Patents

一种智能环境下机器人运动路径深度学习控制规划方法 Download PDF

Info

Publication number
CN107368076A
CN107368076A CN201710640558.XA CN201710640558A CN107368076A CN 107368076 A CN107368076 A CN 107368076A CN 201710640558 A CN201710640558 A CN 201710640558A CN 107368076 A CN107368076 A CN 107368076A
Authority
CN
China
Prior art keywords
bat
layer
chaos
training
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710640558.XA
Other languages
English (en)
Other versions
CN107368076B (zh
Inventor
刘辉
李燕飞
黄家豪
段超
王孝楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201710640558.XA priority Critical patent/CN107368076B/zh
Publication of CN107368076A publication Critical patent/CN107368076A/zh
Application granted granted Critical
Publication of CN107368076B publication Critical patent/CN107368076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种智能环境下机器人运动路径深度学习控制规划方法,该方法包括:步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;步骤2:获取训练样本集;步骤3:构建运载机器人的全局静态路径规划模型;步骤4:将运输任务中的起点和终点坐标输入至基于模糊神经网络的全局静态路径规划模型,获得对应的运载机器人最优规划路径。本发明通过分别建立全局静态路径规划模型和局部动态避障规划模型,利用深度学习的极强的非线性拟合特性,快速的找到全局最优路径,避免了常见的路径规划中陷入局部最优的问题。

Description

一种智能环境下机器人运动路径深度学习控制规划方法
技术领域
本发明属于机器人路径规划领域,特别涉及一种智能环境下机器人运动路径深度学习控制规划方法。
背景技术
随着世界工业4.0的趋势,运载机器人越来越广泛的地被应用在实验室、工厂、医疗智能环境当中,执行运输各种零件、试验原料、医疗物品等任务,代替工人进行体力劳动,大幅提升自动化水平。其中,路径规划作为移动机器人导航关键技术,直接决定了机器人完成运输任务的质量。
当前典型的路径规划方法包括:传统的有栅格法、人工势场法、Dijkstra算法、A*算法、Voronoi图等。智能算法有模糊规则法、神经网络算法、遗传算法、蚁群算法、粒子群优化等方法。如中国专利CN105116902A中公开一种移动机器人避障导航的方法和系统,包括该方法包括:建立家庭环境的全局地图;设置机器人移动的起点和终点;根据A*算法规划机器人的移动路径;在所述全局地图中标记障碍物的位置;根据A*算法重新规划机器人的移动路径;根据所述规划的路径控制机器人移动;机器人到达终点,则停止移动。A*算法是机器人路径规划中最有效的直接搜索方法,搜索速度快,效率高,但是易陷于局部最优。
发明内容
本发明提供了一种智能环境下机器人运动路径深度学习控制规划方法,其目的在于,克服上述现有技术中存在的问题,通过分别建立全局静态路径规划模型和局部动态避障规划模型,利用深度学习的极强的非线性拟合特性,快速的找到全局最优路径,避免了常见的路径规划中陷入局部最优的问题。在全局静态路径规划中使用差分进化狼群算法优化BP层的深度置信网络模型,局部动态避障规划中使用混沌蝙蝠算法优化BP层的深度置信网络模型,保证了路径规划中路径的最优特性。
一种智能环境下机器人运动路径深度学习控制规划方法,包括以下步骤:
步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;
运载区域地面中心点为原点,正东方向为X轴,正北方向为Y轴,垂直地面方向为Z轴;
所述运载机器人运载区域为一个楼栋内所有的地板连通区域,所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域;
在全局地图三维坐标系中,每个楼层的地板连通区域的二维平面坐标相同,z坐标不同;
步骤2:获取训练样本集;
在全局地图三维坐标系中,设计至少200组可行走区域中不同的点到点的最优设计全局路径,以每条最优设计全局路径作为一个训练样本;
步骤3:构建运载机器人的全局静态路径规划模型;
利用全局训练样本集中每个全局样本的起点-终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的全局静态路径规划模型;
其中,在全局训练过程中,深度学习DBN网络所使用的BP网络权值采用差分进化狼群算法进行寻优获得;
步骤4:分别将运输任务中从初始待命点到取物点,从取物点到放物点,和从放物点到待命点坐标输入至基于深度学习DBN网络的全局静态路径规划模型,获得对应区间的运载机器人最优全局规划路径。
运载机器人依据得到的最优规划路径前行,完成运输任务。
运载机器人得到从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后前往放物点最近的待命点。
进一步的,对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的全局静态路径规划模型:
深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;
使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:
第一层限制玻儿兹曼机RBM的训练是指,从200组静态规划训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
第二层限制玻儿兹曼机RBM的训练是指,使用与第一层第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
BP网络层的训练是指,使用差分进化狼群算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组训练样本,训练完成后输出整个DBN模型作为全局静态路径规划算法模型。
进一步的,所述基于深度学习DBN网络的全局静态路径规划模型所使用的BP网络权值采用差分进化狼群算法进行寻优获得的过程如下:
步骤2.1:以个体狼的位置作为BP网络权值,初始化狼群中的个体狼并设置狼群参数;
狼群包含多只个体狼;
狼群规模的取值范围为[50,300],步长因子的取值范围为[80,160],探狼比例因子的取值范围为[2,6],最大游走次数的取值范围为[15,30],距离判定因子的取值范围为[50,100],最大奔袭次数的取值范围为[5,15],更新比例因子的取值范围为[2,6],最大迭代次数的取值范围为[500,1000],最大搜索精度的取值范围为[0.001,0.01];
步骤2.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;
将个体狼位置体对应的BP网络权值代入基于深度学习DBN网络的全局静态路径规划模型中,并利用个体狼位置确定的基于深度学习DBN网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的全局规划路径,将所有全局训练样本的规划全局路径和最优设计全局长度作商后,再取均值,作为第一适应度函数F1
其中,M为训练样本数,n为输出的全局规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个全局样本使用该狼确定的深度学习DBN模型得到的路径中第j点和第j-1点的X轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标Y轴坐标,第j点和第j-1点为相邻两点,L为人工设置的样本对应最优设计全局路径的长度;
模型输出的路径越短,个体狼的适应度F越大,个体狼越优秀。
步骤2.3:更新狼群,并获得更新后的最优头狼位置;
依次对所有个体狼进行游走行为、奔袭行为、围攻行为、变异操作、交叉操作、选择操作;
步骤2.4:判断是否达到优化精度要求或t达到最大迭代次数,若达到,输出头狼的位置对应的BP网络的权值,若未达到,令t=t+1,返回步骤2.3。
进一步的,运载机器人依据得到的最优全局规划路径前行,执行运输任务时,在前行过程中,利用Kinect传感器实时获取的新增障碍物所在区域的起点和终点输入局部动态避障规划模型进行避障;
利用局部避障训练样本集中每个样本的起点和终点坐标作为输入数据,对应的最优设计避障路径为输出,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的局部避障模型;
其中,在训练过程中,基于深度学习DBN网络的局部避障模型的BP网络权值采用混沌蝙蝠算法寻优确定;
所述Kinect传感器获取的新增障碍物所在区域的起点和终点是通过Kinect传感器发出测量信号与接收到的设置在天花板的定位片位置信息计算获得;
所述局部避障训练样本集是在全局地图三维坐标系中,设计至少200组可行走区域中新增障碍物所在区域中不同的点到点的最优设计避障路径构成,每条最优设计避障路径作为一个避障训练样本。
进一步的,对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的局部避障模型:
深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;
使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:
第一层限制玻儿兹曼机RBM的训练是指,从200组避障规划训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
第二层限制玻儿兹曼机RBM的训练是指,使用与第一层第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
BP网络层的训练是指,使用混沌蝙蝠算法算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组避障训练样本,训练完成后输出整个DBN模型作为局部动态避障规划模型。
进一步的,所述基于深度学习DBN网络的局部避障模型中深度学习DBN网络所使用的BP网络权值采用混沌蝙蝠算法寻优获得的过程如下:
步骤4.1:以混沌蝙蝠个体的位置作为基于深度学习DBN网络的局部避障模型中深度学习DBN网络中的BP网络权值,设置混沌蝙蝠种群参数并初始化混沌蝙蝠种群中的混沌蝙蝠个体;
混沌蝙蝠种群规模M的取值范围为[120,300],蝙蝠个体最大脉冲频度R0,取值范围为[0.45,0.55],最大脉冲声音强度A0的取值范围为[0.40,0.6],蝙蝠搜索频度增加系数的取值范围为[0.03,0.05],声音强度衰减系的取值范围为[0.90,0.95],适应度方差阈值的取值范围为[0.01,0.05],搜索脉冲频率的取值范围为[0,0.15],最大迭代次数的取值范围为[300,1000],最大搜索精度的取值范围为[0.001,0.01];
步骤4.2:设定适应度函数,并确定初始最优混沌蝙蝠个体位置和迭代次数t,t=1;
将混沌蝙蝠个体位置对应的BP网络权值代入基于深度学习DBN网络的局部避障模型中,并利用混沌蝙蝠个体位置确定的基于深度学习DBN网络的局部避障模型输出避障训练样本集中每个避障训练样本起点和终点对应的规划局部路径,将所有避障训练样本的规划局部路径和最优设计避障长度作商后,再取均值,作为第二适应度函数F2
其中,M为训练样本数,n为输出的局部避障路径所经历的坐标点的个数,xi,j和xi,j-1为第i个避障训练样本使用该蝙蝠确定的深度学习DBN模型得到的路径中第j点和第j-1点的X轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标Y轴坐标,第j点和第j-1点为相邻两点,L为人工设置的样本对应最优设计避障路径的长度;
模型输出的路径越短,蝙蝠个体的适应度F越大,蝙蝠个体越优秀。
步骤4.3:利用设定的脉冲频率更新混沌蝙蝠的搜索脉冲频率、位置和速度;
步骤4.4:若R1<Ri,则更新混沌蝙蝠当前位置,否则对混沌蝙蝠当前位置进行扰动,扰动后位置代替混沌蝙蝠当前位置;
其中,R1为在[0,1]上均匀分布的随机数,Ri为第i只混沌蝙蝠的脉冲频度;
步骤4.5:若R2<Ai,则利用步骤4.4得到的扰动位置作为混沌蝙蝠个体的最新位置,否则,不对混沌蝙蝠个体进行更新;
其中,R2为在[0,1]上均匀分布的随机数,Ai为第i只混沌蝙蝠的声音强度;
步骤4.6假如更新位置后蝙蝠个体i优于混沌蝙蝠种群中最优混沌蝙蝠个体位置F2(xi)>F2(x*),更新最优混沌蝙蝠个体位置,对所有混沌蝙蝠个体的脉冲频度和脉冲音强进行更新;
步骤4.7根据适应度值评估判定新的混沌蝙蝠群体,将混沌蝙蝠群体中适应度排在前5%的混沌蝙蝠个体作为精英个体,对适应度排在后5%的混沌蝙蝠个体进行淘汰;
同时,对精英个体采用Logistic映射混沌优化策略进行优化,并随机产生新的混沌蝙蝠个体代替淘汰的混沌蝙蝠个体,得到新的混沌蝙蝠种群;
步骤4.8:依据每个混沌蝙蝠个体位置的适应度从新的混沌蝙蝠种群中,找出最优混沌蝙蝠个体位置;
步骤4.9:若满足预设搜索精度或达到最大迭代次数,则转入步骤4.10,否则,令t=t+1,转步骤4.3,直到找到满足设定的最优混沌蝙蝠个体位置为止;
步骤4.10:输出最优混沌蝙蝠个体位置对应的基于深度学习DBN网络的局部避障模型中BP网络权值。
进一步的,利用运载机器人自带的Kinect传感器与设置在天花板的定位片,通过Kinect传感器发出的测量信号与接收到的定位片位置信息,获取运载机器人的实时位置,将实时位置与规划路径位置之间的误差进行比较,对实时前行中的运载机器人进行坐标校准。
进一步的,当运载机器人需要从一个楼层运动至另外一个楼层时,将全局路径规划分解成在两个楼层中的局部路径规划,每个局部路径规划均采用基于模糊神经网络的全局静态路径规划模型;
第一个局部路径规划的起点为运输任务起点,终点为第一个楼层的电梯所在位置;
第二个局部路径规划的起点为第二个楼层的电梯所在位置,终点为运输任务终点;
第一个楼层的电梯和第二个楼层的电梯为同一电梯。
根据实际任务的起点和终点使用路径规划算法模型进行路径规划,如果起点和终点跨楼层,那么路径规划的输入改为起点坐标和起点楼层电梯路径点坐标,终点和终点楼层电梯路径点坐标,输出两个楼层中的最优线路,并将其与电梯模块进行连接,构成完整路径轨迹。没有跨楼层情况发生的情况下,直接输入起点和终点坐标,使用算法模型进行路径规划。
定位片布置方法如下:
在机器人工作环境中布置定位片,用以机器人在运行中实时校准自身坐标在全局坐标系中的位置。
首先保证全局环境内部能够被定位片覆盖,在室内环境下定位片密度为一个定位片控制1.5m2范围的环境,在楼道中每隔3m设置一个定位片。
其次,在机器人的待命处,取物处,放物处,电梯门前,门禁前等地点布置定位片,有利于机器人在保证自身位置精度的基础进行取物、放物、门禁交互、电梯交互操作。
在前行过程中,利用运载机器人自带的Kinect传感器获取障碍物所在区域信息,将新增障碍物所在的区域从可行区域中删除,更新可行区域范围。
从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后返回待命点。
有益效果
本发明提供了一种智能环境下机器人运动路径深度学习控制规划方法,该方法利用深度学习的隐藏层数增多提升网络的复杂性,相比于各种神经网络网络,深度学习以其极强的拟合能力,使机器人路径规划中将全局地图坐标划分极细的条件下导致的巨大运算量的运算成为可能,使用深度学习使规划的路径平滑化,真正的趋近于全局最优。避障操作时,使用训练完毕的深度学习模型,相比于普通神经网络以及算法,时间上可以优化一半以上,同时保证路径的最优。
附图说明
图1为本发明所述方法的路径规划流程图;
图2为本发明设计的深度学习DBN网络结构图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的说明。
如图1所示,一种智能环境下机器人运动路径深度学习控制规划方法,包括以下步骤:
步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;
运载区域地面中心点为原点,正东方向为X轴,正北方向为Y轴,垂直地面方向为Z轴;
所述运载机器人运载区域为一个楼栋内所有的地板连通区域,所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域;
在全局地图三维坐标系中,每个楼层的地板连通区域的二维平面坐标相同,z坐标不同;
步骤2:获取训练样本集;
在全局地图三维坐标系中,设计200组可行走区域中不同的点到点的最优设计全局路径,以每条最优设计全局路径作为一个训练样本;
步骤3:构建运载机器人的全局静态路径规划模型;
利用全局训练样本集中每个全局样本的起点-终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的全局静态路径规划模型;
对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的全局静态路径规划模型:
深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;
使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:
第一层限制玻儿兹曼机RBM的训练是指,从200组静态规划训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
第二层限制玻儿兹曼机RBM的训练是指,使用与第一层第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
BP网络层的训练是指,使用差分进化狼群算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组训练样本,训练完成后输出整个DBN模型作为全局静态路径规划算法模型。
在全局训练过程中,深度学习DBN网络所使用的BP网络权值采用差分进化狼群算法进行寻优获得;
所述基于深度学习DBN网络的全局静态路径规划模型所使用的BP网络权值采用差分进化狼群算法进行寻优获得的过程如下:
步骤2.1:以个体狼的位置作为BP网络权值,初始化狼群中的个体狼并设置狼群参数;
狼群包含多只个体狼;
狼群规模的取值为200,步长因子的取值为90,探狼比例因子的取值为4,最大游走次数的取值为25,距离判定因子的取值为60,最大奔袭次数的取值为10,更新比例因子的取值为3,最大迭代次数的取值为800,最大搜索精度的取值为0.001;
步骤2.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;
将个体狼位置体对应的BP网络权值代入基于深度学习DBN网络的全局静态路径规划模型中,并利用个体狼位置确定的基于深度学习DBN网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的全局规划路径,将所有全局训练样本的规划全局路径和最优设计全局长度作商后,再取均值,作为第一适应度函数F1
其中,M为训练样本数,n为输出的全局规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个全局样本使用该狼确定的深度学习DBN模型得到的路径中第j点和第j-1点的X轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标Y轴坐标,第j点和第j-1点为相邻两点,L为人工设置的样本对应最优设计全局路径的长度;
模型输出的路径越短,个体狼的适应度F越大,个体狼越优秀。
步骤2.3:更新狼群,并获得更新后的最优头狼位置;
依次对所有个体狼进行游走行为、奔袭行为、围攻行为、变异操作、交叉操作、选择操作;
步骤2.4:判断是否达到优化精度要求或t达到最大迭代次数,若达到,输出头狼的位置对应的BP网络的权值,若未达到,返回步骤2.3,并且t=t+1。
步骤4:分别将运输任务中从初始待命点到取物点,从取物点到放物点,和从放物点到待命点坐标输入至基于深度学习DBN网络的全局静态路径规划模型,获得对应的运载机器人最优全局规划路径。
运载机器人依据得到的最优规划路径前行,完成运输任务。
运载机器人得到从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后前往放物点最近的待命点。
运载机器人依据得到的最优全局规划路径前行,执行运输任务时,在前行过程中,利用Kinect传感器实时获取的新增障碍物所在区域的起点和终点输入局部动态避障规划模型进行避障;
所述Kinect传感器获取的新增障碍物所在区域的起点和终点是通过Kinect传感器发出测量信号与接收到的设置在天花板的定位片位置信息计算获得;
利用运载机器人自带的Kinect传感器与设置在天花板的定位片,通过Kinect传感器发出的测量信号与接收到的定位片位置信息,获取运载机器人的实时位置,将实时位置与规划路径位置之间的误差进行比较,对实时前行中的运载机器人进行坐标校准。
利用局部避障训练样本集中每个样本的起点和终点坐标作为输入数据,对应的最优设计避障路径为输出,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的局部避障模型;
在训练过程中,基于深度学习DBN网络的局部避障模型的BP网络权值采用混沌蝙蝠算法寻优确定;
所述局部避障训练样本集是在全局地图三维坐标系中,设计200组可行走区域中新增障碍物所在区域中不同的点到点的最优设计避障路径构成,每条最优设计避障路径作为一个避障训练样本。
对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的局部避障模型:
深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;
使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:
第一层限制玻儿兹曼机RBM的训练是指,从200组避障规划训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
第二层限制玻儿兹曼机RBM的训练是指,使用与第一层第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
BP网络层的训练是指,使用混沌蝙蝠算法算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组避障训练样本,训练完成后输出整个DBN模型作为局部动态避障规划模型。
所述基于深度学习DBN网络的局部避障模型中深度学习DBN网络所使用的BP网络权值采用混沌蝙蝠算法寻优获得的过程如下:
步骤4.1:以混沌蝙蝠个体的位置作为基于深度学习DBN网络的局部避障模型中深度学习DBN网络中的BP网络权值,设置混沌蝙蝠种群参数并初始化混沌蝙蝠种群中的混沌蝙蝠个体;
混沌蝙蝠种群规模M的取值范围为200,蝙蝠个体最大脉冲频度R0,取值为0.5,最大脉冲声音强度A0的取值范围为0.5,蝙蝠搜索频度增加系数的取值范围为0.04,声音强度衰减系的取值范围为0.95,适应度方差阈值的取值范围为0.01,搜索脉冲频率的取值范围为[0,0.15],最大迭代次数的取值范围为800,最大搜索精度的取值范围为0.001;
步骤4.2:设定适应度函数,并确定初始最优混沌蝙蝠个体位置和迭代次数t,t=1;
将混沌蝙蝠个体位置对应的BP网络权值代入基于深度学习DBN网络的局部避障模型中,并利用混沌蝙蝠个体位置确定的基于深度学习DBN网络的局部避障模型输出避障训练样本集中每个避障训练样本起点和终点对应的规划局部路径,将所有避障训练样本的规划局部路径和最优设计避障长度作商后,再取均值,作为第二适应度函数F2
其中,M为训练样本数,n为输出的局部避障路径所经历的坐标点的个数,xi,j和xi,j-1为第i个避障样本使用该蝙蝠确定的深度学习DBN模型得到的路径中第j点和第j-1点的X轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标Y轴坐标,第j点和第j-1点为相邻两点,L为人工设置的样本对应最优设计避障路径的长度;
模型输出的路径越短,蝙蝠个体的适应度F越大,蝙蝠个体越优秀。
步骤4.3:利用设定的脉冲频率更新混沌蝙蝠的搜索脉冲频率、位置和速度;
步骤4.4:若R1<Ri,则更新混沌蝙蝠当前位置,否则对混沌蝙蝠当前位置进行扰动,扰动后位置代替混沌蝙蝠当前位置;
其中,R1为在[0,1]上均匀分布的随机数,Ri为第i只混沌蝙蝠的脉冲频度;
步骤4.5:若R2<Ai,则利用步骤4.4得到的扰动位置作为混沌蝙蝠个体的最新位置,否则,不对混沌蝙蝠个体进行更新;
其中,R2为在[0,1]上均匀分布的随机数,Ai为第i只混沌蝙蝠的声音强度;
步骤4.6:假如更新位置后蝙蝠个体i优于混沌蝙蝠种群中最优混沌蝙蝠个体位置F2(xi)>F2(x*),更新最优混沌蝙蝠个体位置,对所有混沌蝙蝠个体的脉冲频度和脉冲音强进行更新;
步骤4.7:根据适应度值评估判定新的混沌蝙蝠群体,将混沌蝙蝠群体中适应度排在前5%的混沌蝙蝠个体作为精英个体,对适应度排在后5%的混沌蝙蝠个体进行淘汰;
同时,对精英个体采用Logistic映射混沌优化策略进行优化,并随机产生新的混沌蝙蝠个体代替淘汰的混沌蝙蝠个体,得到新的混沌蝙蝠种群;
步骤4.8:依据每个混沌蝙蝠个体位置的适应度从新的混沌蝙蝠种群中,找出最优混沌蝙蝠个体位置;
步骤4.9:若满足预设搜索精度或达到最大迭代次数,则转入步骤4.10,否则,令t=t+1,转步骤4.3,直到找到满足设定的最优混沌蝙蝠个体位置为止;
步骤4.10:输出最优混沌蝙蝠个体位置对应的基于深度学习DBN网络的局部避障模型中BP网络权值。
当运载机器人需要从一个楼层运动至另外一个楼层时,将全局路径规划分解成在两个楼层中的局部路径规划,每个局部路径规划均采用基于模糊神经网络的全局静态路径规划模型;
第一个局部路径规划的起点为运输任务起点,终点为第一个楼层的电梯所在位置;
第二个局部路径规划的起点为第二个楼层的电梯所在位置,终点为运输任务终点;
第一个楼层的电梯和第二个楼层的电梯为同一电梯。
根据实际任务的起点和终点使用路径规划算法模型进行路径规划,如果起点和终点跨楼层,那么路径规划的输入改为起点坐标和起点楼层电梯路径点坐标,终点和终点楼层电梯路径点坐标,输出两个楼层中的最优线路,并将其与电梯模块进行连接,构成完整路径轨迹。没有跨楼层情况发生的情况下,直接输入起点和终点坐标,使用算法模型进行路径规划。
运输过程中,机器人开启安装于头部的Kinect,并实时监测路径前方的道路通畅情况,一旦发现有障碍物,通过头部Kinect的深度传感器将障碍物的轮廓位置扫描并传输到车载计算机,计算机开启局部动态避障MEA-MKSVM模型,将障碍物轮廓位置,对应为不可行区域添加在地图中,计算最优避障路径,并根据最优避障路径通过障碍物;
定位片布置方法如下:
在机器人工作环境中布置定位片,用以机器人在运行中实时校准自身坐标在全局坐标系中的位置。
首先保证全局环境内部能够被定位片覆盖,在室内环境下定位片密度为一个定位片控制1.5m2范围的环境,在楼道中每隔3m设置一个定位片。
其次在机器人的待命处,取物处,放物处,电梯门前,门禁前等地点布置定位片,有利于机器人在保证自身位置精度的基础进行取物、放物、门禁交互、电梯交互操作。
在前行过程中,利用运载机器人自带的Kinect传感器获取障碍物所在区域信息,将。
从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后前往待命点。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (8)

1.一种智能环境下机器人运动路径深度学习控制规划方法,其特征在于,包括以下步骤:
步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;
运载区域地面中心点为原点,正东方向为X轴,正北方向为Y轴,垂直地面方向为Z轴;
所述运载机器人运载区域为一个楼栋内所有的地板连通区域,所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域;
步骤2:获取训练样本集;
在全局地图三维坐标系中,设计至少200组可行走区域中不同的点到点的最优设计全局路径,以每条最优设计全局路径作为一个训练样本;
步骤3:构建运载机器人的全局静态路径规划模型;
利用全局训练样本集中每个全局样本的起点-终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的全局静态路径规划模型;
其中,在全局训练过程中,深度学习DBN网络所使用的BP网络权值采用差分进化狼群算法进行寻优获得;
步骤4:分别将运输任务中从初始待命点到取物点,从取物点到放物点,和从放物点到待命点坐标输入至基于深度学习DBN网络的全局静态路径规划模型,获得对应的区间的运载机器人最优全局规划路径。
2.根据权利要求1所述的方法,其特征在于,对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的全局静态路径规划模型:
深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;
使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:
第一层限制玻儿兹曼机RBM的训练是指,从200组静态规划训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
第二层限制玻儿兹曼机RBM的训练是指,使用与第一层第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
BP网络层的训练是指,使用差分进化狼群算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组训练样本,训练完成后输出整个DBN模型作为全局静态路径规划算法模型。
3.根据权利要求2所述的方法,其特征在于,所述基于深度学习DBN网络的全局静态路径规划模型所使用的BP网络权值采用差分进化狼群算法进行寻优获得的过程如下:
步骤2.1:以个体狼的位置作为BP网络权值,初始化狼群中的个体狼并设置狼群参数;
狼群规模的取值范围为[50,300],步长因子的取值范围为[80,160],探狼比例因子的取值范围为[2,6],最大游走次数的取值范围为[15,30],距离判定因子的取值范围为[50,100],最大奔袭次数的取值范围为[5,15],更新比例因子的取值范围为[2,6],最大迭代次数的取值范围为[500,1000],最大搜索精度的取值范围为[0.001,0.01];
步骤2.2:设定适应度函数,并确定初始最优头狼位置和迭代次数t,t=1;
将个体狼位置体对应的BP网络权值代入基于深度学习DBN网络的全局静态路径规划模型中,并利用个体狼位置确定的基于深度学习DBN网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的全局规划路径,将所有全局训练样本的规划全局路径和最优设计全局长度作商后,再取均值,作为第一适应度函数F1
<mrow> <msub> <mi>F</mi> <mn>1</mn> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>M</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>2</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mi>L</mi> <msqrt> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>y</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,M为训练样本数,n为输出的全局规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个样本使用该狼确定的深度学习DBN模型得到的路径中第j点和第j-1点的X轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标Y轴坐标,第j点和第j-1点为相邻两点,L为人工设置的样本对应最优设计全局路径的长度;
步骤2.3:更新狼群,并获得更新后的最优头狼位置;
依次对所有个体狼进行游走行为、奔袭行为、围攻行为、变异操作、交叉操作、选择操作;
步骤2.4:判断是否达到优化精度要求或t达到最大迭代次数,若达到,输出头狼的位置对应的BP网络的权值,若未达到,令t=t+1,返回步骤2.3。
4.根据权利要求1-3任一项所述的方法,其特征在于,运载机器人依据得到的最优全局规划路径前行,执行运输任务时,在前行过程中,利用Kinect传感器实时获取的新增障碍物所在区域的起点和终点输入局部动态避障规划模型进行避障;
利用局部避障训练样本集中每个样本的起点和终点坐标作为输入数据,对应的最优设计避障路径为输出,对深度学习DBN网络进行训练,得到基于深度学习DBN网络的局部避障模型;
其中,在训练过程中,基于深度学习DBN网络的局部避障模型的BP网络权值采用混沌蝙蝠算法寻优确定;
所述Kinect传感器获取的新增障碍物所在区域的起点和终点是通过Kinect传感器发出测量信号与接收到的设置在天花板的定位片位置信息计算获得;
所述局部避障训练样本集是在全局地图三维坐标系中,设计至少200组可行走区域中新增障碍物所在区域中不同的点到点的最优设计避障路径构成,每条最优设计避障路径作为一个避障训练样本。
5.根据权利要求4所述的方法,其特征在于,对深度学习DBN网络进行如下训练过程得到基于深度学习DBN网络的局部避障模型:
深度学习DBN模型包括为五层,分别为:一层输入层、三层隐藏层以及一层输出层,其中可视层和第一隐藏层构成第一层限制玻儿兹曼机RBM,第一隐藏层和第二隐藏层构成第二层限制玻儿兹曼机RBM,第二隐藏层和第三隐藏层构成BP网络层;
使用逐层训练的方法依次对两层限制玻儿兹曼机RBM和BP网络层进行训练:
第一层限制玻儿兹曼机RBM的训练是指,从200组避障规划训练样本中随机抽取150组训练样本作为第一层限制玻儿兹曼机RBM训练样本,训练完成后得到第一层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
第二层限制玻儿兹曼机RBM的训练是指,使用与第一层第一层限制玻儿兹曼机RBM训练时相同的150组训练样本,以及同样的方法训练第二层限制玻儿兹曼机RBM,得到第二层限制玻儿兹曼机RBM的参数:权值矩阵、可见层偏置以及隐藏层偏置;
BP网络层的训练是指,使用混沌蝙蝠算法算法优化的BP网络对整个DBN模型进行微调,训练样本为剩余的50组避障训练样本,训练完成后输出整个DBN模型作为局部动态避障规划模型。
6.根据权利要求5所述的方法,其特征在于,所述基于深度学习DBN网络的局部避障模型中深度学习DBN网络所使用的BP网络权值采用混沌蝙蝠算法寻优获得的过程如下:
步骤4.1:以混沌蝙蝠个体的位置作为基于深度学习DBN网络的局部避障模型中深度学习DBN网络中的BP网络权值,设置混沌蝙蝠种群参数并初始化混沌蝙蝠种群中的混沌蝙蝠个体;
混沌蝙蝠种群规模M的取值范围为[120,300],蝙蝠个体最大脉冲频度R0,取值范围为[0.45,0.55],最大脉冲声音强度A0的取值范围为[0.40,0.6],蝙蝠搜索频度增加系数的取值范围为[0.03,0.05],声音强度衰减系的取值范围为[0.90,0.95],适应度方差阈值的取值范围为[0.01,0.05],搜索脉冲频率的取值范围为[0,0.15],最大迭代次数的取值范围为[300,1000],最大搜索精度的取值范围为[0.001,0.01];
步骤4.2:设定适应度函数,并确定初始最优混沌蝙蝠个体位置和迭代次数t,t=1;
将混沌蝙蝠个体位置对应的BP网络权值代入基于深度学习DBN网络的局部避障模型中,并利用混沌蝙蝠个体位置确定的基于深度学习DBN网络的局部避障模型输出避障训练样本集中每个避障训练样本起点和终点对应的规划局部路径,将所有避障训练样本的规划局部路径和最优设计避障长度作商后,再取均值,作为第二适应度函数F2
步骤4.3:利用设定的脉冲频率更新混沌蝙蝠的搜索脉冲频率、位置和速度;
步骤4.4:若R1<Ri,则更新混沌蝙蝠当前位置,否则对混沌蝙蝠当前位置进行扰动,扰动后位置代替混沌蝙蝠当前位置;
其中,R1为在[0,1]上均匀分布的随机数,Ri为第i只混沌蝙蝠的脉冲频度;
步骤4.5:若R2<Ai,则利用步骤4.4得到的扰动位置作为混沌蝙蝠个体的最新位置,否则,不对混沌蝙蝠个体进行更新;
其中,R2为在[0,1]上均匀分布的随机数,Ai为第i只混沌蝙蝠的声音强度;
步骤4.6假如更新位置后蝙蝠个体i优于混沌蝙蝠种群中最优混沌蝙蝠个体位置F2(xi)>F2(x*),更新最优混沌蝙蝠个体位置,对所有混沌蝙蝠个体的脉冲频度和脉冲音强进行更新;
步骤4.7根据适应度值评估判定新的混沌蝙蝠群体,将混沌蝙蝠群体中适应度排在前5%的混沌蝙蝠个体作为精英个体,对适应度排在后5%的混沌蝙蝠个体进行淘汰;
同时,对精英个体采用Logistic映射混沌优化策略进行优化,并随机产生新的混沌蝙蝠个体代替淘汰的混沌蝙蝠个体,得到新的混沌蝙蝠种群;
步骤4.8:依据每个混沌蝙蝠个体位置的适应度从新的混沌蝙蝠种群中,找出最优混沌蝙蝠个体位置;
步骤4.9:若满足预设搜索精度或达到最大迭代次数,则转入步骤4.10,否则,令t=t+1,转步骤4.3,直到找到满足设定的最优混沌蝙蝠个体位置为止;
步骤4.10:输出最优混沌蝙蝠个体位置对应的基于深度学习DBN网络的局部避障模型中BP网络权值。
7.根据权利要求6所述的方法,其特征在于,利用运载机器人自带的Kinect传感器与设置在天花板的定位片,通过Kinect传感器发出的测量信号与接收到的定位片位置信息,获取运载机器人的实时位置,将实时位置与规划路径位置之间的误差进行比较,对实时前行中的运载机器人进行坐标校准。
8.根据权利要求7所述的方法,其特征在于,当运载机器人需要从一个楼层运动至另外一个楼层时,将全局路径规划分解成在两个楼层中的局部路径规划,每个局部路径规划均采用基于模糊神经网络的全局静态路径规划模型;
第一个局部路径规划的起点为运输任务起点,终点为第一个楼层的电梯所在位置;
第二个局部路径规划的起点为第二个楼层的电梯所在位置,终点为运输任务终点;
第一个楼层的电梯和第二个楼层的电梯为同一电梯。
CN201710640558.XA 2017-07-31 2017-07-31 一种智能环境下机器人运动路径深度学习控制规划方法 Active CN107368076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710640558.XA CN107368076B (zh) 2017-07-31 2017-07-31 一种智能环境下机器人运动路径深度学习控制规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710640558.XA CN107368076B (zh) 2017-07-31 2017-07-31 一种智能环境下机器人运动路径深度学习控制规划方法

Publications (2)

Publication Number Publication Date
CN107368076A true CN107368076A (zh) 2017-11-21
CN107368076B CN107368076B (zh) 2018-03-27

Family

ID=60308901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710640558.XA Active CN107368076B (zh) 2017-07-31 2017-07-31 一种智能环境下机器人运动路径深度学习控制规划方法

Country Status (1)

Country Link
CN (1) CN107368076B (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108122048A (zh) * 2017-11-23 2018-06-05 浙江专线宝网阔物联科技有限公司 一种运输路径调度方法及其系统
CN108255182A (zh) * 2018-01-30 2018-07-06 上海交通大学 一种基于深度强化学习的服务机器人行人感知避障方法
CN108319293A (zh) * 2018-01-17 2018-07-24 哈尔滨工程大学 一种基于lstm网络的uuv实时避碰规划方法
CN108334677A (zh) * 2018-01-17 2018-07-27 哈尔滨工程大学 一种基于gru网络的uuv实时避碰规划方法
CN108680155A (zh) * 2018-02-01 2018-10-19 苏州大学 基于部分感知马氏决策过程的机器人最优路径规划方法
CN108803321A (zh) * 2018-05-30 2018-11-13 清华大学 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
CN109540151A (zh) * 2018-03-25 2019-03-29 哈尔滨工程大学 一种基于强化学习的auv三维路径规划方法
CN109902796A (zh) * 2019-03-14 2019-06-18 重庆邮电大学 一种基于烟花爆炸行为的改进的狼群算法
CN109976347A (zh) * 2019-04-11 2019-07-05 中南大学 一种基于快速扩展随机树和势场法的视觉伺服路径规划方法
CN110362085A (zh) * 2019-07-22 2019-10-22 合肥小步智能科技有限公司 一种用于特种巡检机器人的类脑平台
CN110488835A (zh) * 2019-08-28 2019-11-22 北京航空航天大学 一种基于双反向传播神经网络的无人系统智能局部路径规划方法
CN110782012A (zh) * 2019-10-21 2020-02-11 衢州学院 一种危化品车辆运输状态自学习预警模型的搭建方法
CN110940341A (zh) * 2019-12-31 2020-03-31 深圳前海达闼云端智能科技有限公司 路径规划方法、机器人及计算机可读存储介质
CN110986953A (zh) * 2019-12-13 2020-04-10 深圳前海达闼云端智能科技有限公司 路径规划方法、机器人及计算机可读存储介质
CN111103801A (zh) * 2019-12-31 2020-05-05 芜湖哈特机器人产业技术研究院有限公司 基于遗传算法的移动机器人重定位方法及移动机器人
CN111152226A (zh) * 2020-01-19 2020-05-15 吉利汽车研究院(宁波)有限公司 一种机器人工作轨迹规划方法及系统
CN111527500A (zh) * 2017-12-29 2020-08-11 美光科技公司 用于增强人工神经网络的分布式架构中的自学习
CN111587408A (zh) * 2018-01-12 2020-08-25 华为技术有限公司 机器人导航和对象跟踪
CN111610788A (zh) * 2020-06-13 2020-09-01 大连海事大学 一种分级模糊-人工势场路径规划的方法
CN111930121A (zh) * 2020-08-10 2020-11-13 哈尔滨工程大学 一种室内移动机器人的混合路径规划方法
CN112432652A (zh) * 2021-01-26 2021-03-02 德鲁动力科技(成都)有限公司 路径规划系统及路径规划方法
WO2021082709A1 (zh) * 2019-10-31 2021-05-06 五邑大学 水下清淤机器人路径规划方法、装置、机器人和存储介质
CN112882469A (zh) * 2021-01-14 2021-06-01 浙江大学 一种融合全局训练的深度强化学习避障导航方法
CN112987713A (zh) * 2019-12-17 2021-06-18 杭州海康威视数字技术股份有限公司 自动驾驶设备的控制方法、装置及存储介质
CN113343355A (zh) * 2021-06-08 2021-09-03 四川大学 基于深度学习的飞机蒙皮型面检测路径规划方法
CN113359738A (zh) * 2021-06-17 2021-09-07 东莞理工学院 基于深度学习的移动机器人路径规划方法
CN113485343A (zh) * 2021-07-14 2021-10-08 北京惠风智慧科技有限公司 一种基于人工智能的机器人行走方法及装置
CN113741420A (zh) * 2021-07-28 2021-12-03 浙江工业大学 一种由数据驱动的采样搜索方法和系统
CN114577214A (zh) * 2022-03-02 2022-06-03 哈尔滨工业大学 一种应用于跨异构多层空间的轮式机器人路径规划方法
US11705004B2 (en) 2018-04-19 2023-07-18 Micron Technology, Inc. Systems and methods for automatically warning nearby vehicles of potential hazards
US11755884B2 (en) 2019-08-20 2023-09-12 Micron Technology, Inc. Distributed machine learning with privacy protection
CN117091608A (zh) * 2023-10-17 2023-11-21 山东怀思人工智能科技有限公司 一种教育机器人的路径规划方法、设备及介质
CN117311366A (zh) * 2023-11-21 2023-12-29 南京禄口国际机场空港科技有限公司 一种应用于机场草坪的割草机的路径控制方法、系统及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094460A1 (en) * 2008-10-09 2010-04-15 Samsung Electronics Co., Ltd. Method and apparatus for simultaneous localization and mapping of robot
CN101769754A (zh) * 2010-01-19 2010-07-07 湖南大学 一种基于类三维地图的移动机器人全局路径规划方法
CN102929279A (zh) * 2012-11-07 2013-02-13 无锡普智联科高新技术有限公司 基于三维空间密集存储区域的多机器人路径规划方法
CN104571113A (zh) * 2015-01-20 2015-04-29 博康智能网络科技股份有限公司 移动机器人的路径规划方法
CN105117769A (zh) * 2015-09-14 2015-12-02 杭州电子科技大学 基于差分进化狼群算法的欺骗干扰识别方法
CN105281847A (zh) * 2015-09-14 2016-01-27 杭州电子科技大学 基于模型参数辨识的欺骗干扰识别方法
CN106023211A (zh) * 2016-05-24 2016-10-12 深圳前海勇艺达机器人有限公司 基于深度学习的机器人图像定位方法及系统
CN106092138A (zh) * 2016-06-06 2016-11-09 东南大学 一种基于微处理器的硅微陀螺仪温度补偿方法
CN106444738A (zh) * 2016-05-24 2017-02-22 武汉科技大学 基于动态运动基元学习模型的移动机器人路径规划方法
CN106548645A (zh) * 2016-11-03 2017-03-29 济南博图信息技术有限公司 基于深度学习的车辆路径寻优方法及系统
CN106774314A (zh) * 2016-12-11 2017-05-31 北京联合大学 一种基于行走轨迹的家庭服务机器人路径规划方法
CN106780631A (zh) * 2017-01-11 2017-05-31 山东大学 一种基于深度学习的机器人闭环检测方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094460A1 (en) * 2008-10-09 2010-04-15 Samsung Electronics Co., Ltd. Method and apparatus for simultaneous localization and mapping of robot
CN101769754A (zh) * 2010-01-19 2010-07-07 湖南大学 一种基于类三维地图的移动机器人全局路径规划方法
CN102929279A (zh) * 2012-11-07 2013-02-13 无锡普智联科高新技术有限公司 基于三维空间密集存储区域的多机器人路径规划方法
CN104571113A (zh) * 2015-01-20 2015-04-29 博康智能网络科技股份有限公司 移动机器人的路径规划方法
CN105117769A (zh) * 2015-09-14 2015-12-02 杭州电子科技大学 基于差分进化狼群算法的欺骗干扰识别方法
CN105281847A (zh) * 2015-09-14 2016-01-27 杭州电子科技大学 基于模型参数辨识的欺骗干扰识别方法
CN106023211A (zh) * 2016-05-24 2016-10-12 深圳前海勇艺达机器人有限公司 基于深度学习的机器人图像定位方法及系统
CN106444738A (zh) * 2016-05-24 2017-02-22 武汉科技大学 基于动态运动基元学习模型的移动机器人路径规划方法
CN106092138A (zh) * 2016-06-06 2016-11-09 东南大学 一种基于微处理器的硅微陀螺仪温度补偿方法
CN106548645A (zh) * 2016-11-03 2017-03-29 济南博图信息技术有限公司 基于深度学习的车辆路径寻优方法及系统
CN106774314A (zh) * 2016-12-11 2017-05-31 北京联合大学 一种基于行走轨迹的家庭服务机器人路径规划方法
CN106780631A (zh) * 2017-01-11 2017-05-31 山东大学 一种基于深度学习的机器人闭环检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
陈志军 等: "基于模糊神经网络和遗传算法的机器人三维路径规划方法", 《重庆师范大学学报(自然科学版)》 *
陈虹 等: "基于优化数据处理的深度信念网络模型的入侵检测方法", 《计算机应用》 *

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108122048B (zh) * 2017-11-23 2021-07-20 浙江专线宝网阔物联科技有限公司 一种运输路径调度方法及其系统
CN108122048A (zh) * 2017-11-23 2018-06-05 浙江专线宝网阔物联科技有限公司 一种运输路径调度方法及其系统
CN111527500A (zh) * 2017-12-29 2020-08-11 美光科技公司 用于增强人工神经网络的分布式架构中的自学习
CN111527500B (zh) * 2017-12-29 2023-10-31 美光科技公司 用于增强人工神经网络的分布式架构中的自学习
CN111587408B (zh) * 2018-01-12 2022-07-12 华为技术有限公司 机器人导航和对象跟踪
CN111587408A (zh) * 2018-01-12 2020-08-25 华为技术有限公司 机器人导航和对象跟踪
CN108319293A (zh) * 2018-01-17 2018-07-24 哈尔滨工程大学 一种基于lstm网络的uuv实时避碰规划方法
CN108334677A (zh) * 2018-01-17 2018-07-27 哈尔滨工程大学 一种基于gru网络的uuv实时避碰规划方法
CN108334677B (zh) * 2018-01-17 2021-06-11 哈尔滨工程大学 一种基于gru网络的uuv实时避碰规划方法
CN108319293B (zh) * 2018-01-17 2021-01-12 哈尔滨工程大学 一种基于lstm网络的uuv实时避碰规划方法
CN108255182A (zh) * 2018-01-30 2018-07-06 上海交通大学 一种基于深度强化学习的服务机器人行人感知避障方法
WO2019148645A1 (zh) * 2018-02-01 2019-08-08 苏州大学张家港工业技术研究院 基于部分感知马氏决策过程的机器人最优路径规划方法
CN108680155A (zh) * 2018-02-01 2018-10-19 苏州大学 基于部分感知马氏决策过程的机器人最优路径规划方法
CN108680155B (zh) * 2018-02-01 2020-09-08 苏州大学 基于部分感知马氏决策过程的机器人最优路径规划方法
CN109540151B (zh) * 2018-03-25 2020-01-17 哈尔滨工程大学 一种基于强化学习的auv三维路径规划方法
CN109540151A (zh) * 2018-03-25 2019-03-29 哈尔滨工程大学 一种基于强化学习的auv三维路径规划方法
US11705004B2 (en) 2018-04-19 2023-07-18 Micron Technology, Inc. Systems and methods for automatically warning nearby vehicles of potential hazards
CN108803321B (zh) * 2018-05-30 2020-07-10 清华大学 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
CN108803321A (zh) * 2018-05-30 2018-11-13 清华大学 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
CN109902796A (zh) * 2019-03-14 2019-06-18 重庆邮电大学 一种基于烟花爆炸行为的改进的狼群算法
CN109976347A (zh) * 2019-04-11 2019-07-05 中南大学 一种基于快速扩展随机树和势场法的视觉伺服路径规划方法
CN109976347B (zh) * 2019-04-11 2023-10-13 中南大学 一种基于快速扩展随机树和势场法的视觉伺服路径规划方法
CN110362085A (zh) * 2019-07-22 2019-10-22 合肥小步智能科技有限公司 一种用于特种巡检机器人的类脑平台
US11755884B2 (en) 2019-08-20 2023-09-12 Micron Technology, Inc. Distributed machine learning with privacy protection
CN110488835A (zh) * 2019-08-28 2019-11-22 北京航空航天大学 一种基于双反向传播神经网络的无人系统智能局部路径规划方法
CN110782012A (zh) * 2019-10-21 2020-02-11 衢州学院 一种危化品车辆运输状态自学习预警模型的搭建方法
WO2021082709A1 (zh) * 2019-10-31 2021-05-06 五邑大学 水下清淤机器人路径规划方法、装置、机器人和存储介质
CN110986953A (zh) * 2019-12-13 2020-04-10 深圳前海达闼云端智能科技有限公司 路径规划方法、机器人及计算机可读存储介质
CN112987713A (zh) * 2019-12-17 2021-06-18 杭州海康威视数字技术股份有限公司 自动驾驶设备的控制方法、装置及存储介质
CN110940341A (zh) * 2019-12-31 2020-03-31 深圳前海达闼云端智能科技有限公司 路径规划方法、机器人及计算机可读存储介质
CN111103801A (zh) * 2019-12-31 2020-05-05 芜湖哈特机器人产业技术研究院有限公司 基于遗传算法的移动机器人重定位方法及移动机器人
CN110940341B (zh) * 2019-12-31 2022-04-22 达闼机器人有限公司 路径规划方法、机器人及计算机可读存储介质
CN111103801B (zh) * 2019-12-31 2022-05-17 芜湖哈特机器人产业技术研究院有限公司 基于遗传算法的移动机器人重定位方法及移动机器人
CN111152226B (zh) * 2020-01-19 2021-09-07 吉利汽车研究院(宁波)有限公司 一种机器人工作轨迹规划方法及系统
CN111152226A (zh) * 2020-01-19 2020-05-15 吉利汽车研究院(宁波)有限公司 一种机器人工作轨迹规划方法及系统
CN111610788A (zh) * 2020-06-13 2020-09-01 大连海事大学 一种分级模糊-人工势场路径规划的方法
CN111610788B (zh) * 2020-06-13 2023-04-18 大连海事大学 一种分级模糊-人工势场路径规划的方法
CN111930121A (zh) * 2020-08-10 2020-11-13 哈尔滨工程大学 一种室内移动机器人的混合路径规划方法
CN112882469A (zh) * 2021-01-14 2021-06-01 浙江大学 一种融合全局训练的深度强化学习避障导航方法
CN112432652A (zh) * 2021-01-26 2021-03-02 德鲁动力科技(成都)有限公司 路径规划系统及路径规划方法
CN113343355B (zh) * 2021-06-08 2022-10-18 四川大学 基于深度学习的飞机蒙皮型面检测路径规划方法
CN113343355A (zh) * 2021-06-08 2021-09-03 四川大学 基于深度学习的飞机蒙皮型面检测路径规划方法
CN113359738A (zh) * 2021-06-17 2021-09-07 东莞理工学院 基于深度学习的移动机器人路径规划方法
CN113485343A (zh) * 2021-07-14 2021-10-08 北京惠风智慧科技有限公司 一种基于人工智能的机器人行走方法及装置
CN113741420A (zh) * 2021-07-28 2021-12-03 浙江工业大学 一种由数据驱动的采样搜索方法和系统
CN113741420B (zh) * 2021-07-28 2023-12-19 浙江工业大学 一种由数据驱动的采样搜索方法和系统
CN114577214A (zh) * 2022-03-02 2022-06-03 哈尔滨工业大学 一种应用于跨异构多层空间的轮式机器人路径规划方法
CN114577214B (zh) * 2022-03-02 2022-09-20 哈尔滨工业大学 一种应用于跨异构多层空间的轮式机器人路径规划方法
CN117091608A (zh) * 2023-10-17 2023-11-21 山东怀思人工智能科技有限公司 一种教育机器人的路径规划方法、设备及介质
CN117091608B (zh) * 2023-10-17 2023-12-29 山东怀思人工智能科技有限公司 一种教育机器人的路径规划方法、设备及介质
CN117311366A (zh) * 2023-11-21 2023-12-29 南京禄口国际机场空港科技有限公司 一种应用于机场草坪的割草机的路径控制方法、系统及存储介质
CN117311366B (zh) * 2023-11-21 2024-02-13 南京禄口国际机场空港科技有限公司 一种应用于机场草坪的割草机的路径控制方法、系统及存储介质

Also Published As

Publication number Publication date
CN107368076B (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN107368076B (zh) 一种智能环境下机器人运动路径深度学习控制规划方法
CN107272705B (zh) 一种智能环境下机器人路径的多神经网络控制规划方法
CN107436604B (zh) 一种智能环境下运载机器人路径智能分解控制规划方法
CN107450535B (zh) 一种智能运载机器人最优路径混合图论控制规划方法
CN106444769B (zh) 一种室内移动机器人增量式环境信息采样的最优路径规划方法
CN108762264A (zh) 基于人工势场与滚动窗口的机器人的动态避障方法
CN112356830B (zh) 一种基于模型强化学习的智能泊车方法
Nikolos et al. Evolutionary algorithm based offline/online path planner for UAV navigation
CN107065890A (zh) 一种无人车智能避障方法及系统
CN105137967A (zh) 一种深度自动编码器与q学习算法相结合的移动机器人路径规划方法
CN108413976A (zh) 一种面向多工况的爬壁机器人智能路径规划方法及系统
CN113625716B (zh) 一种多智能体动态路径规划方法
CN109508035A (zh) 基于分布式控制的多区域分级式无人机编队路径规划方法
Zhao et al. The experience-memory Q-learning algorithm for robot path planning in unknown environment
CN113128770B (zh) 基于dqn的不确定车间环境下物料配送实时优化方法
CN113156980B (zh) 一种基于深度强化学习的塔式起重机路径规划方法及系统
CN111506063B (zh) 一种基于分层强化学习框架的移动机器人无图导航方法
Ni et al. An improved real-time path planning method based on dragonfly algorithm for heterogeneous multi-robot system
Kyprianou et al. Towards the achievement of path planning with multi-robot systems in dynamic environments
CN113391633A (zh) 一种面向城市环境的移动机器人融合路径规划方法
Kim et al. Simulating travel paths of construction site workers via deep reinforcement learning considering their spatial cognition and wayfinding behavior
Zhao Optimal path planning for robot based on ant colony algorithm
CN116501034A (zh) 基于迁移强化学习的vex机器人路径规划方法
CN114721397B (zh) 一种基于强化学习和好奇心的迷宫机器人路径规划方法
Shi et al. Mobile robot path planning in three-dimensional environment based on ACO-PSO hybrid algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant