CN110543171B - 一种基于改进bp神经网络的仓储多agv路径规划方法 - Google Patents

一种基于改进bp神经网络的仓储多agv路径规划方法 Download PDF

Info

Publication number
CN110543171B
CN110543171B CN201910794044.9A CN201910794044A CN110543171B CN 110543171 B CN110543171 B CN 110543171B CN 201910794044 A CN201910794044 A CN 201910794044A CN 110543171 B CN110543171 B CN 110543171B
Authority
CN
China
Prior art keywords
neural network
agv
network model
path planning
agvs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910794044.9A
Other languages
English (en)
Other versions
CN110543171A (zh
Inventor
陈永府
郑迥之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201910794044.9A priority Critical patent/CN110543171B/zh
Publication of CN110543171A publication Critical patent/CN110543171A/zh
Application granted granted Critical
Publication of CN110543171B publication Critical patent/CN110543171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0223Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0238Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using obstacle or wall sensors
    • G05D1/024Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using obstacle or wall sensors in combination with a laser
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0231Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means
    • G05D1/0246Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using a video camera in combination with image processing means
    • G05D1/0251Control of position or course in two dimensions specially adapted to land vehicles using optical position detecting means using a video camera in combination with image processing means extracting 3D information from a plurality of images taken from different locations, e.g. stereo vision
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0257Control of position or course in two dimensions specially adapted to land vehicles using a radar
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Electromagnetism (AREA)
  • Multimedia (AREA)
  • Optics & Photonics (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,包括以下步骤:获取仓储环境点云数据并构建栅格地图;获取当前时刻待路径规划的所有AGV的实时位置及其对应的目标位置,并输入训练好的BP神经网络模型中,并随机选取一台AGV作为首个输入,以获取该AGV移动状态;对当前时刻未确定移动状态的所有AGV,重复以上操作,直至获取到所有AGV的移动状态;若当前时刻所有待路径规划的AGV均达到目标位置,输出当前时刻所有待路径规划的AGV的完整路径;否则将下一时刻设置为当前时刻,重复以上操作;本发明极大地简化神经网络结构,提高了学习器的准确性,同时提高了收敛速度,避免过拟合问题,有效提高仓储作业效率。

Description

一种基于改进BP神经网络的仓储多AGV路径规划方法
技术领域
本发明属于机器人技术领域,更具体地,涉及一种基于改进BP神经网络的仓储多AGV路径规划方法。
背景技术
AGV(Automated Guided Vehicle),即自动导航车,是指装备有电磁或光学等自动导引装置,能够沿规定的导引路径行驶,具有安全保护以及各种移载功能的运输车。AGV通过自有的自动装卸机构和导航装置,可实现物品搬运和装卸过程的全自动化。其自身的自动导航系统保证AGV无需人工牵引就能自动行驶,将存放货物的货架从停放位置(起始点)送至操作台(目的地)。
AGV是一种效率高、安全性高、自动化程度高的物流运输方式,且相对于传统的物流运输方式,其对人的依赖程度大大降低,极大的减少了人力成本;同时,在一些特殊物料(有毒化学原料,放射性原料)的运输过程中,以AGV为运输载体,减少了人接触有害物质的机会,加强了对工作人员的保护,使整个运输过程更加安全;另外,AGV的灵活性也使其相较传统运输工具占用空间更小,这可以有效地提高空间利用率,减少用地耗费成本。
因此,随着机器人技术和仓储物流业的快速发展,仓储AGV逐渐出现在各大物流公司的仓库中,承担各种物流运输工作。与此同时,仓储多AGV的路径规划问题备受关注,只有优良的路径规划算法才能提高物流作业效率,降低作业成本。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于改进BP神经网络的仓储多AGV路径规划方法,其目的在于通过采用BP神经网络对仓储多AGV进行路径规划,并在BP神经网络的代价函数中添加修正系数以加快收敛速度,以提高仓储多AGV路径规划的准确度和计算效率,由此解决现有技术中由于仓储多AGV路径规划不良而导致的物流作业效率低下,作业成本高的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,包括以下步骤:
(1)获取仓储环境点云数据,并将所述仓储环境点云数据映射为栅格地图;
(2)确定当前时刻待路径规划的所有AGV在步骤(1)中获取的栅格地图中的实时位置及其对应的目标位置;
(3)从待路径规划的所有AGV中随机选取一台AGV作为首个输入,将步骤(2)中获取的待路径规划所有AGV的实时位置和对应目标位置输入训练好的BP神经网络模型中,以获取选取的AGV的移动状态;
(4)对当前时刻待路径规划的所有AGV中剩余的AGV,重复步骤(3),直至获取到所有AGV的移动状态为止;
(5)判断当前时刻所有待路径规划的AGV是否均到达步骤(2)中确定的目标位置,如果是,则输出当前时刻所有待路径规划的AGV的完整路径,过程结束;否则进入步骤(6);
(6)将下一时刻设置为当前时刻,并返回步骤(2)。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其步骤(3)中所述BP神经网络模型包括输入层、输出层及隐藏层;其中,所述输入层、输出层及隐藏层输出特征数量分别为8x6、6x5及5x1。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其步骤(3)中所述BP神经网络模型通过以下步骤训练:
(3-1)获取AGV的历史工作数据,并将所述历史工作数据作为样品数据集;其中,所述AGV历史工作数据包括各AGV在所述栅格地图中的实时位置、其对应的目标位置、及首个输入AGV的移动状态;
(3-2)将步骤(3-1)中获取的样品数据集按照60%:20%:20%比例分为训练子集、交叉验证子集和测试子集;
(3-3)以步骤(3-2)中获取的训练子集中各AGV的实时位置及其对应的目标位置为输入,以步骤(3-2)获取的训练子集中首个输入AGV的移动状态为输出,以代价函数最小化为优化目标训练BP神经网络模型;
(3-4)采用步骤(3-2)中获取的交叉验证子集对步骤(3-3)训练后的BP神经网络模型进行交叉验证,当所述BP神经网络模型输出结果准确率高于一预设阈值时,则交叉验证通过,并进入步骤(3-5);否则返回步骤(3-3);
(3-5)采用步骤(3-2)中获取的测试子集对步骤(3-4)交叉验证后的BP神经网络模型进行再次验证,当所述BP神经网络模型输出结果准确率高于一预设阈值时,则训练过程结束,否则返回步骤(3-1)。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其步骤(3-3)中所述优化目标是采用以下公式计算:
Figure BDA0002180389260000031
式中,J(Θ)为代价函数;m为所述训练子集包含的样本总数,其取值范围为103~105
c为所述BP神经网络模型中输出层的神经单元个数,其取值范围为5~10;
λ为正则化参数,其取值范围为0~10;
L为所述BP神经网络模型的层数,其取值范围为L≥3
Sl为所述BP神经网络模型中第l层的神经元个数,其取值范围为5~8;
Θtj (l)为所述BP神经网络模型中第l层的第j个神经元到第l+1层的第t个神经元的权重,其通过梯度下降算法计算获取;
costik表示所述训练子集中第i个样本在所述BP神经网络模型中输出层的第k个神经元上的代价;
α为修正系数,其值是根据所述BP神经网络模型获取的首个输入AGV的移动状态与该AGV在所述训练子集中对应的样本标签的关系确定,其中所述样本标签为所述训练子集中样本AGV的实际移动状态。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其α具体取值如下:
Figure BDA0002180389260000041
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其costik采样以下公式计算:
costik=α·[yk (i)·lg(hΘ(xi)k)+(1-yk (i))·lg(1-hΘ(xi)k)]
式中,yk (i)为所述训练子集中第i个样本的第k个元素值,其取值为0或1;hΘ(xi)k为所述训练子集中第i个样本在所述BP神经网络模型输出层第k个神经元的输出,其是通过前向传播算法计算获取。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其hΘ(xi)k采样以下公式计算:
Figure BDA0002180389260000051
Figure BDA0002180389260000052
Figure BDA0002180389260000053
其中,
Figure BDA0002180389260000058
表示所述BP神经网络模型第l层的第
Figure BDA0002180389260000054
个神经元的激励;a0 (l)=1,为偏置单元,
Figure BDA0002180389260000055
为所述训练子集中的指定样本在所述BP神经网络模型输入层的第
Figure BDA0002180389260000056
个神经元对应的输出。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其Θtj (l)采用以下公式计算:
Figure BDA0002180389260000057
其中η为学习率,其取值范围为0~1;
Θtj (l)的初始值为-0.3~0.3。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其步骤(3-4)及(3-5)中所述的预设阈值为95%。
优选地,所述的基于改进BP神经网络的仓储多AGV路径规划方法,其隐藏层为单隐层或双隐层。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得以下有益效果:
(1)针对现有技术中利用神经网络解决AGV路径规划问题存在神经网络结构复杂、输出神经元数量过多、学习器的准确性不高等问题,本发明通过采用步骤(3)将步骤(2)中所获取到的AGV实时位置和对应目标位置输入训练好的BP神经网络模型中,并随机选取一台AGV作为首个输入,以获取该AGV移动状态,从而使得BP神经网络模型每次计算一个AGV的移动状态,进而获取该AGV的路径规划,而并非像现有技术中通过一次计算就得出各AGV的完整路线,极大提高计算效率;同时,通过采用步骤(4)不断地对尚未经过所述训练好的BP神经网络模型计算的所有待路径规划的AGV进行处理,既避免了重复处理,也避免遗漏,提高了准确性。
(2)针对现有技术中利用神经网络解决AGV路径规划问题存在每次需要计算全部AGV的全部时刻的完整路径,从而计算效率低下,适用性差等问题,本发明通过采用步骤(2)和(3)随机选取未知第t时刻的AGV数据,并利用训练好的BP神经网络对该数据进行计算,以获取第t时刻的AGV的移动状态,采用(5)判断当第t时刻的AGV是否均达到目标位置,对于尚未达到目标位置,采用步骤(6)进行多次迭代,得到各AGV的完整路径,再反馈给各AGV,从而控制AGV向目标位置移动,而非一次计算就得出各AGV的完整路线;从而对任意时刻的任一AGV具有普适性,符合实际应用场景。
(3)针对现有技术中BP神经网络模型结构复杂等问题,本发明提供的BP神经网络模型只包括输入层、输出层及隐藏层,从而简化了神经网络结构,减少了神经元数量,提高了学习器的准确性。
(4)针对现有技术中BP神经网络模型对于多AGV路径规划问题的代价函数过于单一化,容易导致收敛速度慢,且在样本数据集很大的情况下,还易出现过拟合的现象,使算法没有很好的泛化能力等问题,本发明通过在传统BP神经网络模型代价函数中添加正则化参数以避免出现过拟合问题,从而使BP神经网络模型具有更好的泛化能力,通过在BP神经网络代价函数中添加了修正系数α,其对路径规划过程中的不同误差情况给予了不同程度的惩罚,从而有效提高神经网络的收敛速度,提高了计算效率。
附图说明
图1是本发明提供的一种基于改进BP神经网络的仓储多AGV路径规划方法流程示意图;
图2是本发明提供的一种基于改进BP神经网络的仓储多AGV路径规划方法具体BP神经网络结构示意图;
图3本发明提供的一种基于改进BP神经网络的仓储多AGV路径规划方法具体应用流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
仓储多AGV路径规划问题属于静态环境已知的路径规划问题,且AGV之间可以进行通讯交流信息。现有的解决类似多AGV路径规划问题的方法主要包括经典算法、仿生算法和学习算法等几种:其中经典算法包括A*算法、人工势场法、Dijkstra算法等,仿生算法包括遗传算法、蚁群算法、粒子群算法等;然而上述各种算法都存在容易陷入局部最优或者运算效率低下,耗时大的问题,因此都不适合应用于仓储环境下的实时场景。
而学习算法,因其具有鲁棒性高和能够自适应学习等优势,被广泛运用在在仓储环境中;同时,在仓储环境中,由于训练样本的数据较易获得,学习算法能够充分利用仓储AGV历史工作数据,从而提高了准确性。
目前学习算法主要包括:强化学习、Q-学习算法、神经网络等,其中,强化学习及Q-学习算法在AGV路径规划方面的应用大多停留在单AGV阶段,只有神经网络扩展到了多AGV路径规划问题。
现有的神经网络解决AGV路径规划问题时通常以各AGV的完整路线为输出,这样会导致神经网络结构复杂,输出神经元数量很多,学习器的准确性不高。此外,对于多AGV路径规划问题的代价函数过于单一化,容易导致收敛速度慢。在样本数据集很大的情况下,还易出现过拟合的现象,使算法没有很好的泛化能力。
而BP神经网络,即back propagation神经网络,是一种按照误差逆向传播算法训练的多层前馈神经网络;其在现有神经网络的基础上,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,不存在传统神经网络的局部极小及收敛速度慢等问题。
如图1所示,本发明提供了一种基于改进BP神经网络的仓储多AGV路径规划方法,包括以下步骤:
(1)获取仓储环境点云数据,并将所述仓储环境点云数据映射为栅格地图;
具体而言,所述仓储环境点云数据包括货架所在位置、仓储AGV停放区域以及所述货架所在位置和仓储AGV停放区域之间的过道;其通过3D扫描设备获取,所述3D扫描设备包括立体摄像头,激光雷达等;
在本发明中,所述栅格地图,其行数等于货架行数与横向过道条数之和,其值优选为10~100;其列数等于AGV停放区域纵向列数加上货架列数与纵向过道条数之和,其值优选为12~120;其节点为仓储AGV位置,其相邻节点之间直接连接边为仓储AGV的路径;
(2)获取当前时刻待路径规划的所有AGV在步骤(1)中获取的栅格地图中的实时位置及其对应的目标位置;
(3)从待路径规划的所有AGV中随机选取一台AGV作为首个输入,将步骤(2)中获取的待路径规划所有AGV的实时位置和对应目标位置输入训练好的BP神经网络模型中,以获取选取的AGV的移动状态;
具体而言,所述移动状态包括上、下、左、右及等待,根据该AGV移动状态,该AGV从所述仓储的栅格地图中实时位置对应的节点移动至所述移动状态对应的节点,所述两个节点之间的直接连接边为该AGV的路径。
现有的神经网络解决AGV路径规划问题时,通常将所有待路径规划的AGV的实时位置及其对应的目标位置同时输入训练好的神经网络模型中,以得到所有待路径规划的AGV的移动状态,从而获取所有待路径规划的AGV的完整路径规划;这种方式会导致神经网络结构复杂、输出神经元数量过多、学习器的准确性不高等问题。此外,也易造成因代价函数过于单一化而导致收敛速度慢的问题。
而本发明提供的一种基于改进BP神经网络的仓储多AGV路径规划方法,通过采用本步骤对所有待路径规划的AGV进行随机排序,并将排在首位的待路径规划的AGV的实时位置及其对应的目标位置数据输入训练好的BP神经网络模型中以计算该AGV移动状态;从而使得每次用计算一个AGV的移动状态,进而获取该AGV的路径规划,而并非像现有技术中通过一次计算就得出各AGV的完整路线。本发明通过本步骤可以极大地减少神经网络的神经元数量,简化神经网络结构,提高学习器的准确性。
在本发明中,所述BP神经网络模型包括输入层、输出层及隐藏层;具体而言,所述BP神经网络模型详情如下表所示:
表1本发明提供的BP神经网络模型详细结构
输入特征数量 神经元个数 连接数 输出特征数量
输入层 8 8 8x6 8x6
隐藏层 6x8 6 6x8+6x5 6x5
输出层 5x6 5 5x6 5x1
优选地,所述隐藏层为单隐层或双隐层,以提高计算效率;所述隐藏层神经元数量依照以下公式计算获取:
Figure BDA0002180389260000091
其中,q为所述BP神经网络模型中隐藏层所包含的神经元个数,n为所述隐藏层的输入特征个数,c为所述隐藏层的输出层神经元个数,其取值见上表。
对仓储多AGV系统,所述BP神经网络模型能够满足仓储环境下多AGV路径规划问题的实时性要求。
在本发明中,所述BP神经网络模型通过以下步骤训练:
(3-1)获取AGV的历史工作数据,并将所述历史工作数据作为样品数据集;其中,所述AGV历史工作数据包括各AGV在所述栅格地图中的实时位置、其对应的目标位置、及首个输入AGV的移动状态;
在本发明中,首个输入AGV,指的是仓储的所有AGV中首个发生移动的AGV。
(3-2)将步骤(3-1)中获取的样品数据集按照60%:20%:20%比例分为训练子集、交叉验证子集和测试子集;
(3-3)以步骤(3-2)中获取的训练子集中各AGV的实时位置及其对应的目标位置为输入,以步骤(3-2)获取的训练子集中首个输入AGV的移动状态为输出,以代价函数最小化为优化目标训练BP神经网络模型;
进一步地,所述优化目标采用如下公式进行计算:
Figure BDA0002180389260000101
其中J(Θ)为代价函数;
m为所述训练子集包含的样本总数,其取值范围优选为103~105,以提供足够多的样本数量从而保证计算结果的准确性。
i为所述训练子集中指定样本,其取值范围为i=1、2……m;
c为所述BP神经网络模型输出层神经单元个数,其值优选为5~10,具体而言,在本发明中,所述输出层单元个数优选为5;
k为所述输出层中指定神经单元,其取值范围为k=1、2……c;
λ为正则化参数,其取值范围为0~10,以防止过拟合;
L为所述BP神经网络模型层数,具体而言,在本发明中,所述BP神经网络包括:输入层、输出层及至少一个隐藏层,因此,所述L取值范围为L≥3);
l所述BP神经网络模型指定层,其取值范围为l=1、2……L;
Sl为所述BP神经网络模型第l层的神经元个数,Sl+1为所述BP神经网络模型第l+1层的神经元个数,其取值范围均为5~8;
j为所述BP神经网络模型第l层指定神经元,其取值范围为j=1、2……Sl
t为所述BP神经网络模型第l+1层指定神经元,其取值范围为t=1、2……Sl+1
Θtj (l)为所述BP神经网络模型第l层第j个神经元到第l+1层第t个神经元的权重,其通过梯度下降算法计算获取;
优选地,所述Θtj (l)采用以下公式计算:
Figure BDA0002180389260000111
其中η为学习率,其取值范围为0~1;
Θtj (l)的初始值为-0.3~0.3;
本发明中的BP神经网络模型通过批处理的学习方式,即使用一批样本的总误差来调整权值,解决了现有技术中因样本输入顺序引起的精度问题和训练的抖动问题。
costik表示所述训练子集中第i个样本在所述BP神经网络模型输出层第k个神经元上的代价:
优选地,所述costik采样以下公式计算:
costik=α·[yk (i)·lg(hΘ(xi)k)+(1-yk (i))·lg(1-hΘ(xi)k)]
式中,yk (i)为所述训练子集中第i个样本的第k个元素值,所述样本标签指所述训练子集中样本AGV的实际移动状态;其取值为0或1,具体而言,所述y(i)∈R5×1,其具体为五维列向量,其元素的取值为0或1,其中与样本移动状态相对应的元素值为1,其余为0,例如当所述训练子集中样本i的移动状态为向上时,则y(i)=[1,0,0,0,0]T
hΘ(xi)k为所述训练子集中第i个样本在所述BP神经网络模型输出层第k个神经元的输出,其通过前向传播算法计算获取。
优选地,所述hΘ(xi)k采用以下公式计算:
Figure BDA0002180389260000121
Figure BDA0002180389260000122
Figure BDA0002180389260000123
其中,
Figure BDA00021803892600001210
表示所述BP神经网络模型第l层的第
Figure BDA0002180389260000124
个神经元的激励,
Figure BDA0002180389260000125
为所述BP神经网络模型第l层指定神经元,其取值范围为:
Figure BDA0002180389260000126
更具体地,a0 (l)=1,为偏置单元,
Figure BDA0002180389260000127
为所述训练子集中的指定样本在所述BP神经网络模型输入层的第
Figure BDA0002180389260000128
个神经元对应的输出。
α为修正系数,其值是根据所述BP神经网络模型获取的首个输入AGV的移动状态与该AGV在所述训练子集中对应的样本标签的关系确定,其中所述样本标签为所述训练子集中样本AGV的实际移动状态。
具体而言,在本发明中,所述α具体取值如下:
Figure BDA0002180389260000129
通过本步骤,在常规的BP神经网络模型代价函数中添加了修正系数α,所述α对路径规划过程中的不同误差情况给予了不同程度的惩罚,从而能够有效提高神经网络的收敛速度,极大的提高了计算效率。
(3-4)采用步骤(3-2)中获取的交叉验证子集对步骤(3-3)训练后的BP神经网络模型进行交叉验证,当所述BP神经网络模型输出结果准确率高于一预设阈值时,则交叉验证通过,并进入步骤(3-5);否则返回步骤(3-3);
优选地,所述预设阈值为95%,以保证结果的准确性;
通过本步骤,利用交叉验证子集对步骤(3-3)获取的BP神经网络模型进行交叉验证,以拟合出最优正则化参数,从而使所述BP神经网络模型具有最好的泛化能力,进而有效避免了现有技术的神经网络算法在仓储多AGV路径规划中存在的过拟合的问题。
(3-5)采用步骤(3-2)中获取的测试子集对步骤(3-4)交叉验证后的BP神经网络模型进行再次验证,当所述BP神经网络模型输出结果准确率高于一预设阈值时,则训练过程结束,否则返回步骤(3-1)。
优选地,所述预设阈值为95%,以保证结果的准确性;
具体而言,当步骤(3-5)所述的BP神经网络模型输出结果准确率低于95%时,画出BP神经网络模型的学习曲线,即训练集和交叉验证集的误差与样本大小的关系,通过对学习曲线进行分析,得出网络是否存在高偏差或者高方差的问题,并据此采取相应的改进措施,例如高方差时,可采用获取更多训练样本,减少特征数,增大正则化参数等方式改进学习器;高偏差时可通过寻找其他特征,减小特征数等方式改进学习器。
通过本步骤,利用测试子集对步骤(3-4)中的BP神经网络模型进行再次验证,从而保障BP神经网络模型的准确率。
(4)对当前时刻待路径规划的所有AGV中剩余的AGV,重复步骤(3),直至获取到所有AGV的移动状态为止;
(5)判断当前时刻所有待路径规划的AGV是否均到达步骤(2)中确定的目标位置,如果是,则输出当前时刻所有待路径规划的AGV的完整路径,过程结束;否则进入步骤(6);
本发明通过采用步骤(4)和(5),对当前时刻尚未经过所述训练好的BP神经网络模型计算的所有待路径规划的AGV进行重复步骤(4)的操作,从而使得每次用计算一个AGV的移动状态,进而获取该AGV的路径规划,而并非像现有技术中通过一次计算就得出各AGV的完整路线。本发明通过本步骤可以极大地减少神经网络的神经元数量,简化神经网络结构,提高学习器的准确性;同时,通过不断地对尚未经过所述训练好的BP神经网络模型计算的所有待路径规划的AGV进行处理,既避免了重复处理,也避免遗漏,提高了准确性。
(6)将下一时刻设置为当前时刻,并返回步骤(2)。
本发明通过步骤(6),调度系统随机选取未知第t时刻的AGV数据,并利用训练好的BP神经网络对该数据进行计算,以获取第t时刻的AGV的移动状态,通过判断当第t时刻的AGV是否均达到目标位置,对于尚未达到目标位置,经过多次迭代,得到各AGV的完整路径,再反馈给各AGV,从而控制AGV向目标位置移动,而非一次计算就得出各AGV的完整路线。从而对任意时刻的任一AGV具有普适性,符合实际应用场景。
将本发明的一种基于改进BP神经网络的仓储多AGV路径规划方法应用到具体仓储多AGV环境中,其BP神经网络模型结构如图2所示,其具体工作过程如图3所示:
中央调度系统已经通过立体摄像头扫描获取仓储环境点云数据并映射为栅格地图,各AGV将自己在栅格地图中的实时位置和目标位置信息发送给中央调度系统,而后进入迭代运算过程,初始化迭代次数t=1,迭代的终止条件是得到各AGV的完整路径。在一次迭代中,调度系统随机将未知第t步移动状态的AGV置于BP神经网络输入层的首位,并利用训练好的BP神经网络对数据信息进行计算,直至各AGV第t步的移动状态已知。迭代完成之后,系统得到各AGV的完整路线,再反馈给各AGV,控制AGV向目标位置移动。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,包括以下步骤:
(1)获取仓储环境点云数据,并将所述仓储环境点云数据映射为栅格地图;
(2)确定当前时刻待路径规划的所有AGV在步骤(1)中获取的栅格地图中的实时位置及其对应的目标位置;
(3)从待路径规划的所有AGV中随机选取一台AGV作为首个输入,将步骤(2)中获取的待路径规划所有AGV的实时位置和对应目标位置输入训练好的BP神经网络模型中,以获取选取的AGV的移动状态;本步骤的BP神经网络模型通过以下步骤训练:
(3-1)获取AGV的历史工作数据,并将所述历史工作数据作为样品数据集;其中,所述AGV历史工作数据包括各AGV在所述栅格地图中的实时位置、其对应的目标位置、及首个输入AGV的移动状态;
(3-2)将步骤(3-1)中获取的样品数据集按照60%:20%:20%比例分为训练子集、交叉验证子集和测试子集;
(3-3)以步骤(3-2)中获取的训练子集中各AGV的实时位置及其对应的目标位置为输入,以步骤(3-2)获取的训练子集中首个输入AGV的移动状态为输出,以代价函数最小化为优化目标训练BP神经网络模型;
(3-4)采用步骤(3-2)中获取的交叉验证子集对步骤(3-3)训练后的BP神经网络模型进行交叉验证,当所述BP神经网络模型输出结果准确率高于一预设阈值时,则交叉验证通过,并进入步骤(3-5);否则返回步骤(3-3);
(3-5)采用步骤(3-2)中获取的测试子集对步骤(3-4)交叉验证后的BP神经网络模型进行再次验证,当所述BP神经网络模型输出结果准确率高于一预设阈值时,则训练过程结束,否则返回步骤(3-1);
(4)对当前时刻待路径规划的所有AGV中剩余的AGV,重复步骤(3),直至获取到所有AGV的移动状态为止;
(5)判断当前时刻所有待路径规划的AGV是否均到达步骤(2)中确定的目标位置,如果是,则输出当前时刻所有待路径规划的AGV的完整路径,过程结束;否则进入步骤(6);
(6)将下一时刻设置为当前时刻,并返回步骤(2)。
2.如权利要求1所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,步骤(3)中所述BP神经网络模型包括输入层、输出层及隐藏层;其中,所述输入层、输出层及隐藏层输出特征数量分别为8x6、6x5及5x1。
3.如权利要求1所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,步骤(3-3)中所述优化目标是采用以下公式计算:
Figure FDA0002455028500000031
式中,J(Θ)为代价函数;m为所述训练子集包含的样本总数,其取值范围为103~105
c为所述BP神经网络模型中输出层的神经单元个数,其取值范围为5~10;
λ为正则化参数,其取值范围为0~10;
L为所述BP神经网络模型的层数,其取值范围为L≥3
Sl为所述BP神经网络模型中第l层的神经元个数,其取值范围为5~8;
Θtj (l)为所述BP神经网络模型中第l层的第j个神经元到第l+1层的第t个神经元的权重,其通过梯度下降算法计算获取;
costik表示所述训练子集中第i个样本在所述BP神经网络模型中输出层的第k个神经元上的代价;
α为修正系数,其值是根据所述BP神经网络模型获取的首个输入AGV的移动状态与该AGV在所述训练子集中对应的样本标签的关系确定,其中所述样本标签为所述训练子集中样本AGV的实际移动状态。
4.如权利要求3所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,所述α具体取值如下:
Figure FDA0002455028500000032
Figure FDA0002455028500000041
5.如权利要求3所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,所述costik采样以下公式计算:
costik=α·[yk (i)·lg(hΘ(xi)k)+(1-yk (i))·lg(1-hΘ(xi)k)]
式中,yk (i)为所述训练子集中第i个样本的第k个元素值,其取值为0或1;hΘ(xi)k为所述训练子集中第i个样本在所述BP神经网络模型输出层第k个神经元的输出,其是通过前向传播算法计算获取。
6.如权利要求5所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,所述hΘ(xi)k采样以下公式计算:
Figure FDA0002455028500000042
Figure FDA0002455028500000043
Figure FDA0002455028500000044
其中,
Figure FDA0002455028500000048
表示所述BP神经网络模型第l层的第
Figure FDA0002455028500000045
个神经元的激励;特别地,a0 (l)=1,为偏置单元,
Figure FDA0002455028500000046
为所述训练子集中的指定样本在所述BP神经网络模型输入层的第
Figure FDA0002455028500000047
个神经元对应的输出。
7.如权利要求3所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,所述Θtj (l)采用以下公式计算:
Figure FDA0002455028500000051
其中η为学习率,其取值范围为0~1;
Θtj (l)的初始值为-0.3~0.3。
8.如权利要求1所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,步骤(3-4)及(3-5)中所述的预设阈值为95%。
9.如权利要求2所述的基于改进BP神经网络的仓储多AGV路径规划方法,其特征在于,所述隐藏层为单隐层或双隐层。
CN201910794044.9A 2019-08-27 2019-08-27 一种基于改进bp神经网络的仓储多agv路径规划方法 Active CN110543171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910794044.9A CN110543171B (zh) 2019-08-27 2019-08-27 一种基于改进bp神经网络的仓储多agv路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910794044.9A CN110543171B (zh) 2019-08-27 2019-08-27 一种基于改进bp神经网络的仓储多agv路径规划方法

Publications (2)

Publication Number Publication Date
CN110543171A CN110543171A (zh) 2019-12-06
CN110543171B true CN110543171B (zh) 2020-07-31

Family

ID=68712171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910794044.9A Active CN110543171B (zh) 2019-08-27 2019-08-27 一种基于改进bp神经网络的仓储多agv路径规划方法

Country Status (1)

Country Link
CN (1) CN110543171B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112987713A (zh) * 2019-12-17 2021-06-18 杭州海康威视数字技术股份有限公司 自动驾驶设备的控制方法、装置及存储介质
CN111880405B (zh) * 2020-07-03 2022-06-14 广东工业大学 柔性制造车间系统中的agv自适应路径规划实时控制方法
CN112016811A (zh) * 2020-08-04 2020-12-01 四叶草(苏州)智能科技有限公司 一种基于强化学习的agv智能调度系统及方法
CN112835333B (zh) * 2020-12-31 2022-03-15 北京工商大学 一种基于深度强化学习多agv避障与路径规划方法及系统
CN112859885A (zh) * 2021-04-25 2021-05-28 四川远方云天食品科技有限公司 一种送料机器人路径协同优化方法
CN113627646B (zh) * 2021-07-08 2024-07-02 中汽创智科技有限公司 一种基于神经网络的路径规划方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106654987A (zh) * 2016-11-18 2017-05-10 华北电力大学(保定) 电力线路多机器人协作巡检方法
CN108549210A (zh) * 2018-04-19 2018-09-18 东华大学 基于bp神经网络pid控制的多无人机协同飞行方法
CN109506650A (zh) * 2018-09-12 2019-03-22 广东嘉腾机器人自动化有限公司 基于bp网络的agv导航行程偏差修正方法
CN109917817A (zh) * 2019-05-06 2019-06-21 中国海洋大学 多水下机器人协同路径规划方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9346167B2 (en) * 2014-04-29 2016-05-24 Brain Corporation Trainable convolutional network apparatus and methods for operating a robotic vehicle
CN108803313B (zh) * 2018-06-08 2022-07-12 哈尔滨工程大学 一种基于海流预测模型的路径规划方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106654987A (zh) * 2016-11-18 2017-05-10 华北电力大学(保定) 电力线路多机器人协作巡检方法
CN108549210A (zh) * 2018-04-19 2018-09-18 东华大学 基于bp神经网络pid控制的多无人机协同飞行方法
CN109506650A (zh) * 2018-09-12 2019-03-22 广东嘉腾机器人自动化有限公司 基于bp网络的agv导航行程偏差修正方法
CN109917817A (zh) * 2019-05-06 2019-06-21 中国海洋大学 多水下机器人协同路径规划方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BP神经网络在路径规划中的应用;李慧 等;《应用科技》;20040930;全文 *
Research on Robot Path Planning Based on Fuzzy Neural Network Algorithm;Hao Wang 等;《2018 IEEE 3rd Advanced Information Technology, Electronic and Automation Control Conference (IAEAC)》;20181117;全文 *
基于BP网络的自主水下机器人(AUV)路径规划研究;刘存根;《中国优秀硕士学位论文全文数据库信息科技辑》;20090215;第3-8、10-13、15-16、29-36页 *
基于神经网络的AGV智能车路径规划的仿真研究;项宏峰 等;《北京印刷学院学报》;20171130;全文 *

Also Published As

Publication number Publication date
CN110543171A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN110543171B (zh) 一种基于改进bp神经网络的仓储多agv路径规划方法
CN113110509B (zh) 一种基于深度强化学习的仓储系统多机器人路径规划方法
CN112650237B (zh) 基于聚类处理和人工势场的船舶路径规划方法和装置
CN106979784B (zh) 基于混合鸽群算法的非线性航迹规划
CN113703472B (zh) 多无人机与车辆协同巡检的路径优化方法和装置
Azevedo et al. Solving the 3D stowage planning problem integrated with the quay crane scheduling problem by representation by rules and genetic algorithm
CN110334838B (zh) 基于蚁群算法和遗传算法的agv小车协同调度方法及系统
CN113359702B (zh) 一种基于水波优化-禁忌搜索的智能仓库agv作业优化调度方法
CN105858044A (zh) 一种穿梭车与升降机结合的仓储系统优化调度方法
CN117093009B (zh) 一种基于机器视觉的物流agv小车导航控制方法及系统
CN110375759A (zh) 基于蚁群算法的多机器人路径规划方法
CN114019983A (zh) 面向多任务点的无人艇协同路径规划方法
Dharmasiri et al. Novel implementation of multiple automated ground vehicles traffic real time control algorithm for warehouse operations: djikstra approach
Cai et al. Risk-aware path planning under uncertainty in dynamic environments
Li et al. Simulation analysis of a deep reinforcement learning approach for task selection by autonomous material handling vehicles
Herdianti et al. Distribution cost optimization using pigeon inspired optimization method with reverse learning mechanism
CN116644936A (zh) 一种多agv的路径规划和调度方法
Lin et al. An improved fault-tolerant cultural-PSO with probability for multi-AGV path planning
Kulvicius et al. One-shot multi-path planning using fully convolutional networks in a comparison to other algorithms
CN116859919A (zh) 基于深度强化学习和循环神经网络的多agv路径规划方法
CN112987713A (zh) 自动驾驶设备的控制方法、装置及存储介质
CN116817909A (zh) 一种基于深度强化学习的无人机中继式导航方法
Wang et al. Research on optimization of multi-AGV path based on genetic algorithm considering charge utilization
Han et al. Hybrid Algorithm-Based Full Coverage Search Approach With Multiple AUVs to Unknown Environments in Internet of Underwater Things
Huu et al. Machine learning model for a dynamic path planning problem

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant