CN113253684B - 基于图卷积神经网络的多agv调度方法及装置、电子设备 - Google Patents
基于图卷积神经网络的多agv调度方法及装置、电子设备 Download PDFInfo
- Publication number
- CN113253684B CN113253684B CN202110599262.4A CN202110599262A CN113253684B CN 113253684 B CN113253684 B CN 113253684B CN 202110599262 A CN202110599262 A CN 202110599262A CN 113253684 B CN113253684 B CN 113253684B
- Authority
- CN
- China
- Prior art keywords
- agvs
- neural network
- agv
- convolution neural
- graph convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004088 simulation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/4189—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the transport system
- G05B19/41895—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the transport system using automatic guided vehicles [AGV]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/32—Operator till task planning
- G05B2219/32252—Scheduling production, machining, job shop
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/60—Electric or hybrid propulsion means for production processes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于图卷积神经网络的多AGV调度方法及装置、电子设备,包括:根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;获取AGV执行移动任务的运行日志数据集;针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
Description
技术领域
本申请涉及AGV调度技术领域,尤其涉及一种基于图卷积神经网络的多AGV调度方法及装置、电子设备。
背景技术
在多AGV运行的场景中(如大规模仓库物流自动化场景),AGV调度系统的主要目标是通过对所有AGV均衡调度和利用,最小化所有搬运任务的执行时间,提升运行效率,同时需避免发生相向冲突、同向冲突、转向冲突及多车死锁等问题,因为上述问题会产生拥堵,会造成设备资源的浪费,甚至AGV小车停止作业,使整个调度系统停滞。
然而,多AGV调度系统在实际运行过程中面临许多动态的随机因素的影响,比如AGV车辆故障,搬运任务的临时添加或取消,车辆在路径上运行时间的不确定性等等,因此,静态生成的最优的调度计划是无法满足实际系统运行的需要的,需要实时的动态调度算法对系统中的不确定性因素进行实时响应与调整,但是动态调度的计算复杂度较大,本领域的工程师往往采用启发式或者基于规则的动态调度策略(比如分区域策略,基于时间窗策略,基于AGV或任务优先级策略等等),上述动态调度策略虽然在一定程度上能够解决/缓解车辆死锁等问题,并维持多AGV运行的连续性,但是启发式或规则式的算法是非全局最优的,属于局部优化策略,往往是以牺牲多AGV之间的协调性与全局运行效率最优为代价的,且无法避免潜在多AGV互相死锁问题。
发明内容
本申请实施例的目的是提供一种基于图卷积神经网络的多AGV调度方法及装置、电子设备,以解决相关技术中存在的多AGV调度运行效率不高且容易存在死锁的问题。
根据本申请实施例的第一方面,提供一种基于图卷积神经网络的多AGV调度方法,包括:
根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
获取AGV执行移动任务的运行日志数据集,所述运行日志数据集由多组样本构成,每个样本由所有AGV在某一时刻的运行状态组成,所述运行状态包括所有AGV所处的当前位置、所有AGV的目标位置、所有AGV的正在执行的移动任务以及完成正在执行的移动任务的实际完成时间;
针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
进一步地,在AGV从起始位置向目标位置移动后,还包括:
随机给到达所述目标位置的AGV分配新的移动任务;
继续获取AGV执行新的移动任务的运行日志数据集。
进一步地,所述AGV以最大行驶速度从所述起始位置运行到所述目标位置。
进一步地,所述目标位置为当AGV运行到某一位置后,在路径拓扑地图中随机指定一个作为目标位置。
进一步地,在获取AGV执行移动任务的运行日志数据集的过程中,还包括:
随机停用一辆或多辆AGV,以模拟现场车辆出现故障停用的情况,且停用时间长度随机确定。
进一步地,针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本,包括:
对于某一时刻,计算各个AGV从当前位置移动到目标位置实际完成时间,计算所有AGV完成各自当前移动任务所花时间总和,其中,为完成正
在执行的移动任务的实际完成时间,为AGV正在执行的移动任务,,n为AGV
数量;
进一步地,所述图卷积神经网络主要由多个图卷积层、多层感知机以及SOFTMAX层构成。
根据本申请实施例的第二方面,提供一种基于图卷积神经网络的多AGV调度装置,包括:
分配模块,用于根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
获取模块,用于获取AGV执行移动任务的运行日志数据集,所述运行日志数据集由多组样本构成,每个样本由所有AGV在某一时刻的运行状态组成,所述运行状态包括所有AGV所处的当前位置、所有AGV的目标位置、所有AGV的正在执行的移动任务以及完成正在执行的移动任务的实际完成时间;
重复剔除模块,用于针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
训练模块,用于将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
选取模块,用于将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
根据本申请实施例的第三方面,提供一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如第一方面所述方法的步骤。
本申请的实施例提供的技术方案可以包括以下有益效果:
由上述实施例可知,本申请实施例采用图卷积神经网络通过运行日志数据集不仅可以学会两点间最短路径等浅层次的拓扑特征,亦可学会蕴含于网络拓扑与车辆状态信息下深层次的系统特征(如潜在的路径冲突,多车等待,多车死锁等),因此相较于传统的基于启发式或者基于规则的动态调度策略,本发明实施例的方法具备从整个全局网络、长时间窗口进行优化计算的优点,能够得到更佳的调度效果。
本发明实施例的调度方法采用端对端的神经网络计算,只要将当前运行状态输入神经网络经过一次正向计算即可生成调度决策,与传统的基于遗传算法或其他人工智能算法相比,其所需的计算时间时间与复杂度均较小,满足实时动态调度需求。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种基于图卷积神经网络的多AGV调度方法的流程图。
图2是根据一示例性实施例示出的某多AGV调度网络结构图。
图3是根据一示例性实施例示出的一种基于图卷积神经网络的多AGV调度装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
图1是根据一示例性实施例示出的一种基于图卷积神经网络的多AGV调度方法的流程图。参考图1,本发明实施例提供一种基于图卷积神经网络的多AGV调度方法,该方法可应用于服务器端,该方法可以包括以下步骤:
步骤S11,根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
步骤S12,获取AGV执行移动任务的运行日志数据集,所述运行日志数据集由多组样本构成,每个样本由所有AGV在某一时刻的运行状态组成,所述运行状态包括所有AGV所处的当前位置、所有AGV的目标位置、所有AGV的正在执行的移动任务以及完成正在执行的移动任务的实际完成时间;
步骤S13,针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
步骤S14,将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
步骤S15,将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
由上述实施例可知,本申请实施例采用图卷积神经网络通过运行日志数据集不仅可以学会两点间最短路径等浅层次的拓扑特征,亦可学会蕴含于网络拓扑与车辆状态信息下深层次的系统特征(如潜在的路径冲突,多车等待,多车死锁等),因此相较于传统的基于启发式或者基于规则的动态调度策略,本发明实施例的方法具备从整个全局网络、长时间窗口进行优化计算的优点,能够得到更佳的调度效果。
本发明实施例的调度方法采用端对端的神经网络计算,只要将当前运行状态输入神经网络经过一次正向计算即可生成调度决策,与传统的基于遗传算法或其他人工智能算法相比,其所需的计算时间时间与复杂度均较小,满足实时动态调度需求。
在步骤S11的具体实施中,根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
具体地,为了以较低代价且较快的速度获得训练数据集,本发明实施例采用仿真模拟的形式来获取数据,详细步骤可包括:
1、设置参与本次模拟的AGV数量,该数量应与实际场景部署的AGV数量相同。
2、根据路径拓扑地图,为每辆AGV分配不同的移动任务,如果一个位置已经被某虚拟AGV占用,则其他虚拟AGV无法往该位置移动。同时,只有一辆AGV移动到路径中的下一个节点时,其原来所占用的当前节点才会被释放。
3、为了达到最小化移动任务执行时间的目标,所述AGV以最大行驶速度从所述起始位置运行到所述目标位置。
4、自动初始化对应数量的虚拟AGV,并为每辆虚拟AGV分配不同的起始位置与目标位置,并将初始时间设为零时刻。其中,每个起始节点仅允许创建一辆AGV。
5、当AGV运行到某一位置后,在路径拓扑地图中随机指定一个作为目标点。
6、当AGV抵达任务的目标位置后,可在目标位置等待一段时间,该时间长度随机生成,而后将会收到新移动任务,新移动任务的目标位置也是随机生成的。
7、仿真运行过程中随机停用一台或几台虚拟AGV,以模拟现场车辆出现故障停用的情况。
8、当完成的任务数量达到预先给定的阈值后,仿真运行结束。
更佳的,针对上述第5点,亦可采用某种启发式或规则式的算法快速生成下一个目标点,这样可以有效的提升仿真模块产生较佳调度决策的概率,有利于训练更佳的图卷积神经网络。
本发明实施例中,在AGV从起始位置向目标位置移动后,还可包括:随机给到达所述目标位置的AGV分配新的移动任务;继续获取AGV执行新的移动任务的运行日志数据集。
具体的,本实施例通过下达足够数量的移动任务使AGV执行,有效的确保的图卷积神经网络训练数据样本量与样本的覆盖面,可以有效避免卷积神经网络训练过拟合等问题,特别的,对于异常故障的运行日志的加入,可以使图卷积神经网络学习这些异常场景的数据,提升卷积神经网络应对各种情况的鲁棒性和效率。
在步骤S13的具体实施中,针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
具体地,对于某一时刻,计算各个AGV从当前位置移动到目标位置实际完
成时间,计算所有AGV完成各自当前移动任务所花时间总和,其中,为
完成正在执行的移动任务的实际完成时间,为AGV正在执行的移动任务,,n
为AGV数量;
在步骤S14的具体实施中,将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
具体地,本发明实施例中,所述图卷积神经网络采用GCN(图卷积神经网络)和NN(神经网络)的常用架构,即主要由多个GCNConv(图卷积层)、MLP(多层感知机)以及SOFTMAX层构成,其中GCNConv(图卷积层)、MLP(多层感知机)激活层的具体层数、每层中的卷积核大小等网络参数需根据场景特点具体设计确定。其中,GCNConv(图卷积层)的作用主要为提取输入图的特征,并将不同的层相互整合,将地图拓扑信息,AGV当前位置,AGV目标位置等信息融合;其中,MLP(多重感知机)的主要作用是进一步提取特征,并整理特征至合适的输出维度。在这些层之后,添加一个SOFTMAX层进行归一化,输出结果。
所述的图卷积神经网络与普通的卷积神经网络相比,更擅于非欧式空间数据的图数据类型特征的分析与提取(如包括节点,边等拓扑结构的网络)。
下面以某具体多AGV调度问题说明对本实施例进行说明,如示意图2所示,图中的拓扑结构为一个简单的调度网络结构图,有两辆AGV,即AGV1,AGV2,有ABCDEF六个节点,节点间有连线说明存在路径,路径上的数字表明通过该路径所需的时间,旗帜标志表示AGV的目标点,在当前状态AGV1有三个可能路径选择,通过仿真运行,其产生的三个样本如下:
样本1:
AGV1到A,AGV1到B,AGV2到A,AGV2到E,共耗时间2+2+2+3 = 9
样本2:
AGV1到F and AGV2同时到A,AGV2同时到E, AGV1到A,AGV1到B, 共耗时间2+3+3+2= 10
样本3:
AGV1到E and AGV2同时到A,AGV1到B,AGV2同时到E,共耗时间2+2+3 = 7
由此,仅保留样本3训练图卷积神经网络,从上例中可见,样本1中由于AGV1和AGV2争夺节点A,导致耗时较多,而样本2中,由于AGV1一开始选择节点F已经严重偏离了其到目标点B的最短路径,所以耗时也较多。因此,采用本发明的样本选择对图卷积神经网络进行训练,可以有效的使图卷积神经网络学会拓扑结构特征与车辆资源竞争,死锁等特征,使其输出较佳的调度策略。
与前述的一种基于图卷积神经网络的多AGV调度方法的实施例相对应,本申请还提供了一种基于图卷积神经网络的多AGV调度装置的实施例。
图3是根据一示例性实施例示出的一种基于图卷积神经网络的多AGV调度装置框图。参照图3,该装置包括:
分配模块31,用于根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
获取模块32,用于获取AGV执行移动任务的运行日志数据集,所述运行日志数据集由多组样本构成,每个样本由所有AGV在某一时刻的运行状态组成,所述运行状态包括所有AGV所处的当前位置、所有AGV的目标位置、所有AGV的正在执行的移动任务以及完成正在执行的移动任务的实际完成时间;
重复剔除模块33,用于针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
训练模块34,用于将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
选取模块35,用于将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本申请还提供一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的一种基于图卷积神经网络的多AGV调度方法。
相应的,本申请还提供一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如上述的一种基于图卷积神经网络的多AGV调度方法。
本领域技术人员在考虑说明书及实践这里公开的内容后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种基于图卷积神经网络的多AGV调度方法,其特征在于,包括:
根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
获取AGV执行移动任务的运行日志数据集,所述运行日志数据集由多组样本构成,每个样本由所有AGV在某一时刻的运行状态组成,所述运行状态包括所有AGV所处的当前位置、所有AGV的目标位置、所有AGV的正在执行的移动任务以及完成正在执行的移动任务的实际完成时间;
针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
2.根据权利要求1所述的方法,其特征在于,在AGV从起始位置向目标位置移动后,还包括:
随机给到达所述目标位置的AGV分配新的移动任务;
继续获取AGV执行新的移动任务的运行日志数据集。
3.根据权利要求1所述的方法,其特征在于,所述AGV以最大行驶速度从所述起始位置运行到所述目标位置。
4.根据权利要求1所述的方法,其特征在于,所述目标位置为当AGV运行到某一位置后,在路径拓扑地图中随机指定一个节点作为目标位置。
5.根据权利要求1所述的方法,其特征在于,在获取AGV执行移动任务的运行日志数据集的过程中,还包括:
随机停用一辆或多辆AGV,以模拟现场车辆出现故障停用的情况,且停用时间长度随机确定。
7.根据权利要求1所述的方法,其特征在于,所述图卷积神经网络主要由多个图卷积层、多层感知机以及SOFTMAX层构成。
8.一种基于图卷积神经网络的多AGV调度装置,其特征在于,包括:
分配模块,用于根据路径拓扑地图,为每辆AGV分配不同的移动任务,所述移动任务用于触发AGV从起始位置向目标位置移动;
获取模块,用于获取AGV执行移动任务的运行日志数据集,所述运行日志数据集由多组样本构成,每个样本由所有AGV在某一时刻的运行状态组成,所述运行状态包括所有AGV所处的当前位置、所有AGV的目标位置、所有AGV的正在执行的移动任务以及完成正在执行的移动任务的实际完成时间;
重复剔除模块,用于针对所有AGV的当前位置和目标位置均相同的那些样本,保留其中所有AGV移动到各自目标位置所花费时间之和最少的样本;
训练模块,用于将剩余样本的所有AGV的所处的当前位置和所有AGV的目标位置作为图卷积神经网络的训练输入,将该样本的下一个时刻所有AGV的所处的当前位置作为图卷积神经网络的训练输出,对图卷积神经网络进行反向传播训练;
选取模块,用于将运行状态输入到训练好的图卷积神经网络中,选取图卷积神经网络的输出作为最优调度决策方案。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110599262.4A CN113253684B (zh) | 2021-05-31 | 2021-05-31 | 基于图卷积神经网络的多agv调度方法及装置、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110599262.4A CN113253684B (zh) | 2021-05-31 | 2021-05-31 | 基于图卷积神经网络的多agv调度方法及装置、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113253684A CN113253684A (zh) | 2021-08-13 |
CN113253684B true CN113253684B (zh) | 2021-09-21 |
Family
ID=77183851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110599262.4A Active CN113253684B (zh) | 2021-05-31 | 2021-05-31 | 基于图卷积神经网络的多agv调度方法及装置、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113253684B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110471287A (zh) * | 2019-08-27 | 2019-11-19 | 合肥工业大学 | 一种多有轨穿梭小车的实时调度方法及系统 |
CN110516913A (zh) * | 2019-07-31 | 2019-11-29 | 智久(厦门)机器人科技有限公司 | 一种多台自动导引装置的任务分配方法、装置及存储器 |
CN110660082A (zh) * | 2019-09-25 | 2020-01-07 | 西南交通大学 | 一种基于图卷积与轨迹卷积网络学习的目标跟踪方法 |
CN111738372A (zh) * | 2020-08-26 | 2020-10-02 | 中国科学院自动化研究所 | 分布式多智能体时空特征提取方法、行为决策方法 |
CN111862579A (zh) * | 2020-06-10 | 2020-10-30 | 深圳大学 | 一种基于深度强化学习的出租车调度方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9989964B2 (en) * | 2016-11-03 | 2018-06-05 | Mitsubishi Electric Research Laboratories, Inc. | System and method for controlling vehicle using neural network |
US20190184561A1 (en) * | 2017-12-15 | 2019-06-20 | The Regents Of The University Of California | Machine Learning based Fixed-Time Optimal Path Generation |
-
2021
- 2021-05-31 CN CN202110599262.4A patent/CN113253684B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516913A (zh) * | 2019-07-31 | 2019-11-29 | 智久(厦门)机器人科技有限公司 | 一种多台自动导引装置的任务分配方法、装置及存储器 |
CN110471287A (zh) * | 2019-08-27 | 2019-11-19 | 合肥工业大学 | 一种多有轨穿梭小车的实时调度方法及系统 |
CN110660082A (zh) * | 2019-09-25 | 2020-01-07 | 西南交通大学 | 一种基于图卷积与轨迹卷积网络学习的目标跟踪方法 |
CN111862579A (zh) * | 2020-06-10 | 2020-10-30 | 深圳大学 | 一种基于深度强化学习的出租车调度方法及系统 |
CN111738372A (zh) * | 2020-08-26 | 2020-10-02 | 中国科学院自动化研究所 | 分布式多智能体时空特征提取方法、行为决策方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113253684A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nguyen et al. | Help, anna! visual navigation with natural multimodal assistance via retrospective curiosity-encouraging imitation learning | |
CN110412869B (zh) | 一种多星协同的空间动态目标实时跟踪方法 | |
WO2019141220A1 (zh) | 移动机器人的路径规划方法及系统 | |
CN111401557B (zh) | 智能体决策制定方法、ai模型训练方法、服务器及介质 | |
CN114415735B (zh) | 面向动态环境的多无人机分布式智能任务分配方法 | |
CN114139637B (zh) | 多智能体信息融合方法、装置、电子设备及可读存储介质 | |
CN109819032B (zh) | 一种联合考虑基站选择与计算迁移的云机器人任务分配方法 | |
CN111898770B (zh) | 一种多智能体强化学习方法、电子设备及存储介质 | |
KR102171269B1 (ko) | 이미지의 채색 완성 방법, 장치 및 컴퓨터 프로그램과 인공 신경망 학습 방법, 장치 및 컴퓨터 프로그램 | |
CN113253684B (zh) | 基于图卷积神经网络的多agv调度方法及装置、电子设备 | |
CN113408949A (zh) | 一种机器人时序任务规划方法及装置、电子设备 | |
JP2022091660A (ja) | ニューラルネットワークを用いるデータ処理方法、データ処理装置及びこれを含む電子装置 | |
CN115423093A (zh) | 任务迁移方法、电子设备及计算机存储介质 | |
Li et al. | Dynamic motion planning model for multirobot using graph neural network and historical information | |
CN109670224B (zh) | 一种多机器人服务圆形区域搜索算法 | |
Hong et al. | Deterministic policy gradient based formation control for multi-agent systems | |
CN114237259A (zh) | 一种基于浮动资源的多智能体路径规划方法、导航服务器及可读存储介质 | |
CN113435571A (zh) | 实现多任务并行的深度网络训练方法和系统 | |
CN115371685B (zh) | 工控场景下无人设备优势路径规划方法、装置及存储介质 | |
Uzkent et al. | Dynamic inference with grounding based vision and language models | |
Cabral et al. | Auction-based solution for the ordering problem in robotic self-assembly | |
US20240104375A1 (en) | Method and system for lightweighting artificial neural network model, and non-transitory computer-readable recording medium | |
Yulan et al. | Study on multi-robot cooperation stalking using finite state machine | |
CN114489043B (zh) | 多智能体路径规划方法、装置、电子设备及存储介质 | |
CN116776751B (zh) | 一种智能决策算法模型设计开发辅助系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |