CN108845496A - 一种自动化码头agv调度方法及系统 - Google Patents
一种自动化码头agv调度方法及系统 Download PDFInfo
- Publication number
- CN108845496A CN108845496A CN201810499201.9A CN201810499201A CN108845496A CN 108845496 A CN108845496 A CN 108845496A CN 201810499201 A CN201810499201 A CN 201810499201A CN 108845496 A CN108845496 A CN 108845496A
- Authority
- CN
- China
- Prior art keywords
- task
- task box
- training set
- box
- agv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 252
- 238000004088 simulation Methods 0.000 claims abstract description 83
- 238000012216 screening Methods 0.000 claims description 37
- 238000011156 evaluation Methods 0.000 claims description 24
- 238000013210 evaluation model Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种自动化码头AGV调度方法及系统,所述调度方法包括以下步骤:步骤1:输入模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;步骤2:输入未作业任务箱列表V,初始化调度策略π;针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业;步骤3:判断未作业任务箱是否全部完成分配;步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真;步骤5:利用新训练集S’对DBN网络模型进行训练更新,更新后的DBN网络模型作为下一轮AGV任务分配使用的DBN网络模型。本申请将深度学习网络模型引入到AGV实时调度分配中,实现了AGV任务分配的实时最优。
Description
技术领域
本发明属于自动化码头作业调度决策技术领域,具体涉及一种自动化码头AGV调度方法及系统。
背景技术
在自动化码头中,自动导引车(automated guided vehicle,AGV)用于完成岸桥与自动堆垛起重机之间的集装箱水平运输,但是其作业效率受自身条件、作业环境、码头布局等因素影响,因此,准确把握AGV调度是码头提高作业效率的关键。高效的集装箱装卸作业水平能提高码头作业效率、缩短船舶在港时间,而AGV与岸桥、场桥作业的协同性是影响船舶装卸效率的重要因素之一,在理想状态下,岸桥与场桥无需等待AGV即可无延迟装卸集装箱。由于AGV数量的增加会导致拥堵,因此AGV与岸桥、场桥之间高水平的协同性无法通过单纯增加AGV数量实现,反而最终影响岸桥与场桥的作业效率。因此,需要设计一种高效率的AGV调度方法,已经成为提高自动化码头作业效率的关键。
发明内容
为了解决上述技术问题,本发明提供了一种自动化码头AGV调度方法及系统。
本发明通过以下技术方案实现:
一种自动化码头AGV调度方法,包括以下步骤:
步骤1:为所有AGV随机分配初始作业任务并进行作业;设定模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
步骤2:建立未作业任务箱列表V,初始化调度策略π;
针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业,所述当前时刻为空闲AGV到达交换区的时刻;
步骤3:判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入步骤4至步骤5进行调度策略的更新;
步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
步骤5:通过模拟仿真筛选出仿真最优任务箱i*后,对DBN网络模型进行训练更新;针对产生的空闲AGV,返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,步骤2中筛选策略最优任务箱π(VT)采用偏好函数进行,具体包括如下过程:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,:步骤4中,根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*:
Z(i)=WHHn+r+WEEn+r,i∈VT (4)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离。
进一步地,在上述技术方案中,步骤5中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集和合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
进一步地,在上述技术方案中,步骤2中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (9)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (14)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
本发明还包括一种自动化码头AGV调度系统,包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块;
算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表;
策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息,将使用当前调度策略π筛选出的策略最优任务箱π(VT)分配给当前时刻空闲AGV进行作业;
任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息,判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新;
模拟仿真模块用于根据算法参数设置模块输入的设定值,对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
调度策略实时更新模块用于对DBN网络模型进行训练更新;当产生空闲AGV时,返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,模拟仿真模块中,根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*:
Z(i)=WHHn+r+WEEn+r,i∈VT (20)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
在调度策略实时更新模块中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集和合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
进一步地,在上述技术方案中,策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (25)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括调度策略评估模块,包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (30)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
本发明的有益效果为:
(1)本发明所述的调度方法及系统综合考虑岸桥的作业效率和AGV的空载行驶距离,构建集装箱评价标准体系;同时利用两两比较的偏好函数对所有未作业集装箱进行评估,选出最优集装箱完成AGV分配,可在短时间内实时筛选最优任务箱;
(2)本发明所述的调度方法及系统将新兴技术深度学习引入到AGV实时调度分配中,针对环境的动态变化,利用DBN网络模型实时更新AGV的当前调度策略,实现了AGV任务分配的实时最优;
(3)本发明所述的调度方法及系统将训练集进行实时更新,完成了旧样本与新样本在总训练集当中的动态平衡,并给予每一个训练集样本不同的权重,使得可靠度强的样本对调度结果拥有更大的影响;
(4)本发明所述的调度方法及系统可根据码头实际需求改变岸桥作业效率与AGV空载行驶距离的相对权重,对重视程度高的部分给予更高权重,从而产生相应的调度方案。
附图说明
下面结合附图和具体实施方法对本发明作进一步详细的说明。
图1为所述调度方法的流程图;
图2为所述调度方法的算法流程图;
图3为自动化码头的布局及装卸图;
图4为AGV运行区的运行路线图;
图5为所述调度系统模块图。
具体实施方法
下面结合附图和实施例对本发明的技术方案进行清楚、完整的描述。
实施例1
如图1-4所示,一种自动化码头AGV调度方法,包括以下步骤:
步骤1:为所有AGV随机分配初始作业任务并进行作业;设定模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
步骤2:建立未作业任务箱列表V,初始化调度策略π;
针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业,所述当前时刻为空闲AGV到达交换区的时刻;
步骤3:判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入步骤4至步骤5进行调度策略的更新;
步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
步骤5:通过模拟仿真筛选出仿真最优任务箱i*后,对DBN网络模型进行训练更新;针对产生的空闲AGV,返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,步骤2中筛选策略最优任务箱π(VT)采用偏好函数进行,具体包括如下过程:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,:步骤4中,根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*:
Z(i)=WHHn+r+WEEn+r,i∈VT (4)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离。
进一步地,在上述技术方案中,步骤5中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
由于模拟仿真所依据的当前策略不一定是真正的最优策略,因此产生的训练集存在一定误差,为减轻此误差对调度结果的影响,本申请引入权重至训练集样本(i*,i),对可靠度强的样本给予更高权重,经过公式(8)计算得到权重后,任务箱i*与i之间的模拟仿真评价值相差越大,则权重越大,则说明该样本对DBN网络训练的影响也越大;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集和合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
其中,本申请所述训练集的表现形式为任务箱两两比较,包括两个任务箱的偏好值Fe(m,n)和两个任务箱的总偏好值R(m,n);
随着训练集的累积,新训练集S’对训练效果的影响会不断减小,针对此问题,本申请实时更新训练集,假设新产生的训练集大小始终为d,新样本在本轮训练集更新后留下的概率为I/(d+I),在s轮训练集更新后的概率为(I/(d+I))s,随着训练集不断更新,旧样本留存的概率越来越小,减轻了旧样本对调度策略更新的影响,同时提高了算法的运算速度。
进一步地,在上述技术方案中,步骤2中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (9)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
其中,所述出口箱表示需要由堆场作业区运输至岸桥作业区的任务箱,所述进口箱表示需要由岸桥作业区运输至堆场作业区的任务箱;
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (14)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
如图5所示,本发明还包括一种自动化码头AGV调度系统,包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块;
算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表;
策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息,将使用当前调度策略π筛选出的策略最优任务箱π(VT)分配给当前时刻空闲AGV进行作业;
任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息,判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新;
模拟仿真模块用于根据算法参数设置模块输入的设定值,对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
调度策略实时更新模块用于对DBN网络模型进行训练更新;当产生空闲AGV时,返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。
进一步地,在上述技术方案中,策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
进一步地,在上述技术方案中,模拟仿真模块中,根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*:
Z(i)=WHHn+r+WEEn+r,i∈VT (20)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
在调度策略实时更新模块中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集和合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
进一步地,在上述技术方案中,策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (25)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
进一步地,在上述技术方案中,还包括调度策略评估模块,包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (30)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
通过上述实施例所述的技术方案,本发明所述的本发明所述的调度方法及系统综合考虑岸桥的作业效率和AGV的空载行驶距离,构建集装箱评价标准体系;同时利用两两比较的偏好函数对所有未作业集装箱进行评估,选出最优集装箱完成AGV分配,可在短时间内实时筛选最优任务箱。
以上所述,仅为本发明较佳的具体实施方法,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种自动化码头AGV调度方法,其特征在于,包括以下步骤:
步骤1:为所有AGV随机分配初始作业任务并进行作业;设定模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
步骤2:建立未作业任务箱列表V,初始化调度策略π;
针对当前时刻空闲AGV,根据当前调度策略π筛选出策略最优任务箱π(VT)分配给空闲AGV进行作业,所述当前时刻为空闲AGV到达交换区的时刻;
步骤3:判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入步骤4至步骤5进行调度策略的更新;
步骤4:对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
步骤5:通过模拟仿真筛选出仿真最优任务箱i*后,对DBN网络模型进行训练更新;针对产生的空闲AGV,返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。
2.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:步骤2中筛选策略最优任务箱π(VT)采用偏好函数进行,具体包括如下过程:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
3.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:步骤4中,根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*:
Z(i)=WHHn+r+WEEn+r,i∈VT (4)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
步骤5中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集和合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
4.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:步骤2中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (9)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
5.根据权利要求1所述的自动化码头AGV调度方法,其特征在于:还包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (14)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
6.一种自动化码头AGV调度系统,其特征在于:包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块;
算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值WH、权重值WE和训练集样本权重参数α;
调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表;
策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息,将使用当前调度策略π筛选出的策略最优任务箱π(VT)分配给当前时刻空闲AGV进行作业;
任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息,判断未作业任务箱是否全部完成分配,若已完成分配,则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间;若未完成分配,则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新;
模拟仿真模块用于根据算法参数设置模块输入的设定值,对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真,并筛选得到仿真最优任务箱i*,模拟仿真过程依据当前策略π进行;
调度策略实时更新模块用于对DBN网络模型进行训练更新;当产生空闲AGV时,返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。
7.根据权利要求6所述的自动化码头AGV调度系统,其特征在于:策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括:
步骤11:根据当前调度策略π中用于对任务箱进行评估的p个标准,对每一个任务箱进行评估,分别计算每一个任务箱对应的每一个标准e的标准值:Ae(m)(e=1,2…p);
步骤12:对所有任务箱进行两两比较,设用于比较的两个任务箱分别为任务箱m和任务箱n,分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值,偏好值根据如下公式计算:
其中Fe(m,n)为对于标准e,任务箱m相对于任务箱n的偏好值,Ae(m)为任务箱m对应标准e的标准值,Ae(n)为任务箱对应标准e的标准值;
将计算得到的偏好值输入到DBN网络模型,得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值:
R(m,n)←Fe(m,n),e=1,2,…p
其中,R(m,n)为任务箱m相对于任务箱n的总偏好值,R(m,n)∈[0,1],若任务箱m优于任务箱n,则取值越接近1;若任务箱n优于任务箱m,则取值越接近0;
步骤13:利用总偏好值根据如下公式计算每一个任务箱的总评价值:
其中,为任务箱m的总评价值,VT为当前时刻T未作业任务箱集合;
根据如下公式筛选得到当前策略π中的策略最优任务箱:
其中,VT为当前时刻T未作业任务箱集合。
8.根据权利要求6所述的自动化码头AGV调度系统,其特征在于:模拟仿真模块中,根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i),比较进行模拟仿真的任务箱的Z(i)值,Z(i)值最小的任务箱即为仿真最优任务箱i*:
Z(i)=WHHn+r+WEEn+r,i∈VT (20)
其中Hn+r和En+r为n+r个任务箱装卸后,任务箱i的岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为Hn+r和En+r对应的权重;q为岸桥数量;tn+r为n+r个任务箱作业完成后的时刻;l为n+r个任务箱开始作业的时刻;um为AGV作业任务箱m的空载距离;
在调度策略实时更新模块中,对DBN网络模型进行更新的过程包括对训练集S进行更新:
进行第一轮更新时,训练集S为空集;进行第二轮及后续的更新时,上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S;
对训练集S进行更新时,将训练集S的样本容量与训练集标准容量I进行对比,若训练集S的样本容量小于I,则将初始训练集G’合并入训练集S产生新训练集S’;若训练集S的样本容量大于I,则从训练集S中随机提取I个训练样本,将剩余的训练样本与初始训练集G’合并产生新训练集S’;从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集;
其中,初始训练集G’的产生过程为:
首先初始化一个空集作为临时训练集G;
假设当前时刻T的未作业任务箱数为dT,将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比,同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算:
其中α为训练集样本权重参数,x、k为未作业任务箱;
为样本量为dT-1个的积极训练集,其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i,此时总偏好值为1;
为样本量为dT-1个的消极训练集,其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i,此时总偏好值为0;
引入权重后生成的训练集和合并产生总样本量为样本量为2(dT-1)个的权重训练集;
将权重训练集合并入临时训练集G中产生初始训练集G’:
9.根据权利要求6所述的自动化码头AGV调度系统,其特征在于:策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个,标准值越低则代表任务箱优先级越高:
A1(m)表示岸桥或场桥在作业任务箱m前需要的时间,包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间;
A2(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离;
A3(m)表示任务箱m的紧急程度,通过如下公式计算得到:
A3(m)=Tm-Tmin (25)
其中,Tm为任务箱m的截止作业时间,Tmin为截止作业时间的最小值;
A4(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离,其值取负数;
A5(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间,其值取负数;
A6(m)表示当前时刻AGV作业任务箱m出现双循环的情况,其取值根据如下公式进行计算:
A7(m)表示进口箱与出口箱的区别,其取值根据如下公式进行计算,其中给予出口箱更高的优先级:
A8(m)表示任务箱m对应场桥的相对剩余工作量,其取值根据如下公式进行计算,在作业量大的堆场箱区中,其中给予出口箱更高的优先级:
其中为在当前时刻T,任务箱m对应场桥的剩余工作量;为在当前时刻T,所有场桥的平均剩余工作量;
A9(m)表示当前时刻AGV优于其他AGV的程度,其取值根据如下公式进行计算:
其中k为当前时刻AGV,式中BT(i,m)为在当前时刻T,i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间,U为AGV集合。
10.根据权利要求6所述的自动化码头AGV调度系统,其特征在于:还包括调度策略评估模块,包括用于评价调度策略优劣的调度策略评估模型,所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标,具体根据如下公式进行,其中Z值越小表示调度策略较优:
Z=WHHN+WEEN (30)
其中HN和EN为N个任务箱装卸后,岸桥平均作业时间和AGV平均空载行驶距离;WH和WE分别为HN和EN对应的权重;q为岸桥数量;tN为N个任务箱装卸后的时刻;l为N个任务箱开始作业的时刻;um为AGV作业任务箱的空载距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810499201.9A CN108845496B (zh) | 2018-05-23 | 2018-05-23 | 一种自动化码头agv调度方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810499201.9A CN108845496B (zh) | 2018-05-23 | 2018-05-23 | 一种自动化码头agv调度方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108845496A true CN108845496A (zh) | 2018-11-20 |
CN108845496B CN108845496B (zh) | 2021-06-25 |
Family
ID=64213274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810499201.9A Active CN108845496B (zh) | 2018-05-23 | 2018-05-23 | 一种自动化码头agv调度方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108845496B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444599A (zh) * | 2020-03-23 | 2020-07-24 | 兰剑智能科技股份有限公司 | 一种agv项目仿真与监控方法及系统 |
CN111949035A (zh) * | 2020-08-24 | 2020-11-17 | 兰剑智能科技股份有限公司 | Agv调度系统中多车互锁解锁的方法、装置及设备 |
CN112764405A (zh) * | 2021-01-25 | 2021-05-07 | 青岛港国际股份有限公司 | 基于时间预估模型的agv调度方法 |
CN112836974A (zh) * | 2021-02-05 | 2021-05-25 | 上海海事大学 | 一种基于dqn和mcts的箱区间多场桥动态调度方法 |
CN112990617A (zh) * | 2019-12-02 | 2021-06-18 | 杭州海康机器人技术有限公司 | 智能移动机器人的调度方法和调度装置 |
CN113110330A (zh) * | 2021-04-15 | 2021-07-13 | 青岛港国际股份有限公司 | 一种基于全局最优匹配的agv动态调度管理方法 |
CN113627643A (zh) * | 2021-06-28 | 2021-11-09 | 东南大学 | 一种多式联运的船舶与堆场间无人集卡调度优化方法 |
CN115049324A (zh) * | 2022-08-17 | 2022-09-13 | 上海国际港务(集团)股份有限公司 | 码头agv车调度方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101458788A (zh) * | 2008-12-19 | 2009-06-17 | 天津市市政工程设计研究院 | 集装箱码头物流仿真优化系统 |
CN103164782A (zh) * | 2011-12-16 | 2013-06-19 | 招商局国际信息技术有限公司 | 一种集装箱卡车智能调度系统及方法 |
CN104281894A (zh) * | 2014-10-30 | 2015-01-14 | 大连海事大学 | 基于航道与泊位资源的船舶调度优化方法 |
CN107025141A (zh) * | 2017-05-18 | 2017-08-08 | 成都海天数联科技有限公司 | 一种基于大数据混合作业模型的调度方法 |
-
2018
- 2018-05-23 CN CN201810499201.9A patent/CN108845496B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101458788A (zh) * | 2008-12-19 | 2009-06-17 | 天津市市政工程设计研究院 | 集装箱码头物流仿真优化系统 |
CN103164782A (zh) * | 2011-12-16 | 2013-06-19 | 招商局国际信息技术有限公司 | 一种集装箱卡车智能调度系统及方法 |
CN104281894A (zh) * | 2014-10-30 | 2015-01-14 | 大连海事大学 | 基于航道与泊位资源的船舶调度优化方法 |
CN107025141A (zh) * | 2017-05-18 | 2017-08-08 | 成都海天数联科技有限公司 | 一种基于大数据混合作业模型的调度方法 |
Non-Patent Citations (2)
Title |
---|
RI CHOE等: "Online preference learning for adaptive dispatching of AGVs in an automated container terminal", 《APPLIED SOFT COMPUTING》 * |
W.W. COHEN等: "Learning to order things", 《JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112990617A (zh) * | 2019-12-02 | 2021-06-18 | 杭州海康机器人技术有限公司 | 智能移动机器人的调度方法和调度装置 |
CN111444599A (zh) * | 2020-03-23 | 2020-07-24 | 兰剑智能科技股份有限公司 | 一种agv项目仿真与监控方法及系统 |
CN111949035A (zh) * | 2020-08-24 | 2020-11-17 | 兰剑智能科技股份有限公司 | Agv调度系统中多车互锁解锁的方法、装置及设备 |
CN112764405A (zh) * | 2021-01-25 | 2021-05-07 | 青岛港国际股份有限公司 | 基于时间预估模型的agv调度方法 |
WO2022156440A1 (zh) * | 2021-01-25 | 2022-07-28 | 青岛港国际股份有限公司 | 基于时间预估模型的agv调度方法 |
CN112836974A (zh) * | 2021-02-05 | 2021-05-25 | 上海海事大学 | 一种基于dqn和mcts的箱区间多场桥动态调度方法 |
CN112836974B (zh) * | 2021-02-05 | 2024-01-23 | 上海海事大学 | 一种基于dqn和mcts的箱区间多场桥动态调度方法 |
CN113110330A (zh) * | 2021-04-15 | 2021-07-13 | 青岛港国际股份有限公司 | 一种基于全局最优匹配的agv动态调度管理方法 |
CN113110330B (zh) * | 2021-04-15 | 2022-11-22 | 青岛港国际股份有限公司 | 一种基于全局最优匹配的agv动态调度管理方法 |
CN113627643A (zh) * | 2021-06-28 | 2021-11-09 | 东南大学 | 一种多式联运的船舶与堆场间无人集卡调度优化方法 |
CN115049324A (zh) * | 2022-08-17 | 2022-09-13 | 上海国际港务(集团)股份有限公司 | 码头agv车调度方法、装置、计算机设备和存储介质 |
CN115049324B (zh) * | 2022-08-17 | 2022-11-04 | 上海国际港务(集团)股份有限公司 | 码头agv车调度方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108845496B (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108845496B (zh) | 一种自动化码头agv调度方法及系统 | |
Cao et al. | Integrated quay crane and yard truck schedule problem in container terminals | |
CN111861205A (zh) | 一种自动化集装箱码头出口箱空间分配方法 | |
CN109726863A (zh) | 一种多目标优化的物流方法和系统 | |
CN112434870B (zh) | 一种集装箱区垂直布置的双自动化场桥动态调度方法 | |
CN111091238A (zh) | 一种自动化集装箱码头agv智能化调度方法 | |
CN111498696B (zh) | 一种双吊具场桥调度优化方法及装置 | |
CN108647810A (zh) | 订单运输的分配方法及装置、计算机可读介质 | |
CN110599000B (zh) | 自动化码头翻箱评估方法、箱位分配方法及相关装置 | |
KR20090115274A (ko) | 개별 컨테이너 적하순서 계획 방법 | |
CN112712288A (zh) | 一种内河码头干散货作业集成调度方法 | |
CN114331075A (zh) | 堆场拖车调度方法、装置、设备及存储介质 | |
Ozcan et al. | A reward-based algorithm for the stacking of outbound containers | |
Yu et al. | Yard template generation for automated container terminal based on bay sharing strategy | |
CN109019056A (zh) | 一种集装箱堆场双层高架轨道垂直运输设备调度方法 | |
Chen et al. | Research on integrated scheduling optimization of double-trolley quay crane and AGV in automated terminal | |
CN113743739B (zh) | 一种基于混合整数规划、组合优化算法的agv调度方法 | |
CN108596446B (zh) | 受集装箱吊车任务队列约束的港内集卡派发方法 | |
Lee et al. | Integrated quay crane and yard truck schedule for inbound containers | |
CN115860161A (zh) | 一种进场集装箱选位方法、装置及可读介质 | |
Rinkács et al. | Adaptive simulation of automated guided vehicle systems using multi agent based approach for supplying materials | |
CN117494854A (zh) | 港口作业管理方法、装置和存储介质 | |
Liu et al. | Fuzzy optimization of storage space allocation in a container terminal | |
KR20220089609A (ko) | 연계된 작업의 병목검출 시스템 | |
CN117474297B (zh) | 一种面向自动化码头的船舶泊位和岸桥分配的优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |