CN108845496A

CN108845496A - 一种自动化码头agv调度方法及系统

Info

Publication number: CN108845496A
Application number: CN201810499201.9A
Authority: CN
Inventors: 曾庆成; 王泽浩; 朱禹仲; 王征; 陈康
Original assignee: Dalian Maritime University
Current assignee: Dalian Maritime University
Priority date: 2018-05-23
Filing date: 2018-05-23
Publication date: 2018-11-20
Anticipated expiration: 2038-05-23
Also published as: CN108845496B

Abstract

本发明公开了一种自动化码头AGV调度方法及系统，所述调度方法包括以下步骤：步骤1：输入模拟仿真长度r、训练集标准容量I、权重值W_H、权重值W_E和训练集样本权重参数α；步骤2：输入未作业任务箱列表V，初始化调度策略π；针对当前时刻空闲AGV，根据当前调度策略π筛选出策略最优任务箱π(V_T)分配给空闲AGV进行作业；步骤3：判断未作业任务箱是否全部完成分配；步骤4：对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真；步骤5：利用新训练集S’对DBN网络模型进行训练更新，更新后的DBN网络模型作为下一轮AGV任务分配使用的DBN网络模型。本申请将深度学习网络模型引入到AGV实时调度分配中，实现了AGV任务分配的实时最优。

Description

一种自动化码头AGV调度方法及系统

技术领域

本发明属于自动化码头作业调度决策技术领域，具体涉及一种自动化码头AGV调度方法及系统。

背景技术

在自动化码头中，自动导引车(automated guided vehicle,AGV)用于完成岸桥与自动堆垛起重机之间的集装箱水平运输，但是其作业效率受自身条件、作业环境、码头布局等因素影响，因此，准确把握AGV调度是码头提高作业效率的关键。高效的集装箱装卸作业水平能提高码头作业效率、缩短船舶在港时间，而AGV与岸桥、场桥作业的协同性是影响船舶装卸效率的重要因素之一，在理想状态下，岸桥与场桥无需等待AGV即可无延迟装卸集装箱。由于AGV数量的增加会导致拥堵，因此AGV与岸桥、场桥之间高水平的协同性无法通过单纯增加AGV数量实现，反而最终影响岸桥与场桥的作业效率。因此，需要设计一种高效率的AGV调度方法，已经成为提高自动化码头作业效率的关键。

发明内容

为了解决上述技术问题，本发明提供了一种自动化码头AGV调度方法及系统。

本发明通过以下技术方案实现：

一种自动化码头AGV调度方法，包括以下步骤：

步骤1：为所有AGV随机分配初始作业任务并进行作业；设定模拟仿真长度r、训练集标准容量I、权重值W_H、权重值W_E和训练集样本权重参数α；

步骤2：建立未作业任务箱列表V，初始化调度策略π；

针对当前时刻空闲AGV，根据当前调度策略π筛选出策略最优任务箱π(V_T)分配给空闲AGV进行作业，所述当前时刻为空闲AGV到达交换区的时刻；

步骤3：判断未作业任务箱是否全部完成分配，若已完成分配，则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间；若未完成分配，则进入步骤4至步骤5进行调度策略的更新；

步骤4：对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真，并筛选得到仿真最优任务箱i^*，模拟仿真过程依据当前策略π进行；

步骤5：通过模拟仿真筛选出仿真最优任务箱i^*后，对DBN网络模型进行训练更新；针对产生的空闲AGV，返回步骤2利用更新后的DBN网络模型进行下一轮AGV任务分配。

进一步地，在上述技术方案中，步骤2中筛选策略最优任务箱π(V_T)采用偏好函数进行，具体包括如下过程：

步骤11：根据当前调度策略π中用于对任务箱进行评估的p个标准，对每一个任务箱进行评估，分别计算每一个任务箱对应的每一个标准e的标准值：A_e(m)(e＝1,2…p)；

步骤12：对所有任务箱进行两两比较，设用于比较的两个任务箱分别为任务箱m和任务箱n，分别计算任务箱m相对于任务箱n的偏好值和任务箱n相对于任务箱m的偏好值，偏好值根据如下公式计算：

其中F_e(m,n)为对于标准e，任务箱m相对于任务箱n的偏好值，A_e(m)为任务箱m对应标准e的标准值，A_e(n)为任务箱对应标准e的标准值；

将计算得到的偏好值输入到DBN网络模型，得到任务箱m相对于任务箱n的总偏好值和任务箱n相对于任务箱m的总偏好值：

R(m,n)←F_e(m,n),e＝1,2,…p

其中，R(m,n)为任务箱m相对于任务箱n的总偏好值，R(m,n)∈[0,1]，若任务箱m优于任务箱n，则取值越接近1；若任务箱n优于任务箱m，则取值越接近0；

步骤13：利用总偏好值根据如下公式计算每一个任务箱的总评价值：

其中，为任务箱m的总评价值，V_T为当前时刻T未作业任务箱集合；

根据如下公式筛选得到当前策略π中的策略最优任务箱：

其中，V_T为当前时刻T未作业任务箱集合。

进一步地，在上述技术方案中，：步骤4中，根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i)，比较进行模拟仿真的任务箱的Z(i)值，Z(i)值最小的任务箱即为仿真最优任务箱i^*：

Z(i)＝W_HH_n+r+W_EE_n+r,i∈V_T (4)

其中H_n+r和E_n+r为n+r个任务箱装卸后，任务箱i的岸桥平均作业时间和AGV平均空载行驶距离；W_H和W_E分别为H_n+r和E_n+r对应的权重；q为岸桥数量；t_n+r为n+r个任务箱作业完成后的时刻；l为n+r个任务箱开始作业的时刻；u_m为AGV作业任务箱m的空载距离。

进一步地，在上述技术方案中，步骤5中，对DBN网络模型进行更新的过程包括对训练集S进行更新：

进行第一轮更新时，训练集S为空集；进行第二轮及后续的更新时，上一轮训练集S更新后产生的新训练集S’作为下一轮更新DBN网络模型时待更新的训练集S；

对训练集S进行更新时，将训练集S的样本容量与训练集标准容量I进行对比，若训练集S的样本容量小于I，则将初始训练集G’合并入训练集S产生新训练集S’；若训练集S的样本容量大于I，则从训练集S中随机提取I个训练样本，将剩余的训练样本与初始训练集G’合并产生新训练集S’；从训练集S中随机提取的I个训练样本作为下一轮更新DBN网络模型使用的初始训练集；

其中，初始训练集G’的产生过程为：

首先初始化一个空集作为临时训练集G；

假设当前时刻T的未作业任务箱数为d_T，将仿真最优任务箱i*与除i*外其他未作业任务箱进行两两对比，同时根据每一个训练集样本的权重产生训练集和其中每一个训练集样本的权重根据如下公式计算：

其中α为训练集样本权重参数，x、k为未作业任务箱；

为样本量为d_T-1个的积极训练集，其中1表示训练集中仿真最优任务箱i*优于与之比较的其他任务箱i，此时总偏好值为1；

为样本量为d_T-1个的消极训练集，其中0表示训练集中仿真最优任务箱i*劣于与之比较的其他任务箱i，此时总偏好值为0；

引入权重后生成的训练集和合并产生总样本量为样本量为2(d_T-1)个的权重训练集；

将权重训练集合并入临时训练集G中产生初始训练集G’：

进一步地，在上述技术方案中，步骤2中用于对任务箱进行评估的标准为9个，标准值越低则代表任务箱优先级越高：

A₁(m)表示岸桥或场桥在作业任务箱m前需要的时间，包括岸桥或场桥的移动时间和岸桥或场桥作业优先级更高的任务箱所用的时间；

A₂(m)表示当前时刻AGV为了作业任务箱m需要行驶的空载距离；

A₃(m)表示任务箱m的紧急程度，通过如下公式计算得到：

A₃(m)＝T_m-T_min (9)

其中，T_m为任务箱m的截止作业时间，T_min为截止作业时间的最小值；

A₄(m)表示当前时刻AGV作业任务箱m需要行驶的重载距离，其值取负数；

A₅(m)表示任务箱m对应的岸桥作业单个集装箱的平均延迟时间，其值取负数；

A₆(m)表示当前时刻AGV作业任务箱m出现双循环的情况，其取值根据如下公式进行计算：

A₇(m)表示进口箱与出口箱的区别，其取值根据如下公式进行计算，其中给予出口箱更高的优先级：

A₈(m)表示任务箱m对应场桥的相对剩余工作量，其取值根据如下公式进行计算，在作业量大的堆场箱区中，其中给予出口箱更高的优先级：

其中为在当前时刻T，任务箱m对应场桥的剩余工作量；为在当前时刻T，所有场桥的平均剩余工作量；

A₉(m)表示当前时刻AGV优于其他AGV的程度，其取值根据如下公式进行计算：

其中k为当前时刻AGV，式中B_T(i,m)为在当前时刻T，i号AGV达到空闲状态并抵达任务箱m所在位置所需的时间，U为AGV集合。

进一步地，在上述技术方案中，还包括用于评价调度策略优劣的调度策略评估模型，所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标，具体根据如下公式进行，其中Z值越小表示调度策略较优：

Z＝W_HH_N+W_EE_N (14)

其中H_N和E_N为N个任务箱装卸后，岸桥平均作业时间和AGV平均空载行驶距离；W_H和W_E分别为H_N和E_N对应的权重；q为岸桥数量；t_N为N个任务箱装卸后的时刻；l为N个任务箱开始作业的时刻；u_m为AGV作业任务箱的空载距离。

本发明还包括一种自动化码头AGV调度系统，包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块；

算法参数设置模块用于输入设定的模拟仿真长度r、训练集标准容量I、权重值W_H、权重值W_E和训练集样本权重参数α；

调度信息采集模块用于采集每一个任务箱的分配状态信息、每一个AGV状态信息和AGV到达交换区的时刻信息以及创建并更新未作业任务箱列表；

策略最优任务箱筛选模块用于根据调度信息采集模块采集到的当前时刻空闲AGV到达交换区的时刻信息，将使用当前调度策略π筛选出的策略最优任务箱π(V_T)分配给当前时刻空闲AGV进行作业；

任务箱作业判断模块用于根据调度信息采集模块采集到的每一个任务箱的分配状态信息，判断未作业任务箱是否全部完成分配，若已完成分配，则输出当前调度策略π以及AGV空载距离和岸桥平均作业时间；若未完成分配，则进入模拟仿真模块和调度策略实时更新模块进行调度策略的更新；

模拟仿真模块用于根据算法参数设置模块输入的设定值，对未作业任务箱列表中除策略最优任务箱以外的任务箱进行长度为r的模拟仿真，并筛选得到仿真最优任务箱i^*，模拟仿真过程依据当前策略π进行；

调度策略实时更新模块用于对DBN网络模型进行训练更新；当产生空闲AGV时，返回策略最优任务箱筛选模块利用更新后的DBN网络模型进行下一轮AGV任务分配。

进一步地，在上述技术方案中，策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括：

R(m,n)←F_e(m,n),e＝1,2,…p

根据如下公式筛选得到当前策略π中的策略最优任务箱：

其中，V_T为当前时刻T未作业任务箱集合。

进一步地，在上述技术方案中，模拟仿真模块中，根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i)，比较进行模拟仿真的任务箱的Z(i)值，Z(i)值最小的任务箱即为仿真最优任务箱i^*：

Z(i)＝W_HH_n+r+W_EE_n+r,i∈V_T (20)

其中H_n+r和E_n+r为n+r个任务箱装卸后，任务箱i的岸桥平均作业时间和AGV平均空载行驶距离；W_H和W_E分别为H_n+r和E_n+r对应的权重；q为岸桥数量；t_n+r为n+r个任务箱作业完成后的时刻；l为n+r个任务箱开始作业的时刻；u_m为AGV作业任务箱m的空载距离；

在调度策略实时更新模块中，对DBN网络模型进行更新的过程包括对训练集S进行更新：

其中，初始训练集G’的产生过程为：

首先初始化一个空集作为临时训练集G；

其中α为训练集样本权重参数，x、k为未作业任务箱；

将权重训练集合并入临时训练集G中产生初始训练集G’：

进一步地，在上述技术方案中，策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个，标准值越低则代表任务箱优先级越高：

A₃(m)表示任务箱m的紧急程度，通过如下公式计算得到：

A₃(m)＝T_m-T_min (25)

进一步地，在上述技术方案中，还包括调度策略评估模块，包括用于评价调度策略优劣的调度策略评估模型，所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标，具体根据如下公式进行，其中Z值越小表示调度策略较优：

Z＝W_HH_N+W_EE_N (30)

本发明的有益效果为：

(1)本发明所述的调度方法及系统综合考虑岸桥的作业效率和AGV的空载行驶距离，构建集装箱评价标准体系；同时利用两两比较的偏好函数对所有未作业集装箱进行评估，选出最优集装箱完成AGV分配，可在短时间内实时筛选最优任务箱；

(2)本发明所述的调度方法及系统将新兴技术深度学习引入到AGV实时调度分配中，针对环境的动态变化，利用DBN网络模型实时更新AGV的当前调度策略，实现了AGV任务分配的实时最优；

(3)本发明所述的调度方法及系统将训练集进行实时更新，完成了旧样本与新样本在总训练集当中的动态平衡，并给予每一个训练集样本不同的权重，使得可靠度强的样本对调度结果拥有更大的影响；

(4)本发明所述的调度方法及系统可根据码头实际需求改变岸桥作业效率与AGV空载行驶距离的相对权重，对重视程度高的部分给予更高权重，从而产生相应的调度方案。

附图说明

下面结合附图和具体实施方法对本发明作进一步详细的说明。

图1为所述调度方法的流程图；

图2为所述调度方法的算法流程图；

图3为自动化码头的布局及装卸图；

图4为AGV运行区的运行路线图；

图5为所述调度系统模块图。

具体实施方法

下面结合附图和实施例对本发明的技术方案进行清楚、完整的描述。

实施例1

如图1-4所示，一种自动化码头AGV调度方法，包括以下步骤：

步骤2：建立未作业任务箱列表V，初始化调度策略π；

R(m,n)←F_e(m,n),e＝1,2,…p

根据如下公式筛选得到当前策略π中的策略最优任务箱：

其中，V_T为当前时刻T未作业任务箱集合。

Z(i)＝W_HH_n+r+W_EE_n+r,i∈V_T (4)

其中，初始训练集G’的产生过程为：

首先初始化一个空集作为临时训练集G；

其中α为训练集样本权重参数，x、k为未作业任务箱；

由于模拟仿真所依据的当前策略不一定是真正的最优策略，因此产生的训练集存在一定误差，为减轻此误差对调度结果的影响，本申请引入权重至训练集样本(i^*,i)，对可靠度强的样本给予更高权重，经过公式(8)计算得到权重后，任务箱i^*与i之间的模拟仿真评价值相差越大，则权重越大，则说明该样本对DBN网络训练的影响也越大；

将权重训练集合并入临时训练集G中产生初始训练集G’：

其中，本申请所述训练集的表现形式为任务箱两两比较，包括两个任务箱的偏好值F_e(m,n)和两个任务箱的总偏好值R(m,n)；

随着训练集的累积，新训练集S’对训练效果的影响会不断减小，针对此问题，本申请实时更新训练集，假设新产生的训练集大小始终为d，新样本在本轮训练集更新后留下的概率为I/(d+I)，在s轮训练集更新后的概率为(I/(d+I))^s，随着训练集不断更新，旧样本留存的概率越来越小，减轻了旧样本对调度策略更新的影响，同时提高了算法的运算速度。

A₃(m)表示任务箱m的紧急程度，通过如下公式计算得到：

A₃(m)＝T_m-T_min (9)

其中，所述出口箱表示需要由堆场作业区运输至岸桥作业区的任务箱，所述进口箱表示需要由岸桥作业区运输至堆场作业区的任务箱；

Z＝W_HH_N+W_EE_N (14)

如图5所示，本发明还包括一种自动化码头AGV调度系统，包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块；

R(m,n)←F_e(m,n),e＝1,2,…p

根据如下公式筛选得到当前策略π中的策略最优任务箱：

其中，V_T为当前时刻T未作业任务箱集合。

Z(i)＝W_HH_n+r+W_EE_n+r,i∈V_T (20)

其中，初始训练集G’的产生过程为：

首先初始化一个空集作为临时训练集G；

其中α为训练集样本权重参数，x、k为未作业任务箱；

将权重训练集合并入临时训练集G中产生初始训练集G’：

A₃(m)表示任务箱m的紧急程度，通过如下公式计算得到：

A₃(m)＝T_m-T_min (25)

Z＝W_HH_N+W_EE_N (30)

通过上述实施例所述的技术方案，本发明所述的本发明所述的调度方法及系统综合考虑岸桥的作业效率和AGV的空载行驶距离，构建集装箱评价标准体系；同时利用两两比较的偏好函数对所有未作业集装箱进行评估，选出最优集装箱完成AGV分配，可在短时间内实时筛选最优任务箱。

以上所述，仅为本发明较佳的具体实施方法，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种自动化码头AGV调度方法，其特征在于，包括以下步骤：

步骤2：建立未作业任务箱列表V，初始化调度策略π；

2.根据权利要求1所述的自动化码头AGV调度方法，其特征在于：步骤2中筛选策略最优任务箱π(V_T)采用偏好函数进行，具体包括如下过程：

R(m,n)←F_e(m,n),e＝1,2,…p

根据如下公式筛选得到当前策略π中的策略最优任务箱：

其中，V_T为当前时刻T未作业任务箱集合。

3.根据权利要求1所述的自动化码头AGV调度方法，其特征在于：步骤4中，根据公式(4)-(7)计算得到每一个任务箱i的模拟仿真评价值Z(i)，比较进行模拟仿真的任务箱的Z(i)值，Z(i)值最小的任务箱即为仿真最优任务箱i^*：

Z(i)＝W_HH_n+r+W_EE_n+r,i∈V_T (4)

步骤5中，对DBN网络模型进行更新的过程包括对训练集S进行更新：

其中，初始训练集G’的产生过程为：

首先初始化一个空集作为临时训练集G；

其中α为训练集样本权重参数，x、k为未作业任务箱；

将权重训练集合并入临时训练集G中产生初始训练集G’：

4.根据权利要求1所述的自动化码头AGV调度方法，其特征在于：步骤2中用于对任务箱进行评估的标准为9个，标准值越低则代表任务箱优先级越高：

A₃(m)表示任务箱m的紧急程度，通过如下公式计算得到：

A₃(m)＝T_m-T_min (9)

5.根据权利要求1所述的自动化码头AGV调度方法，其特征在于：还包括用于评价调度策略优劣的调度策略评估模型，所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标，具体根据如下公式进行，其中Z值越小表示调度策略较优：

Z＝W_HH_N+W_EE_N (14)

6.一种自动化码头AGV调度系统，其特征在于：包括算法参数设置模块、调度信息采集模块、策略最优任务箱筛选模块、任务箱作业判断模块、模拟仿真模块和调度策略实时更新模块；

7.根据权利要求6所述的自动化码头AGV调度系统，其特征在于：策略最优任务箱筛选模块使用当前调度策略筛选策略最优任务箱的过程包括：

R(m,n)←F_e(m,n),e＝1,2,…p

根据如下公式筛选得到当前策略π中的策略最优任务箱：

其中，V_T为当前时刻T未作业任务箱集合。

8.根据权利要求6所述的自动化码头AGV调度系统，其特征在于：模拟仿真模块中，根据公式(20)-(23)计算得到每一个任务箱i的模拟仿真评价值Z(i)，比较进行模拟仿真的任务箱的Z(i)值，Z(i)值最小的任务箱即为仿真最优任务箱i^*：

Z(i)＝W_HH_n+r+W_EE_n+r,i∈V_T (20)

其中，初始训练集G’的产生过程为：

首先初始化一个空集作为临时训练集G；

其中α为训练集样本权重参数，x、k为未作业任务箱；

将权重训练集合并入临时训练集G中产生初始训练集G’：

9.根据权利要求6所述的自动化码头AGV调度系统，其特征在于：策略最优任务箱筛选模块中用于对任务箱进行评估的标准为9个，标准值越低则代表任务箱优先级越高：

A₃(m)表示任务箱m的紧急程度，通过如下公式计算得到：

A₃(m)＝T_m-T_min (25)

10.根据权利要求6所述的自动化码头AGV调度系统，其特征在于：还包括调度策略评估模块，包括用于评价调度策略优劣的调度策略评估模型，所述调度策略评估模型以最小岸桥平均作业时间和最短AGV空载距离为目标，具体根据如下公式进行，其中Z值越小表示调度策略较优：

Z＝W_HH_N+W_EE_N (30)