CN115471142B

CN115471142B - 一种基于人机协同的港口拖轮作业智能调度方法

Info

Publication number: CN115471142B
Application number: CN202211359685.XA
Authority: CN
Inventors: 陈琳瑛; 孙长萍; 牟军敏; 陈鹏飞; 黄亚敏
Original assignee: Wuhan University of Technology WUT
Current assignee: Wuhan University of Technology WUT
Priority date: 2022-11-02
Filing date: 2022-11-02
Publication date: 2023-04-07
Anticipated expiration: 2042-11-02
Also published as: CN115471142A

Abstract

本发明提供了一种基于人机协同的港口拖轮作业智能调度方法，包括：基于预设遗传算法确定港口拖轮作业调度计划的理论最优调度方案；基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征分类；基于预设的神经网络融合模型对所述理论最优调度方案和调度员的人为习惯特征分类进行融合，得到融合最优调度方案；基于预设的调度阈值和所述融合最优调度方案确定目标调度方案。本发明提供的基于人机协同的港口拖轮作业智能调度方法能够将得到的理论最优调度方案与调度员人为习惯特征分类融合，使得到的调度方案包含调度员人为习惯特征，能够兼顾调度计划的稳定性以及与调度人员的协调性，提高拖轮作业的效率，并降低成本。

Description

一种基于人机协同的港口拖轮作业智能调度方法

技术领域

本发明涉及港口调度技术领域，具体涉及一种基于人机协同的港口拖轮作业智能调度方法。

背景技术

拖轮作业调度系统是港口体系中必不可少的一部分，关系到船舶能否安全快速准时的进入码头泊位。目前各港口的拖轮调度主要依靠港口资深调度员凭借经验进行人工调度计划安排。

在现有技术中，拖轮调度多采用智能算法寻求调度计划最优解，例如人工蜂群算法、粒子群算法、遗传算法等，取得了较好的结果。在现有的技术中，各自智能算法虽然能得到调度最优解，但各种模型的建立都比较理想化，容易陷入局部最优，所得到的调度最优解与人工调度计划相差较大，不能满足调度人员对复杂调度的业务规则需求。人工调度的优点是易于操作和临时调整，考虑情况复杂，约束优先级可根据情况调整，缺点是因人而异，调度结果受人为经验影响较大，随机性强不稳定。智能算法虽求解快速准确但难以求解复杂调度问题。

综上，现有技术中得到的拖轮调度计划无法兼顾调度计划的稳定性以及与调度人员的协调性，导致拖轮作业的效率不高，成本增加。

发明内容

有鉴于此，有必要提供一种基于人机协同的港口拖轮作业智能调度方法，解决现有技术中得到的拖轮调度计划无法兼顾调度计划的稳定性以及与调度人员的协调性，从而导致拖轮作业的效率不高，成本增加的技术问题。

为了解决上述技术问题，本发明提供了一种基于人机协同的港口拖轮作业智能调度方法，包括：

基于预设遗传算法确定港口拖轮作业调度计划的理论最优调度方案；

基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征进行分类，得到习惯特征分类信息；

基于预设的神经网络融合模型对所述理论最优调度方案和习惯特征分类信息进行融合，得到融合最优调度方案；

基于预设的调度阈值和所述融合最优调度方案确定目标调度方案。

在一些可能实现的方式中，所述基于预设遗传算法确定港口拖轮作业调度计划的理论最优调度方案，包括：

对所述港口拖轮作业调度计划中相关元素进行编码，得到编码表格，根据所述编码表格随机生成个体，产生初始种群；

以空驶时间最小为目标定义目标函数，并设定所述目标函数的倒数为适应度；

基于锦标赛法在所述初始种群中筛选出满足所述适应度的个体作为最优个体；

使用Order Crossover交叉算子，在交叉过程中选取所述最优个体的一对染色体作为父本染色体和母本染色体，以所述父本染色体和母本染色体为基础迭代进行交叉运算并将产生的后代加入到基因集中，并设定交叉率；

使用位置变异法作为变异算子，随机选择所述基因集中的染色体，在所述染色体中随机产生两个位置交换这两个位置的值，并设定变异率；

从基因集中得到满足适应度调度的理论最优调度方案。

在一些可能实现的方式中，所述预设的神经网络自编码器模型包括第一编码器和第一解码器；所述基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征进行分类，得到习惯特征分类信息，包括：基于所述第一编码器提取所述港口拖轮作业调度计划中调度员的人为习惯特征，将所述习惯特征转化为一个N维的特征向量；

基于所述第一解码器对所述特征向量进行解码，恢复为所述港口拖轮作业调度计划中的调度信息内容，得到习惯特征分类信息。

在一些可能实现的方式中，得到所述预设的神经网络自编码器，包括:

获取历史港口拖轮作业调度数据，构建数据集；

建立初始神经网络自编码器模型，以所述数据集为输入，调度员的人为习惯分类为输出，迭代训练所述初始神经网络自编码器模型，得到所述预设的神经网络自编码器模型。

在一些可能实现的方式中，所述迭代训练所述初始神经网络自编码器模型，包括：

获取所述数据集的历史港口拖轮作业调度数据，依次输入所述第一编码器中，得到编码信息；

将所述编码信息输入所述第一解码器中，得到解码信息；

检验所述解码信息与输入的历史港口拖轮作业调度数据相似度，并调整所述编码器和解码器的参数使重构误差最小，直到所述解码器输出的解码信息与所述历史港口拖轮作业调度数据相似度达到设定阈值。

在一些可能实现的方式中，所述预设的神经网络融合模型包括第二编码器和第二解码器；所述基于预设的神经网络融合模型对所述理论最优调度方案和习惯特征分类信息进行融合，得到融合最优调度方案，包括：

基于所述第二编码器提取所述理论最优调度计划和习惯特征分类信息的特征向量；

基于所述第二解码器对所述理论最优调度计划和习惯特征分类信息的特征向量进行解码还原，并根据预设的强化学习算法得到融合最优调度方案。

在一些可能实现的方式中，所述根据预设的强化学习算法得到融合最优调度方案，包括：

根据所述预设的强化学习算法的状态、动因、动作和奖励要素将所述港口拖轮作业调度计划中拖轮定义为动因要素，状态要素为所述理论最优调度计划，动作要素为所述调度员的人为习惯特征分类，奖励要素为包含所述调度员的人为习惯特征分类的调度方案，建立一个以状态要素为行、动作要素为列的Q值表，通过每个动作带来的奖励不断更新所述Q值表中的Q值，从而获得理想状态要素下、理想动作要素的Q值，根据所述理想状态要素下、理想动作要素的Q值得到融合最优调度方案。

在一些可能实现的方式中，所述基于预设的调度阈值和所述融合最优调度方案确定目标调度方案，包括：

设定调度阈值，并对比实际调度结果与所述融合最优调度方案的相同率；

当所述相同率高于所述调度阈值时输出目标调度方案；

当所述相同率低于设定阈值时根据预设的网络模型得到目标调度方案。

在一些可能实现的方式中，所述当所述相同率低于设定阈值时根据预设的网络模型得到目标调度方案，包括：

获取历史数据的实际调度结果数据，构建训练集对所述网络模型进行训练，得到所述预设的网络模型；

当所述相同率低于所述调度阈值时将所述调度计划融合最优解输入所述预设的网络模型，得到目标调度方案。

在一些可能实现的方式中，还包括：

设置滚动窗口，实时更新所述港口拖轮作业调度计划，当所述港口拖轮作业调度计划中出现变动时，更新整个学习过程，得到新的目标调度方案。

采用上述实施例的有益效果是：本发明提供的基于人机协同的港口拖轮作业智能调度方法通过遗传算法确定港口拖轮作业调度计划的理论最优调度方案，并根据神经网络自编码器模型得到调度员的人为习惯特征分类，将理论最优调度方案和调度员的人为习惯特征分类进行融合，使得到的融合最优调度方案包含了理论最优调度方案稳定性和调度员与调度方案的协调性，同时设置调度阈值，能够根据调度阈值对方案进行相应调整，进一步增加了调度方案的可行性及稳定性，最后通过设置的滚动窗口，能够根据调度计划中的变动实时更新调度方案，增加了方案的实时性，使得本发明提供的基于人机协同的港口拖轮作业智能调度方法能够兼顾调度计划的稳定性以及与调度人员的协调性，提高拖轮作业的效率，并降低成本。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于人机协调的港口拖轮作业智能调度方法的一个实施例流程示意图；

图2为本发明提供的图一中步骤S101一实施例的流程示意图；

图3为本发明提供的迭代训练初始神经网络自编码器模型一实施例的流程示意图；

图4为本发明提供的图1中步骤S104一实施例的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，示意性的附图并未按实物比例绘制。本发明中使用的流程图示出了根据本发明的一些实施例实现的操作。应当理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本发明内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器系统和/或微控制器系统中实现这些功能实体。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

在实施例描述之前，对相关词语进行释义：

遗传算法（Genetic Algorithm，GA）：该算法是根据大自然中生物体进化规律而设计提出的。是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。该算法通过数学的方式，利用计算机仿真运算，将问题的求解过程转换成类似生物进化中的染色体基因的交叉、变异等过程。在求解较为复杂的组合优化问题时，相对一些常规的优化算法，通常能够较快地获得较好的优化结果。遗传算法已被人们广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域。

Q-Learning算法：是强化学习算法中value-based的算法，Q即为Q（s，a），就是在某一个时刻的state状态下，采取动作a能够获得收益的期望，环境会根据 agent的动作反馈相应的reward奖赏，所以算法的主要思想就是将state和action构建成一张Q_table表来存储Q值，然后根据Q值来选取能够获得最大收益的动作。

基于上述技术名词的描述，现有技术中根据机器学习建立的模型对港口拖轮作业调度计划进行求解得到的结果较为理想化，容易陷入局部最优，不能满足调度人员对复杂调度的业务规则需求，通过人工调度得到的调度计划的调度结果受人为经验影响较大，随机性强稳定性差。本发明旨在提出一种能够兼顾调度计划的稳定性以及与调度人员的协调性的港口拖轮作业智能调度方法。

以下分别对具体实施例进行详细说明：

本发明实施例提供了一种基于人机协调的港口拖轮作业智能调度方法。

如图1所示，图1为本发明提供的基于人机协调的港口拖轮作业智能调度方法的一个实施例流程示意图，基于人机协调的港口拖轮作业智能调度方法包括：

S101、基于预设遗传算法确定港口拖轮作业调度计划的理论最优调度方案；

S102、基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征进行分类，得到习惯特征分类信息；

S103、基于预设的神经网络融合模型对所述理论最优调度方案和习惯特征分类信息进行融合，得到融合最优调度方案；

S104、基于预设的调度阈值和所述融合最优调度方案确定目标调度方案。

与现有技术相比，本发明实施例提供的基于人机协同的港口拖轮作业智能调度方法通过遗传算法确定港口拖轮作业调度计划的理论最优调度方案，并根据神经网络自编码器模型得到调度员的人为习惯特征分类，将理论最优调度方案和调度员的人为习惯特征分类进行融合，使得到的融合最优调度方案包含了理论最优调度方案稳定性和调度员与调度方案的协调性，同时设置调度阈值，能够根据调度阈值对方案进行相应调整，进一步增加了调度方案的可行性及稳定性使得本发明提供的基于人机协同的港口拖轮作业智能调度方法能够兼顾调度计划的稳定性以及与调度人员的协调性，提高拖轮作业的效率，并降低成本。

在本发明的一些实施例中，如图2所示，图2为本发明提供的图一中步骤S101一实施例的流程示意图，步骤S101包括：

S201、对所述港口拖轮作业调度计划中相关元素进行编码，得到编码表格，根据所述编码表格随机生成个体，产生初始种群；

S202、以空驶时间最小为目标定义目标函数，并设定所述目标函数的倒数适应度；

S203、个体选择算子采用锦标赛法，筛选保留满足所述适应度的个体，并选取最优个体；

S204、使用Order Crossover交叉算子，在交叉过程中选取所述最优个体的一对染色体作为父本染色体和母本染色体，以所述父本染色体和母本染色体为基础迭代进行交叉运算并将产生的后代加入到基因集中，并设定交叉率；

S205、使用位置变异法作为变异算子，随机选择所述基因集中的染色体，在所述染色体中随机产生两个位置交换这两个位置的值，并设定变异率；

S206、从所述基因集中得到满足适应度的理论最优调度方案。

在本发明具体的实施例中，根据预设的基于预设遗传算法确定港口拖轮作业调度计划的理论最优调度方案，包括如下步骤：

第一步：获取港口拖轮作业调度计划，对港口拖轮作业调度计划中船舶序号、到达时间、所需拖轮数量、目标泊位和所匹配的拖轮进行编码。根据编码表格中包含的船舶序号、拖轮数量需求、开始时间、船舶初始位置、船舶目标位置等信息作为染色体序列编码元素随机生产个体，产生初始种群。

第二步：解码并计算适应度，本实施例中以为空驶时间最小定义目标函数f，并设定目标函数f的倒数为适应度fitbess：

其中，目标函数f表示拖轮空驶时间最小，即拖轮从拖轮基地或者上一次任务完成位置到达即将服务的船舶位置的行驶时间最小，k表示需要调度的船舶总数量，i表示作业船舶的编号，i=[1，2，3……k]，Ni表示船舶i所需的拖轮数量，m表示拖轮编号，m=[1，2，3……M]，表示作业开始时间，表示船舶目标位置，表示船舶初始位置。

第三步：个体选择算子，采用锦标赛法对所述初始种群中的个体进行选择，其实现策略为从整个种群中随机抽取n个个体让其竞争，若个体i满足适应度条件，则保留，若不满足则抛弃，最后选取最优个体。

第四步：交叉。在交叉过程中，使用Order Crossover（OX）交叉算子，对于一对染色体g1，g2，分别作为父本染色体和母本染色体，在g1序列中随机产生一个起始位置和终止位置，选择g1序列中起始位置到终止位置的序列编码作为初级后代的染色体序列编码，然后将g2中不包含在初级后代的染色体序列编码的其余编码加入到初级后代两侧得到第一后代，交换g1，g2产生第二后代，以所述父本染色体和母本染色体为基础迭代进行交叉运算并将产生的后代加入到基因集中。交叉率设置为0.95。

第五步：变异。为跳出局部最优解，使用位置变异法作为变异算子，即从染色体中随机产生两个位置交换这两个位置的值。变异率设置为0.05。

最后，从基因集中得到满足适应度的最优解即为所述理论最优调度方案。

与现有技术相比，现有技术所建立的模型较为理想化，容易陷入局部最优，不能满足调度人员对复杂调度的业务规则需求。在本发明实施例中，为跳出局部最优解，使用位置变异法作为变异算子，提高后代解的优良性，提高了理论最优调度方案的可靠性。

进一步地，在本方发明的一些实施例中，所述预设的神经网络自编码器模型包括第一编码器和第一解码器；所述基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征进行分类，得到习惯特征分类信息，包括：

基于所述第一编码器提取所述港口拖轮作业调度计划中调度员的人为习惯特征，将所述习惯特征转化为一个N维的特征向量；

得到所述预设的神经网络自编码器，包括：

获取历史港口拖轮作业调度数据，构建数据集；

其中，如图3所示，图3为本发明提供的迭代训练初始神经网络自编码器模型一实施例的流程示意图，迭代训练所述初始神经网络自编码器模型包括：

S301、获取所述数据集的历史港口拖轮作业调度数据，依次输入所述第一编码器中，得到编码信息；

S302、将所述编码信息输入所述第一解码器中，得到解码信息；

S303、检验所述解码信息与输入的历史港口拖轮作业调度数据相似度，并调整所述编码器和解码器的参数使重构误差最小，直到所述解码器输出的解码信息与所述历史港口拖轮作业调度数据相似度达到设定阈值。

在本发明具体的实施例中，基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征分类，包括如下步骤：

第一步，设计一个基于神经网络架构的自编码器模型，包括第一编码器和第一解码器，其中第一编码器，用于提取信息特征，最终将习惯特征转化为一个N维的特征向量。第一解码器用于对特征向量的解码，从而恢复原来的调度信息的内容。

第二步：获取历史港口拖轮作业调度数据，构建数据集，将数据集中包含的船舶名称、作业计划开始时间，拖轮需求（数量及马力），目标泊位等一系列计划信息及匹配拖轮作为输入，如船名：zhenhua31，计划时间：01-20 10：15，拖轮需求2，目标泊位：zhen7，吨位：20000匹配拖轮：T2T6。同时给出被选中拖轮的作业成本，此处的作业成本指的是初始化时从拖轮基地行驶到目标泊位的时间成本，或者是计划中从完成当前作业位置驶往下一作业位置的时间成本。通过自编码器模型提取调度计划中的特征信息。

第三步：将以上相关信息输入自编码器模型进行训练。具体的训练过程是，将输入信息输入第一编码器中，得到一个编码信息，将编码信息输入第一解码器，并检验输出信息是否很接近输入信息，如果第一解码器输出信息与输入信息相似度达到设定阈值，通过调整第一编码器和第一解码器的参数使重构误差最小。

第四步：训练完成后，模型中的第一编码器部分对调度员人为习惯特征信息进行编码。

第五步：通过模型编码，过滤原信息中的噪声及其他背景信息，完成对高维数据的降维操作，即可对调度员的人为习惯进行分类。

本发明实施例通过获取历史港口拖轮作业调度数据，并根据预设的神经网络自编码器模型完成对调度员的人为习惯的分类，并能过滤原信息中的噪声及其他背景信息，完成对高维数据的降维，为后续的调度计划求解提供基础。

进一步地，在本方发明的一些实施例中，所述预设的神经网络融合模型包括第二编码器和第二解码器；所述基于预设的神经网络融合模型对所述理论最优调度方案和习惯特征分类信息进行融合，得到融合最优调度方案，包括：

其中根据预设的强化学习算法得到融合最优调度方案，包括：

在本发明具体的实施例中，基于预设的神经网络融合模型对所述理论最优调度方案和调度员的人为习惯特征分类进行融合，得到融合最优调度方案，包括如下步骤：

第一步，设计一个基于编码器-解码器结构的神经网络模型，包括第二编码器和第二解码器，其中第二编码器，用于提取理论最优调度计划和调度员的人为习惯特征分类的特征向量；第二解码器用于所述理论最优调度计划和调度员的人为习惯特征分类的特征向量进行解码还原。

第二步：获取理论最优调度计划和调度员的人为习惯特征分类，通过编码器-解码器网络模型获取理论最优调度计划和调度员的人为习惯特征分类中的特征信息。

第三步：根据将以上特征信息和预设的强化学习算法进行迭代效率。具体的训练过程是，强化学习算法中包含state（状态）、agent（动因）、action（决策或动作）和reward（奖励）要素，将所述港口拖轮作业调度计划中拖轮定义为动因要素，设定状态要素为所述理论最优调度计划，动作要素为所述调度员的人为习惯特征分类，奖励要素为包含所述调度员的人为习惯特征分类的调度方案，建立一个以状态要素为行、动作要素为列的Q值表，通过每个动作带来的奖励不断更新所述Q值表中的Q值，根据Q值来选取能够获得最大收益的动作，从而获得理想状态要素下、理想动作要素的Q值，根据理想状态要素下、理想动作要素的Q值确定融合最优调度方案。

本发明实施例通过在理论最优调度计划中添加调度员的人为习惯特征，并使用强化学习算法将调度员的人为习惯特征与理论最优调度计划融合，得到考虑人为偏好的拖轮调度计划，得到能够兼顾调度计划的稳定性以及与调度人员的协调性，提高拖轮作业的效率，减少成本。

进一步地，在本方发明的一些实施例中，如图4所示，图4为本发明提供的图1中步骤S104一实施例的流程示意图，步骤S104包括：

S401、设定调度阈值，并对比实际调度结果与所述融合最优调度方案的相同率；

S401、当所述相同率高于所述调度阈值时输出目标调度方案；

S401、当所述相同率低于设定阈值时根据预设的网络模型得到目标调度方案。

其中，当所述相同率低于设定阈值时根据预设的网络模型得到目标调度方案，包括：

在本发明具体的实施例中，基于预设的调度阈值和所述融合最优调度方案确定目标调度方案，包括如下步骤：

首先，构建一个判定结构，根据实际调度结果，对比融合调度计划，并设置调度阈值，当调度计划相同率高于80%时，认为与实际调度计划相符和，直接输出融合调度方案作为目标调度方案，当调度计划相同率低于80%时，即认为与实际调度计划严重不符。

然后，利用历史数据的实际调度结果，获取历史数据的实际调度结果数据，构建训练集对所述网络模型进行训练，得到训练完备的网络模型。

将相同率低于调度阈值的融合调度计划输入训练完备的网络模型，得到目标调度方案。

进一步地，在本发明的一些实施例中，得到目标调度方案后，还包括：设置滚动窗口，实时更新所述港口拖轮作业调度计划，当所述港口拖轮作业调度计划中出现变动时，更新整个学习过程，得到新的目标调度方案。

在本发明具体的实施例中，采用滚动优化策略，设置rolling horizon滚动窗口，可设置为12小时，滚动更新的时间步长可由当地港口特点和到港船舶频率设置，每个时间步长滚动求解一次。具体实现过程为：根据预计到港船舶数据和设置步长，将整个时间区域划分为当前时域T0和下一时域T0+△k，此时△k为优化步长。然后根据到港船舶相关信息及调度员变化信息和调度计划得出当前时域内最优解，并随着时间不断滚动计算。通过滚动窗口的不断更新以实现拖轮调度计划的动态更新，从而得到整体最优调度方案。

需要说明的是，调度员变化信息包括调度员人为偏好转变的或出现新的调度员。

相应地，本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质用于存储计算机可读取的程序或指令，程序或指令被处理器执行时，能够实现上述各方法实施例提供的基于人机协同的港口拖轮作业智能调度方法中的步骤或功能。

本领域技术人员可以理解，实现上述实施例方法的全部或部分流程，可以通过计算机程序来指令相关的硬件（如处理器，控制器等）来完成，计算机程序可存储于计算机可读存储介质中。其中，计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。

以上对本发明所提供的一种基于人机协同的港口拖轮作业智能调度方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于人机协同的港口拖轮作业智能调度方法，其特征在于，包括：

基于预设的调度阈值和所述融合最优调度方案确定目标调度计划；

其中，根据预设的基于预设遗传算法确定港口拖轮作业调度计划的理论最优调度方案，包括如下步骤：

第一步：获取港口拖轮作业调度计划，对港口拖轮作业调度计划中船舶序号、到达时间、所需拖轮数量、目标泊位和所匹配的拖轮进行编码，根据编码表格中包含的船舶序号、拖轮数量需求、开始时间、船舶初始位置、船舶目标位置信息作为染色体序列编码元素随机生产个体，产生初始种群；

第二步：以空驶时间最小为目标定义目标函数f，并设定所述目标函数f的倒数为适应度fitbess：

其中，目标函数f表示拖轮空驶时间最小，即拖轮从拖轮基地或者上一次任务完成位置到达即将服务的船舶位置的行驶时间最小，k表示需要调度的船舶总数量，i表示作业船舶的编号，i=[1，2，3……k]，Ni表示船舶i所需的拖轮数量，m表示拖轮编号，m=[1，2，3……M]，T表示作业开始时间，表示船舶目标位置，表示船舶初始位置；

第三步：基于锦标赛法在所述初始种群中筛选出满足所述适应度的个体作为最优个体；

第四步：使用Order Crossover交叉算子，在交叉过程中选取所述最优个体的一对染色体作为父本染色体和母本染色体，以所述父本染色体和母本染色体为基础迭代进行交叉运算并将产生的后代加入到基因集中，并设定交叉率；

第五步：使用位置变异法作为变异算子，随机选择所述基因集中的染色体，在所述染色体中随机产生两个位置交换这两个位置的值，并设定变异率；

第六步：从所述基因集中得到满足适应度的最优解即为所述理论最优调度方案；

所述基于预设的神经网络融合模型对所述理论最优调度方案和习惯特征分类信息进行融合，得到融合最优调度方案，包括：

所述预设的神经网络融合模型包括第二编码器和第二解码器；

根据所述第二编码器提取所述理论最优调度方案和习惯特征分类信息的特征向量；

根据所述第二解码器对所述理论最优调度方案和习惯特征分类信息的特征向量进行解码还原，并根据预设的强化学习算法得到融合最优调度方案；

所述根据预设的强化学习算法得到融合最优调度方案，包括：

根据所述预设的强化学习算法的状态、动因、动作和奖励要素将所述港口拖轮作业调度计划中拖轮定义为动因要素，状态要素为所述理论最优调度方案，动作要素为所述调度员的人为习惯特征分类，奖励要素为包含所述调度员的人为习惯特征分类的调度计划，建立一个以状态要素为行、动作要素为列的Q值表，通过每个动作带来的奖励不断更新所述Q值表中的Q值，从而获得理想状态要素下、理想动作要素的Q值，根据所述理想状态要素下、理想动作要素的Q值得到融合最优调度方案。

2.根据权利要求1所述的基于人机协同的港口拖轮作业智能调度方法，其特征在于，所述预设的神经网络自编码器模型包括第一编码器和第一解码器；

所述基于预设的神经网络自编码器模型对所述港口拖轮作业调度计划中调度员的人为习惯特征进行分类，得到习惯特征分类信息，包括：

3.根据权利要求2所述的基于人机协同的港口拖轮作业智能调度方法，其特征在于，得到所述预设的神经网络自编码器，包括:

获取历史港口拖轮作业调度数据，构建数据集；

4.根据权利要求3所述的基于人机协同的港口拖轮作业智能调度方法，其特征在于，所述迭代训练所述初始神经网络自编码器模型，包括：

将所述编码信息输入所述第一解码器中，得到解码信息；

5.根据权利要求1所述的基于人机协同的港口拖轮作业智能调度方法，其特征在于，所述基于预设的调度阈值和所述融合最优调度方案确定目标调度计划，包括：

当所述相同率高于所述调度阈值时输出目标调度计划；

当所述相同率低于调度阈值时根据预设的网络模型得到目标调度计划。

6.根据权利要求5所述的基于人机协同的港口拖轮作业智能调度方法，其特征在于，所述当所述相同率低于设定阈值时根据预设的网络模型得到目标调度计划，包括：

当所述相同率低于所述调度阈值时将所述调度计划融合最优解输入所述预设的网络模型，得到目标调度计划。

7.根据权利要求1所述的基于人机协同的港口拖轮作业智能调度方法，其特征在于，还包括：

设置滚动窗口，实时更新所述港口拖轮作业调度计划，当所述港口拖轮作业调度计划中出现变动时，更新整个学习过程，得到新的目标调度计划。