CN117290673A

CN117290673A - 一种基于多模型融合的船舶能耗高精度预测系统

Info

Publication number: CN117290673A
Application number: CN202311158277.2A
Authority: CN
Inventors: 王凯; 国鑫; 王建行; 黄连忠; 马冉祺; 赵俊豪
Original assignee: Dalian Maritime University
Current assignee: Dalian Maritime University
Priority date: 2023-09-08
Filing date: 2023-09-08
Publication date: 2023-12-26

Abstract

本发明公开了一种基于多模型融合的船舶能耗高精度预测系统，包括数据收集与分析模块用于收集并处理船舶能效数据及气象数据，根据特征选择方法对数据进行特征选择；单模型算法船舶能耗预测模块用于构建不同类型的船舶能耗预测模型并进行测试，基于测试结果选取性能优异的模型构成船舶能耗预测模型集；多模型融合船舶能耗预测模块用于通过Stacking模型融合方法将船舶能耗预测模型集中的基础模型进行融合，并采用贝叶斯优化算法和自适应算法优化融合模型，根据优化后的融合模型进行船舶能耗预测；人机交互模块用于对其他模块的分析处理、运行过程以及分析结果进行显示。本发明构建了基于Stacking的船舶能耗预测融合模型，提高了船舶能耗预测融合模型的预测精度。

Description

一种基于多模型融合的船舶能耗高精度预测系统

技术领域

本发明涉及船舶能耗预测应用领域，尤其涉及一种基于多模型融合的船舶能耗高精度预测系统。

背景技术

船舶智能能效管理是实现船舶绿色化和智能化发展的有效途径之一。为开展船舶能耗智能预测方法研究，进一步提高船舶智能能效管理水平，需要开展更加准确、高效的船舶能耗预测方法与技术研究。然而，现有船舶能耗预测模型预测精度低，且没有综合考虑航行气象数据等多变影响因素，从而导致能耗预测模型对航行环境适应性弱，难以实现船舶能耗的精准预测。

发明内容

本发明提供一种基于多模型融合的船舶能耗高精度预测系统，以克服上述技术问题。

一种基于多模型融合的船舶能耗高精度预测系统，包括数据收集与分析模块、单模型算法船舶能耗预测模块、多模型融合船舶能耗预测模块以及人机交互模块，

数据收集与分析模块用于收集船舶能效数据及气象数据，并对船舶能效数据及气象数据进行预处理，根据特征选择方法对预处理后的船舶能效数据和气象数据进行特征选择后得到特征数据集，并将特征数据集按一定比例划分训练集和测试集，

单模型算法船舶能耗预测模块用于分别使用训练集构建不同类型的船舶能耗预测模型并采用测试集进行测试，根据测试结果计算得到不同模型的性能评价指标，根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集，

多模型融合船舶能耗预测模块用于基于Stacking模型融合方法对船舶能耗预测模型集进行融合，并将融合后的模型表示为融合模型，并根据贝叶斯优化算法和自适应算法对融合模型进行参数优化，根据优化后的融合模型对船舶能耗进行预测，

人机交互模块用于显示数据收集与分析模块、单模型算法船舶能耗预测模块以及多模型融合船舶能耗预测模块的分析处理、运行过程以及分析结果。

优选地，所述单模型算法船舶能耗预测模块包括基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元，所述基于统计机器学习的预测模型单元包括基于多元线性回归模型的船舶能耗预测模型、基于支持向量回归的船舶能耗预测模型以及基于K近邻算法的船舶能耗预测模型，所述基于神经网络算法的预测模型单元包括基于BP神经网络的船舶能耗预测模型和基于长短期记忆神经网络的船舶能耗预测模型，所述基于集成学习算法的预测模型单元包括基于决策树的船舶能耗预测模型、基于随机森林算法的船舶能耗预测模型、基于极端梯度提升算法的船舶能耗预测模型、基于极端随机树的船舶能耗预测模型以及基于AdaBoost的船舶能耗预测模型，所述单模型对比分析单元用于根据测试集对不同类型的船舶能耗预测模型进行测试并获取测试结果，根据测试结果计算得到不同模型的性能评价指标，根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集。

优选地，所述根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集包括根据性能评价指标设置目标函数，

根据性能评价指标中的决定系数设置第一约束条件，将满足第一约束条件的船舶能耗预测模型存储至第一过滤模型集中，并分别计算第一过滤模型集中目标函数的取值并按照目标函数取值进行降序排序，

设置第二约束条件，所述第二约束条件为模型的数量约束，根据第二约束条件从第一过滤模型集中依次选择模型并存储至船舶能耗预测模型集中。

优选地，所述根据性能评价指标设置目标函数为根据公式(1)设置目标函数，

式中，R²、MAPE、RMSE、MAE和MSE分别为决定系数、平均绝对百分比误差、均方根误差、平均绝对误差和均方误差；w₁、w₂、w₃、w₄和w₅为不同的权重系数且相加为1。

优选地，所述根据贝叶斯优化算法和自适应算法对融合模型进行参数优化包括，

步骤S1：获取船舶能耗预测模型集中的船舶能耗预测模型并表示为基础模型，

步骤S2：基于Stacking模型融合方法对所获取的基础模型进行融合，并将融合后的模型表示为融合模型，

步骤S3：通过采用贝叶斯优化算法和自适应算法对基础模型的参数域空间内的近似最优超参数组合参数进行调整，

步骤S4：基于得到的基础模型的近似最优超参数组合，将其作为融合模型的参数，得到基于贝叶斯优化算法和自适应算法优化的融合模型。

优选地，所述步骤S2包括构建一个包含两层结构的模型，所述模型的第一层为基础学习层，所述模型的第二层为元学习层，所述基础学习层用于根据特征数据集分别对船舶能耗预测模型集中的船舶能耗预测模型进行K折交叉验证训练并生成新数据集，将新数据集划分为新训练集和新测试集，所述元学习层用于构建元模型并根据新数据集对元模型进行学习，所述学习包括分别根据新训练集和新测试集对元模型进行训练和测试，将训练和测试后的元模型表示为融合模型。

本发明提供一种基于多模型融合的船舶能耗高精度预测系统，设计了目标函数，分别计算不同类型的船舶能耗预测模型的性能评价指标的取值，基于第一约束条件和第二约束条件选择了多种性能较佳的单模型，并根据Stacking模型对性能较佳的单模型进行了融合，构建了基于Stacking框架的船舶能耗预测融合模型，并通过贝叶斯优化算法和自适应算法对融合模型进行了优化，从而提高了船舶能耗预测融合模型的预测精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明系统结构图；

图2是本发明基于多模型融合的船舶能耗高精度预测流程图；

图3是本发明船舶能耗预测模型集构建过程示意图；

图4是本发明Stacking模型框架图；

图5是本发明基于贝叶斯优化融合模型建立过程示意图；

图6是本发明融合模型构建具体实现过程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明系统结构图，如图1所示，本实施例的方法可以包括数据收集与分析模块、单模型算法船舶能耗预测模块、多模型融合船舶能耗预测模块，以及人机交互模块，

本发明提供一种基于多模型融合的船舶能耗高精度预测系统，设计了目标函数，分别计算不同类型的船舶能耗预测模型的性能评价指标的取值，基于第一约束条件和第二约束条件选择了多种性能较佳的单模型，根据Stacking模型对性能较佳的单模型进行了融合，构建了基于Stacking的船舶能耗预测融合模型，并根据贝叶斯优化算法和自适应算法对融合模型进行了优化，从而提高了船舶能耗预测融合模型的预测精度。

具体地，本实施例给出了基于多模型融合的船舶能耗高精度预测系统的详细介绍，其中数据收集与分析模块可以划分为数据收集单元、数据预处理单元以及数据分析单元，单模型算法船舶能耗预测模块可以划分为基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元，多模型融合船舶能耗预测模块包括自适应融合模型、贝叶斯优化融合模型以及多模型融合，人机交互模块可以划分为显示单元、管理单元以及操作单元，本发明的预测流程如图2所示。

数据收集与分析模块用于收集船舶能效数据及气象数据，并对船舶能效数据及气象数据进行预处理，根据特征选择方法对预处理后的船舶能效数据和气象数据进行特征选择，所述数据收集与分析模块包括数据收集单元、数据预处理单元以及数据分析单元，所述数据收集单元用于通过在安装在船舶上的多源传感器获取船舶能效数据，并根据欧洲中期天气预报中心获取气象数据，具体地，通过安装在船上的多源传感器收集船舶在航行过程中如经纬度、航速、航向、吃水、主机转速、功率、燃料油量等营运数据，通过欧洲中期天气预报中心收集风速、风向和特征波高等气象数据。

所述数据预处理单元用于对船舶能效数据和气象数据进行预处理，所述预处理包括异常值清洗、特征选择、标准化、量纲消除和数据缩放，所述数据分析单元用于对预处理后的船舶能效数据和气象数据进行归一化和相关性分析后表示为第一数据集，根据Pearson相关系数法，从第一数据集中选择与船舶能耗具有较高相关系数的特征组成特征数据集，并按一定比例划分训练集和测试集，其中，数据归一化处理采用Min-max方法，将船舶能效数据映射到[0,1]区间，对已知船舶能耗数据进行变换，具体的公式(1)如下：

式中：x_min表示样本数据最小值；x_max表示样本数据最大值；x_k表示样本数据任意值；表示任意数归一化后的值。

相关性分析采用Pearson相关系数法，对船舶能耗与各输入特征之间的相关性进行分析，具体的公式(2)如下：

式中：分别代表样本特征x、y的平均值；x_i指第i个样本特征x的值；y_i指第i个样本特征y的值；n表示特征对应的样本数量；r表示相关系数，用以衡量特征x与特征y的相关程度。r处于-1＜r＜1的范围内，r＞0是正相关，r＜0是负相关。

单模型算法船舶能耗预测模块用于分别使用训练集数据构建不同类型的船舶能耗预测模型，并根据测试集数据的测试结果计算得到不同模型的性能评价指标，根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集，

所述单模型算法船舶能耗预测模块包括基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元。

所述基于统计机器学习的预测模型单元包括基于多元线性回归模型的船舶能耗预测模型、基于支持向量回归的船舶能耗预测模型以及基于K近邻算法的船舶能耗预测模型。

所述基于神经网络算法的预测模型单元包括基于BP神经网络的船舶能耗预测模型和基于长短期记忆神经网络的船舶能耗预测模型。

所述基于集成学习算法的预测模型单元包括基于决策树的船舶能耗预测模型、基于随机森林算法的船舶能耗预测模型、基于极端梯度提升算法的船舶能耗预测模型、基于极端随机树的船舶能耗预测模型以及基于AdaBoost的船舶能耗预测模型。

所述单模型对比分析单元用于根据测试集对不同类型的船舶能耗预测模型进行测试并获取测试结果，根据测试结果计算得到不同模型的性能评价指标，根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集，所述根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集包括根据性能评价指标设置目标函数，所述根据性能评价指标设置目标函数为根据公式(3)设置目标函数，

式中，R²、MAPE、RMSE、MAE和MSE分别为决定系数、平均绝对百分比误差、均方根误差、平均绝对误差和均方误差；w₁、w₂、w₃、w₄和w₅为不同的权重系数且相加为1。这些指标的相对重要性根据对模型要求有所不同。因此，在综合考虑模型的预测准确性和泛化性后，对指标权重赋值后如公式(4)所示：

根据性能评价指标中的决定系数设置第一约束条件，将满足第一约束条件的船舶能耗预测模型存储至第一过滤模型集中，分别计算第一过滤模型集中目标函数的取值并按照目标函数取值进行降序排序，

船舶能耗预测模型集构建过程如图3所示，步骤为：

步骤1：选取多个候选基础模型进行训练评估，计算得到的每个模型的综合评价指标S和决定系数R²值储存到第一过滤模型集-样式字典DataFrame中；

步骤2：根据R²约束条件，考虑模型预测精度尽量高，筛选出R²大于等于0.9的模型，将它们按照综合评价指标S大小进行降序排序；

步骤3：根据模型数量约束条件，依次选出满足条件的S值最大的前n个模型，本实施例中n值为4；

步骤4：基于所有选出的模型构成船舶能耗预测模型集。

多模型融合船舶能耗预测模块用于基于Stacking模型融合方法对船舶能耗预测模型集进行融合后表示为融合模型，其模型框架图如图4所示，所述基于Stacking模型融合方法对船舶能耗预测模型集进行融合后表示为融合模型包括构建一个包含两层结构的模型，所述模型的第一层为基础学习层，所述模型的第二层为元学习层，所述基础学习层用于根据特征数据集分别对船舶能耗预测模型集中的船舶能耗预测模型进行K折交叉验证训练并生成新数据集，将新数据集划分为新训练集和新测试集，所述元学习层用于构建元模型，根据新训练集和新测试集对元模型进行训练和测试，将训练和测试后的元模型表示为融合模型。为避免过拟合，采用K折交叉验证训练，其优点在于兼顾数据集中样本的特性，每次划分的子训练集和验证集不存在重复学习的情况，从而减少了过拟合的概率，提高融合后模型的性能。本实施例中K的取值为5。

并根据贝叶斯优化算法和自适应算法对融合模型进行参数优化，所述根据贝叶斯优化算法和自适应算法对融合模型进行参数优化包括，

步骤S2：基于Stacking模型融合方法对所获取的基础模型进行融合并将融合后的模型表示为融合模型，

步骤S3：通过采用贝叶斯优化算法和自适应算法对基础模型在参数域空间内的近似最优超参数组合参数进行调整；基于贝叶斯优化的融合模型建立过程如图5所示，步骤S3可以划分为以下过程：

S31、根据基础模型M₁-M₅的参数域空间和超参数组合数目θ₁-θ_n，随机产生初始化样本点x_i作为高斯模型的输入，将训练集作为基础模型的输入，利用基础模型在验证集上的y_i值(即1-S值)和样本点x_i对高斯模型进行修正，使高斯模型更接近函数真实分布；

S32、利用采样函数从修正后的高斯模型选择下一步要评估的参数组合点x_i，使得高斯模型相对于其他候选集可以更加快速准确的接近目标函数的真实分布，所述采样函数可以为：期望提升策略采样函数、概率提升策略采样函数、高斯过程上置信边界策略采样函数、基于信息的汤普森采样函数和熵增加策略采样函数；

S33、将新的x_i和y_i输入到高斯模型中，跳转至S32，对高斯过程进行修正；基于自适应算法重新选择下一个评估点，直到终止条件，所述终止条件为适应度函数的取值满足阈值；此刻，最小的y_i所对应的x_i值即为参数域空间内最优的超参数组合，从而获得基础模型M₁-M₅的近似最优超参数组合；

步骤S4：基于得到的基础模型M₁-M₅的近似最优超参数组合，将其作为融合模型的参数，得到基于贝叶斯优化算法和自适应算法优化的融合模型。

根据优化后的融合模型对船舶能耗进行预测。

具体地，融合模型构建具体实现过程示意图如图6所示，主要包括以下步骤：

步骤A1：选择基础模型。通过基础模型选择策略选择出多个基础模型M₁、M₂、……、M_n；

步骤A2：数据划分。将处理好的船舶能效数据D按照8:2比例划分为训练集X和测试集C，采用交叉验证的方法将训练数据集X分为互不交叉的5份，记P₁～P₅；

步骤A3：一次交叉验证的过程。基于训练集P₁-P₄训练生成的模型A₁对测试集P₅进行预测；

步骤A4：单模型交叉验证过程。在第一次交叉验证完成之后，将得到当前测试集P₅的预测值，记为r₁；以此类推，最终将得到r₂，r₃，r₄，r₅，求其平均值组成一个对训练集X的预测值矩阵，记为R₁。将得到在整个交叉验证完成之后，模型A₁对原始数据集的测试集C进行预测得到预测值，记为s₁；以此类推，得到s₂，s₃，s₄，s₅，再取平均值，得到S₁；

步骤A5：每个模型重复以上步骤A4，得到R₂，R₃，R₄，R₅和S₂，S₃，S₄，S₅矩阵。将R₁-R₅模型组成新的训练集X_x，S₁-S₅组成新的测试集C_c；

步骤A6：元模型训练。第二层中将新的训练集X_x输入到下一层的元模型RR模型训练。元模型RR模型通过学习训练集，给基础模型的预测结果赋予权重，从而使预测结果更为准确，训练过程结束，融合后得到最终融合模型；

步骤A7：模型预测。基于新的测试集C_c采用经过训练的元模型进行预测，并作为最终的预测结果输出。

人机交互模块用于显示数据收集与分析模块、单模型算法船舶能耗预测模块以及多模型融合船舶能耗预测模块的分析处理、运行过程以及分析结果，所述人机交互模块包括显示单元、管理单元以及操作单元，所述显示单元用于在显示设备上进行显示，所述管理单元用于确定可进行显示的信息，所述操作单元用于将管理单元确定的信息通过显示单元进行显示。

一种基于多模型融合的船舶能耗高精度预测方法，包括以下步骤：

步骤1-1：通过数据收集与分析模块收集相关数据并预处理后，并进行相关性分析选择合适的特征值传输至单模型算法船舶能耗预测模块；

步骤1-2：通过单模型算法船舶能耗预测模块接收所述数据收集与分析模块选择的数据，进行单模型的测试，并对比分析不同模型的性能，挑选出表现较优的多个模型构建船舶能耗预测模型集；

步骤1-3：多模型融合船舶能耗预测模块通过Stacking模型融合方法，将基于单模型算法船舶能耗预测模块构建船舶能耗预测模型集中的基础模型进行融合，形成融合模型，然后，利用贝叶斯优化算法和自适应算法优化融合模型，根据优化后的融合模型对船舶能耗进行预测。

整体的有益效果：

本发明提供一种基于多模型融合的船舶能耗高精度预测系统，设计了目标函数，分别计算获得不同类型的船舶能耗预测模型的性能评价指标值，基于第一约束条件和第二约束条件选择了多种性能较佳的基础模型，根据Stacking模型对性能较佳的基础模型进行了融合，构建了基于Stacking的船舶能耗预测融合模型，并根据贝叶斯优化算法和自适应算法对融合模型进行了优化，从而提高了船舶能耗预测融合模型的预测精度。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于多模型融合的船舶能耗高精度预测系统，其特征在于，包括数据收集与分析模块、单模型算法船舶能耗预测模块、多模型融合船舶能耗预测模块以及人机交互模块，

2.根据权利要求1所述的一种基于多模型融合的船舶能耗高精度预测系统，其特征在于，所述单模型算法船舶能耗预测模块包括基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元，所述基于统计机器学习的预测模型单元包括基于多元线性回归模型的船舶能耗预测模型、基于支持向量回归的船舶能耗预测模型以及基于K近邻算法的船舶能耗预测模型，所述基于神经网络算法的预测模型单元包括基于BP神经网络的船舶能耗预测模型和基于长短期记忆神经网络的船舶能耗预测模型，所述基于集成学习算法的预测模型单元包括基于决策树的船舶能耗预测模型、基于随机森林算法的船舶能耗预测模型、基于极端梯度提升算法的船舶能耗预测模型、基于极端随机树的船舶能耗预测模型以及基于AdaBoost的船舶能耗预测模型，所述单模型对比分析单元用于根据测试集对不同类型的船舶能耗预测模型进行测试并获取测试结果，根据测试结果计算得到不同模型的性能评价指标，根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集。

3.根据权利要求1所述的一种基于多模型融合的船舶能耗高精度预测系统，其特征在于，所述根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集包括根据性能评价指标设置目标函数，

4.根据权利要求3所述的一种基于多模型融合的船舶能耗高精度预测系统，其特征在于，所述根据性能评价指标设置目标函数为根据公式(1)设置目标函数，

5.根据权利要求1所述的一种基于多模型融合的船舶能耗高精度预测系统，其特征在于，所述根据贝叶斯优化算法和自适应算法对融合模型进行参数优化包括，

6.根据权利要求5所述的一种基于多模型融合的船舶能耗高精度预测系统，其特征在于，所述步骤S2包括构建一个包含两层结构的模型，所述模型的第一层为基础学习层，所述模型的第二层为元学习层，所述基础学习层用于根据特征数据集分别对船舶能耗预测模型集中的船舶能耗预测模型进行K折交叉验证训练并生成新数据集，将新数据集划分为新训练集和新测试集，所述元学习层用于构建元模型并根据新数据集对元模型进行学习，所述学习包括分别根据新训练集和新测试集对元模型进行训练和测试，将训练和测试后的元模型表示为融合模型。