CN117290673A - 一种基于多模型融合的船舶能耗高精度预测系统 - Google Patents
一种基于多模型融合的船舶能耗高精度预测系统 Download PDFInfo
- Publication number
- CN117290673A CN117290673A CN202311158277.2A CN202311158277A CN117290673A CN 117290673 A CN117290673 A CN 117290673A CN 202311158277 A CN202311158277 A CN 202311158277A CN 117290673 A CN117290673 A CN 117290673A
- Authority
- CN
- China
- Prior art keywords
- model
- energy consumption
- ship energy
- consumption prediction
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 158
- 230000004927 fusion Effects 0.000 title claims abstract description 85
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 78
- 238000012360 testing method Methods 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000005457 optimization Methods 0.000 claims abstract description 25
- 238000007405 data analysis Methods 0.000 claims abstract description 22
- 238000013480 data collection Methods 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 238000007500 overflow downdraw method Methods 0.000 claims abstract description 11
- 230000003993 interaction Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000010187 selection method Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 38
- 238000011156 evaluation Methods 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 7
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 3
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多模型融合的船舶能耗高精度预测系统,包括数据收集与分析模块用于收集并处理船舶能效数据及气象数据,根据特征选择方法对数据进行特征选择;单模型算法船舶能耗预测模块用于构建不同类型的船舶能耗预测模型并进行测试,基于测试结果选取性能优异的模型构成船舶能耗预测模型集;多模型融合船舶能耗预测模块用于通过Stacking模型融合方法将船舶能耗预测模型集中的基础模型进行融合,并采用贝叶斯优化算法和自适应算法优化融合模型,根据优化后的融合模型进行船舶能耗预测;人机交互模块用于对其他模块的分析处理、运行过程以及分析结果进行显示。本发明构建了基于Stacking的船舶能耗预测融合模型,提高了船舶能耗预测融合模型的预测精度。
Description
技术领域
本发明涉及船舶能耗预测应用领域,尤其涉及一种基于多模型融合的船舶能耗高精度预测系统。
背景技术
船舶智能能效管理是实现船舶绿色化和智能化发展的有效途径之一。为开展船舶能耗智能预测方法研究,进一步提高船舶智能能效管理水平,需要开展更加准确、高效的船舶能耗预测方法与技术研究。然而,现有船舶能耗预测模型预测精度低,且没有综合考虑航行气象数据等多变影响因素,从而导致能耗预测模型对航行环境适应性弱,难以实现船舶能耗的精准预测。
发明内容
本发明提供一种基于多模型融合的船舶能耗高精度预测系统,以克服上述技术问题。
一种基于多模型融合的船舶能耗高精度预测系统,包括数据收集与分析模块、单模型算法船舶能耗预测模块、多模型融合船舶能耗预测模块以及人机交互模块,
数据收集与分析模块用于收集船舶能效数据及气象数据,并对船舶能效数据及气象数据进行预处理,根据特征选择方法对预处理后的船舶能效数据和气象数据进行特征选择后得到特征数据集,并将特征数据集按一定比例划分训练集和测试集,
单模型算法船舶能耗预测模块用于分别使用训练集构建不同类型的船舶能耗预测模型并采用测试集进行测试,根据测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集,
多模型融合船舶能耗预测模块用于基于Stacking模型融合方法对船舶能耗预测模型集进行融合,并将融合后的模型表示为融合模型,并根据贝叶斯优化算法和自适应算法对融合模型进行参数优化,根据优化后的融合模型对船舶能耗进行预测,
人机交互模块用于显示数据收集与分析模块、单模型算法船舶能耗预测模块以及多模型融合船舶能耗预测模块的分析处理、运行过程以及分析结果。
优选地,所述单模型算法船舶能耗预测模块包括基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元,所述基于统计机器学习的预测模型单元包括基于多元线性回归模型的船舶能耗预测模型、基于支持向量回归的船舶能耗预测模型以及基于K近邻算法的船舶能耗预测模型,所述基于神经网络算法的预测模型单元包括基于BP神经网络的船舶能耗预测模型和基于长短期记忆神经网络的船舶能耗预测模型,所述基于集成学习算法的预测模型单元包括基于决策树的船舶能耗预测模型、基于随机森林算法的船舶能耗预测模型、基于极端梯度提升算法的船舶能耗预测模型、基于极端随机树的船舶能耗预测模型以及基于AdaBoost的船舶能耗预测模型,所述单模型对比分析单元用于根据测试集对不同类型的船舶能耗预测模型进行测试并获取测试结果,根据测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集。
优选地,所述根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集包括根据性能评价指标设置目标函数,
根据性能评价指标中的决定系数设置第一约束条件,将满足第一约束条件的船舶能耗预测模型存储至第一过滤模型集中,并分别计算第一过滤模型集中目标函数的取值并按照目标函数取值进行降序排序,
设置第二约束条件,所述第二约束条件为模型的数量约束,根据第二约束条件从第一过滤模型集中依次选择模型并存储至船舶能耗预测模型集中。
优选地,所述根据性能评价指标设置目标函数为根据公式(1)设置目标函数,
式中,R2、MAPE、RMSE、MAE和MSE分别为决定系数、平均绝对百分比误差、均方根误差、平均绝对误差和均方误差;w1、w2、w3、w4和w5为不同的权重系数且相加为1。
优选地,所述根据贝叶斯优化算法和自适应算法对融合模型进行参数优化包括,
步骤S1:获取船舶能耗预测模型集中的船舶能耗预测模型并表示为基础模型,
步骤S2:基于Stacking模型融合方法对所获取的基础模型进行融合,并将融合后的模型表示为融合模型,
步骤S3:通过采用贝叶斯优化算法和自适应算法对基础模型的参数域空间内的近似最优超参数组合参数进行调整,
步骤S4:基于得到的基础模型的近似最优超参数组合,将其作为融合模型的参数,得到基于贝叶斯优化算法和自适应算法优化的融合模型。
优选地,所述步骤S2包括构建一个包含两层结构的模型,所述模型的第一层为基础学习层,所述模型的第二层为元学习层,所述基础学习层用于根据特征数据集分别对船舶能耗预测模型集中的船舶能耗预测模型进行K折交叉验证训练并生成新数据集,将新数据集划分为新训练集和新测试集,所述元学习层用于构建元模型并根据新数据集对元模型进行学习,所述学习包括分别根据新训练集和新测试集对元模型进行训练和测试,将训练和测试后的元模型表示为融合模型。
本发明提供一种基于多模型融合的船舶能耗高精度预测系统,设计了目标函数,分别计算不同类型的船舶能耗预测模型的性能评价指标的取值,基于第一约束条件和第二约束条件选择了多种性能较佳的单模型,并根据Stacking模型对性能较佳的单模型进行了融合,构建了基于Stacking框架的船舶能耗预测融合模型,并通过贝叶斯优化算法和自适应算法对融合模型进行了优化,从而提高了船舶能耗预测融合模型的预测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明系统结构图;
图2是本发明基于多模型融合的船舶能耗高精度预测流程图;
图3是本发明船舶能耗预测模型集构建过程示意图;
图4是本发明Stacking模型框架图;
图5是本发明基于贝叶斯优化融合模型建立过程示意图;
图6是本发明融合模型构建具体实现过程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明系统结构图,如图1所示,本实施例的方法可以包括数据收集与分析模块、单模型算法船舶能耗预测模块、多模型融合船舶能耗预测模块,以及人机交互模块,
数据收集与分析模块用于收集船舶能效数据及气象数据,并对船舶能效数据及气象数据进行预处理,根据特征选择方法对预处理后的船舶能效数据和气象数据进行特征选择后得到特征数据集,并将特征数据集按一定比例划分训练集和测试集,
单模型算法船舶能耗预测模块用于分别使用训练集构建不同类型的船舶能耗预测模型并采用测试集进行测试,根据测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集,
多模型融合船舶能耗预测模块用于基于Stacking模型融合方法对船舶能耗预测模型集进行融合,并将融合后的模型表示为融合模型,并根据贝叶斯优化算法和自适应算法对融合模型进行参数优化,根据优化后的融合模型对船舶能耗进行预测,
人机交互模块用于显示数据收集与分析模块、单模型算法船舶能耗预测模块以及多模型融合船舶能耗预测模块的分析处理、运行过程以及分析结果。
本发明提供一种基于多模型融合的船舶能耗高精度预测系统,设计了目标函数,分别计算不同类型的船舶能耗预测模型的性能评价指标的取值,基于第一约束条件和第二约束条件选择了多种性能较佳的单模型,根据Stacking模型对性能较佳的单模型进行了融合,构建了基于Stacking的船舶能耗预测融合模型,并根据贝叶斯优化算法和自适应算法对融合模型进行了优化,从而提高了船舶能耗预测融合模型的预测精度。
具体地,本实施例给出了基于多模型融合的船舶能耗高精度预测系统的详细介绍,其中数据收集与分析模块可以划分为数据收集单元、数据预处理单元以及数据分析单元,单模型算法船舶能耗预测模块可以划分为基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元,多模型融合船舶能耗预测模块包括自适应融合模型、贝叶斯优化融合模型以及多模型融合,人机交互模块可以划分为显示单元、管理单元以及操作单元,本发明的预测流程如图2所示。
数据收集与分析模块用于收集船舶能效数据及气象数据,并对船舶能效数据及气象数据进行预处理,根据特征选择方法对预处理后的船舶能效数据和气象数据进行特征选择,所述数据收集与分析模块包括数据收集单元、数据预处理单元以及数据分析单元,所述数据收集单元用于通过在安装在船舶上的多源传感器获取船舶能效数据,并根据欧洲中期天气预报中心获取气象数据,具体地,通过安装在船上的多源传感器收集船舶在航行过程中如经纬度、航速、航向、吃水、主机转速、功率、燃料油量等营运数据,通过欧洲中期天气预报中心收集风速、风向和特征波高等气象数据。
所述数据预处理单元用于对船舶能效数据和气象数据进行预处理,所述预处理包括异常值清洗、特征选择、标准化、量纲消除和数据缩放,所述数据分析单元用于对预处理后的船舶能效数据和气象数据进行归一化和相关性分析后表示为第一数据集,根据Pearson相关系数法,从第一数据集中选择与船舶能耗具有较高相关系数的特征组成特征数据集,并按一定比例划分训练集和测试集,其中,数据归一化处理采用Min-max方法,将船舶能效数据映射到[0,1]区间,对已知船舶能耗数据进行变换,具体的公式(1)如下:
式中:xmin表示样本数据最小值;xmax表示样本数据最大值;xk表示样本数据任意值;表示任意数归一化后的值。
相关性分析采用Pearson相关系数法,对船舶能耗与各输入特征之间的相关性进行分析,具体的公式(2)如下:
式中:分别代表样本特征x、y的平均值;xi指第i个样本特征x的值;yi指第i个样本特征y的值;n表示特征对应的样本数量;r表示相关系数,用以衡量特征x与特征y的相关程度。r处于-1<r<1的范围内,r>0是正相关,r<0是负相关。
单模型算法船舶能耗预测模块用于分别使用训练集数据构建不同类型的船舶能耗预测模型,并根据测试集数据的测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集,
所述单模型算法船舶能耗预测模块包括基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元。
所述基于统计机器学习的预测模型单元包括基于多元线性回归模型的船舶能耗预测模型、基于支持向量回归的船舶能耗预测模型以及基于K近邻算法的船舶能耗预测模型。
所述基于神经网络算法的预测模型单元包括基于BP神经网络的船舶能耗预测模型和基于长短期记忆神经网络的船舶能耗预测模型。
所述基于集成学习算法的预测模型单元包括基于决策树的船舶能耗预测模型、基于随机森林算法的船舶能耗预测模型、基于极端梯度提升算法的船舶能耗预测模型、基于极端随机树的船舶能耗预测模型以及基于AdaBoost的船舶能耗预测模型。
所述单模型对比分析单元用于根据测试集对不同类型的船舶能耗预测模型进行测试并获取测试结果,根据测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集,所述根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集包括根据性能评价指标设置目标函数,所述根据性能评价指标设置目标函数为根据公式(3)设置目标函数,
式中,R2、MAPE、RMSE、MAE和MSE分别为决定系数、平均绝对百分比误差、均方根误差、平均绝对误差和均方误差;w1、w2、w3、w4和w5为不同的权重系数且相加为1。这些指标的相对重要性根据对模型要求有所不同。因此,在综合考虑模型的预测准确性和泛化性后,对指标权重赋值后如公式(4)所示:
根据性能评价指标中的决定系数设置第一约束条件,将满足第一约束条件的船舶能耗预测模型存储至第一过滤模型集中,分别计算第一过滤模型集中目标函数的取值并按照目标函数取值进行降序排序,
设置第二约束条件,所述第二约束条件为模型的数量约束,根据第二约束条件从第一过滤模型集中依次选择模型并存储至船舶能耗预测模型集中。
船舶能耗预测模型集构建过程如图3所示,步骤为:
步骤1:选取多个候选基础模型进行训练评估,计算得到的每个模型的综合评价指标S和决定系数R2值储存到第一过滤模型集-样式字典DataFrame中;
步骤2:根据R2约束条件,考虑模型预测精度尽量高,筛选出R2大于等于0.9的模型,将它们按照综合评价指标S大小进行降序排序;
步骤3:根据模型数量约束条件,依次选出满足条件的S值最大的前n个模型,本实施例中n值为4;
步骤4:基于所有选出的模型构成船舶能耗预测模型集。
多模型融合船舶能耗预测模块用于基于Stacking模型融合方法对船舶能耗预测模型集进行融合后表示为融合模型,其模型框架图如图4所示,所述基于Stacking模型融合方法对船舶能耗预测模型集进行融合后表示为融合模型包括构建一个包含两层结构的模型,所述模型的第一层为基础学习层,所述模型的第二层为元学习层,所述基础学习层用于根据特征数据集分别对船舶能耗预测模型集中的船舶能耗预测模型进行K折交叉验证训练并生成新数据集,将新数据集划分为新训练集和新测试集,所述元学习层用于构建元模型,根据新训练集和新测试集对元模型进行训练和测试,将训练和测试后的元模型表示为融合模型。为避免过拟合,采用K折交叉验证训练,其优点在于兼顾数据集中样本的特性,每次划分的子训练集和验证集不存在重复学习的情况,从而减少了过拟合的概率,提高融合后模型的性能。本实施例中K的取值为5。
并根据贝叶斯优化算法和自适应算法对融合模型进行参数优化,所述根据贝叶斯优化算法和自适应算法对融合模型进行参数优化包括,
步骤S1:获取船舶能耗预测模型集中的船舶能耗预测模型并表示为基础模型,
步骤S2:基于Stacking模型融合方法对所获取的基础模型进行融合并将融合后的模型表示为融合模型,
步骤S3:通过采用贝叶斯优化算法和自适应算法对基础模型在参数域空间内的近似最优超参数组合参数进行调整;基于贝叶斯优化的融合模型建立过程如图5所示,步骤S3可以划分为以下过程:
S31、根据基础模型M1-M5的参数域空间和超参数组合数目θ1-θn,随机产生初始化样本点xi作为高斯模型的输入,将训练集作为基础模型的输入,利用基础模型在验证集上的yi值(即1-S值)和样本点xi对高斯模型进行修正,使高斯模型更接近函数真实分布;
S32、利用采样函数从修正后的高斯模型选择下一步要评估的参数组合点xi,使得高斯模型相对于其他候选集可以更加快速准确的接近目标函数的真实分布,所述采样函数可以为:期望提升策略采样函数、概率提升策略采样函数、高斯过程上置信边界策略采样函数、基于信息的汤普森采样函数和熵增加策略采样函数;
S33、将新的xi和yi输入到高斯模型中,跳转至S32,对高斯过程进行修正;基于自适应算法重新选择下一个评估点,直到终止条件,所述终止条件为适应度函数的取值满足阈值;此刻,最小的yi所对应的xi值即为参数域空间内最优的超参数组合,从而获得基础模型M1-M5的近似最优超参数组合;
步骤S4:基于得到的基础模型M1-M5的近似最优超参数组合,将其作为融合模型的参数,得到基于贝叶斯优化算法和自适应算法优化的融合模型。
根据优化后的融合模型对船舶能耗进行预测。
具体地,融合模型构建具体实现过程示意图如图6所示,主要包括以下步骤:
步骤A1:选择基础模型。通过基础模型选择策略选择出多个基础模型M1、M2、……、Mn;
步骤A2:数据划分。将处理好的船舶能效数据D按照8:2比例划分为训练集X和测试集C,采用交叉验证的方法将训练数据集X分为互不交叉的5份,记P1~P5;
步骤A3:一次交叉验证的过程。基于训练集P1-P4训练生成的模型A1对测试集P5进行预测;
步骤A4:单模型交叉验证过程。在第一次交叉验证完成之后,将得到当前测试集P5的预测值,记为r1;以此类推,最终将得到r2,r3,r4,r5,求其平均值组成一个对训练集X的预测值矩阵,记为R1。将得到在整个交叉验证完成之后,模型A1对原始数据集的测试集C进行预测得到预测值,记为s1;以此类推,得到s2,s3,s4,s5,再取平均值,得到S1;
步骤A5:每个模型重复以上步骤A4,得到R2,R3,R4,R5和S2,S3,S4,S5矩阵。将R1-R5模型组成新的训练集Xx,S1-S5组成新的测试集Cc;
步骤A6:元模型训练。第二层中将新的训练集Xx输入到下一层的元模型RR模型训练。元模型RR模型通过学习训练集,给基础模型的预测结果赋予权重,从而使预测结果更为准确,训练过程结束,融合后得到最终融合模型;
步骤A7:模型预测。基于新的测试集Cc采用经过训练的元模型进行预测,并作为最终的预测结果输出。
人机交互模块用于显示数据收集与分析模块、单模型算法船舶能耗预测模块以及多模型融合船舶能耗预测模块的分析处理、运行过程以及分析结果,所述人机交互模块包括显示单元、管理单元以及操作单元,所述显示单元用于在显示设备上进行显示,所述管理单元用于确定可进行显示的信息,所述操作单元用于将管理单元确定的信息通过显示单元进行显示。
一种基于多模型融合的船舶能耗高精度预测方法,包括以下步骤:
步骤1-1:通过数据收集与分析模块收集相关数据并预处理后,并进行相关性分析选择合适的特征值传输至单模型算法船舶能耗预测模块;
步骤1-2:通过单模型算法船舶能耗预测模块接收所述数据收集与分析模块选择的数据,进行单模型的测试,并对比分析不同模型的性能,挑选出表现较优的多个模型构建船舶能耗预测模型集;
步骤1-3:多模型融合船舶能耗预测模块通过Stacking模型融合方法,将基于单模型算法船舶能耗预测模块构建船舶能耗预测模型集中的基础模型进行融合,形成融合模型,然后,利用贝叶斯优化算法和自适应算法优化融合模型,根据优化后的融合模型对船舶能耗进行预测。
整体的有益效果:
本发明提供一种基于多模型融合的船舶能耗高精度预测系统,设计了目标函数,分别计算获得不同类型的船舶能耗预测模型的性能评价指标值,基于第一约束条件和第二约束条件选择了多种性能较佳的基础模型,根据Stacking模型对性能较佳的基础模型进行了融合,构建了基于Stacking的船舶能耗预测融合模型,并根据贝叶斯优化算法和自适应算法对融合模型进行了优化,从而提高了船舶能耗预测融合模型的预测精度。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (6)
1.一种基于多模型融合的船舶能耗高精度预测系统,其特征在于,包括数据收集与分析模块、单模型算法船舶能耗预测模块、多模型融合船舶能耗预测模块以及人机交互模块,
数据收集与分析模块用于收集船舶能效数据及气象数据,并对船舶能效数据及气象数据进行预处理,根据特征选择方法对预处理后的船舶能效数据和气象数据进行特征选择后得到特征数据集,并将特征数据集按一定比例划分训练集和测试集,
单模型算法船舶能耗预测模块用于分别使用训练集构建不同类型的船舶能耗预测模型并采用测试集进行测试,根据测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集,
多模型融合船舶能耗预测模块用于基于Stacking模型融合方法对船舶能耗预测模型集进行融合,并将融合后的模型表示为融合模型,并根据贝叶斯优化算法和自适应算法对融合模型进行参数优化,根据优化后的融合模型对船舶能耗进行预测,
人机交互模块用于显示数据收集与分析模块、单模型算法船舶能耗预测模块以及多模型融合船舶能耗预测模块的分析处理、运行过程以及分析结果。
2.根据权利要求1所述的一种基于多模型融合的船舶能耗高精度预测系统,其特征在于,所述单模型算法船舶能耗预测模块包括基于统计机器学习的预测模型单元、基于神经网络算法的预测模型单元、基于集成学习算法的预测模型单元以及单模型对比分析单元,所述基于统计机器学习的预测模型单元包括基于多元线性回归模型的船舶能耗预测模型、基于支持向量回归的船舶能耗预测模型以及基于K近邻算法的船舶能耗预测模型,所述基于神经网络算法的预测模型单元包括基于BP神经网络的船舶能耗预测模型和基于长短期记忆神经网络的船舶能耗预测模型,所述基于集成学习算法的预测模型单元包括基于决策树的船舶能耗预测模型、基于随机森林算法的船舶能耗预测模型、基于极端梯度提升算法的船舶能耗预测模型、基于极端随机树的船舶能耗预测模型以及基于AdaBoost的船舶能耗预测模型,所述单模型对比分析单元用于根据测试集对不同类型的船舶能耗预测模型进行测试并获取测试结果,根据测试结果计算得到不同模型的性能评价指标,根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集。
3.根据权利要求1所述的一种基于多模型融合的船舶能耗高精度预测系统,其特征在于,所述根据性能评价指标的取值选择满足约束条件的船舶能耗预测模型集包括根据性能评价指标设置目标函数,
根据性能评价指标中的决定系数设置第一约束条件,将满足第一约束条件的船舶能耗预测模型存储至第一过滤模型集中,并分别计算第一过滤模型集中目标函数的取值并按照目标函数取值进行降序排序,
设置第二约束条件,所述第二约束条件为模型的数量约束,根据第二约束条件从第一过滤模型集中依次选择模型并存储至船舶能耗预测模型集中。
4.根据权利要求3所述的一种基于多模型融合的船舶能耗高精度预测系统,其特征在于,所述根据性能评价指标设置目标函数为根据公式(1)设置目标函数,
式中,R2、MAPE、RMSE、MAE和MSE分别为决定系数、平均绝对百分比误差、均方根误差、平均绝对误差和均方误差;w1、w2、w3、w4和w5为不同的权重系数且相加为1。
5.根据权利要求1所述的一种基于多模型融合的船舶能耗高精度预测系统,其特征在于,所述根据贝叶斯优化算法和自适应算法对融合模型进行参数优化包括,
步骤S1:获取船舶能耗预测模型集中的船舶能耗预测模型并表示为基础模型,
步骤S2:基于Stacking模型融合方法对所获取的基础模型进行融合,并将融合后的模型表示为融合模型,
步骤S3:通过采用贝叶斯优化算法和自适应算法对基础模型的参数域空间内的近似最优超参数组合参数进行调整,
步骤S4:基于得到的基础模型的近似最优超参数组合,将其作为融合模型的参数,得到基于贝叶斯优化算法和自适应算法优化的融合模型。
6.根据权利要求5所述的一种基于多模型融合的船舶能耗高精度预测系统,其特征在于,所述步骤S2包括构建一个包含两层结构的模型,所述模型的第一层为基础学习层,所述模型的第二层为元学习层,所述基础学习层用于根据特征数据集分别对船舶能耗预测模型集中的船舶能耗预测模型进行K折交叉验证训练并生成新数据集,将新数据集划分为新训练集和新测试集,所述元学习层用于构建元模型并根据新数据集对元模型进行学习,所述学习包括分别根据新训练集和新测试集对元模型进行训练和测试,将训练和测试后的元模型表示为融合模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311158277.2A CN117290673A (zh) | 2023-09-08 | 2023-09-08 | 一种基于多模型融合的船舶能耗高精度预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311158277.2A CN117290673A (zh) | 2023-09-08 | 2023-09-08 | 一种基于多模型融合的船舶能耗高精度预测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117290673A true CN117290673A (zh) | 2023-12-26 |
Family
ID=89247218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311158277.2A Pending CN117290673A (zh) | 2023-09-08 | 2023-09-08 | 一种基于多模型融合的船舶能耗高精度预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290673A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118211721A (zh) * | 2024-04-02 | 2024-06-18 | 广州科技职业技术大学 | 基于人工智能的建筑能耗预测方法 |
-
2023
- 2023-09-08 CN CN202311158277.2A patent/CN117290673A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118211721A (zh) * | 2024-04-02 | 2024-06-18 | 广州科技职业技术大学 | 基于人工智能的建筑能耗预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113537600B (zh) | 一种全过程耦合机器学习的中长期降水预报建模方法 | |
CN112288164B (zh) | 一种计及空间相关性和修正数值天气预报的风功率组合预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN111861013B (zh) | 一种电力负荷预测方法及装置 | |
CN106503867A (zh) | 一种遗传算法最小二乘风电功率预测方法 | |
CN115374995A (zh) | 一种分布式光伏、小风电场站功率预测方法 | |
CN109143408B (zh) | 基于mlp的动态区域联合短时降水预报方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN112285807A (zh) | 一种气象信息预测方法及装置 | |
CN117290673A (zh) | 一种基于多模型融合的船舶能耗高精度预测系统 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN114676923A (zh) | 发电功率的预测方法、装置、计算机设备和存储介质 | |
CN116826737A (zh) | 一种光伏功率的预测方法、装置、存储介质及设备 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN117913808A (zh) | 一种分布式光伏发电预测方法及其装置 | |
CN116525135B (zh) | 基于气象因素的时空模型对疫情发展态势进行预测的方法 | |
CN108038518A (zh) | 一种基于气象数据的光伏发电功率确定方法及系统 | |
CN116663404A (zh) | 一种耦合人工智能和贝叶斯理论的洪水预报方法及系统 | |
CN116561569A (zh) | 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法 | |
CN115983095A (zh) | 一种基于聚类算法、神经网络和遗传算法的光伏发电预测方法 | |
CN114234392B (zh) | 一种基于改进pso-lstm的空调负荷精细预测方法 | |
CN112348700B (zh) | 一种结合som聚类与ifou方程的线路容量预测方法 | |
CN115423091A (zh) | 一种条件对抗神经网络训练方法、场景生成方法和系统 | |
KR20230072219A (ko) | 날씨 예측 데이터를 이용한 확률적 시나리오 기법의 최적 입찰량 결정 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |