CN113240201A

CN113240201A - 一种基于gmm-dnn混合模型预测船舶主机功率方法

Info

Publication number: CN113240201A
Application number: CN202110635998.2A
Authority: CN
Inventors: 苏伟; 张久文; 吴尽昭; 熊菊霞; 张嘉琦; 刘映杰
Original assignee: Lanzhou University; Guangxi University for Nationalities
Current assignee: Lanzhou University; Guangxi University for Nationalities
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2021-08-10
Anticipated expiration: 2041-06-08
Also published as: CN113240201B

Abstract

本发明公开了一种基于GMM‑DNN混合模型预测船舶主机功率方法，首先对船舶特征进行相关性分析，选择与主机功率相关系数较大的船舶特征作为GMM‑DNN混合模型的输入；其次使用GMM对船舶特征进行聚类，将聚类结果作为标签和船舶特征一起作为DNN的输入，同时使用Adam‑Dropout优化模型；最后为了探究方法的有效性，本发明比较了多元线性回归、非线性回归、普通DNN、GMM‑DNN的预测效果，实验表明GMM‑DNN混合模型在船舶主机功率预测上性能最优。

Description

一种基于GMM-DNN混合模型预测船舶主机功率方法

技术领域

本发明属于船舶主机功率预测技术领域，特别是涉及一种基于GMM-DNN混合模型预测船舶主机功率方法。

背景技术

捕捞努力量是一种衡量特定时间、特定区域投入渔业捕捞生产工具的数量或捕捞强度的度量单位，同时也是统计渔获量，评估渔业资源开发强度，支撑渔业可持续发展和分析渔业经济的重要依据和指标，然而未知的船舶主机功率数据阻碍了捕捞努力量的估算。

船舶主机功率是预测航行油耗、评估船舶废气排放中的一项重要数据，然而，未知的船舶主机功率数据对基于大数据的船舶油耗及排放预测产生了障碍。

因此，亟需探索一种预测船舶主机功率方法成为研究人员关注的问题。

发明内容

为了解决上述技术问题，本发明提供一种基于GMM-DNN混合模型预测船舶主机功率方法，通过比较多元线性回归、非线性回归、普通DNN、GMM-DNN的预测效果，证明了GMM-DNN混合模型在船舶主机功率预测上性能最优。

为实现上目的，本发明提出一种基于GMM-DNN混合模型预测船舶主机功率方法，具体包括以下步骤：

S1、将采集到的船舶数据进行特征提取，并对提取的船舶特征进行预处理；

S2、基于Keras构建GMM-DNN混合模型，并对所述GMM-DNN混合模型进行优化，得到优化后的GMM-DNN混合模型；

S3、利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测，并对预测结果进行综合评价。

优选地，所述S1具体为：

S1.1、采集船舶数据，并对所述船舶数据进行特征提取，得到若干项船舶特征；所述船舶特征，包括：MMSI、船舶长度、船舶宽度、船舶型深、船舶类型和主机功率；

S1.2、对所述船舶特征进行相关性分析，选取与所述主机功率呈现强正相关性的船舶特征；与所述主机功率呈现强正相关性的船舶特征，包括：船舶长度、船舶宽度和船舶型深；

S1.3、对选取出的船舶特征进行异常值处理，即删除选取的船舶特征中存在空缺数据和不满足筛选标准的数据；

S1.4、对所述船舶类型采用One-Hot编码技术进行特征编码；对所述船舶长度、船舶宽度和所述船舶型深进行归一化处理。

优选地，利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测的方法，具体为：

步骤一：将所述船舶特征输入到GMM模型中进行聚类，输出聚类标签；

步骤二：将所述聚类标签和选取出的与所述主机功率呈现强正相关性的船舶特征同时输入DNN模型，同时使用Adam-Dropout优化器进行模型优化，输出船舶主机功率预测结果；

步骤三：选用评价指标对所述船舶主机功率预测结果进行综合评价。

优选地，所述GMM模型是采用期望最大化算法来进行初始化GMM的均值及协方差的参数估计。

优选地，所述期望最大化算法，具体为：

首先，需要设定GMM模型的簇的个数，求出初始化GMM的均值及协方差的预估计值并计算目标船只属于相应簇的概率；然后使用最大似然函数，将数据点划分到概率较大的簇中，同时更新GMM的均值及协方差；最后重复前两步的操作，直至似然函数收敛，聚类结束，即可得到聚类标签C_i。

优选地，所述DNN模型，包括：1个输入层，若干个隐藏层和1个输出层组成，层与层之间均为全连接。

优选地，所述DNN模型的激活函数选用ReLU函数。

优选地，所述DNN模型采用Dropout随机归零所述隐藏层中任意神经元的部分权重或输出。

优选地，所述评价指标，包括：均方误差、均方根误差、绝对百分误差和平均绝对百分误差。

与现有技术相比，本发明的有益效果在于：

本发明首先对船舶特征进行相关性分析，选择与主机功率相关系数较大的船舶特征作为GMM-DNN混合模型的输入；其次使用GMM对船舶特征进行聚类，GMM作为DNN的预处理步骤，不仅可以识别出相同类型的船舶，甚至可以识别出主尺度相似但类型不同的船舶，即能够在不需要任何先验知识的情况下发现隐藏在大量数据中的聚类规则，挖掘数据更深层次的信息，大大提高了模型的整体效率和质量。最后将聚类结果作为标签和船舶特征一起作为DNN的输入，同时使用Adam-Dropout优化模型，采用评价指标对本发明的模型进行综合评价，相比传统方法，GMM-DNN混合模型在船舶主机功率预测方面表现出了更高的性能和更强的抗干扰能力。同时基于GMM-DNN混合模型预测船舶主机功率的方法将为完善船舶主机功率数据、估算捕捞努力量、预测船舶油耗和区域排放等方面提供方法指导和数据支持。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法流程图；

图2为本发明船舶数据相关系数示意图；

图3为本发明GMM-DNN混合模型结构示意图；

图4为本发明DNN模型结构示意图；

图5为本发明GMM-DNN混合模型的评估预测结果图；

图6为本发明DNN和GMM-DNN混合模型的船舶主机功率预测效果比较图；

图7为本发明幂函数回归分析结果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

本发明使用GMM对船舶主机功率进行辨识和聚类，将聚类结果作为标签与船舶长度、宽度、型深一起作为DNN的输入。最后使用Adam-Dropout优化的DNN模型预测船舶主机功率。为探究方法的有效性，本文比较了多元线性回归、多元非线性回归、深度神经网络DNN和GMM-DNN在船舶主机功率上的估算效果。实验证明在大型船舶的主机功率预测中，GMM-DNN比其他方法有更好的效果。

参照图1所示，本发明提出一种基于GMM-DNN混合模型预测船舶主机功率方法，具体包括以下步骤：

S1.1、本发明所采集的船舶数据来自中国船级社的8000余条船舶数据，包括：MMSI、船舶长度(L)、船舶宽度(B)、船舶型深(D)、船舶类型(T)、主机功率(P)等三十余项船舶特征，如表1所示。

表1

S1.2、首先，对船舶特征进行相关性分析，选择与主机功率相关系数较大的船舶特征作为后续GMM-DNN混合模型的输入，其相关系数矩阵如图2所示，船舶主机功率(P)与船舶长度(L)、船舶宽度(B)、船舶型深(D)的相关系数R分别为0.82，0.72，0.74，呈现强正相关。

S1.3、然后，再对船舶数据进行异常值处理，删除了在船舶长度(L)、船舶宽度(B)、船舶型深(D)及主机功率(P)字段中存在空缺的数据。同时由于主尺寸较小的船舶数据会对预测结果产生较大的影响，因此还删除了不满足筛选标准(1)式的数据，得到了满足标准的3698条数据。

S1.4、最后，由于船舶类型(T)中每个类别相互独立，故选用One-Hot编码对船舶类型T进行特征编码。同时，其余船舶长度(L)、船舶宽度(B)和船舶型深(D)特征按照(2)式进行min-max归一化，将原始值映射到[0,1]区间内。

式中，X_max、X_min分别为船舶特征的最大值和最小值；X′为归一化后的船舶数据。

S2、基于Keras构建GMM-DNN混合模型，并在所述GMM-DNN混合模型中引入Adam-Dropout优化器，得到优化后的GMM-DNN混合模型；

本发明基于Keras构建GMM-DNN混合模型，如图3所示，L为船舶长度，B为船舶宽度，D为船舶型深，T为船舶类型，C为GMM的聚类结果。

其中，GMM主要用于船舶特征辨识与聚类，因此选取L、B、D及T船舶特征作为GMM的输入，并认为单个的输入特征向量g_i服从高斯分布，如式(4)所示：

其中，g_i(i＝1,2，3，4)为输入特征向量；σ_i为输入特征向量的协方差矩阵；u_i为输入特征向量的均值；n为数据维度；T为转置；p(g_i)为高斯密度函数。

全部特征向量L、B、D及T的概率密度函数P(G)可表示为单个高斯密度p(g_i)的加权和，如式(4)所示：

式中，M为混合系数；ω_i为权重参数；G为输入特征向量L、B、D及T的集合。

然后对GMM进行参数估计，本发明此次采用期望最大化算法(Expectation-Maximization algorithm，EM)来对GMM进行参数估计。具体为：

首先，需要设定GMM模型的簇的个数，求出初始化GMM的均值及协方差的预估计值并计算数据点(即，目标船)属于相应簇的概率；然后使用最大似然函数，将数据点划分到概率较大的簇中，同时更新GMM的均值及协方差；最后重复上述两步，直至似然函数收敛，聚类结束，即可得到聚类标签C_i。聚类完成后，将聚类标签C_i与船舶特征L_i、B_i、D_i、T_i一起送入DNN模型。

DNN模型的结构如图4所示，模型由一个输入层，多个隐藏层和一个输出层组成，层与层之间均为全连接。其中，a_i为输入层与隐含层之间的偏置参数，x_i(i＝1,2，…，n)为DNN模型的输入，即L_i、B_i、D_i、T_i及C_i。

输入向量

首先通过隐藏层的神经元，与权重ω_ij、偏倚a_j线性叠加，并经过非线性激活函数后在输出层得到A_j，如(5)式所示。其中，激活函数采用ReLU函数，其定义为(6)式，在深度网络中相比于其它激活函数，ReLU对于线性函数有更强的表达能力；而对于非线性函数，ReLU解决了梯度消失问题，可使模型的收敛速度维持在一个稳定状态。

h(x)＝max(0，x) (6)

其次，隐含层的输出A_j通过全连接层输出O_k，如(7)式所示。

最后，求模型输出O_k与船舶主机功率标签Y_k的差，得到预测误差e_k，该误差再经过反向传播，通过梯度下降算法，并使用式(8)更新模型的权重ω_ij、ω_jk，使用式(9)更新模型的偏置参数a_ij、b_k。

式中，η为学习率；m为每层节点的个数；ω_ij、a_ij为输入层与隐含层之间的权重和偏置参数；ω_jk、b_k为隐含层和输出层之间的权重和偏置参数。

为加快模型的收敛速度、防止模型陷入局部最优，模型采用Adam优化器进行优化，其优化策略为式(10)：

式中，J(M)为参数M的随机目标函数值；g_t为第t时间步的梯度；m_t、v_t为第t时间步的一阶与二阶动量项；m_t-1、v_t-1为第t-1时间步的一阶与二阶动量项；β₁、β₂为第t时间步的动力值；

为第t时间步修正后的一阶与二阶动量项。

对于一个具有N层隐藏层的神经网络，为防止模型过拟合，用Dropout随机归零隐藏层中任意神经元的部分权重或输出，其原理如式(11)所示。

式中，λ^l是一个由服从独立伯努利分布的随机变量组成的向量；

为第l层的输出向量；

为第l+1层的输出向量；*表示逐位相乘；h(x)为激活函数；

和

为第l+1层的权重和偏置参数。

本发明的评价指标选用均方误差(Mean-Square Error，MSE)、均方根误差(RootMean Square Error，RMSE)、绝对百分误差(Absolute Percentage Error，APE)和平均绝对百分误差(Mean Absolute Percentage Error，MAPE)来对本发明的构建的GMM-DNN模型预测效果进行综合评价，其定义为式如(12)所示：

式中，N为样本数，y_i和f(x_i)分别为第i个样本点的真实值和预测值。

为了验证本模型的预测效果，本发明基于Keras搭建基于GMM-DNN的船舶主机功率预测模型，模型中隐含层均为全连接层，损失函数采用MSE，模型参数随机初始化，并利用反向传播算法训练。同时将预处理后的数据按7:3随机划分为训练集和测试集，为防止模型陷入局部最优，通过重复训练得到最小值；训练结束后，使用MSE、RMSE、APE及MAPE评价预测效果，并保存最优模型。

在基于GMM-DNN的船舶主机功率预测模型中，先通过GMM对船舶进行分类，再基于聚类结果和船舶特征通过DNN模型进行预测。实验采用多组参数、多次实验取最优值的方法确定GMM-DNN混合模型的最佳参数。

首先，需要探究DNN模型的最佳网络层数、神经元个数及优化器，实验使用SGD、Adam和Adam-Dropout分别对模型进行了优化，同时将隐含层的层数范围设置为3-13，每层隐含层中神经元的个数范围设置为1-50，迭代次数范围设置为100-1000，实验步长为100，每批数据量(batch-size)为20。多次实验表明，当模型有4层隐含层，每层11个隐含层神经元时，预测效果最好。故当DNN模型选用最优的网络层数和神经元个数，并使用SGD、Adam和Adam-Dropout优化器进行10次不同输入组合的平行实验，记录最好的实验结果，结果如表2所示(使用不同输入组合和优化算法的DNN效果比较)。

表2

实验结果表明，当优化器为Adam-Dropout，DNN模型的输入为“L、B、D、T”时，测试集的MAPE最小，为15.81％，模型的预测效果最好。

其次，需要探究GMM的最佳聚类个数，GMM通过计算船舶属于某一类的概率来判断最终的归属类别。多次实验表明：GMM可以有效辨识相同类型的船舶以及不同类型但船舶主尺度和主机功率相似的船舶，且当GMM的聚类个数设置为4时，聚类效果最好。

最后，为评估GMM-DNN混合模型在预测船舶主机功率上的效果，实验将GMM的输入设为L、B、D、T，DNN模型的输入设为L、B、D、T、C，模型参数均选用最优参数。随机抽取100个船舶样本使用GMM-DNN混合模型进行预测并评估预测结果，评估结果如图5所示。

在本实验中，GMM-DNN混合模型的MAPE为14.57％，最大APE为40.75％，最小APE为0.23％。实验结果表明，本发明提出的基于GMM-DNN预测船舶主机功率的模型，除小部分船舶的预测结果由于数据不准确等因素产生了较大的误差，绝大多数船舶的预测效果较好，整体模型符合实验预期。

此外，基于经过相同预处理的同一数据集，DNN模型和GMM-DNN混合模型的船舶主机功率预测效果如图6所示。

从图中可以看出，基于GMM-DNN预测船舶主机功率模型的误差明显小于普通DNN模型，说明本发明提出的GMM-DNN混合模型在预测船舶主机功率方面，相较于普通DNN模型，预测效果更好、抗干扰能力更强、实用性更高。

以上实验表明，在基于GMM-DNN预测船舶主机功率的模型中，GMM作为DNN的预处理步骤，不仅可以识别出相同类型的船舶，甚至可以识别出主尺度相似但类型不同的船舶，即能够在不需要任何先验知识的情况下发现隐藏在大量数据中的聚类规则，挖掘数据更深层次的信息，大大提高了模型的整体效率和质量。

为了探究方法的有效性，本发明比较了多元线性回归、非线性回归、普通DNN、GMM-DNN的预测效果，实验表明GMM-DNN混合模型在船舶主机功率预测上性能最优。

(1)多元线性回归

在多元线性回归模型中，先将主机功率设置为因变量，再将船舶长度、船舶宽度、船舶型深、船舶类型的不同组合设为自变量，其中船舶类型需转换为虚拟变量，结果如表3所示(模型汇总表)。

表3

实验表明，当自变量为L、B、D、T时，模型的R²最大，标准误差最小。在该自变量组合下，模型的R值为0.923，故该模型有效，其方差分析结果如表4所示(方差分析)。

表4

实验使用F检验作为整个回归方程的总体检验，在此条件下查得临界值F＝1.669248303，表中F值远远大于此值，因此认为各个自变量对因变量均有显著影响，且sig值小于0.05，模型具有统计学意义。

(2)非线性回归

在非线性回归模型中，先将设置主机功率作为因变量，再将船舶长度、船舶宽度与船舶型深的乘积作为自变量，模型曲线估算情况如表5所示(模型曲线估算汇总表)。

表5

实验表明，当模型的曲线为幂函数时，R²最大，且显著性结果为0.000，模型通过显著性检验，预测效果相对较好，其回归效果如图7所示。

本发明为探究各模型的预测效果，实验随机抽取了经过相同预处理的数据集，使用多元线性回归模型、幂函数回归模型、DNN模型与本章提出的GMM-DNN混合模型分别预测船舶主机功率，并选用合适的评价指标进行评价，实验结果如表6所示(不同方法的船舶主机功率预测结果)。

表6

由表可知，GMM-DNN混合模型的MAPE为14.57％，比多元线性回归的MAPE降低了28.27％，比幂函数回归的MAPE降低了23.36％，比普通DNN模型的MAPE降低了1.24％。因此得到，相较于基础方法，GMM-DNN混合模型在预测船舶主机功率上预测误差最小，预测效果最好。

以所述的实施例仅是对本发明的优选方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

Claims

1.一种基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，具体包括以下步骤：

2.根据权利要求1所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述S1具体为：

3.根据权利要求1所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测的方法，具体为：

4.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述GMM模型是采用期望最大化算法来进行初始化GMM的均值及协方差的参数估计。

5.根据权利要求4所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述期望最大化算法，具体为：

6.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述DNN模型，包括：1个输入层，若干个隐藏层和1个输出层组成，层与层之间均为全连接。

7.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述DNN模型的激活函数选用ReLU函数。

8.根据权利要求6所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述DNN模型采用Dropout随机归零所述隐藏层中任意神经元的部分权重或输出。

9.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法，其特征在于，所述评价指标，包括：均方误差、均方根误差、绝对百分误差和平均绝对百分误差。