CN113240201A - 一种基于gmm-dnn混合模型预测船舶主机功率方法 - Google Patents
一种基于gmm-dnn混合模型预测船舶主机功率方法 Download PDFInfo
- Publication number
- CN113240201A CN113240201A CN202110635998.2A CN202110635998A CN113240201A CN 113240201 A CN113240201 A CN 113240201A CN 202110635998 A CN202110635998 A CN 202110635998A CN 113240201 A CN113240201 A CN 113240201A
- Authority
- CN
- China
- Prior art keywords
- ship
- gmm
- dnn
- model
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 238000010219 correlation analysis Methods 0.000 claims abstract description 5
- 238000011156 evaluation Methods 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 21
- 238000002474 experimental method Methods 0.000 abstract description 19
- 238000012417 linear regression Methods 0.000 abstract description 10
- 230000006870 function Effects 0.000 description 19
- 239000013598 vector Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Abstract
本发明公开了一种基于GMM‑DNN混合模型预测船舶主机功率方法,首先对船舶特征进行相关性分析,选择与主机功率相关系数较大的船舶特征作为GMM‑DNN混合模型的输入;其次使用GMM对船舶特征进行聚类,将聚类结果作为标签和船舶特征一起作为DNN的输入,同时使用Adam‑Dropout优化模型;最后为了探究方法的有效性,本发明比较了多元线性回归、非线性回归、普通DNN、GMM‑DNN的预测效果,实验表明GMM‑DNN混合模型在船舶主机功率预测上性能最优。
Description
技术领域
本发明属于船舶主机功率预测技术领域,特别是涉及一种基于GMM-DNN混合模型预测船舶主机功率方法。
背景技术
捕捞努力量是一种衡量特定时间、特定区域投入渔业捕捞生产工具的数量或捕捞强度的度量单位,同时也是统计渔获量,评估渔业资源开发强度,支撑渔业可持续发展和分析渔业经济的重要依据和指标,然而未知的船舶主机功率数据阻碍了捕捞努力量的估算。
船舶主机功率是预测航行油耗、评估船舶废气排放中的一项重要数据,然而,未知的船舶主机功率数据对基于大数据的船舶油耗及排放预测产生了障碍。
因此,亟需探索一种预测船舶主机功率方法成为研究人员关注的问题。
发明内容
为了解决上述技术问题,本发明提供一种基于GMM-DNN混合模型预测船舶主机功率方法,通过比较多元线性回归、非线性回归、普通DNN、GMM-DNN的预测效果,证明了GMM-DNN混合模型在船舶主机功率预测上性能最优。
为实现上目的,本发明提出一种基于GMM-DNN混合模型预测船舶主机功率方法,具体包括以下步骤:
S1、将采集到的船舶数据进行特征提取,并对提取的船舶特征进行预处理;
S2、基于Keras构建GMM-DNN混合模型,并对所述GMM-DNN混合模型进行优化,得到优化后的GMM-DNN混合模型;
S3、利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测,并对预测结果进行综合评价。
优选地,所述S1具体为:
S1.1、采集船舶数据,并对所述船舶数据进行特征提取,得到若干项船舶特征;所述船舶特征,包括:MMSI、船舶长度、船舶宽度、船舶型深、船舶类型和主机功率;
S1.2、对所述船舶特征进行相关性分析,选取与所述主机功率呈现强正相关性的船舶特征;与所述主机功率呈现强正相关性的船舶特征,包括:船舶长度、船舶宽度和船舶型深;
S1.3、对选取出的船舶特征进行异常值处理,即删除选取的船舶特征中存在空缺数据和不满足筛选标准的数据;
S1.4、对所述船舶类型采用One-Hot编码技术进行特征编码;对所述船舶长度、船舶宽度和所述船舶型深进行归一化处理。
优选地,利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测的方法,具体为:
步骤一:将所述船舶特征输入到GMM模型中进行聚类,输出聚类标签;
步骤二:将所述聚类标签和选取出的与所述主机功率呈现强正相关性的船舶特征同时输入DNN模型,同时使用Adam-Dropout优化器进行模型优化,输出船舶主机功率预测结果;
步骤三:选用评价指标对所述船舶主机功率预测结果进行综合评价。
优选地,所述GMM模型是采用期望最大化算法来进行初始化GMM的均值及协方差的参数估计。
优选地,所述期望最大化算法,具体为:
首先,需要设定GMM模型的簇的个数,求出初始化GMM的均值及协方差的预估计值并计算目标船只属于相应簇的概率;然后使用最大似然函数,将数据点划分到概率较大的簇中,同时更新GMM的均值及协方差;最后重复前两步的操作,直至似然函数收敛,聚类结束,即可得到聚类标签Ci。
优选地,所述DNN模型,包括:1个输入层,若干个隐藏层和1个输出层组成,层与层之间均为全连接。
优选地,所述DNN模型的激活函数选用ReLU函数。
优选地,所述DNN模型采用Dropout随机归零所述隐藏层中任意神经元的部分权重或输出。
优选地,所述评价指标,包括:均方误差、均方根误差、绝对百分误差和平均绝对百分误差。
与现有技术相比,本发明的有益效果在于:
本发明首先对船舶特征进行相关性分析,选择与主机功率相关系数较大的船舶特征作为GMM-DNN混合模型的输入;其次使用GMM对船舶特征进行聚类,GMM作为DNN的预处理步骤,不仅可以识别出相同类型的船舶,甚至可以识别出主尺度相似但类型不同的船舶,即能够在不需要任何先验知识的情况下发现隐藏在大量数据中的聚类规则,挖掘数据更深层次的信息,大大提高了模型的整体效率和质量。最后将聚类结果作为标签和船舶特征一起作为DNN的输入,同时使用Adam-Dropout优化模型,采用评价指标对本发明的模型进行综合评价,相比传统方法,GMM-DNN混合模型在船舶主机功率预测方面表现出了更高的性能和更强的抗干扰能力。同时基于GMM-DNN混合模型预测船舶主机功率的方法将为完善船舶主机功率数据、估算捕捞努力量、预测船舶油耗和区域排放等方面提供方法指导和数据支持。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图;
图2为本发明船舶数据相关系数示意图;
图3为本发明GMM-DNN混合模型结构示意图;
图4为本发明DNN模型结构示意图;
图5为本发明GMM-DNN混合模型的评估预测结果图;
图6为本发明DNN和GMM-DNN混合模型的船舶主机功率预测效果比较图;
图7为本发明幂函数回归分析结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
本发明使用GMM对船舶主机功率进行辨识和聚类,将聚类结果作为标签与船舶长度、宽度、型深一起作为DNN的输入。最后使用Adam-Dropout优化的DNN模型预测船舶主机功率。为探究方法的有效性,本文比较了多元线性回归、多元非线性回归、深度神经网络DNN和GMM-DNN在船舶主机功率上的估算效果。实验证明在大型船舶的主机功率预测中,GMM-DNN比其他方法有更好的效果。
参照图1所示,本发明提出一种基于GMM-DNN混合模型预测船舶主机功率方法,具体包括以下步骤:
S1、将采集到的船舶数据进行特征提取,并对提取的船舶特征进行预处理;
S1.1、本发明所采集的船舶数据来自中国船级社的8000余条船舶数据,包括:MMSI、船舶长度(L)、船舶宽度(B)、船舶型深(D)、船舶类型(T)、主机功率(P)等三十余项船舶特征,如表1所示。
表1
S1.2、首先,对船舶特征进行相关性分析,选择与主机功率相关系数较大的船舶特征作为后续GMM-DNN混合模型的输入,其相关系数矩阵如图2所示,船舶主机功率(P)与船舶长度(L)、船舶宽度(B)、船舶型深(D)的相关系数R分别为0.82,0.72,0.74,呈现强正相关。
S1.3、然后,再对船舶数据进行异常值处理,删除了在船舶长度(L)、船舶宽度(B)、船舶型深(D)及主机功率(P)字段中存在空缺的数据。同时由于主尺寸较小的船舶数据会对预测结果产生较大的影响,因此还删除了不满足筛选标准(1)式的数据,得到了满足标准的3698条数据。
S1.4、最后,由于船舶类型(T)中每个类别相互独立,故选用One-Hot编码对船舶类型T进行特征编码。同时,其余船舶长度(L)、船舶宽度(B)和船舶型深(D)特征按照(2)式进行min-max归一化,将原始值映射到[0,1]区间内。
式中,Xmax、Xmin分别为船舶特征的最大值和最小值;X′为归一化后的船舶数据。
S2、基于Keras构建GMM-DNN混合模型,并在所述GMM-DNN混合模型中引入Adam-Dropout优化器,得到优化后的GMM-DNN混合模型;
本发明基于Keras构建GMM-DNN混合模型,如图3所示,L为船舶长度,B为船舶宽度,D为船舶型深,T为船舶类型,C为GMM的聚类结果。
其中,GMM主要用于船舶特征辨识与聚类,因此选取L、B、D及T船舶特征作为GMM的输入,并认为单个的输入特征向量gi服从高斯分布,如式(4)所示:
其中,gi(i=1,2,3,4)为输入特征向量;σi为输入特征向量的协方差矩阵;ui为输入特征向量的均值;n为数据维度;T为转置;p(gi)为高斯密度函数。
全部特征向量L、B、D及T的概率密度函数P(G)可表示为单个高斯密度p(gi)的加权和,如式(4)所示:
式中,M为混合系数;ωi为权重参数;G为输入特征向量L、B、D及T的集合。
然后对GMM进行参数估计,本发明此次采用期望最大化算法(Expectation-Maximization algorithm,EM)来对GMM进行参数估计。具体为:
首先,需要设定GMM模型的簇的个数,求出初始化GMM的均值及协方差的预估计值并计算数据点(即,目标船)属于相应簇的概率;然后使用最大似然函数,将数据点划分到概率较大的簇中,同时更新GMM的均值及协方差;最后重复上述两步,直至似然函数收敛,聚类结束,即可得到聚类标签Ci。聚类完成后,将聚类标签Ci与船舶特征Li、Bi、Di、Ti一起送入DNN模型。
DNN模型的结构如图4所示,模型由一个输入层,多个隐藏层和一个输出层组成,层与层之间均为全连接。其中,ai为输入层与隐含层之间的偏置参数,xi(i=1,2,…,n)为DNN模型的输入,即Li、Bi、Di、Ti及Ci。
输入向量首先通过隐藏层的神经元,与权重ωij、偏倚aj线性叠加,并经过非线性激活函数后在输出层得到Aj,如(5)式所示。其中,激活函数采用ReLU函数,其定义为(6)式,在深度网络中相比于其它激活函数,ReLU对于线性函数有更强的表达能力;而对于非线性函数,ReLU解决了梯度消失问题,可使模型的收敛速度维持在一个稳定状态。
h(x)=max(0,x) (6)
其次,隐含层的输出Aj通过全连接层输出Ok,如(7)式所示。
最后,求模型输出Ok与船舶主机功率标签Yk的差,得到预测误差ek,该误差再经过反向传播,通过梯度下降算法,并使用式(8)更新模型的权重ωij、ωjk,使用式(9)更新模型的偏置参数aij、bk。
式中,η为学习率;m为每层节点的个数;ωij、aij为输入层与隐含层之间的权重和偏置参数;ωjk、bk为隐含层和输出层之间的权重和偏置参数。
为加快模型的收敛速度、防止模型陷入局部最优,模型采用Adam优化器进行优化,其优化策略为式(10):
式中,J(M)为参数M的随机目标函数值;gt为第t时间步的梯度;mt、vt为第t时间步的一阶与二阶动量项;mt-1、vt-1为第t-1时间步的一阶与二阶动量项;β1、β2为第t时间步的动力值;为第t时间步修正后的一阶与二阶动量项。
对于一个具有N层隐藏层的神经网络,为防止模型过拟合,用Dropout随机归零隐藏层中任意神经元的部分权重或输出,其原理如式(11)所示。
S3、利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测,并对预测结果进行综合评价。
本发明的评价指标选用均方误差(Mean-Square Error,MSE)、均方根误差(RootMean Square Error,RMSE)、绝对百分误差(Absolute Percentage Error,APE)和平均绝对百分误差(Mean Absolute Percentage Error,MAPE)来对本发明的构建的GMM-DNN模型预测效果进行综合评价,其定义为式如(12)所示:
式中,N为样本数,yi和f(xi)分别为第i个样本点的真实值和预测值。
为了验证本模型的预测效果,本发明基于Keras搭建基于GMM-DNN的船舶主机功率预测模型,模型中隐含层均为全连接层,损失函数采用MSE,模型参数随机初始化,并利用反向传播算法训练。同时将预处理后的数据按7:3随机划分为训练集和测试集,为防止模型陷入局部最优,通过重复训练得到最小值;训练结束后,使用MSE、RMSE、APE及MAPE评价预测效果,并保存最优模型。
在基于GMM-DNN的船舶主机功率预测模型中,先通过GMM对船舶进行分类,再基于聚类结果和船舶特征通过DNN模型进行预测。实验采用多组参数、多次实验取最优值的方法确定GMM-DNN混合模型的最佳参数。
首先,需要探究DNN模型的最佳网络层数、神经元个数及优化器,实验使用SGD、Adam和Adam-Dropout分别对模型进行了优化,同时将隐含层的层数范围设置为3-13,每层隐含层中神经元的个数范围设置为1-50,迭代次数范围设置为100-1000,实验步长为100,每批数据量(batch-size)为20。多次实验表明,当模型有4层隐含层,每层11个隐含层神经元时,预测效果最好。故当DNN模型选用最优的网络层数和神经元个数,并使用SGD、Adam和Adam-Dropout优化器进行10次不同输入组合的平行实验,记录最好的实验结果,结果如表2所示(使用不同输入组合和优化算法的DNN效果比较)。
表2
实验结果表明,当优化器为Adam-Dropout,DNN模型的输入为“L、B、D、T”时,测试集的MAPE最小,为15.81%,模型的预测效果最好。
其次,需要探究GMM的最佳聚类个数,GMM通过计算船舶属于某一类的概率来判断最终的归属类别。多次实验表明:GMM可以有效辨识相同类型的船舶以及不同类型但船舶主尺度和主机功率相似的船舶,且当GMM的聚类个数设置为4时,聚类效果最好。
最后,为评估GMM-DNN混合模型在预测船舶主机功率上的效果,实验将GMM的输入设为L、B、D、T,DNN模型的输入设为L、B、D、T、C,模型参数均选用最优参数。随机抽取100个船舶样本使用GMM-DNN混合模型进行预测并评估预测结果,评估结果如图5所示。
在本实验中,GMM-DNN混合模型的MAPE为14.57%,最大APE为40.75%,最小APE为0.23%。实验结果表明,本发明提出的基于GMM-DNN预测船舶主机功率的模型,除小部分船舶的预测结果由于数据不准确等因素产生了较大的误差,绝大多数船舶的预测效果较好,整体模型符合实验预期。
此外,基于经过相同预处理的同一数据集,DNN模型和GMM-DNN混合模型的船舶主机功率预测效果如图6所示。
从图中可以看出,基于GMM-DNN预测船舶主机功率模型的误差明显小于普通DNN模型,说明本发明提出的GMM-DNN混合模型在预测船舶主机功率方面,相较于普通DNN模型,预测效果更好、抗干扰能力更强、实用性更高。
以上实验表明,在基于GMM-DNN预测船舶主机功率的模型中,GMM作为DNN的预处理步骤,不仅可以识别出相同类型的船舶,甚至可以识别出主尺度相似但类型不同的船舶,即能够在不需要任何先验知识的情况下发现隐藏在大量数据中的聚类规则,挖掘数据更深层次的信息,大大提高了模型的整体效率和质量。
为了探究方法的有效性,本发明比较了多元线性回归、非线性回归、普通DNN、GMM-DNN的预测效果,实验表明GMM-DNN混合模型在船舶主机功率预测上性能最优。
(1)多元线性回归
在多元线性回归模型中,先将主机功率设置为因变量,再将船舶长度、船舶宽度、船舶型深、船舶类型的不同组合设为自变量,其中船舶类型需转换为虚拟变量,结果如表3所示(模型汇总表)。
表3
实验表明,当自变量为L、B、D、T时,模型的R2最大,标准误差最小。在该自变量组合下,模型的R值为0.923,故该模型有效,其方差分析结果如表4所示(方差分析)。
表4
实验使用F检验作为整个回归方程的总体检验,在此条件下查得临界值F=1.669248303,表中F值远远大于此值,因此认为各个自变量对因变量均有显著影响,且sig值小于0.05,模型具有统计学意义。
(2)非线性回归
在非线性回归模型中,先将设置主机功率作为因变量,再将船舶长度、船舶宽度与船舶型深的乘积作为自变量,模型曲线估算情况如表5所示(模型曲线估算汇总表)。
表5
实验表明,当模型的曲线为幂函数时,R2最大,且显著性结果为0.000,模型通过显著性检验,预测效果相对较好,其回归效果如图7所示。
本发明为探究各模型的预测效果,实验随机抽取了经过相同预处理的数据集,使用多元线性回归模型、幂函数回归模型、DNN模型与本章提出的GMM-DNN混合模型分别预测船舶主机功率,并选用合适的评价指标进行评价,实验结果如表6所示(不同方法的船舶主机功率预测结果)。
表6
由表可知,GMM-DNN混合模型的MAPE为14.57%,比多元线性回归的MAPE降低了28.27%,比幂函数回归的MAPE降低了23.36%,比普通DNN模型的MAPE降低了1.24%。因此得到,相较于基础方法,GMM-DNN混合模型在预测船舶主机功率上预测误差最小,预测效果最好。
以所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (9)
1.一种基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,具体包括以下步骤:
S1、将采集到的船舶数据进行特征提取,并对提取的船舶特征进行预处理;
S2、基于Keras构建GMM-DNN混合模型,并对所述GMM-DNN混合模型进行优化,得到优化后的GMM-DNN混合模型;
S3、利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测,并对预测结果进行综合评价。
2.根据权利要求1所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述S1具体为:
S1.1、采集船舶数据,并对所述船舶数据进行特征提取,得到若干项船舶特征;所述船舶特征,包括:MMSI、船舶长度、船舶宽度、船舶型深、船舶类型和主机功率;
S1.2、对所述船舶特征进行相关性分析,选取与所述主机功率呈现强正相关性的船舶特征;与所述主机功率呈现强正相关性的船舶特征,包括:船舶长度、船舶宽度和船舶型深;
S1.3、对选取出的船舶特征进行异常值处理,即删除选取的船舶特征中存在空缺数据和不满足筛选标准的数据;
S1.4、对所述船舶类型采用One-Hot编码技术进行特征编码;对所述船舶长度、船舶宽度和所述船舶型深进行归一化处理。
3.根据权利要求1所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,利用所述优化后的GMM-DNN混合模型对船舶主机功率进行预测的方法,具体为:
步骤一:将所述船舶特征输入到GMM模型中进行聚类,输出聚类标签;
步骤二:将所述聚类标签和选取出的与所述主机功率呈现强正相关性的船舶特征同时输入DNN模型,同时使用Adam-Dropout优化器进行模型优化,输出船舶主机功率预测结果;
步骤三:选用评价指标对所述船舶主机功率预测结果进行综合评价。
4.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述GMM模型是采用期望最大化算法来进行初始化GMM的均值及协方差的参数估计。
5.根据权利要求4所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述期望最大化算法,具体为:
首先,需要设定GMM模型的簇的个数,求出初始化GMM的均值及协方差的预估计值并计算目标船只属于相应簇的概率;然后使用最大似然函数,将数据点划分到概率较大的簇中,同时更新GMM的均值及协方差;最后重复前两步的操作,直至似然函数收敛,聚类结束,即可得到聚类标签Ci。
6.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述DNN模型,包括:1个输入层,若干个隐藏层和1个输出层组成,层与层之间均为全连接。
7.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述DNN模型的激活函数选用ReLU函数。
8.根据权利要求6所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述DNN模型采用Dropout随机归零所述隐藏层中任意神经元的部分权重或输出。
9.根据权利要求3所述的基于GMM-DNN混合模型预测船舶主机功率方法,其特征在于,所述评价指标,包括:均方误差、均方根误差、绝对百分误差和平均绝对百分误差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110635998.2A CN113240201B (zh) | 2021-06-08 | 2021-06-08 | 一种基于gmm-dnn混合模型预测船舶主机功率方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110635998.2A CN113240201B (zh) | 2021-06-08 | 2021-06-08 | 一种基于gmm-dnn混合模型预测船舶主机功率方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113240201A true CN113240201A (zh) | 2021-08-10 |
CN113240201B CN113240201B (zh) | 2024-02-09 |
Family
ID=77137215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110635998.2A Active CN113240201B (zh) | 2021-06-08 | 2021-06-08 | 一种基于gmm-dnn混合模型预测船舶主机功率方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113240201B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743662A (zh) * | 2021-08-31 | 2021-12-03 | 中山大学 | 一种基于机器学习的船舶关键技术参数预测方法及系统 |
CN115050214A (zh) * | 2022-06-07 | 2022-09-13 | 兰州大学 | 一种基于ais数据的船舶碰撞风险预测方法 |
CN115169434A (zh) * | 2022-06-14 | 2022-10-11 | 上海船舶运输科学研究所有限公司 | 基于k均值聚类算法的主机工况特征值提取方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709640A (zh) * | 2016-12-15 | 2017-05-24 | 华南理工大学 | 基于深度学习与支持向量回归的船舶能耗预测方法 |
CN107609601A (zh) * | 2017-09-28 | 2018-01-19 | 北京计算机技术及应用研究所 | 一种基于多层卷积神经网络的舰船目标识别方法 |
US20200134461A1 (en) * | 2018-03-20 | 2020-04-30 | Sri International | Dynamic adaptation of deep neural networks |
CN111369077A (zh) * | 2020-02-10 | 2020-07-03 | 大连理工大学 | 一种基于机器学习的在港船舶能耗预测方法 |
CN112446096A (zh) * | 2020-11-26 | 2021-03-05 | 上海船舶运输科学研究所 | 一种基于航行大数据的船舶主机油耗动态预估方法 |
-
2021
- 2021-06-08 CN CN202110635998.2A patent/CN113240201B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709640A (zh) * | 2016-12-15 | 2017-05-24 | 华南理工大学 | 基于深度学习与支持向量回归的船舶能耗预测方法 |
CN107609601A (zh) * | 2017-09-28 | 2018-01-19 | 北京计算机技术及应用研究所 | 一种基于多层卷积神经网络的舰船目标识别方法 |
US20200134461A1 (en) * | 2018-03-20 | 2020-04-30 | Sri International | Dynamic adaptation of deep neural networks |
CN111369077A (zh) * | 2020-02-10 | 2020-07-03 | 大连理工大学 | 一种基于机器学习的在港船舶能耗预测方法 |
CN112446096A (zh) * | 2020-11-26 | 2021-03-05 | 上海船舶运输科学研究所 | 一种基于航行大数据的船舶主机油耗动态预估方法 |
Non-Patent Citations (2)
Title |
---|
周春辉等: "基于大数据的内河船舶主机功率估算方法", 大连海事大学学报, vol. 45, no. 2, pages 47 - 52 * |
李敬阳;吴明辉;王莉;王晓迪;: "一种基于GMM-DNN的说话人确认方法", 计算机应用与软件, no. 12, pages 137 - 141 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743662A (zh) * | 2021-08-31 | 2021-12-03 | 中山大学 | 一种基于机器学习的船舶关键技术参数预测方法及系统 |
CN113743662B (zh) * | 2021-08-31 | 2024-04-16 | 中山大学 | 一种基于机器学习的船舶关键技术参数预测方法及系统 |
CN115050214A (zh) * | 2022-06-07 | 2022-09-13 | 兰州大学 | 一种基于ais数据的船舶碰撞风险预测方法 |
CN115050214B (zh) * | 2022-06-07 | 2023-08-29 | 兰州大学 | 一种基于ais数据的船舶碰撞风险预测方法 |
CN115169434A (zh) * | 2022-06-14 | 2022-10-11 | 上海船舶运输科学研究所有限公司 | 基于k均值聚类算法的主机工况特征值提取方法及系统 |
CN115169434B (zh) * | 2022-06-14 | 2023-09-19 | 上海船舶运输科学研究所有限公司 | 基于k均值聚类算法的主机工况特征值提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113240201B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113240201A (zh) | 一种基于gmm-dnn混合模型预测船舶主机功率方法 | |
CN112070125A (zh) | 一种基于孤立森林学习的不平衡数据集的预测方法 | |
CN110929843A (zh) | 一种基于改进深度自编码网络的异常用电行为辨识方法 | |
CN112116198B (zh) | 数据驱动的流程工业状态感知网络关键节点筛选方法 | |
CN111368920A (zh) | 基于量子孪生神经网络的二分类方法及其人脸识别方法 | |
CN109581339B (zh) | 一种基于头脑风暴自动调整自编码网络的声呐识别方法 | |
CN114781538A (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 | |
CN107704883A (zh) | 一种菱镁矿矿石的品级的分类方法及系统 | |
CN114707754A (zh) | 一种基于BiLSTM-CNN模型的智能电表故障预测方法及系统 | |
CN110674858A (zh) | 一种基于时空关联与大数据挖掘的交通拥堵检测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN110766060B (zh) | 基于深度学习的时间序列相似度的计算方法、系统及介质 | |
Zhou et al. | Supply chain fraud prediction based on xgboost method | |
Sun | Real estate evaluation model based on genetic algorithm optimized neural network | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN114037001A (zh) | 基于wgan-gp-c和度量学习的机械泵小样本故障诊断方法 | |
CN111708865A (zh) | 一种基于改进XGBoost算法的技术预见及专利预警分析方法 | |
CN116128544A (zh) | 一种电力营销异常营业数据的主动稽核方法和系统 | |
CN115083511A (zh) | 基于图表示学习与注意力的外围基因调控特征提取方法 | |
Zhu et al. | Application of Improved Deep Belief Network Based on Intelligent Algorithm in Stock Price Prediction | |
CN111353523A (zh) | 一种对铁路客户进行分类的方法 | |
CN111832941A (zh) | 一种罪犯改造质量评估系统的子训练集处理方法 | |
Li et al. | Prediction and Sensitivity Analysis of Companies’ Return on Equity Based on Deep Neural Network | |
Jiao | Big Data Mining Optimization Algorithm Based on Machine Learning Model. | |
CN117473435B (zh) | 一种基于时空特征的突发公共卫生事件虚假异常信息检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |