CN110826790A - 一种绞吸式挖泥船施工生产率智能预测方法 - Google Patents

一种绞吸式挖泥船施工生产率智能预测方法 Download PDF

Info

Publication number
CN110826790A
CN110826790A CN201911050438.XA CN201911050438A CN110826790A CN 110826790 A CN110826790 A CN 110826790A CN 201911050438 A CN201911050438 A CN 201911050438A CN 110826790 A CN110826790 A CN 110826790A
Authority
CN
China
Prior art keywords
data
feature
productivity
cutter suction
suction dredger
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911050438.XA
Other languages
English (en)
Inventor
李明超
韩帅
白硕
孔锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201911050438.XA priority Critical patent/CN110826790A/zh
Publication of CN110826790A publication Critical patent/CN110826790A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种绞吸式挖泥船施工生产率智能预测方法:(1)采集挖泥船各个部位上的施工监测数据;(2)根据Relief算法建立影响绞吸挖泥船生产率的特征选择模型,得出最优的特征集合;(3)根据连续均值去噪法对最优的特征集合进行噪声处理,得到去噪后的特征数据集合;(4)根据去噪后的特征数据集合,选择极度提升树集成学习预测模型,对绞吸挖泥船进行生产率预测;(5)根据多种评估指标,对生产率预测结果进行评价衡量。本发明打破了传统经验上认为影响生产率的特征要素,选出来新的有效的影响生产率的因素,用数据挖掘方法选出主要特征,并对这些特征机器学习,准确预测了绞吸挖泥船的生产率,为绞吸挖泥船生产率预测找到了一种新途径。

Description

一种绞吸式挖泥船施工生产率智能预测方法
技术领域
本发明涉及疏浚工程、水利工程等的航道开挖、港池开挖、水域清淤的施工生产率预测技术,同时涉及到数据挖掘领域的特征选择方法、机器学习预测方法等,特别涉及一种绞吸式挖泥船施工生产率智能预测方法。
背景技术
疏浚工程是为拓宽和加深水域利用特定的机械设备挖掘水下沉积物、沙子、岩石等的土石方工程。在这里挖泥船是这项工作的核心设备,世界范围内存在数量众多的挖泥船,特别是西欧、日本、美国和东南亚等地区。它们服务于沿海和内河的港口航道建设与维护、临海工业区建设与沿海城市发展、水利防洪清淤以及环境保护和改善等多方面。特别是近年来,海洋资源利用越来越引起重视,海洋油气和采矿业、海底管线铺设、海岸养护、标志性海洋建筑物等产业将形成海洋疏浚新市场。2011-2016年,中国疏浚总量连年增长。2011年,中国总疏浚量在17亿立方米左右;2016年上升至41亿立方米左右。庞大的疏浚市场给疏浚行业带来了机遇,同时也提出了技术上的新挑战。由于绞吸式挖泥船的良好挖掘性能及一站式的挖、输、送体系而备受青睐,在工作进程中,绞刀头的旋转运动破坏了原状土的内聚力,使得水和土混合形成一定浓度的疏浚物,经刀头吸入口被输送到指定位置。荷兰的IHC挖泥船建造商,在市场上推出了一系列子系统控制产品,如自动泵控制器、自动绞刀、增压自动化等来控制较高的生产率,但效果仍不令人满意。挖泥船产能是影响疏浚效益的关键因素,实时监控性能、实船调节参数,使得挖泥船平稳高效运行是疏浚作业系统的首要目标。然而,疏浚作业效率是一个高度动态变化的过程,影响因素多、相互关系复杂,和疏浚极为复杂的工作环境密切相关,使得作业过程的控制参数与实际过程输出参数的关系不明确,很难用传统的学习方法去分析验证和预测。这给挖泥船的实时产能预测制造了障碍。为此,根据绞吸挖泥船的监测数据建立合适的产能预测模型,对于分析其发展趋势具有重要意义。
由于疏浚行业技术局限性及对数据的保密性,很少有关于机器学习算法处理疏浚设备监测数据的文章发表。但近年来,研究人员从不同方面提出了产能预测方法。例如,通过改进传统Smith预估器,提出一种参数辨识的模糊Smith产能预估控制方法。通过施工经验选取影响疏浚产能的四个指标,提出了基于Levenberg Marquardt算法的双隐含层BP神经网络模型预测绞吸挖泥船产量。为提高预测精度,提出了贝叶斯支持向量机,利用贝叶斯理论改进支持向量机的判别准则,估计支持向量机中的参数,从而提高预测精度。从吸入端口考虑,研究者将粒子滤波算法应用于耙吸式挖泥船,用于预测耙头密度进而进行产能预估。从疏浚材料方面考虑,前人运用粗糙集理论和条件熵开发疏浚材料定量分类模型,并结合挖泥船性能指标开发了挖泥船生产效率预测模型。
发明内容
本发明的目的是克服现有技术中的不足,提供一种基于综合数据挖掘技术的绞吸挖泥船生产率预测方法。本发明用数据挖掘方法选出主要特征,并对这些特征机器学习,准确预测了绞吸挖泥船的生产率,为绞吸挖泥船生产率预测找到了一种新途径。
本发明所采用的技术方案是:一种绞吸式挖泥船施工生产率智能预测方法,包括以下步骤:
步骤A,通过绞吸挖泥船施工过程,采集挖泥船各个部位上的施工监测数据作为样本数据;
步骤B,根据Relief算法建立影响绞吸挖泥船生产率的特征选择模型,得出最优的特征集合;
步骤C,根据连续均值去噪法对步骤B得到的最优的特征集合进行噪声处理,得到去噪后的特征数据集合;
步骤D,根据步骤C得到的去噪后的特征数据集合,选择极度提升树集成学习预测模型,对绞吸挖泥船进行生产率预测;
步骤E,根据多种评估指标,对步骤D获得的生产率预测结果进行评价衡量。
进一步地,步骤A中,所采集的施工监测数据包括横移速度、真空度和流速。
进一步地,步骤B中,所述的影响绞吸挖泥船生产率的特征选择模型,根据各个特征和类别的相关性赋予特征不同的权重,权重小于设定的阈值的特征将被移除,从而得到最优的特征集合。
其中,步骤B具体包括:
步骤B1,对步骤A得到的样本数据进行预处理:得到的原始施工监测数据存在若干个空值,采用均值插补法进行空白处填值,得到新的施工监测数据集A,如公式(1)所示:
Figure BDA0002255205270000031
式中,MD为缺失空白处填充的各类施工监测数据的均值;n为样本数据的维度,即,样本数量;xi为第i个样本,i=1,2,…,n;
步骤B2,对步骤B1得到的新的数据集A进行m次抽样,各类施工监测数据为特征,并设定特征权重的阈值为a,设定最近邻样本个数为k,设定原始特征个数为N、设定输出是各类施工监测数据的特征权重集合T;
步骤B3,从新的施工监测数据集A中随机选择一个样本数据R,然后从样本数据R的同类样本集中找出样本数据R的k个最近邻样本Ui(i=1,2,3,…,k),并依次循环从每一个不同类样本集中找出k个最近邻样本Si(C)(i=1,2,3,…,k),其中,Si(C)(i=1,2,3,…,k)表示类C中的第i个最近邻样本,采用diff(D,R1,R2)表示样本R1和样本R2在特征Dj(j=1,2,3,…,N)上的差,计算如公式(2)所示;
Figure BDA0002255205270000032
式中,R1[D]为样本R1在特征Dj(j=1,2,3,…,N)上的差,R2[D]为样本R2在特征Dj(j=1,2,3,…,N)上的差;
步骤B4,将所有特征数据依次带入公式(2)循环更新计算每个特征数据的权重,并把Dj(j=1,2,3,…,N)个特征添加到特征权重集合T中,便得到最优的特征集合,如公式(3)所示:
W[Dj]=P(特征Dj取值不同|不同类的最邻近样本)
-P(特征Dj取值不同|同类的最邻近样本) (3)
式中,W[Dj]为特征Dj(j=1,2,3,…,N)的权值,P(特征Dj取值不同|不同类的最邻近样本)表示不同类的最近邻样本之间特征Dj(j=1,2,3,…,N)取值不同的概率,P(特征Dj取值不同|同类的最邻近样本)则表示同类的最近邻样本之间特征Dj(j=1,2,3,…,N)取值不同的概率。
进一步地,步骤C中,所述的根据连续均值去噪法对步骤B得到的最优的特征集合进行噪声处理包括:
步骤C1,针对每一个选出的施工监测特征进行处理,导入特征数据到连续均值去噪法程序中;
步骤C2,根据施工经验设置特征数据的噪声阈值Z,检查导入特征的第一个数据是否为噪声值,如果是则去除,否则保留;
步骤C3,假设前E个数据均为正常值,计算前E个数据的均值,如果第E+1个数据大于前E个数据均值的Z倍,则第E+1个数据被视为噪声值去除,否则,第E+1个数据视为正常值保留,计算前E+1个数据的均值;
步骤C4,对第E+1之后的所有数据按照步骤C3进行处理,得到去除噪声值的一个特征数据集合;
步骤C5,依次导入其它特征数据,按照步骤C2至步骤C4进行处理,得到去除噪声值的所有特征数据集合。
进一步地,步骤D中,所述的根据步骤C得到的去噪后的特征数据集合,选择极度提升树集成学习预测模型,对绞吸挖泥船进行生产率预测包括:
步骤D1,由步骤C得到的去噪后的特征数据集合作为极度提升树集成学习预测模型的输入数据,以产量率作为目标数据;
步骤D2,采用min-max离散标准化方法对特征数据进行数据标准化处理,得到标准化特征数据集合;
步骤D3,在标准化特征数据集合中随机选取90%的标准化特征数据组成训练数据集合G,采用训练数据集合G对极度提升树集成学习预测模型进行训练。
步骤D4,将标准化特征数据集合中剩余的10%标准化特征数据输入训练好的极度提升树集成学习预测模型,得到生产率预测预测数据。
进一步地,步骤E中,所述的根据多种评估指标,对步骤D获得的生产率预测结果进行评价衡量包括:
根据步骤D中极度提升树集成学习预测模型得到的生产率预测结果,将生产率预测结果和实际生产率作图对比预测效果,并计算均方根误差预测结果评价指标、平均绝对百分误差预测结果评价指标、平均绝对误差预测结果评价指标和拟合优度预测结果评价指标,以多种评估指标衡量预测效果。
本发明的有益效果是:
本发明结合了疏浚工程中绞吸挖泥船的工作原理和当下流行的数据挖掘技术,以一种全新的方法实现了对绞吸挖泥船生产率的预测,并克服了以往生产率预测的误差大、不准确的缺点,为以后高效施工参数的优化奠定了基础。
附图说明
图1:本发明基于综合数据挖掘的绞吸挖泥船施工生产率预测方法流程图;
图2:绞吸挖泥船模型示意图;
图3:连续均值去噪流程图;
图4:去噪前管路总阻尼示意图;
图5:去噪前绞刀切削角度示意图;
图6:去噪后管路总阻尼示意图;
图7:去噪后绞刀切削角度示意图;
图8:GBDT生产率预测结果示意图。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下:
如附图1所示,一种绞吸式挖泥船施工生产率智能预测方法,包括以下步骤:
步骤A,通过绞吸挖泥船施工过程,采集挖泥船各个部位上的施工监测数据作为样本数据。
通过安装在挖泥船舶各个部位上的监测仪器,实船采集施工期绞吸挖泥船上的运行数据,绞吸挖泥船如图2所示。其中,数据采集的传感器种类众多,包括用于流量测量的电磁流量计、泥浆浓度测量的浓度计、真空表、绞刀位置指示仪、绞刀桥架角度传感器、潮位遥报仪、船舶吃水传感器、产量计等;所采集的施工监测数据包括横移速度、真空度和流速等;以获取时间序列形式的连续数据资料,整理后的数据如表1所示。
步骤B,根据Relief算法建立影响绞吸挖泥船生产率的特征选择模型,从众多监测数据中筛选对绞吸船生产率产生重要影响作用的特征数据项,得出最优的特征集合。Relief是一种特征权重算法(Feature weighting algorithms),根据各个特征和类别的相关性赋予特征不同的权重,权重小于设定的阈值的特征将被移除,从而得到最优的特征集合。
步骤B1,对步骤A得到的样本数据进行预处理:得到的原始施工监测数据存在若干个空值,采用均值插补法进行空白处填值,得到新的施工监测数据集A,如公式(1)所示:
Figure BDA0002255205270000061
式中,MD为缺失空白处填充的各类施工监测数据的均值;n为样本数据的维度,即,样本数量;xi为第i个样本,i=1,2,…,n。
步骤B2,对步骤B1得到的新的数据集A进行m次抽样,各类施工监测数据为特征,并设定特征权重的阈值为a,设定最近邻样本个数为k,设定原始特征个数为N、设定输出是各类施工监测数据的特征权重集合T;
步骤B3,从新的施工监测数据集A中随机选择一个样本数据R,然后从样本数据R的同类样本集中找出样本数据R的k个最近邻样本Ui(i=1,2,3,…,k),并依次循环从每一个不同类样本集中找出k个最近邻样本Si(C)(i=1,2,3,…,k),其中,Si(C)(i=1,2,3,…,k)表示类C中的第i个最近邻样本,采用diff(D,R1,R2)表示样本R1和样本R2在特征Dj(j=1,2,3,…,N)上的差,计算如公式(2)所示;
Figure BDA0002255205270000062
式中,R1[D]为样本R1在特征Dj(j=1,2,3,…,N)上的差,R2[D]为样本R2在特征Dj(j=1,2,3,…,N)上的差。
步骤B4,将所有特征数据依次带入公式(2)循环更新计算每个特征数据的权重,并把Dj(j=1,2,3,…,N)个特征添加到特征权重集合T中,便得到最优的特征集合,如公式(3)所示;
W[Dj]=P(特征Dj取值不同|不同类的最邻近样本)
-P(特征Dj取值不同|同类的最邻近样本) (3)
式中,W[Dj]为特征Dj(j=1,2,3,…,N)的权值,P(特征Dj取值不同|不同类的最邻近样本)表示不同类的最近邻样本之间特征Dj(j=1,2,3,…,N)取值不同的概率,P(特征Dj取值不同|同类的最邻近样本)则表示同类的最近邻样本之间特征Dj(j=1,2,3,…,N)取值不同的概率。
步骤C,根据连续均值去噪法(CMCM)对步骤B得到的最优的特征集合进行噪声清洗,得到去噪后的特征数据集合。
步骤C1,针对每一个选出的施工监测特征Q进行处理,导入特征数据到连续均值去噪法(CMCM)程序中。
步骤C2,根据施工经验设置特征数据的噪声阈值Z,检查导入特征的第一个数据是否为噪声值,如果是则去除,否则保留。
步骤C3,假设前E个数据均为正常值,则前E个数据组成非噪声集合q’(q1,q1,…,qe),计算前E个数据的均值B,如果第E+1个数据大于前E个数据均值B的Z倍,即,qe+1>B×Z,则第E+1个数据被视为噪声值去除,否则,第E+1个数据视为正常值保留,更新非噪声集合q’(q1,q1,…,qe,qe+1),计算前E+1个数据的均值。
步骤C4,对第E+1之后的所有数据按照步骤C3进行处理,得到去除噪声值的一个特征数据集合。
步骤C5,依次导入其它特征数据,按照步骤C2至步骤C4进行处理,得到去除噪声值的所有特征数据集合,整理流程如图3所示。
步骤D,根据步骤C得到的去噪后的特征数据集合,选择极度提升树(GBDT)集成学习预测模型,对绞吸挖泥船进行生产率预测。
步骤D1,由步骤C得到的去噪后的特征数据集合作为极度提升树(GBDT)集成学习预测模型的输入数据,以产量率作为目标数据。
步骤D2,针对不同特征数据间的量纲和量纲单位存在较大差异,采用min-max离散标准化方法对特征数据进行数据标准化处理,得到标准化特征数据集合。
对输入的特征数据进行线性变换,将特征数据映射到[0,1]之间,如公式(4)所示:
Figure BDA0002255205270000081
式中,x*为数据标准化处理后得到的标准化特征数据,x为特征数据,min特征数据的最小值,max特征数据的最大值。
步骤D3,在标准化特征数据集合中随机选取90%的标准化特征数据组成训练数据集合G,采用训练数据集合G对极度提升树集成学习预测模型进行训练,内部以迭代决策树算法运行,得到回归树函数fh(x),最终得到训练好的极度提升树集成学习预测模型。
首先初始化回归树,获得使损失函数最小的常数估计值,如公式(5)所示:
Figure BDA0002255205270000082
式中,f0(x)为初始化提升树,L(yi,c)为损失函数,yi为第i预测输出值,c为第一个决策树的输出值;
计算损失函数的负梯度在当前模型的值,将损失函数的负梯度在当前模型的值作为残差估计;根据公式(6)提升树的负梯度:
Figure BDA0002255205270000083
式中,rhi为负梯度,h=1,2,...,H;i=1,2,...,N,H为划分输入空间的区域个数;L(y,f(xi))为平方损失函数;y为预测输出值;f(xi)为第i个数据xi输入值的强学习器;fh-1(x)前一轮迭代产生的提升树模型;
对负梯度rhi拟合一颗回归树,得到第h棵树的叶结点区域Rhj(j=1,2,…,J)即一棵由J个叶子节点组成的树,来拟合残差的近似值;
利用线性搜索估计回归树叶结点区域的值,使得损失函数最小化;根据公式(7)计算每个叶结点区域Rhj(j=1,2,…,J)上的最优输出值:
Figure BDA0002255205270000084
式中,chj是最佳拟合值,j=1,2,…,J,c1是一个弱学习器,L(yi,fh-1(x)+c1)为附加弱学习器的损失函数;
更新回归树,如公式(8)所示:
Figure BDA0002255205270000091
式中,fh(x)为迭代至第h步的提升树模型,chj是最佳拟合值。
最终得到极度提升树集成学习预测模型,如公式(9)所示:
Figure BDA0002255205270000092
式中,
Figure BDA0002255205270000093
为得到的最终的学习器;fh(x)为迭代至第h步的提升树模型,即,更新的提升树模型,h=1,2,...,H;J为回归树叶子节点的个数,H为划分输入空间的区域个数,chj为最佳拟合值,j=1,2,…,J。
步骤D4,将标准化特征数据集合中剩余的10%标准化特征数据输入训练好的极度提升树集成学习预测模型,得到生产率预测预测数据。
步骤E,根据多种评估指标,对步骤D获得的生产率预测结果进行评价衡量。
根据步骤D中极度提升树集成学习预测模型得到的生产率预测结果,将生产率预测结果和实际生产率作图对比预测效果,并计算预测结果评价指标RMSE(均方根误差)、MAPE(平均绝对百分误差)、MAE(平均绝对误差)、R2(拟合优度),以多种评估指标衡量预测效果。
RMSE指标如公式(10)所示:
Figure BDA0002255205270000094
式中,RMSE为均方根误差,nf为预测值个数,yfi为原始数据,
Figure BDA0002255205270000095
为预测值。
MAPE指标如公式(11)所示:
Figure BDA0002255205270000096
式中,MAPE为平均绝对百分误差,nf为预测值个数,yfi为原始数据,
Figure BDA0002255205270000097
为预测值。
MAE指标如公式(12)所示:
Figure BDA0002255205270000098
式中,MAE为平均绝对误差,nf为预测值个数,yfi为原始数据,
Figure BDA0002255205270000101
为预测值。
R2指标如公式(13)所示:
Figure BDA0002255205270000102
式中,R2为拟合优度,nf为预测值个数,yfi为原始数据,
Figure BDA0002255205270000103
为预测值;为原始测值序列平均值;
Figure BDA0002255205270000105
为预测值序列平均值。
通过以上步骤,即可实现对绞吸挖泥船的生产率预测。
下面我们将借助一个工程实例对本方法进行验证,整个数学建模过程是通过Python语言及其Scikit-learn机器学习包实现:
工程概况:某航道的设计底标高为-15.2m,航道口门内设计底宽为249m,通航宽度为253m,口门外设计底宽为262m,通航宽度为266m;曲线半径取为2460m,航道边坡为1:5。计算超深0.4m,超宽4m。设计拟使用1条2500m3/h的绞吸式挖泥船疏浚施工,施工期8.5个月。根据某绞吸挖泥船施工运行状况,采集施工期间各个部位的监测数据,如表1所示。
表1施工期绞吸挖泥船监测数据
Figure BDA0002255205270000111
基于本方法所述的一种绞吸式挖泥船施工生产率智能预测方法,通过特征根消除方法(Recursive feature elimination)对255组监测数据进行特征筛选,最终保留了对生产率最相关的十个特征选项,它们分别是:“横移工作压力”、“水下泵电机电压”、“绞刀切削角度”、“管路总阻尼”、“流量”、“水下泵电压”、“主定位桩前进距离”、“水下泵发电机功率”、“舱内泵转速”、“台车行程”。
根据连续均值去噪法,针对所选的特征数据进行去噪处理,这里举例说明,如图4和图5分别是原始的去噪前的管路总阻尼和绞刀切削角度,噪声数据淹没了正常数据的走势,通过上述去噪方法得到相对平滑的有数据序列,如图6和图7所示。
对去噪后的数据归一化处理,根据极度提升树回归预测方法(GBDT)进行生产率预测,最后得到预测数据,并作图和原始数据对比,如图8所示,最后通过多指标分析得到RMSE为288.03、MAE为221.64、MAPE为0.09、R2为0.75。能很好的预测施工期绞吸挖泥船生产率。
综上,本发明一种绞吸式挖泥船施工生产率智能预测方法,打破了传统经验上认为影响生产率的特征要素,选出来新的有效的影响生产率的因素,用数据挖掘方法选出主要特征,并对这些特征机器学习,准确预测了绞吸挖泥船的生产率,为绞吸挖泥船生产率预测找到了一种新途径。
尽管上面结合附图对本发明的优选实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,并不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可以做出很多形式,这些均属于本发明的保护范围之内。

Claims (7)

1.一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,包括以下步骤:
步骤A,通过绞吸挖泥船施工过程,采集挖泥船各个部位上的施工监测数据作为样本数据;
步骤B,根据Relief算法建立影响绞吸挖泥船生产率的特征选择模型,得出最优的特征集合;
步骤C,根据连续均值去噪法对步骤B得到的最优的特征集合进行噪声处理,得到去噪后的特征数据集合;
步骤D,根据步骤C得到的去噪后的特征数据集合,选择极度提升树集成学习预测模型,对绞吸挖泥船进行生产率预测;
步骤E,根据多种评估指标,对步骤D获得的生产率预测结果进行评价衡量。
2.根据权利要求1所述的一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,步骤A中,所采集的施工监测数据包括横移速度、真空度和流速。
3.根据权利要求1所述的一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,步骤B中,所述的影响绞吸挖泥船生产率的特征选择模型,根据各个特征和类别的相关性赋予特征不同的权重,权重小于设定的阈值的特征将被移除,从而得到最优的特征集合。
4.根据权利要求3所述的一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,步骤B具体包括:
步骤B1,对步骤A得到的样本数据进行预处理:得到的原始施工监测数据存在若干个空值,采用均值插补法进行空白处填值,得到新的施工监测数据集A,如公式(1)所示:
Figure FDA0002255205260000011
式中,MD为缺失空白处填充的各类施工监测数据的均值;n为样本数据的维度,即,样本数量;xi为第i个样本,i=1,2,…,n;
步骤B2,对步骤B1得到的新的数据集A进行m次抽样,各类施工监测数据为特征,并设定特征权重的阈值为a,设定最近邻样本个数为k,设定原始特征个数为N、设定输出是各类施工监测数据的特征权重集合T;
步骤B3,从新的施工监测数据集A中随机选择一个样本数据R,然后从样本数据R的同类样本集中找出样本数据R的k个最近邻样本Ui(i=1,2,3,…,k),并依次循环从每一个不同类样本集中找出k个最近邻样本Si(C)(i=1,2,3,…,k),其中,Si(C)(i=1,2,3,…,k)表示类C中的第i个最近邻样本,采用diff(D,R1,R2)表示样本R1和样本R2在特征Dj(j=1,2,3,…,N)上的差,计算如公式(2)所示;
Figure FDA0002255205260000021
式中,R1[D]为样本R1在特征Dj(j=1,2,3,…,N)上的差,R2[D]为样本R2在特征Dj(j=1,2,3,…,N)上的差;
步骤B4,将所有特征数据依次带入公式(2)循环更新计算每个特征数据的权重,并把Dj(j=1,2,3,…,N)个特征添加到特征权重集合T中,便得到最优的特征集合,如公式(3)所示:
W[Dj]=P(特征Dj取值不同|不同类的最邻近样本)-P(特征Dj取值不同|同类的最邻近样本) (3)
式中,W[Dj]为特征Dj(j=1,2,3,…,N)的权值,P(特征Dj取值不同|不同类的最邻近样本)表示不同类的最近邻样本之间特征Dj(j=1,2,3,…,N)取值不同的概率,P(特征Dj取值不同|同类的最邻近样本)则表示同类的最近邻样本之间特征Dj(j=1,2,3,…,N)取值不同的概率。
5.根据权利要求1所述的一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,步骤C中,所述的根据连续均值去噪法对步骤B得到的最优的特征集合进行噪声处理包括:
步骤C1,针对每一个选出的施工监测特征进行处理,导入特征数据到连续均值去噪法程序中;
步骤C2,根据施工经验设置特征数据的噪声阈值Z,检查导入特征的第一个数据是否为噪声值,如果是则去除,否则保留;
步骤C3,假设前E个数据均为正常值,计算前E个数据的均值,如果第E+1个数据大于前E个数据均值的Z倍,则第E+1个数据被视为噪声值去除,否则,第E+1个数据视为正常值保留,计算前E+1个数据的均值;
步骤C4,对第E+1之后的所有数据按照步骤C3进行处理,得到去除噪声值的一个特征数据集合;
步骤C5,依次导入其它特征数据,按照步骤C2至步骤C4进行处理,得到去除噪声值的所有特征数据集合。
6.根据权利要求1所述的一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,步骤D中,所述的根据步骤C得到的去噪后的特征数据集合,选择极度提升树集成学习预测模型,对绞吸挖泥船进行生产率预测包括:
步骤D1,由步骤C得到的去噪后的特征数据集合作为极度提升树集成学习预测模型的输入数据,以产量率作为目标数据;
步骤D2,采用min-max离散标准化方法对特征数据进行数据标准化处理,得到标准化特征数据集合;
步骤D3,在标准化特征数据集合中随机选取90%的标准化特征数据组成训练数据集合G,采用训练数据集合G对极度提升树集成学习预测模型进行训练;
步骤D4,将标准化特征数据集合中剩余的10%标准化特征数据输入训练好的极度提升树集成学习预测模型,得到生产率预测预测数据。
7.根据权利要求1所述的一种绞吸式挖泥船施工生产率智能预测方法,其特征在于,步骤E中,所述的根据多种评估指标,对步骤D获得的生产率预测结果进行评价衡量包括:
根据步骤D中极度提升树集成学习预测模型得到的生产率预测结果,将生产率预测结果和实际生产率作图对比预测效果,并计算均方根误差预测结果评价指标、平均绝对百分误差预测结果评价指标、平均绝对误差预测结果评价指标和拟合优度预测结果评价指标,以多种评估指标衡量预测效果。
CN201911050438.XA 2019-10-31 2019-10-31 一种绞吸式挖泥船施工生产率智能预测方法 Pending CN110826790A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911050438.XA CN110826790A (zh) 2019-10-31 2019-10-31 一种绞吸式挖泥船施工生产率智能预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911050438.XA CN110826790A (zh) 2019-10-31 2019-10-31 一种绞吸式挖泥船施工生产率智能预测方法

Publications (1)

Publication Number Publication Date
CN110826790A true CN110826790A (zh) 2020-02-21

Family

ID=69551762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911050438.XA Pending CN110826790A (zh) 2019-10-31 2019-10-31 一种绞吸式挖泥船施工生产率智能预测方法

Country Status (1)

Country Link
CN (1) CN110826790A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111271300A (zh) * 2020-03-30 2020-06-12 上海交通大学 基于神经网络的挖泥船泥泵转速在线辨识控制方法及系统
CN111832843A (zh) * 2020-07-29 2020-10-27 中交天津航道局有限公司 一种疏浚工程泥驳选配和初始装驳顺序确定的方法
CN113706037A (zh) * 2021-08-31 2021-11-26 天津大学 基于虚拟传感器的耙吸挖泥船的施工安全辅助监控方法
CN117236511A (zh) * 2023-09-26 2023-12-15 中交广州航道局有限公司 绞吸式挖泥船水下泵真空度的大数据预测方法及装置
CN117314249A (zh) * 2023-10-10 2023-12-29 中交广州航道局有限公司 一种绞吸式挖泥船操作手能力评估的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779137A (zh) * 2016-11-14 2017-05-31 上海海事大学 一种根据海况与操纵条件预测船舶油耗的方法
CN108762079A (zh) * 2018-06-04 2018-11-06 河海大学常州校区 基于深度强化学习的绞吸挖泥船横移过程控制系统及方法
CN110298611A (zh) * 2019-05-16 2019-10-01 重庆瑞尔科技发展有限公司 基于随机森林与深度学习的船舶货运效率调控方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779137A (zh) * 2016-11-14 2017-05-31 上海海事大学 一种根据海况与操纵条件预测船舶油耗的方法
CN108762079A (zh) * 2018-06-04 2018-11-06 河海大学常州校区 基于深度强化学习的绞吸挖泥船横移过程控制系统及方法
CN110298611A (zh) * 2019-05-16 2019-10-01 重庆瑞尔科技发展有限公司 基于随机森林与深度学习的船舶货运效率调控方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHUO BAI 等: "Data mining approach to construction productivity prediction for cutter suction dredgers", 《AUTOMATION IN CONSTRUCTION》 *
菅小艳 等: "不平衡数据集上的Relief特征选择算法", 《数据采集与处理》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111271300A (zh) * 2020-03-30 2020-06-12 上海交通大学 基于神经网络的挖泥船泥泵转速在线辨识控制方法及系统
CN111832843A (zh) * 2020-07-29 2020-10-27 中交天津航道局有限公司 一种疏浚工程泥驳选配和初始装驳顺序确定的方法
CN111832843B (zh) * 2020-07-29 2022-03-22 中交天津航道局有限公司 一种疏浚工程泥驳选配和初始装驳顺序确定的方法
CN113706037A (zh) * 2021-08-31 2021-11-26 天津大学 基于虚拟传感器的耙吸挖泥船的施工安全辅助监控方法
CN117236511A (zh) * 2023-09-26 2023-12-15 中交广州航道局有限公司 绞吸式挖泥船水下泵真空度的大数据预测方法及装置
CN117314249A (zh) * 2023-10-10 2023-12-29 中交广州航道局有限公司 一种绞吸式挖泥船操作手能力评估的方法及装置

Similar Documents

Publication Publication Date Title
CN110826790A (zh) 一种绞吸式挖泥船施工生产率智能预测方法
Bai et al. Data mining approach to construction productivity prediction for cutter suction dredgers
US10032117B2 (en) Method for developing machine operation classifier using machine learning
CN113006188B (zh) 一种基于lstm神经网络的挖掘机分阶段功率匹配方法
CN108595803B (zh) 基于递归神经网络的页岩气井生产压力预测方法
CN114661006A (zh) 一种耙吸挖泥船抽舱吹岸过程优化控制系统及方法
CN114792044A (zh) 一种耦合空间特性基坑邻近地表沉降智能预警方法及系统
CN115952590A (zh) 基于bo-rf-mompa混合算法的盾构隧道优化设计方法及设备
Bai et al. Productivity analysis of trailing suction hopper dredgers using stacking strategy
CN116502478A (zh) 一种基于海底地形监测的自提升平台下桩辅助决策方法
CN114757087A (zh) 一种基于动态主成分分析与lstm的刀具磨损预测方法
Fu et al. Productivity estimation of cutter suction dredger operation through data mining and learning from real-time big data
Mamunts et al. Development of an automated system for managing and optimizing management decisions in the design, organization and production of dredging
CN111460737B (zh) 泥水气压平衡盾构的智能沉降预测方法及系统
CN114091339A (zh) 一种基于gru的耙吸挖泥船艏吹瞬时产量预测方法
CN113642801A (zh) 一种基于lstm的绞吸挖泥船产量预测方法
CN114065639A (zh) 一种挖泥船施工参数的闭环实时反演方法
CN115169644A (zh) 一种挖泥船的能耗预测方法及系统
CN115618480A (zh) 一种基于遗传算法的挖泥船能耗优化方法及系统
Yin et al. A technical note on the application of interpolation method on modeling of 3D surface rock layer
Zhang et al. Energy Efficiency Prediction Model of Suction Hopper Dredger Based on Correlation Analysis and Convolutional Neural Network
CN113762635B (zh) Epb隧道施工地表沉降全周期自适应模糊推理预测方法
Kubota et al. Development of an autopilot model for shield tunneling machines using machine learning
Wang et al. The Production Prediction of Cutter Suction Dredger Based on PCA
CN116047598B (zh) 一种基于人工智能的石油勘探方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination