CN110751339A - 管道腐蚀速率预测的方法、装置和计算机设备 - Google Patents

管道腐蚀速率预测的方法、装置和计算机设备 Download PDF

Info

Publication number
CN110751339A
CN110751339A CN201911015222.XA CN201911015222A CN110751339A CN 110751339 A CN110751339 A CN 110751339A CN 201911015222 A CN201911015222 A CN 201911015222A CN 110751339 A CN110751339 A CN 110751339A
Authority
CN
China
Prior art keywords
data
corrosion
prediction model
training
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911015222.XA
Other languages
English (en)
Inventor
陈良超
杨剑锋
李光海
陆新元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Chemical Technology
Original Assignee
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Chemical Technology filed Critical Beijing University of Chemical Technology
Priority to CN201911015222.XA priority Critical patent/CN110751339A/zh
Publication of CN110751339A publication Critical patent/CN110751339A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Mathematical Analysis (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)

Abstract

本发明公开了管道腐蚀速率预测的方法、装置和计算机设备,其中,从管道设备和管道设备的循环水介质中,获取腐蚀数据,通过数据预处理模型对腐蚀数据进行数据预处理,得到预处理数据,通过降维模型得到降维数据,将降维数据随机分成训练数据和测试数据,根据训练数据进行参数调整和迭代运算,对测试数据中的腐蚀因素数据进行腐蚀速率预测,得到测试数据中腐蚀速率数据的第一预测值,将测试数据中的腐蚀速率数据与第一预测值进行对比,得到回归评估指标,根据回归评估指标评估数据预测模型的预测结果,解决了腐蚀预测模型学习速度慢、精度低的问题,提高了腐蚀预测模型学习效率和预测的准确度。

Description

管道腐蚀速率预测的方法、装置和计算机设备
技术领域
本申请涉及石油化工腐蚀技术领域,特别是涉及管道腐蚀速率预测的方法、 装置和计算机设备。
背景技术
各行各业中,金属腐蚀问题难以避免,而且,腐蚀会对国家经济造成巨大 损失,尤其在石油化工行业中,每年因腐蚀带来的经济损失占本国本年度国民 经济总产值的3%~5%。石油炼制过程中循环水水质问题引起的换热设备和管道 的腐蚀问题凸显,影响炼油装置的安全运行。因此,炼油装置需要通过采集多 种腐蚀影响因素的数据,例如,温度、腐蚀性元素、酸碱度、流速等,以及反 应腐蚀结果的数据,例如,铁离子含量、腐蚀损失等进行水质调整和腐蚀控制。 因此,建立基于各类腐蚀因素变量的腐蚀结果预测模型,通过监测腐蚀因素来 快速评估和预测该循环水的腐蚀状态,采取相应的调整和防腐措施,对开展腐蚀防护工作,保障设备安全有一定意义。
相关技术中,通过神经网络模型建立腐蚀预测模型来预测腐蚀速率,虽然 可以从不同程度上预测特定情况下特定设备的腐蚀状况,但传统神经网络算法 学习速度慢,精度低。
针对相关技术中,腐蚀预测模型学习速度慢、精度低的问题,目前尚未提 出有效的解决方案。
发明内容
针对相关技术中,腐蚀预测模型学习速度慢、精度低的问题,本发明提供 了管道腐蚀速率预测的方法、装置、计算机设备和存储介质,以至少解决上述 问题。
根据本发明的一个方面,提供了一种管道腐蚀速率预测的方法,所述方法 包括:
从管道设备和所述管道设备的循环水介质中,获取腐蚀数据,其中,腐蚀 数据包括腐蚀因素数据和腐蚀速率数据;
通过数据预处理模型对所述腐蚀数据进行数据预处理,得到预处理数据, 其中,所述数据预处理包括数据无量纲化和异常值处理,通过降维模型对所述 预处理数据进行降维处理,得到降维数据;
将所述降维数据随机分成训练数据和测试数据,在数据预测模型根据所述 训练数据进行参数调整和迭代运算之后,对所述测试数据中的所述腐蚀因素数 据进行腐蚀速率预测,得到所述测试数据中所述腐蚀速率数据的第一预测值;
将所述测试数据中的所述腐蚀速率数据与所述第一预测值进行对比,得到 回归评估指标,根据所述回归评估指标评估所述数据预测模型的预测结果,在 所述回归评估指标小于或者等于预设回归评估指标的情况下,输出所述第一预 测值,保存所述数据预测模型。
在其中一个实施例中,在所述数据预测模型根据所述训练数据进行参数调 整和迭代运算之后,所述方法包括:
所述数据预测模型引入缩减参数,通过所述缩减参数控制所述迭代运算的 次数。
在其中一个实施例中,所述数据预测模型根据所述训练数据进行参数调整 包括:
对所述训练数据进行交叉验证,得到训练模型预设参数的训练参数值和评 估值,其中,所述交叉验证包括对所述训练数据进行训练和验证,所述训练参 数值和所述评估值一一对应;
在所述预设参数的数量为1的情况下,根据所述评估值选择所述训练参数 值作为所述数据预测模型的预测参数值,在所述预设参数的数量大于1的情况 下,对每组所述预设参数的组合进行所述交叉验证,根据所述交叉验证的所述 评估值,选择所述训练参数值作为所述数据预测模型的预测参数值。
在其中一个实施例中,所述根据所述回归评估指标评估所述数据预测模型 的预测结果包括:
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据 预测模型的误差曲线的波动范围小于预设波动值的情况下,认为所述数据预测 模型符合所述预设要求,对所述降维数据进行所述参数调整;或者,
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据 预测模型的误差曲线的波动范围大于或者等于所述预设波动值的情况下,认为 所述数据预测模型不符合所述预设要求,对所述腐蚀数据进行所述数据预处理。
根据本发明的另一个方面,提供了一种管道腐蚀速率预测的装置,所述装 置包括获取模块、处理模块、预测模块和检验模块:
所述获取模块,用于从管道设备和所述管道设备的循环水介质中,获取腐 蚀数据,其中,腐蚀数据包括腐蚀因素数据和腐蚀速率数据;
所述处理模块,用于通过数据预处理模型对所述腐蚀数据进行数据预处理, 得到预处理数据,其中,所述数据预处理包括数据无量纲化和异常值处理,通 过降维模型对所述预处理数据进行降维处理,得到降维数据;
所述预测模块,用于将所述降维数据随机分成训练数据和测试数据,在数 据预测模型根据所述训练数据进行参数调整和迭代运算之后,对所述测试数据 中的所述腐蚀因素数据进行腐蚀速率预测,得到所述测试数据中所述腐蚀速率 数据的第一预测值;
所述检验模块,用于将所述测试数据中的所述腐蚀速率数据与所述第一预 测值进行对比,得到回归评估指标,根据所述回归评估指标评估所述数据预测 模型的预测结果,在所述回归评估指标小于或者等于预设回归评估指标的情况 下,输出所述第一预测值,保存所述数据预测模型。
在其中一个实施例中,所述预测模块包括控制单元:
所述控制单元,用于所述数据预测模型引入缩减参数,通过所述缩减参数 控制所述迭代运算的次数。
在其中一个实施例中,所述预测模块还包括训练单元和选择单元:
所述训练单元,用于对所述训练数据进行交叉验证,得到训练模型预设参 数的训练参数值和评估值,其中,所述交叉验证包括对所述训练数据进行训练 和验证,所述训练参数值和所述评估值一一对应;
所述选择单元,用于在所述预设参数的数量为1的情况下,根据所述评估 值选择所述训练参数值作为所述数据预测模型的预测参数值,在所述预设参数 的数量大于1的情况下,对每组所述预设参数的组合进行所述交叉验证,根据 所述交叉验证的所述评估值,选择所述训练参数值作为所述数据预测模型的预 测参数值。
在其中一个实施例中,所述检验模块还用于:
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据 预测模型的误差曲线的波动范围小于预设波动值的情况下,认为所述数据预测 模型符合所述预设要求,对所述降维数据进行所述参数调整;或者,
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据 预测模型的误差曲线的波动范围大于或者等于所述预设波动值的情况下,认为 所述数据预测模型不符合所述预设要求,对所述腐蚀数据进行所述数据预处理。
根据本发明的另一个方面,提供了一种计算机设备,包括存储器和处理器, 所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任 一所述方法。
根据本发明的另一个方面,提供了一种计算机可读存储介质,其上存储有 计算机程序,所述程序被处理器执行时实现上述任一所述方法。
通过本发明,从管道设备和管道设备的循环水介质中,获取腐蚀数据,其 中,腐蚀数据包括腐蚀因素数据和腐蚀速率数据,通过数据预处理模型对该腐 蚀数据进行数据预处理,得到预处理数据,其中,该数据预处理包括数据无量 纲化和异常值处理,通过降维模型对该预处理数据进行降维处理,得到降维数 据,将该降维数据随机分成训练数据和测试数据,在数据预测模型根据该训练 数据进行参数调整和迭代运算之后,对该测试数据中的该腐蚀因素数据进行腐 蚀速率预测,得到该测试数据中该腐蚀速率数据的第一预测值,将该测试数据 中的该腐蚀速率数据与该第一预测值进行对比,得到回归评估指标,根据该回归评估指标评估该数据预测模型的预测结果,在该回归评估指标小于或者等于 预设回归评估指标的情况下,输出该第一预测值,保存该数据预测模型,解决 了腐蚀预测模型学习速度慢、精度低的问题,提高了腐蚀预测模型学习效率和 预测的准确度。
附图说明
图1是根据本发明实施例的管道腐蚀速率预测的方法的应用环境示意图;
图2是根据本发明实施例的管道腐蚀速率预测的方法的流程图;
图3是根据本发明实施例的高杠杆值点的分布示意图;
图4是根据本发明实施例的数据预测模型参数调整的方法的流程图;
图5是根据本发明实施例的数据预测模型的评估检验的流程图;
图6是根据本发明实施例的管道腐蚀速率预测的设备的结构框图一;
图7是根据本发明实施例的管道腐蚀速率预测的设备的结构框图二;
图8是根据本发明实施例的管道腐蚀速率预测的设备的结构框图三;
图9是根据本发明实施例的腐蚀速率预测的方法的流程图;
图10是根据本发明实施例的指标为pH的数据均值方差归一化预处理图;
图11是根据本发明实施例的指标为浊度的数据均值方差归一化预处理图;
图12是根据本发明实施例的采用K-means算法实现离群点检测的结果示意 图;
图13是根据本发明实施例的帽子值分布的示意图;
图14是根据本发明实施例的变量相关关系数分布图;
图15是根据本发明实施例的主成分贡献曲线图;
图16是根据本发明实施例的误差随迭代次数的变化曲线图;
图17是根据本发明实施例的特征的重要程度图;
图18是根据本发明实施例的数据预测模型的预测结果图;
图19是根据本发明实施例的不同预测结果的RMSE和MAE对比示例。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅 用以解释本申请,并不用于限定本申请。
本申请提供的管道腐蚀速率预测的方法,可以应用于如图1所示的应用环 境中,图1是根据本发明实施例的管道腐蚀速率预测的方法的应用环境示意图, 如图1所示,其中,服务器102获取终端104的腐蚀数据,并对该腐蚀数据进 行预处理和降维,服务器102将降维后的数据随机分成训练数据和测试数据, 训练数据用来训练数据预测模型,测试数据用来验证数据预测模型的准确度并 得到回归评估指标,在该数据预测模型验证通过的条件下,服务器102输出该 数据预测模型,其中,服务器102可以为独立的服务器或者是多个服务器组成 的服务器集群,终端104可以为各种检测设备,例如探针、探头或者挂片等, 终端104也可以为笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服 务器102可以通过移动网络、无线网络或者蓝牙连接与终端104进行数据传输。
在一个实施例中,提供了一种管道腐蚀速率预测的方法,图2是根据本发 明实施例的管道腐蚀速率预测的方法的流程图,如图2所示,该方法包括如下 步骤:
步骤S202,从管道设备和管道设备的循环水介质中,获取腐蚀数据,其中, 腐蚀数据包括腐蚀因素数据和腐蚀速率数据,在炼油装置的运行过程中,为监 测评估腐蚀状态,采集的腐蚀数据的类型包括浊度、钙硬度、碱度、温差、腐 蚀性元素、细菌数、余氯。
步骤S204,通过数据预处理模型对该腐蚀数据进行数据预处理,得到预处 理数据,其中,该数据预处理包括数据无量纲化和异常值处理,通过降维模型 对该预处理数据进行降维处理,得到降维数据。
在采集到腐蚀数据中,存在杂乱的,不完整的数据,影响算法的运算效率, 有可能导致最终结果出现偏差,因此,需要对采集到的腐蚀数据进行预处理, 数据预处理主要包括数据无量纲化和异常值处理,其中,数据无量纲化,是指 通过一个合适的变量替代,将一个涉及物理量方程的部分或全部的单位移除, 例如,将不同单位的数据转换成统一格式的数据,或者将描述不同特征的数据 转换为对某个确定特征上的描述。数据的无量纲化可以是线性的,也可以是非 线性的,线性的无量纲化包括中心化处理和缩放处理,其中,中心化处理的本 质是所有数据减去一个固定值后平移到某个位置,缩放处理的本质是通过数据除以一个固定值,将数据固定在某个确定范围之中,而且取对数也是一种缩放 处理。
常用的数据无量纲化有最值归一化和均值方差归一化,最值归一化的计算 可由如下公式1进行:
Figure BDA0002245473370000061
最值归一化可以将所有数据映射到0至1之间,适用于数据分布有明显边 界的情况,但是最值归一化容易受到异常值的影响,造成数据的整体偏斜。均 值方差归一化可由如下公式2进行:
Figure BDA0002245473370000062
其中,μ、σ分别是腐蚀数据的均值和方差,均值方差归一化可以将腐蚀 数据归一化到均值为0、方差为1的分布中,不容易受到异常值影响。
异常值处理包括K-means离群点处理和杠杆值点处理,在管道设备的循环 水中采集的腐蚀数据受条件限制会产生误差,这些误差数据称为异常值,异常 值包括离群点和高杠杆值点,其中,离群点是指数据预测模型预测效果不佳的 观测点,离群点通常有很大的、或正或负的残差,离群点是既不属于聚类也不 属于背景噪声的点。K-means算法采用距离作为相似性的评价指标,认为两个对 象的距离越近,其相似度就越大,K-means算法先随机选取K个对象作为初始 的聚类中心,计算每个对象与种子聚类中心之间的距离,将每个对象分配给距 离它最近的聚类中心,然后重新计算每个聚类的平均值,作为新的聚类中心,不断重复该聚类过程,直到准则函数收敛,收敛函数如公式3所示:
Figure BDA0002245473370000063
其中,E是腐蚀数据中所有对象与它所在的聚类中心的平方误差的综合,E 越大说明对象与聚类中心的距离越大,聚类内的相似度越低,E越小说明聚类内 的相似性越高,x为聚类内的一个数据对象,
Figure BDA0002245473370000064
是聚类Ci的聚类中心,k是聚类 个数,Ci是第i个聚类。
通过K-means算法进行离群点处理的过程为:1、从数据集中随机选取第一 数据;2、计算其他数据与该第一数据间的欧氏距离,如果该距离大于预设阈值, 则判定该数据为离群点;3、选取第二数据,计算其他数据与该第二数据间的欧 氏距离,直到将所有离群点检测出来为止,其中,该第二数据与第一数据不重 复;4、在非离群点中随机选取预设数量的数据作为初始聚类种子;5、计算每 个非离群点数据与聚类中心的距离,根据该距离将数据划分到距离最近的聚类; 6、重复计算每个聚类中对象的平均值,更新聚类中心;7、重复步骤5和步骤6, 直到准则函数E收敛;8、计算每个离群点数据对象与聚类中心的距离,根据距 离将其划分到最近的聚类。
对于高杠杆值点,统计学上,认为一个数据的帽子值大于其帽子均值的2 倍为高杠杆值点,高杠杆值点预测变量的取值超出正常范围,图3是根据本发 明实施例中高杠杆值点的分布示意图,如图3所示。帽子矩阵可由如下公式4 定义:
H=X(XTX)-1XT 公式4
其中,X为观测数据的解释变量,帽子均值为p/n,其中,p是数据预测模 型的参数数量值,n是样本量,一个观测数据为xi的帽子值指的是帽子矩阵的对 角线第i个元素hii,一般地,统计学上认为该值较大时,该观测数据为高杠杆值 点。
另一方面,腐蚀速率受多个因素的影响,通过相关性分析,得到数据存在 多重共线性,多重共线性是指线性回归模型中变量之间存在相关关系,使模型 估计失真或难以估计准确,本文采用主成分分析算法(Principal Components Analysis,简称为PCA)模型,对影响因素进行降维,从而解决多重共线性问题, 构建出有用的特征。降维是从一个维度空间映射到另一个维度空间,特征的多 少并没有减少,PCA算法将数据从原来的坐标系转换到新的坐标系,新坐标系 的选择是由数据本身进行,坐标转换后,大部分数据的方差都包含在最前面的 几个新坐标轴中,因此可以忽略余下的坐标轴,得到降维后的数据,通过PCA算法进行降维的过程为:1、设有m条n维数据,将原始数据按列组成m行n 列矩阵Xm×n;2、求出样本均值,样本均值可由如下公式5得到:
Figure BDA0002245473370000071
3、计算Xm×n的协方差矩阵,协方差矩阵可由如下公式6得到:
4、计算协方差矩阵的特征值和特征向量,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;5、Y=PX即为降维到k维后的数据。
步骤S206,将该降维数据随机分成训练数据和测试数据,在数据预测模型 根据该训练数据进行参数调整和迭代运算之后,对该测试数据中的腐蚀因素数 据进行腐蚀速率预测,得到该测试数据中腐蚀速率数据的第一预测值,其中, 训练数据对模型进行参数调整,测试数据在模型建立完成后,对数据预测模型 预测的准确度进行验证,本实施例在进行迭代运算的过程中,采用梯度提升回 归树(Gradient BoostRegression Tree,简称为GBRT)进行迭代,GBRT算法是 一种迭代的回归树算法,由弱分类器集成,该算法由多棵回归树组成,GBRT 算法的每一棵树是从之前所有树的残差中学习得到的,所有树的结果累加起来 得到最终结果,可处理不同类型的数据,利用GBRT算法进行迭代运算的过程 如下:假设T表示训练数据集,M表示算法设定的迭代次数,其中, T={(x1,y1),(x2,y2),...,(xN,yN)},1、初始化可以由如下公式7进行:
其中,L(yi,c)为损失函数,本实施例中采用的平方损失函数可以由如下公式8 进行:
L(yi,c)=(yi-c)2 公式8
公式8用于估计使损失函数最小化的常数值,是只有一个根节点的树。2、对于 m=1,2,...,M,i=1,2,...,N,计算损失函数的负梯度在当前模型的值,并将它作为残 差的估计值,该估计值可由如下公式9得到:
Figure BDA0002245473370000082
3、根据
Figure BDA0002245473370000083
学习一棵回归树,并得到第m棵树的叶节点区域
Figure BDA0002245473370000084
以拟 合残差的近似值。对于每个j计算根据
Figure BDA0002245473370000085
学习一棵回归树,并得到第m棵树的 叶节点区域,以拟合残差的近似值。对于每个j按照如下公式10进行计算:
Figure BDA0002245473370000086
公式10利用线性搜索估计叶节点区域的值,使损失函数最小化。
步骤S208,将测试数据中的腐蚀速率数据与第一预测值进行对比,得到回 归评估指标,根据该回归评估指标评估数据预测模型的预测结果,在回归评估 指标小于或者等于预设回归评估指标的情况下,输出该第一预测值,保存该数 据预测模型,为了保证模型预测的准确性,测试数据中的数据对建立完成的模 型进行验证,其中,回归评估指标包括均方根误差(Root Mean Square Error,简 称为RMSE)和平均绝对误差(Mean AbsoluteError,简称为MAE),预设回归 评估指标包括预设均方根误差(简称为预设RMSE)和预设平均绝对误差(简 称为预设MAE),预设RMSE的值可以为1或者其它数值,预设MAE的值可以 为1或者其它数值,例如,预设RMSE的值为1,预设MAE的值为1,在回归 评估指标的RMSE为0.4,MAE为0.5的情况下,认为该模型满足要求,输出 预测结果并保存预测模型。
通过步骤S202至S208,对获取到的腐蚀数据进行数据预处理和降维处理, 将降维后的数据随机分成训练数据和测试数据,数据预处理中的无量纲化可以 加快求解速度,提升模型精度,异常值处理采用K-means算法,K-means算法 基于数据距离实现,无需了解数据集的分布情况,发现离群点是高度有效的, 且计算简单,可以快速处理大规模数据的有效性,数据降维是数据挖掘中很重 要的一项技术,不仅可以解决维度数量大的问题,而且可以在压缩数据的同时 让信息损失最小化,PCA算法是数据降维常用的一种方法,可以降低数据复杂 性,识别多个特征,使得数据更易使用,且计算简单、结果易懂,GBRT算法预 测能力强,且不容易过拟合,解决了腐蚀预测模型学习速度慢、精度低的问题, 提高了腐蚀预测模型学习效率和预测的准确度。
在一个实施例中,在数据预测模型根据训练数据进行迭代运算的过程中, 数据预测模型引入缩减参数,通过该缩减参数控制迭代运算的次数,认为在每 次模型叠加时,并不完全信任每一棵残差树,通过缩减系数控制每次只学到每 棵决策树的一小部分信息,通过学习更多的残差树来弥补不足,从而更有效地 避免过拟合问题,达到更高的预测精度,对应的回归树公式由公式11得到:
Figure BDA0002245473370000091
式中,m为回归树,λ为缩减参数,c为残差。
在一个实施例中,图4是根据本发明实施例的数据预测模型参数调整的方 法的流程图,如图4所示,该方法包括如下步骤:
步骤S402,对训练数据中的腐蚀数据进行交叉验证,得到训练模型预设参 数的训练参数值和评估值,其中,该交叉验证包括对训练数据进行训练和验证, 该训练参数值和该评估值一一对应,例如,将训练数据中的数据随机分为k份, 每次选择其中1份作为测试集,其余k-1份作为训练集用于模型训练,重复k 次,交叉验证在每个训练集上训练后得到一个数据预测模型,用该数据预测模 型在相应的测试集上测试,计算并保存模型的评估指标,计算k组测试结果的 平均值作为模型精度的估计,并作为当前k次交叉验证下模型的性能指标。
步骤S404,在预设参数的数量为1的情况下,根据该评估值选择该训练参 数值作为该数据预测模型的预测参数值,在该预设参数的数量大于1的情况下, 对每组该预设参数的组合进行该交叉验证,根据该交叉验证的评估值,选择该 训练参数值作为该数据预测模型的预测参数值,其中,在预设参数的数量为1 的情况下,仅需要进行一次交叉验证,因此将该交叉验证选择的参数作为数据 预测模型的参数,在该预设参数的数量大于1的情况下,数据预测模型的每个 参数都有多个候选值,对每种参数组合做一次交叉验证,根据交叉验证的评估 值选择数据预测模型的预测参数值。
通过步骤S402和S404,对训练数据中的数据进行多次交叉验证,得到数据 预测模型的多组参数值,根据交叉验证的评估值选择一组参数值作为数据预测 模型的预测参数值,得到最终的数据预测模型,交叉验证可以从有限的数据中 获得尽可能多的有效信息,减少过拟合情况的出现,从而提高数据预测模型的 准确度。
在一个实施例中,图5是根据本发明实施例的数据预测模型的评估检验的 流程图,如图5所示,该方法包括如下步骤:
步骤S502,在回归评估指标大于预设回归评估指标的情况下,且在数据预 测模型的误差曲线的波动范围小于预设波动值的情况下,认为该数据预测模型 符合该预设要求,对该降维数据进行参数调整,其中,误差为参数调整的过程 中,数据预测模型得到的预测值和腐蚀速率数据的差值,误差曲线为该误差随 迭代次数变化的曲线,误差随迭代次数不规律变化形成误差曲线的波动,预设 波动值可以根据数据预测模型的中的数据大小进行预设,可以为0.002、0.01或 者其它数量值,迭代次数也可以预先设定,可以为80、100或者其它数量值, 误差曲线的波动范围是在迭代的后一半过程中,误差最大值与最小值的差值, 在波动范围小于预设数量值的情况下,认为误差曲线在迭代次数内达到稳定状 态,数据预测模型满足要求,例如,预设波动值为0.002,迭代次数为80,在迭 代次数从41至80的范围中,误差的曲线的波动范围为0.001,认为数据预测模 型满足要求,仅对数据预测模型中的参数值重新进行调整;或者,
在该回归评估指标大于预设回归评估指标的情况下,且在该数据预测模型 的误差曲线的波动范围大于或者等于该预设波动值的情况下,认为该数据预测 模型不符合该预设要求,对腐蚀数据进行数据预处理,例如,预设波动值为0.002, 迭代次数为80,在迭代次数从41至80的范围中,误差的曲线的波动范围为0.003, 认为数据预测模型不满足要求,对腐蚀数据重新进行数据预处理。
通过步骤S502,通过测试数据判断该数据预测模型是否符合要求,在数据 预测模型不符合要求的情况下,对数据预测模型进行修正,使该数据预测模型 得到更精准的预测结果,提高该数据预测模型的准确度。
应该理解的是,虽然图2至图5的流程图中的各个步骤按照箭头的指示依 次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中 有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它 的顺序执行。而且,图2至图5中的至少一部分步骤可以包括多个子步骤或者 多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在 不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是 可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地 执行。
对应于上述管道腐蚀速率预测的方法,在本实施例中,还提供了一种管道 腐蚀速率预测设备,该设备用于实现上述实施例及优选实施方式,已经进行过 说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或 硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现,但是硬件, 或者软件和硬件的组合的实现也是可能并被构想的。
在一个实施例中,提供了一种管道腐蚀速率预测的设备,图6是根据本发 明实施例的管道腐蚀速率预测的设备的结构框图一,如图6所示,包括:获取 模块62、处理模块64、预测模块66和检验模块68,其中:
获取模块62,从管道设备和管道设备的循环水介质中,获取腐蚀数据,其 中,腐蚀数据包括腐蚀因素数据和腐蚀速率数据,在炼油装置的运行过程中, 为监测评估腐蚀状态,采集的腐蚀数据的类型包括浊度、钙硬度、碱度、温差、 腐蚀性元素、细菌数、余氯等;
处理模块64,用于通过数据预处理模型对该腐蚀数据进行数据预处理,得 到预处理数据,其中,该数据预处理包括数据无量纲化和异常值处理,通过降 维模型对该预处理数据进行降维处理,得到降维数据;
预测模块66,用于将该降维数据随机分成训练数据和测试数据,在数据预 测模型根据训练数据进行参数调整和迭代运算之后,对测试数据中的腐蚀因素 数据进行腐蚀速率预测,得到测试数据中腐蚀速率数据的第一预测值;
检验模块68,用于将该测试数据中的该腐蚀速率数据与该第一预测值进行 对比,得到回归评估指标,根据该回归评估指标评估该数据预测模型的预测结 果,在该回归评估指标小于或者等于预设回归评估指标的情况下,输出该第一 预测值,保存该数据预测模型。
通过上述设备,处理模块64对获取模块62提取到的数据进行数据预处理 和降维处理,数据预处理中的无量纲化可以加快求解速度,提升模型精度,异 常值处理采用K-means算法,K-means算法基于数据距离实现,无需了解数据 集的分布情况,发现离群点是高度有效的,且计算简单,可以快速处理大规模 数据的有效性,数据降维是数据挖掘中很重要的一项技术,它不仅可以解决维 度数量大的问题,而且可以在压缩数据的同时让信息损失最小化,PCA算法是 数据降维常用的一种方法,可以降低数据复杂性,识别多个特征,使得数据更 易使用,且计算简单、结果易懂,预测模块66将降维后的数据随机分成训练数据和测试数据,预测模块66采用GBRT算法进行预测,GBRT算法预测能力强, 且不容易过拟合,解决了腐蚀预测模型学习速度慢、精度低的问题,提高了腐 蚀预测模型学习效率和预测的准确度。
在一个实施例中,图7是根据本发明实施例的管道腐蚀速率预测的设备的 结构框图二,如图7所示,预测模块66包括控制单元72:控制单元72用于数 据预测模型引入缩减参数,通过该缩减参数控制迭代运算的次数,认为在每次 模型叠加时,并不完全信任每一棵残差树,通过缩减系数控制每次只学到每棵 决策树的一小部分信息,通过学习更多的残差树来弥补不足,从而更有效地避 免过拟合问题,达到更高的预测精度。
在一个实施例中,图8是根据本发明实施例的管道腐蚀速率预测的设备的 结构框图三,如图8所示,预测模块66包括:训练单元82和选择单元84。
训练单元82,用于对训练数据进行交叉验证,得到训练模型预设参数的训 练参数值和评估值,其中,该交叉验证包括对训练数据中的数据进行训练和测 试,该训练参数值和该评估值一一对应;
选择单元84,用于在预设参数的数量为1的情况下,根据评估值选择训练 参数值作为数据预测模型的预测参数值,在预设参数的数量大于1的情况下, 对每组该预设参数的组合进行该交叉验证,根据该交叉验证的评估值,选择选 择训练参数值作为该数据预测模型的预测参数值。
通过上述设备,训练单元82对训练数据中的腐蚀数据进行多次交叉验证, 得到数据预测模型的多组参数值,选择单元84根据交叉验证的评估值选择一组 参数值作为数据预测模型的预测参数值,得到最终的数据预测模型,交叉验证 可以从有限的数据中获得尽可能多的有效信息,减少过拟合情况的出现,从而 提高数据预测模型的准确度。
在一个实施例中,检验模块68还用于:在回归评估指标大于预设回归评估 指标的情况下,且在该数据预测模型的误差曲线的波动范围小于预设波动值的 情况下,认为该数据预测模型符合该预设要求,对该降维数据进行该参数调整; 或者,在该回归评估指标大于预设回归评估指标的情况下,且在该数据预测模 型的误差曲线的波动范围大于或者等于该预设波动值的情况下,认为该数据预 测模型不符合该预设要求,对该腐蚀数据值进行数据预处理,检验模块68中的 测试数据判断该数据预测模型是否符合要求,在数据预测模型不符合要求的情 况下,对数据预测模型进行修正,使该数据预测模型得到更精准的预测结果, 提高该数据预测模型的准确度。
下面结合实际应用场景对本发明的实施例进行详细说明,在某循环水厂的 腐蚀速率数据作为研究对象的情况下,利用GBRT算法进行分析和建模,图9 是根据本发明实施例的腐蚀速率预测的方法的流程图,该方法包括如下步骤:
步骤S902,从管道设备和管道设备的循环水中获取腐蚀数据,采集到的数 据包含了pH、浊度、钙硬度、碱度、磷含量、铁含量等腐蚀因素数据和作为腐 蚀响应变量的循环水管道腐蚀速率数据,数据类型均为连续性变量,表1是某 循环水厂腐蚀速率数据示例,数据中包含可用于建立模型的数据记录共有574 条,无缺失值,研究的目标是训练模型来预测循环水管道的腐蚀速率。
表1
Figure BDA0002245473370000131
步骤S904,对腐蚀数据进行数据无量纲化离群点处理和高杠杆值点处理, 由表1可以看出,该样本数据包含了不同量纲的数据,比如pH值在6-9之间, 浊度小于35mg/L,循环量的单位是t/h,且数据的数值都相对较大,各个数据 的取值范围、单位等都不相同,这不仅不利于数据分析,也会对之后的腐蚀速 率预测产生很大的影响,因此,需要对数据进行无量纲化,本实施例中选择均 值方差归一化对数据进行处理。表2是处理后的数据参数名称对应表:
表2
Figure BDA0002245473370000141
在通过均值方差归一化对数据进行无量纲处理后,图10是根据本发明实施 例的指标为pH的数据均值方差归一化结果图,图11是根据本发明实施例的指 标为浊度的数据均值方差归一化结果图。
本实施例中,采用K-means算法实现离群点检测,图12是根据本发明实施 例的采用K-means算法实现离群点检测的结果示意图,其中,实心圆点为正常 值,实心三角为离群点,由图12可得,总共有11个离群点,因此为了减少异 常值对模型预测的影响,删除这11条数据,最终,剩余563条数据,图13是 根据本发明实施例的帽子值分布的示意图,从下往上,第一条水平线标注的是 帽子均值2倍的位置,第二条水平线标注的是帽子均值3倍的位置,在水平线 以上的数据点为高杠杆值点,需要删除,通过以上处理后,最终可用数据为555条。
步骤S906,对无量纲化后的数据进行降维处理,图14是根据本发明实施例 的变量相关关系数分布图,图中数字为对应变量之间的相关系数,从图14可知, 该数据集变量之间,相关性较高,如钙硬度和浓缩倍数的相关系数为0.9,生物 粘泥与粘附速度的相关系数为-0.74,它们之间存在着高度的相关性,因此该数 据存在高度的多重共线性,本实施例采用PCA算法对数据进行降维,从而减少 多重共线性的影响,根据相关系数可知,pH值,钙硬度,碱度,浓缩倍数,生 物粘泥和电导率对腐蚀速率的相关性较高。表3为PCA模型结果,图15是根 据本发明实施例的主成分贡献曲线图,由图15可知,前9个主成分的方差累计 贡献率达到90%以上,说明取前9个主成分即可包含所有变量的90%以上的信 息,因此本实施例根据表3中前9个主成分进行建模。
表3
Figure BDA0002245473370000151
F1,,,F9为降维后的9个新变量,通过特征值向量表示为如下公式12:
F1=-0.342X1+0.067X2+0.329X3-0.302X4-0.252X5+0.198X6 +0.224X7-0.027X8-0.284X9-0.148X10+0.265X11-0.113X12 -0.235X13+0.264X14+0.323X15+0.007X16+0.270X17+0.194X18
F2=-0.100X1+0.240X2+0.074X3-0.081X4+0.053X5+0.316X6 +0.039X7-0.432X8+0.131X9+0.351X10-0.251X11+0.143X12 +0.255X13+0.229X14-0.224X15+0.430X16+0.223X17+0.060X18
F3=0.038X1+0.161X2-0.405X3-0.072X4-0.129X5+0.090X6 -0.581X7+0.121X8-0.088X9-0.203X10+0.296X11-0.176X12 +0.145X13-0.025X14+0.034X15+0.301X16+0.357X17-0.132X18
F4=-0.136X1+0.468X2-0.031X3-0.094X4+0.375X5+0.266X6 +0.048X7+0.048X8-0.090X9-0.187X10+0.114X11+0.148X12 -0.392X13+0.007X14-0.227X15-0.008X16-0.244X17-0.441X18
F5=0.053X1-0.127X2+0.159X3+0.091X4+0.204X5-0.192X6 +0.033X7+0.117X8+0.412X9-0.298X10+0.219X11+0.499X12 +0.139X13+0.413X14+0.185X15+0.099X16+0.195X17-0.163X18
F6=-0.244X1-0.262X2-0.135X3-0.588X4+0.195X5-0.092X6 -0.067X7-0.108X8+0.190X9-0.018X10+0.194X11+0.283X12 -0.082X13-0.403X14-0.178X15+0.051X16-0.004X17+0.297X18
F7=0.269X1+0.405X2-0.085X3+0.115X4-0.326X5+0.102X6 -0.005X7+0.180X8-0.130X9-0.013X10-0.049X11+0.611X12 -0.090X13-0.165X14+0.029X15-0.085X16+0.044X17+0.394X18
F8=-0.307X1+0.088X2-0.039X3-0.275X4-0.435X5-0.126X6 -0.077X7+0.129X8+0.121X9+0.376X10-0.101X11+0.213X12 +0.146X13-0.050X14+0.218X15-0.181X16-0.092X17-0.519X18
F9=0.005X1-0.465X2-0.013X3+0.144X4-0.301X5-0.008X6 +0.010X7-0.325X8-0.454X9-0.216X10-0.031X11+0.325X12 -0.115X13-0.029X14-0.215X15+0.232X16-0.048X17-0.301X18
公式12
步骤S908,对数据预测模型的参数进行调整,得到数据预测模型的最优参 数。为了得到最佳的GBRT模型,首先利用网格搜索算法(GridSearch CV)进 行参数调整,即网格搜索,表4是GBRT需要调的参数:
表4
Figure BDA0002245473370000161
Figure BDA0002245473370000171
在GridSearch CV中,参数loss=‘ls’,参数n_estimators=80,参数 learning_rate=0.1,参数subsample=0.85,参数max_features=0.5,参数max_depth=7, 参数min_samples_split=10,参数min_samples_leaf=5。
步骤S910,建立采用GBRT算法的数据预测模型,通过数据预测模型进行 数据预测和评估。在数据总量值为555条的条件下,按照8:2的比例划分训练数 据和测试数据,随机选取444条数据为训练数据,111条数据为测试数据,损失 函数为均方差,最大迭代次数为80,图16是根据本发明实施例的误差随迭代次 数的变化曲线图,由图16可以得到,随着迭代次数增加,训练集或者测试集的 预测值与真实值之间的误差在不断下降,在迭代次数为20之后,误差曲线趋于 平缓,图17是根据本发明实施例的特征的重要程度图,可以看出,特征“PC1” 的重要程度最高,其次是“PC2”,“PC7”的重要程度最低。图18是根据本 发明实施例的数据预测模型的预测结果图,由图18可得,数据预测模型的预测 值与原始值基本上很相近,本实施例中采用RMSE和MAE作为回归评估指标, 表5是数据预测模型的评估结果,如表5所示。
表5
Figure BDA0002245473370000172
从表5中可得,测试集RMSE为0.00401,测试集MAE为0.00237,即真 实值和预测值平均相差0.00237,说明GBRT模型在腐蚀速率的预测上有很高的 精度。
采用支持向量机(Support Vector Machine,简称为SVM)、随机森林、迭 代算法Adaboost、Bagging算法、极端随机树(Extra Tree)和全连接神经网络 对腐蚀速率数据进行预测,同样进行数据预处理和数据降维过程,并使用 GridSearch CV对进行参数调整,回归评估指标选用RMSE和MAE,表6根据 本发明实施例的各个模型在训练集和测试集上的RMSE和MAE,如表6所示。
表6
Figure BDA0002245473370000173
Figure BDA0002245473370000181
图19是根据本发明实施例的不同预测模型的RMSE和MAE对比图,由表 6和图19可以得到,ExtraTree出现了严重的过拟合现象,在训练集上预测的很 好却在测试集预测的很差,训练集的RMSE值和MAE值几乎为0,全连接神经 网络的预测效果最差,测试集的RMSE值和MAE值是七个模型中最高的,因 此,由GBRT算法得到的数据预测模型的预测效果最好,无论是在训练集还是 测试集,都具有很好的表现,预测最准确。
本实施例采用某石化循环水厂的腐蚀速率数据,其中包含pH值、铁离子、 余氯等18项影响因素,利用K-means和帽子矩阵进行异常值检测,采用 PCA-GBRT算法对管道的腐蚀速率进行了预测,通过网格搜索,得到模型最优 参数,然后经过模型训练与测试,再与几个模型的预测精度进行对比,实验表 明,GBRT算法在腐蚀速率预测上具有更高精度,为腐蚀速率预测提供了可靠的 方法,对实际生产中的腐蚀检测具有参考价值。
在一个实施例中,提供了一种计算机设备。该计算机设备可以是服务器。 该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。 其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储 器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、 计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机 程序的运行提供环境。该计算机设备的数据库用于存储腐蚀速率数据。该计算 机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理 器执行时以实现一种管道腐蚀速率预测方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该 计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输 入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设 备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操 作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机 程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连 接通信。该计算机程序被处理器执行时以实现一种管道腐蚀速率预测方法。该 计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的 输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在 存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上 述各实施例提供的管道腐蚀速率预测方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程 序,计算机程序被处理器执行时实现上述各个实施例提供的管道腐蚀速率预测 方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非 易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方 法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存 储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非 易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程 ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限, RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步 DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM (ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus) 直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器 总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述 实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特 征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但 并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普 通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进, 这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要 求为准。

Claims (10)

1.一种管道腐蚀速率预测的方法,其特征在于,所述方法包括:
从管道设备和所述管道设备的循环水介质中,获取腐蚀数据,其中,腐蚀数据包括腐蚀因素数据和腐蚀速率数据;
通过数据预处理模型对所述腐蚀数据进行数据预处理,得到预处理数据,通过降维模型对所述预处理数据进行降维处理,得到降维数据;
将所述降维数据随机分成训练数据和测试数据,在数据预测模型根据所述训练数据进行参数调整和迭代运算之后,对所述测试数据中的所述腐蚀因素数据进行腐蚀速率预测,得到所述测试数据中所述腐蚀速率数据的第一预测值;
将所述测试数据中的所述腐蚀速率数据与所述第一预测值进行对比,得到回归评估指标,根据所述回归评估指标评估所述数据预测模型的预测结果,在所述回归评估指标小于或者等于预设回归评估指标的情况下,输出所述第一预测值,保存所述数据预测模型。
2.根据权利要求1所述的方法,其特征在于,在所述数据预测模型根据所述训练数据进行参数调整和迭代运算之后,所述方法包括:
所述数据预测模型引入缩减参数,通过所述缩减参数控制所述迭代运算的次数。
3.根据权利要求1所述的方法,其特征在于,所述数据预测模型根据所述训练数据进行参数调整包括:
对所述训练数据进行交叉验证,得到训练模型预设参数的训练参数值和评估值,其中,所述交叉验证包括对所述训练数据进行训练和验证,所述训练参数值和所述评估值一一对应;
在所述预设参数的数量为1的情况下,根据所述评估值选择所述训练参数值作为所述数据预测模型的预测参数值,在所述预设参数的数量大于1的情况下,对每组所述预设参数的组合进行所述交叉验证,根据所述交叉验证的所述评估值,选择所述训练参数值作为所述数据预测模型的预测参数值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述回归评估指标评估所述数据预测模型的预测结果包括:
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据预测模型的误差曲线的波动范围小于预设波动值的情况下,认为所述数据预测模型符合所述预设要求,对所述降维数据进行所述参数调整;或者,
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据预测模型的误差曲线的波动范围大于或者等于所述预设波动值的情况下,认为所述数据预测模型不符合所述预设要求,对所述腐蚀数据进行所述数据预处理。
5.一种管道腐蚀速率预测的装置,其特征在于,所述装置包括获取模块、处理模块、预测模块和检验模块:
所述获取模块,用于从管道设备和所述管道设备的循环水介质中,获取腐蚀数据,其中,腐蚀数据包括腐蚀因素数据和腐蚀速率数据;
所述处理模块,用于通过数据预处理模型对所述腐蚀数据进行数据预处理,得到预处理数据,通过降维模型对所述预处理数据进行降维处理,得到降维数据;
所述预测模块,用于将所述降维数据随机分成训练数据和测试数据,在数据预测模型根据所述训练数据进行参数调整和迭代运算之后,对所述测试数据中的所述腐蚀因素数据进行腐蚀速率预测,得到所述测试数据中所述腐蚀速率数据的第一预测值;
所述检验模块,用于将所述测试数据中的所述腐蚀速率数据与所述第一预测值进行对比,得到回归评估指标,根据所述回归评估指标评估所述数据预测模型的预测结果,在所述回归评估指标小于或者等于预设回归评估指标的情况下,输出所述第一预测值,保存所述数据预测模型。
6.根据权利要求5所述的装置,其特征在于,所述预测模块包括控制单元:
所述控制单元,用于所述数据预测模型引入缩减参数,通过所述缩减参数控制所述迭代运算的次数。
7.根据权利要求5所述的装置,其特征在于,所述预测模块还包括训练单元和选择单元:
所述训练单元,用于对所述训练数据进行交叉验证,得到训练模型预设参数的训练参数值和评估值,其中,所述交叉验证包括对所述训练数据进行训练和验证,所述训练参数值和所述评估值一一对应;
所述选择单元,用于在所述预设参数的数量为1的情况下,根据所述评估值选择所述训练参数值作为所述数据预测模型的预测参数值,在所述预设参数的数量大于1的情况下,对每组所述预设参数的组合进行所述交叉验证,根据所述交叉验证的所述评估值,选择所述训练参数值作为所述数据预测模型的预测参数值。
8.根据权利要求5所述的装置,其特征在于,所述检验模块还用于:
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据预测模型的误差曲线的波动范围小于预设波动值的情况下,认为所述数据预测模型符合所述预设要求,对所述降维数据进行所述参数调整;或者,
在所述回归评估指标大于所述预设回归评估指标的情况下,且在所述数据预测模型的误差曲线的波动范围大于或者等于所述预设波动值的情况下,认为所述数据预测模型不符合所述预设要求,对所述腐蚀数据进行所述数据预处理。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN201911015222.XA 2019-10-24 2019-10-24 管道腐蚀速率预测的方法、装置和计算机设备 Pending CN110751339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911015222.XA CN110751339A (zh) 2019-10-24 2019-10-24 管道腐蚀速率预测的方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911015222.XA CN110751339A (zh) 2019-10-24 2019-10-24 管道腐蚀速率预测的方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN110751339A true CN110751339A (zh) 2020-02-04

Family

ID=69279658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911015222.XA Pending CN110751339A (zh) 2019-10-24 2019-10-24 管道腐蚀速率预测的方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN110751339A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400927A (zh) * 2020-03-31 2020-07-10 中国石油大学(北京) 基于广义可加模型的管道内腐蚀增长预测方法及装置
CN112348264A (zh) * 2020-11-10 2021-02-09 南京钢铁股份有限公司 一种基于随机森林算法的碳钢腐蚀速率预测方法
CN113252544A (zh) * 2021-05-21 2021-08-13 北京化工大学 一种炼油装置腐蚀监测系统和方法
CN114492980A (zh) * 2022-01-21 2022-05-13 中特检深燃安全技术服务(深圳)有限公司 一种城镇燃气埋地管道腐蚀风险的智能预测方法
CN114821091A (zh) * 2022-06-29 2022-07-29 成都理工大学 一种基于逻辑回归二分类的核素快速识别方法
CN115099151A (zh) * 2022-07-01 2022-09-23 西南石油大学 基于gwo-bp修正机理模型的管道腐蚀速率预测方法
TWI787971B (zh) * 2021-08-24 2022-12-21 台灣化學纖維股份有限公司 腐蝕率預測裝置、方法及其電腦程式產品
CN117171661A (zh) * 2023-11-03 2023-12-05 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304680A1 (en) * 2012-05-10 2013-11-14 Bp Exploration Operating Company Limited Predictive corrosion coupons from data mining
CN103870670A (zh) * 2012-12-17 2014-06-18 中国石油天然气集团公司 一种油管腐蚀程度预测方法及装置
CN109255490A (zh) * 2018-09-28 2019-01-22 西安建筑科技大学 一种基于kpca-bas-grnn的埋地管道外腐蚀速率预测方法
CN109828532A (zh) * 2019-01-29 2019-05-31 贵州大学 一种基于ga-gbrt的表面粗糙度预测方法及工艺参数优化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304680A1 (en) * 2012-05-10 2013-11-14 Bp Exploration Operating Company Limited Predictive corrosion coupons from data mining
CN103870670A (zh) * 2012-12-17 2014-06-18 中国石油天然气集团公司 一种油管腐蚀程度预测方法及装置
CN109255490A (zh) * 2018-09-28 2019-01-22 西安建筑科技大学 一种基于kpca-bas-grnn的埋地管道外腐蚀速率预测方法
CN109828532A (zh) * 2019-01-29 2019-05-31 贵州大学 一种基于ga-gbrt的表面粗糙度预测方法及工艺参数优化方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
埃弗里特: "《剑桥统计学辞典 第2版 引进版》", 31 December 2010, 上海财经大学出版社 *
徐涵: "《大数据、人工智能和网络舆情治理》", 31 October 2018, 武汉大学出版社 *
杜宾: "《R语言数据分析与挖掘》", 31 July 2019, 中国铁道出版社有限公司 *
段春莲: "基于KPCA-GRNN的炼化厂管道腐蚀速率预测", 《河北工业科技》 *
沈夏炯: "基于梯度提升回归树的短时交通流预测模型", 《计算机科学》 *
洪兴建 等: "《统计预测》", 浙江工商大学出版社 *
鲁庆: "应用提升回归树研究碳钢的土壤腐蚀规律", 《中南大学学报(自然科学版)》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400927A (zh) * 2020-03-31 2020-07-10 中国石油大学(北京) 基于广义可加模型的管道内腐蚀增长预测方法及装置
CN111400927B (zh) * 2020-03-31 2022-02-18 中国石油大学(北京) 基于广义可加模型的管道内腐蚀增长预测方法及装置
CN112348264A (zh) * 2020-11-10 2021-02-09 南京钢铁股份有限公司 一种基于随机森林算法的碳钢腐蚀速率预测方法
CN113252544A (zh) * 2021-05-21 2021-08-13 北京化工大学 一种炼油装置腐蚀监测系统和方法
CN113252544B (zh) * 2021-05-21 2022-03-18 北京化工大学 一种炼油装置腐蚀监测系统和方法
TWI787971B (zh) * 2021-08-24 2022-12-21 台灣化學纖維股份有限公司 腐蝕率預測裝置、方法及其電腦程式產品
CN114492980B (zh) * 2022-01-21 2022-09-02 中特检深燃安全技术服务(深圳)有限公司 一种城镇燃气埋地管道腐蚀风险的智能预测方法
CN114492980A (zh) * 2022-01-21 2022-05-13 中特检深燃安全技术服务(深圳)有限公司 一种城镇燃气埋地管道腐蚀风险的智能预测方法
CN114821091A (zh) * 2022-06-29 2022-07-29 成都理工大学 一种基于逻辑回归二分类的核素快速识别方法
CN115099151A (zh) * 2022-07-01 2022-09-23 西南石油大学 基于gwo-bp修正机理模型的管道腐蚀速率预测方法
CN115099151B (zh) * 2022-07-01 2024-06-11 西南石油大学 基于gwo-bp修正机理模型的管道腐蚀速率预测方法
CN117171661A (zh) * 2023-11-03 2023-12-05 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统
CN117171661B (zh) * 2023-11-03 2024-01-26 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统

Similar Documents

Publication Publication Date Title
CN110751339A (zh) 管道腐蚀速率预测的方法、装置和计算机设备
CN111679636B (zh) 生产工艺参数处理的系统、方法和计算机设备
Nguyen et al. Model selection for degradation modeling and prognosis with health monitoring data
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
Mittas et al. LSEbA: least squares regression and estimation by analogy in a semi-parametric model for software cost estimation
EP3716160A1 (en) Learning parameters of a probabilistic model comprising gaussian processes
US11216534B2 (en) Apparatus, system, and method of covariance estimation based on data missing rate for information processing
US20190377027A1 (en) Tester and method for testing a device under test and tester and method for determining a single decision function
Wang et al. Fault detection based on diffusion maps and k nearest neighbor diffusion distance of feature space
Li et al. An adaptive prognostics method based on a new health index via data fusion and diffusion process
Dimitrakopoulos et al. A clustering based method accelerating gene regulatory network reconstruction
JP2021033895A (ja) 変数選定方法、変数選定プログラムおよび変数選定システム
RU2746904C1 (ru) Способ контроля неопределённости стохастической системы при условной оценке центра плотности распределения
Chehal et al. Comparative Study of Missing Value Imputation Techniques on E-Commerce Product Ratings
Bogoclu et al. Reliability analysis of non-linear and multimodal limit state functions using adaptive Kriging
Asadi et al. An initial investigation for employing ACH depth function in degradation model selection: A case study with real data
CN113868773B (zh) 基于模糊聚类的飞行器机翼结构的不确定性分析方法
Polat Determination of the effective economic and/or demographic indicators in classification of European Union member and candidate countries using Partial Least Squares Discriminant Analysis
Marrel et al. Likelihood and depth-based criteria for validation of numerical simulators, from comparison with experimental data
Davino et al. Modelling drivers of consumer liking handling consumer and product effects
Qi et al. A Novel Method of AOT Evaluation for Change-Point Detection on Synthetic Time-series
JP2018151913A (ja) 情報処理システム、情報処理方法、及びプログラム
James et al. Comparing Parameter Estimation Techniques for the Generalised Pareto Distribution Using Consistent Scoring Functions
CN117668483A (zh) 一种基于预测残差分布特征约束的软测量建模方法及系统
Withers et al. Cusums for tracking arbitrary functionals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200204