CN114565185A - 基于多源数据的腐蚀速率预测系统 - Google Patents

基于多源数据的腐蚀速率预测系统 Download PDF

Info

Publication number
CN114565185A
CN114565185A CN202210315466.5A CN202210315466A CN114565185A CN 114565185 A CN114565185 A CN 114565185A CN 202210315466 A CN202210315466 A CN 202210315466A CN 114565185 A CN114565185 A CN 114565185A
Authority
CN
China
Prior art keywords
data
corrosion
organism
data set
corrosion rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210315466.5A
Other languages
English (en)
Inventor
杨剑锋
索冠玉
陈良超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Chemical Technology
Original Assignee
Beijing University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Chemical Technology filed Critical Beijing University of Chemical Technology
Priority to CN202210315466.5A priority Critical patent/CN114565185A/zh
Publication of CN114565185A publication Critical patent/CN114565185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)

Abstract

本发明提供一种基于多源数据的腐蚀速率预测系统,该系统面向炼油过程典型多腐蚀机理耦合、多腐蚀因素的复杂腐蚀系统的回归类预测需求,提出适用于炼油过程的基于多源数据的腐蚀速率预测方法,并针对典型腐蚀部位建立基于多源数据的预测模型。该预测模型基于工业现场采集到的水质和介质等多影响变量及设备腐蚀结果指标的数据集,并针对腐蚀多影响变量的特点,应用隔离森林算法进行数据异常数据识别,通过共生生物搜索算法优化RF模型参数,能够提高腐蚀速率预测精度。

Description

基于多源数据的腐蚀速率预测系统
技术领域
本发明涉及石油化工腐蚀防护技术领域,具体涉及一种基于多源数据的腐蚀速率预测系统。
背景技术
腐蚀是影响炼油化工装置平稳安全运行的重要因素,腐蚀可造成设备失效、泄露,严重影响设备使用寿命,甚至引发火灾、爆炸等事故。因此,炼油厂设备的腐蚀状态识别和防护工作显得尤为重要。在炼油装置的关键部位安装在线监测探针,能够有效识别介质的腐蚀速率,反应设备的腐蚀状态,为防腐注剂提供支持。
然而,在线监测探针是一种侵入式腐蚀监测方式,需要在每个监测点都安装监测设备,检测成本高,并且需要在监测点进行开孔安装。应用基于数据的方法可以解决在线监测探针进行腐蚀状态识别的缺点。长期的炼油腐蚀管理过程积累了一定量腐蚀多影响变量和腐蚀结果数据,包括对工艺介质组分和物性的采样分析数据,设备运行工艺参数监测数据,以及反应设备腐蚀状态的探针监测数据等,这些数据都是在设备运行过程或腐蚀管理过程中产生的数据。
基于腐蚀多源数据建立腐蚀速率预测模型,能够得到腐蚀影响因素数据和腐蚀速率数据的映射关系。对于没有安装监测设备的炼油装置,通过输入腐蚀影响因素数据,可直接得到设备的腐蚀速率,指导后期腐蚀管理过程。因此,基于炼油过程多源腐蚀数据实现对腐蚀速率的预测,对装置腐蚀管控有着重要的意义。
发明内容
针对上述技术问题,本发明提供一种基于多源数据的腐蚀速率预测系统,能够至少解决上述技术问题之一:
本发明实施例采用的技术方案为:
本发明实施例提供一种基于多源数据的腐蚀速率预测系统,所述多源数据包括炼油装置运行过程中的工艺运行数据和工艺介质数据,包括m个参数数据;所述系统包括处理器、存储有计算机程序的存储介质、存储器和配置文件,所述配置文件的第i条配置信息包括(Ci,Ti),Ci为第i个采样数据的名称,Ti为第i个采样数据的采样周期,i的取值范围为1到m+1,采样数据包括多源数据和腐蚀损耗量数据;所述存储器存储有腐蚀损耗量数据集和m个参数数据集,所述腐蚀损耗量数据集包括炼油装置运行过程中的预设时间段内的n个腐蚀损耗量数据,第j个参数数据集包括所述预设时间段内的kj个参数数据,j的取值范围为1到m;
所述处理器用于执行计算机程序,实现如下步骤:
S100,获取腐蚀损耗量数据集中的n个腐蚀损耗量数据并将获取的n个腐蚀损耗量数据处理成按时间顺序连续变化的n1个腐蚀速率数据,形成腐蚀速率时序数据集;n1≤n;
S200,从配置文件中获取Tmax=max(T1,T2,…,Tm+1),并基于Tmax从存储器中获取对应的参数数据的kp,p的取值范围为1到m;
S300,基于Tmax,将腐蚀速率时序数据集中的n1个腐蚀速率数据处理成kp个腐蚀速率数据,形成腐蚀速率数据降采样集;kp个腐蚀速率数据中的相邻两个数据间的时间间隔等于Tmax
S400,遍历m个参数数据集,如果第j个数据集对应的采样周期Tj≠Tmax,执行S500;
S500,基于Tmax,第j个参数数据集中的kj个参数数据处理成kp个参数数据,kp个参数数据中的相邻两个数据间的时间间隔等于Tmax
S600,基于S300至S500形成按时间顺序排列的腐蚀多源数据集(D1,D2,…,Dkp),第r个腐蚀多源数据Dr=(A1r,A2r,…,Amr,Br),Asr为Dr中的第s个参数数据,Br为第r个腐蚀速率数据,s的取值范围为1到m,r的取值范围为1到kp;DSt中的所有数据的采样时间相同;
S700,对腐蚀多源数据集中的异常数据进行检测,并将检测到的异常数据剔除,得到标准参数数据集;
S800,基于标准参数数据集,获取多源数据和腐蚀速率数据之间的映射关系;
S900,基于获取的映射关系,对于没有设置有腐蚀监测设备的炼油装置,利用从该炼油装置获取的多源数据对该炼油装置的腐蚀速率数据进行预测。
本发明实施例提供的基于多源数据的腐蚀速率预测系统,能够提高腐蚀速率预测精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于多源数据的腐蚀速率预测系统的执行流程示意图;
图2(a)和图2(b)分别为异常值剔除前后数据的分布情况示意图;
图3(a)和图3(b)分别为异常值剔除前后数据的密度分布情况示意图;
图4(a)和图4(b)分别为优化后训练数据和预测数据的相关性示意图;
图5为优化模型预测值和真实值的对比示意图;
图6为多种模型在数据集上的预测结果的相关性示意图;
图7为不同模型测试样本的预测误差对比示意图;
图8为经交叉验证后不同模型测试样本的预测误差示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在对炼油装置的腐蚀速率的研究过程中,本发明的发明人意识到,可以采用装置运行过程中影响腐蚀速率的多源数据包括工艺运行数据和工艺介质数据等对腐蚀速率进行预测,从而能够极大的降低腐蚀速率预测成本和提高预测精度。
基于此,本发明实施例提供一种基于多源数据的腐蚀速率预测系统。在本发明实施例中,所述多源数据可包括炼油装置运行过程中的工艺运行数据和工艺介质数据,包括m个参数数据。具体地,在一示意性实施例中,所述工艺运行据可包括温度、压力、流量,所述工艺介质数据可包括铁离子浓度、氯离子浓度、铵根离子浓度、硫离子浓度、pH。在该实施例中,m=8。
本发明实施例提供的基于多源数据的腐蚀速率预测系统可包括处理器、存储有计算机程序的存储介质、存储器和配置文件。
其中,所述配置文件的第i条配置信息包括(Ci,Ti),Ci为第i个采样数据的名称,Ti为第i个采样数据的采样周期,i的取值范围为1到m+1,采样数据包括多源数据和腐蚀损耗量数据,每个采样数据的采样周期可根据实际情况确定。例如,对于腐蚀损耗量数据可每半小时采集一次,对于工艺运行数据,可每分钟采集一次,而对于工艺介质数据,可每天采集一次。
所述存储器存储有腐蚀损耗量数据集和m个参数数据集,所述腐蚀损耗量数据集包括炼油装置运行过程中的预设时间段内的n个腐蚀损耗量数据,第j个参数数据集包括所述预设时间段内的kj个参数数据,j的取值范围为1到m。
所述处理器用于执行计算机程序,如图1所示,实现如下步骤:
S100,获取腐蚀损耗量数据集中的n个腐蚀损耗量数据并将获取的n个腐蚀损耗量数据处理成按时间顺序连续变化的n1个腐蚀速率数据,形成腐蚀速率时序数据集;n1≤n。
在本发明实施例中,腐蚀速率数据可由电感探针腐蚀损耗量数据转换获取。而电感探针十分灵敏,在现场条件下,容易造成数据异常的波动,因此根据电感探针的检测特点,需要将电感探针获取的腐蚀损耗量数据平滑处理成按时间顺序连续变化的腐蚀速率数据。
具体地,在S100中,可利用高阶拟合的方式对腐蚀损耗量中的n个腐蚀损耗量数据进行平滑处理得到拟合曲线,以及对拟合曲线求导得到按时间顺序连续变化的n1个腐蚀速率数据。
S200,从配置文件中获取Tmax=max(T1,T2,…,Tm+1),并基于Tmax从存储器中获取对应的参数数据的kp,p的取值范围为1到m。
S300,基于Tmax,将腐蚀速率时序数据集中的n1个腐蚀速率数据处理成kp个腐蚀速率数据,形成腐蚀速率数据降采样集;kp个腐蚀速率数据中的相邻两个数据间的时间间隔等于Tmax
具体地,可基于腐蚀速率数据的采样周期Tc和Tmax确定每个Tmax内的腐蚀速率数据个数n2,n2=[Tmax/Tc],然后对这n2个腐蚀速率数据取平均值,得到Tmax对应的每个采样时刻的腐蚀速率数据,[]表示取整。
S400,遍历m个参数数据集,如果第j个数据集对应的采样周期Tj≠Tmax,执行S500。
S500,基于Tmax,第j个参数数据集中的kj个参数数据处理成kp个参数数据,kp个参数数据中的相邻两个数据间的时间间隔等于Tmax
具体地,对于每个参数数据,可基于该参数数据的采样周期Ts和Tmax确定每个Tmax内的参数数据个数n3,n3=[Tmax/Ts],然后对这n3个参数数据取平均值,得到Tmax对应的每个采样时刻的参数数据,[]表示取整。
S600,基于S300至S500形成按时间顺序排列的腐蚀多源数据集(D1,D2,…,Dkp),第r个腐蚀多源数据Dr=(A1r,A2r,…,Amr,Br),Asr为Dr中的第s个参数数据,Br为第r个腐蚀速率数据,s的取值范围为1到m,r的取值范围为1到kp;DSt中的所有数据的采样时间相同。
通过步骤S300~S500,能够得到采样周期相同的采样数据,按照采样时刻,可形成腐蚀多源数据集。
S700,对腐蚀多源数据集中的异常数据进行检测,并将检测到的异常数据剔除,得到标准参数数据集。
在本发明实施例中,可采用隔离森林算法对腐蚀多源数据集中的异常数据进行检测,并将检测到的异常数据剔除,得到标准参数数据集。隔离森林算法将数据点从根节点到叶子结点的平均路径长度作为评判数据是否为异常值的标准,平均路径越短的点,越可能是异常点,并将识别出的异常数据从腐蚀多源数据集中删除。具体方法如下:
①构建隔离子树:从腐蚀多源数据集中随机抽样获取s个训练样本{d1,d2,…,ds},并随机选择一个特征D,在特征D的最大值和最小值之间随机获得一个切割值。在本发明实施例中,特征指多源参数数据的参数,例如氯离子含量就是一个特征,氯离子含量的最大值最小值,就是特征的最大值和最小值。然后对训练样本中每个训练样本di中的特征进行划分,小于切割值的数据分配给隔离子树的左分支,将大于或等于切割值的数据分配给隔离子树的右分支。然后,在左右分支数据中重复上述步骤,直到数据不再可分或二叉树达到限定高度,就完成了单个隔离子树的构建。
②异常评分:通过①构造一定数据量的隔离子树就构成了隔离森林。遍历所有的隔离子树,计算数据点x在每个隔离子树上的平均路径长度(用h(x)表示),即是从根节点到其所在的叶子节点所经过的边的条数。通过计算异常评分s(x),来衡量数据x是否为异常点,s(x)的计算公式可如下式(1)表示:
Figure BDA0003568863310000061
其中,E(h(x))表示所有隔离子树中的平均路径长度,c(n)是大小为n的数据集的h(x)的平均值,可由如下公式(2)计算:
Figure BDA0003568863310000062
如果s(x)大于a,则表示数据x为异常数据,a为设定值,取值为0~1,可为试验值。
③剔除异常数据:将识别出的异常数据从腐蚀多源数据集中删除,得到标准参数数据集。
S800,基于标准参数数据集,获取多源数据和腐蚀速率数据之间的关联关系。
随着人工智能的快速发展,人工神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)等机器学习算法已经广泛应用于各种类型的腐蚀预测。但是针对炼油工艺过程的多源参数腐蚀预测方法还很少,已有预测模型研究多针对实验数据的研究,但未系统的提出预测方法,且预测模型与现场运行(在线)过程的腐蚀预测与管理结合不紧密。炼油装置生产现场的监测传感器容易受到环境条件干扰出现异常数据。在应用现场数据进行建模时,进行异常值剔除能在一定程度上提高模型训练效果。在机器学习模型中,RF模型应用于在现场复杂条件下获取的数据上能够凸显其对异常数据不敏感、过拟合风险低等方面的优势。同时,RF模型参数选择对于模型的预测效果有一定程度的影响,参数优化过程对于提升腐蚀预测精度起着关键作用。
因此,在本发明实施例中,基于标准参数数据集和随机森林模型(Random Forest,RF)获取多源数据和腐蚀速率数据之间的映射关系。随机森林超参数对模型的预测效果有影响,应用共生生物搜索算法(symbiotic organisms search,SOS)算法对模型超参数进行优化。SOS使用互利共生、偏利共生和寄生三种策略来实现目标函数的最优化。SOS优化目标函数设定为随机森林模型预测误差。
进一步地,所述映射关系可通过如下步骤获取:
S801,将标准参数数据集中的数据分为训练数据集和测试数据集;
S802,生成初始种群,初始种群包括N个生物体,对于每个生物体,执行S803。
在本发明实施例中,初始种群可随机生成。每个生物体为随机森林模型的一组超参数,为高维向量。
S803,将训练数据集输入随机森林模型中进行训练,得到训练后的随机森林模型,利用测试数据集对训练后的随机森林模型进行评估,得到当前生物体的适应度。
本发明实施例中,基于训练数据集训练得到训练后的随机森林模型可包括如下步骤:
(1)从训练数据集中有放回的随机抽样同等数量的p个数据样本。
(2)在每个采样得到的数据集(p个数据样本构成的数据集)上构建决策树(CART)。对于每个树节点,首先从原始的R个特征中随机抽样出m个特征(m<R),然后从这m个特征构成的特征子空间中选择分裂特征j和分裂点s。分裂点s将特征分为左侧子空间R1(j,s)和右侧子空间R2(j,s)。最优特征和分割点依据以下公式选取:
Figure BDA0003568863310000081
其中,xi是第i个数据样本,yi是输入xi对应的输出,c1为R1(j,s)空间样本输出均值,c2为R2(j,s)空间样本输出均值。不断循环上述过程来逐个构造树节点,直到达到停止条件,例如,叶节点中的样本数目小于预先设定的阈值。
(3)根据(1)(2)得到多个CART决策树,对各CART的预测结果进行整合,并计算其平均值作为最终的预测结果。
在本发明实施例中,所述适应度可包括平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE和决定系数R2中的任一种。平均绝对误差MAE、均方根误差RMSE、平均绝对百分比误差MAPE和决定系数R2的计算公式可为现有技术,例如,MAE、RMSE、MAPE和R2可分别如下述公式(4)-(7)所示:
Figure BDA0003568863310000082
Figure BDA0003568863310000083
Figure BDA0003568863310000084
Figure BDA0003568863310000085
式中,yi为真实数据,
Figure BDA0003568863310000086
为真实数据平均值;
Figure BDA0003568863310000087
是对应的预测值,n为样本数量。
优选地,在本发明实施例中,所述适应度可包括平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE中的任一种。在后续的步骤中,使用的适应度均为平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE中的任一种。
S804,基于S803,将适应度最小的生物体确定为当前最优生物体Xbest
S805,对于当前种群中的生物体Xu和Xv,确定对应的新生物体Xunew和Xvnew,新生物体Xunew与生物体Xu和Xbest正相关,新生物体Xvnew与生物体Xv和Xbest正相关,u和v的取值范围为1到N,u≠v。
具体地,在本发明实施例中,Xunew和Xvnew满足如下条件:
Xunew=Xv+rand(0,1)*(Xbest-MV*BF1),Xvnew=Xv+rand(0,1)*(Xbest-MV*BF2);
其中,
Figure BDA0003568863310000091
BF1和BF2表示受益因子,为随机数,例如可随机取1或2,代表每个生物体的受益水平。
S806,基于S803得到新生物体Xunew和Xvnew的适应度,如果得到的Xunew和Xvnew的适应度小于Xu和Xv的适应度,则利用Xunew和Xvnew分别更新Xu和Xv,得到第一更新种群。
对于每个新生物体,可基于S803得到对应的适应度。
S807,对于第一更新种群中的生物体Xw,从第一更新种群中选取另一个生物体Xe,确定对应的新生物体Xwnew;新生物体Xwnew与生物体Xw正相关,与生物体Xe负相关,具体地,Xwnew=Xw+rand(-1,1)*(Xw-Xe);w和e的取值为1到N,r≠u。
S808,基于S803计算新生物体Xwnew的适应度,如果得到的Xwnew的适应度小于Xw的适应度,则利用Xwnew更新Xw,得到第二更新种群;
S809,通过复制第二更新种群中的Xf创建寄生虫PVf,并从Xf中的维度中随机选取一个或者若干个维度替换为对应的搜索空间范围内的随机取值作为PVf的取值;f的取值为1到N;
S810,从第二更新种群中选择不同于Xf的生物体Xo,基于S803分别得到PVf和Xo的适应度,如果PVf的适应度小于Xo的适应度,则利用PVf替换Xo,得到第三更新种群;o的取值为1到N;
S811,基于S803得到第三更新种群的每个生物体的适应度,并基于计算的适应度确定第三更新种群的最优生物体,将得到的最优生物体更新为当前最优生物体Xbest;启动计数器C并设置C=C+1,C的初始值为0。计数器可设置在执行本发明的方法的处理器中。
S812,如果第三更新种群的最优生物个体对应的适应度小于预设适应度值,或者,C≥C0,执行S813,否则,返回S805;C0为预设次数;预设适应度值和预设次数可自定义设置。
S813,将第三更新种群的最优生物个体作为目标生物体,并将目标生物体作为优化后的随机森林模型参数;
S814,将优化后的随机森林模型参数构建的随机森林模型作为腐蚀速率目标预测模型。
腐蚀速率目标预测模型为多源数据和腐蚀速率数据之间的映射关系。
S900,基于获取的映射关系,对于没有设置有腐蚀监测设备的炼油装置,利用从该炼油装置获取的多源数据对该炼油装置的腐蚀速率数据进行预测。
在本发明实施例中,由于基于设置有腐蚀监测设备的炼油装置的多源数据和腐蚀损耗量数据得到两者之间的映射关系,对于没有设置腐蚀监测设备的炼油装置,只需要通过获取其运行过程中产生的多源数据,基于该映射关系就能够得到相应的腐蚀速率,从而不需要专门设置腐蚀监测设备就能够得到精准的腐蚀速率,能够降低监测成本。
【实施例】
本发明实施例中,选取常减压蒸馏装置常压塔塔顶腐蚀系统进行应用效果验证。该系统属于典型低温H2S-HCl-H2O型腐蚀体系,易受硫、氯、铵等元素共同影响,发生湿硫化氢腐蚀、氯化铵腐蚀、盐酸腐蚀等多种机理耦合。收集了装置运行过程中的工艺、介质等监测数据,分别是常顶系统管线的氯离子含量、硫离子含量、铵根离子含量、铁离子含量、pH、温度、压力、流量,以及腐蚀探针损耗量实时变化数据。
首先,进行实时腐蚀速率数据的转换、统一数据采样频率,构成完整的原始腐蚀数据集,共208组。每组数据包括一个氯离子含量数据、一个硫离子含量数据、一个铵根离子含量数据、一个铁离子含量数据、一个pH数据、一个温度数据、一个压力数据、一个流量数据和一个腐蚀速率数据。然后应用SOS方法对多源数据的异常值进行检测,共检测出异常数据21组,剔除异常值之后得到的标准数据集187组。
为对比异常值剔除前后数据的分布情况以氯离子含量为例进行分析。在图2(a)中绘制了原始氯离子含量数据,图2(b)中用三角形的散点绘制了隔离森林方法检测出的氯离子含量的异常数据。在图3(a)和图3(b)中分别绘制异常值剔除前后数据的密度分布,从中可以更清晰的看出,原始数据存在较为孤立的数据分布峰,而经过隔离森林异常值剔除的数据已经近似正太分布。
表1中列出了异常值剔除前后预测模型的预测效果,对剔除异常数据后的全部数据进行5折交叉验证,得到的预测效果如下表1所示。从表1中可以看出,异常值检测方法对于模型评估指标有不同程度的提升。
表1 异常值剔除前后预测模型的预测效果(交叉验证)
评估指标 剔除异常值前 剔除异常值后 提升
RMSE 0.0131 0.0128 2.3%
MAE 0.00943 0.00904 4.1%
R<sup>2</sup> 0.729 0.745 2.2%
在本发明实施例中,5折交叉验证是指:将输入数据分成5份,进行五轮评估,取平均值作为最终的评估结果。第一轮:以其中第1份数据作为测试数据,其余4份数据为训练数据,评估模型;第二轮:以其中第2份数据作为测试数据,其余4份数据为训练数据,评估模型;以此类推。
为进一步提高模型预测精度,应用SOS算法对模型参数进行优化。在训练优化过程,对原始数据随机划分训练集和测试集,对训练数据进行5折交叉验证,以测试集的MAE的平均值为目标函数。应用测试数据集对随机森林进行评估。主要对随机森林模型的四个参数进行优化:树的数量、树的最大深度、叶节点处的最小样本数、特征的数量。其中树的数量设定优化范围为1~1000,特征的数量设定优化范围为1~8,树的最大深度优化范围为1~100,叶节点处的最小样本数优化范围为1~10。同时设定SOS的种群规模为50,迭代次数为100。计算得到随机森林模型的最优参数组合。
模型优化前后的性能对比(RMSE、MAE、R2)可如下表2所示。从表2中可以看出,优化过程显著提升了模型的预测效果。模型预测误差MSE降低12.7%,RMSE降低了12.4%,R2提升了6.1%。
表2 优化前后的模型评估
Figure BDA0003568863310000111
图4(a)和图4(b)绘制了模型预测数据和真实数据的相关性。图5绘制了优化前后模型预测数据和真实数据的对比,可以更直观的看出模型的预测效果。
在剔除异常值之后数据集上分别应用ANN、SVR、DT、Bagging、GBDT、Adaboost、XGBoost等多种机器学习算法建立预测模型,同时应用SOS算法对各个模型的超参数进行优化。以4:1的比例随机划分训练和测试数据集。在图6中绘制了8种模型在数据集上的预测结果的相关性,同时标注了不同模型的决定系数R2,可以看出在多种模型中本方法提出的随机森林模型取得了最高R2(0.840)。在图7中绘制了不同模型测试样本的预测误差(MAE和RMSE),结果表明所建立的随机森林模型的预测误差在多种预测算法中最低。
为进一步评估对比模型的泛化性能和稳定性,对每个预测模型均采用5折交叉验证的方式进行评估,取模型测试集的RMSE、MAE、R2的平均值进行对比,如表3所示。在图8中绘制了经交叉验证后不同模型测试样本的预测误差(MAE和RMSE)。结果表明所提出的随机森林预测模型的各项评估指标均为最优的。
表3 交叉验证下的模型对比
模型 RMSE MAE R<sup>2</sup>
ANN 0.01390 0.01001 0.714
SVR 0.01654 0.01291 0.601
DT 0.01556 0.00990 0.639
Bagging 0.01219 0.00890 0.758
RF 0.01152 0.00815 0.792
GBDT 0.01358 0.00957 0.715
XGBoost 0.01271 0.00966 0.759
AdaBoost 0.01337 0.0102 0.734
综上,本发明面向炼油过程典型多腐蚀机理耦合、多腐蚀因素的复杂腐蚀系统的回归类预测需求,提出适用于炼油过程的基于多源数据的腐蚀速率预测方法,并针对典型腐蚀部位建立基于多源数据的预测模型。该预测模型基于工业现场采集到的水质和介质等多影响变量及设备腐蚀结果指标的数据集,并针对腐蚀多影响变量的特点,应用隔离森林算法进行数据异常数据识别,通过SOS算法优化RF模型参数。通过对比各类预测模型结果,模型有着适用于腐蚀数据集的准确、高效、泛化性强的特点,能够对炼油过程典型腐蚀系统的腐蚀发展预测、设备评估和腐蚀影响因素的防控提供依据。
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
虽然已经通过示例对本申请的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本申请的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本申请的范围和精神。本申请开的范围由所附权利要求来限定。

Claims (9)

1.一种基于多源数据的腐蚀速率预测系统,其特征在于,所述多源数据包括炼油装置运行过程中的工艺运行数据和工艺介质数据,包括m个参数数据;所述系统包括处理器、存储有计算机程序的存储介质、存储器和配置文件,所述配置文件的第i条配置信息包括(Ci,Ti),Ci为第i个采样数据的名称,Ti为第i个采样数据的采样周期,i的取值范围为1到m+1,所述采样数据包括多源数据和腐蚀损耗量数据;所述存储器存储有腐蚀损耗量数据集和m个参数数据集,所述腐蚀损耗量数据集包括炼油装置运行过程中的预设时间段内的n个腐蚀损耗量数据,第j个参数数据集包括所述预设时间段内的kj个参数数据,j的取值范围为1到m;
所述处理器用于执行计算机程序,实现如下步骤:
S100,获取腐蚀损耗量数据集中的n个腐蚀损耗量数据并将获取的n个腐蚀损耗量数据处理成按时间顺序连续变化的n1个腐蚀速率数据,形成腐蚀速率时序数据集;n1≤n;
S200,从配置文件中获取Tmax=max(T1,T2,…,Tm+1),并基于Tmax从存储器中获取对应的参数数据的kp,p的取值范围为1到m;
S300,基于Tmax,将腐蚀速率时序数据集中的n1个腐蚀速率数据处理成kp个腐蚀速率数据,形成腐蚀速率数据降采样集;kp个腐蚀速率数据中的相邻两个数据间的时间间隔等于Tmax
S400,遍历m个参数数据集,如果第j个数据集对应的采样周期Tj≠Tmax,执行S500;
S500,基于Tmax,第j个参数数据集中的kj个参数数据处理成kp个参数数据,kp个参数数据中的相邻两个数据间的时间间隔等于Tmax
S600,基于S300至S500形成按时间顺序排列的腐蚀多源数据集(D1,D2,…,Dkp),第r个腐蚀多源数据Dr=(A1r,A2r,…,Amr,Br),Asr为Dr中的第s个参数数据,Br为第r个腐蚀速率数据,s的取值范围为1到m,r的取值范围为1到kp;DSt中的所有数据的采样时间相同;
S700,对腐蚀多源数据集中的异常数据进行检测,并将检测到的异常数据剔除,得到标准参数数据集;
S800,基于标准参数数据集,获取多源数据和腐蚀速率数据之间的映射关系;
S900,基于获取的映射关系,对于没有设置有腐蚀监测设备的炼油装置,利用从该炼油装置获取的多源数据对该炼油装置的腐蚀速率数据进行预测。
2.根据权利要求1所述的系统,其特征在于,在S100中,利用高阶拟合的方式对腐蚀损耗量数据集中的n个腐蚀速率数据进行平滑处理得到拟合曲线,以及对拟合曲线求导得到按时间顺序连续变化的n1个腐蚀速率数据。
3.根据权利要求1所述的方法,其特征在于,在S700中,利用隔离森林算法对腐蚀多源数据集中的异常数据进行检测,并将检测到的异常数据剔除,得到标准参数数据集。
4.根据权利要求1所述的系统,其特征在于,在S800中,基于标准参数数据集和随机森林模型获取多源数据和腐蚀速率数据之间的映射关系。
5.根据权利要求4所述的系统,其特征在于,所述映射关系通过如下步骤获取:
S801,将标准参数数据集中的数据分为训练数据集和测试数据集;
S802,生成初始种群,初始种群包括N个生物体,对于每个生物体,执行S803;
S803,将训练数据集输入随机森林模型中进行训练,得到训练后的随机森林模型,利用测试数据集对训练后的随机森林模型进行评估,得到当前生物体的适应度;
S804,基于S803,将适应度最小的生物体确定为当前最优生物体Xbest
S805,对于当前种群中的生物体Xu和Xv,确定对应的新生物体Xunew和Xvnew,新生物体Xunew与生物体Xu和Xbest正相关,新生物体Xvnew与生物体Xv和Xbest正相关,u和v的取值范围为1到N,u≠v;
S806,基于S803得到新生物体Xunew和Xvnew的适应度,如果得到的Xunew和Xvnew的适应度小于Xu和Xv的适应度,则利用Xunew和Xvnew分别更新Xu和Xv,得到第一更新种群;
S807,对于第一更新种群中的生物体Xw,从第一更新种群中选取另一个生物体Xe,确定对应的新生物体Xwnew;新生物体Xwnew与的生物体Xw正相关,与生物体Xe负相关;w和e的取值为1到N,r≠u;
S808,基于S803计算新生物体Xwnew的适应度,如果得到的Xwnew的适应度小于Xw的适应度,则利用Xwnew更新Xw,得到第二更新种群;
S809,通过复制第二更新种群中的Xf创建寄生虫PVf,并从Xf中的维度中随机选取一个或者若干个维度替换为对应的搜索空间范围内的随机取值作为PVf的取值;f的取值为1到N;
S810,从第二更新种群中选择不同于Xf的生物体Xo,基于S803分别得到PVf和Xo的适应度,如果PVf的适应度小于Xo的适应度,则利用PVf替换Xo,得到第三更新种群;o的取值为1到N;
S811,基于S803得到第三更新种群的每个生物体的适应度,并基于计算的适应度确定第三更新种群的最优生物体,将得到的最优生物体更新为当前最优生物体Xbest;启动计数器C并设置C=C+1,C的初始值为0;
S812,如果第三更新种群的最优生物个体对应的适应度小于预设适应度值,或者,C≥C0,执行S813,否则,返回S805;C0为预设次数;
S813,将第三更新种群的最优生物个体作为目标生物体,并将目标生物体作为优化后的随机森林模型参数;
S814,将优化后的随机森林模型参数构建的随机森林模型作为腐蚀速率目标预测模型。
6.根据权利要求5所述的系统,其特征在于,在805中,Xunew和Xvnew满足如下条件:
Xunew=Xv+rand(0,1)*(Xbest-MV*BF1),Xvnew=Xv+rand(0,1)*(Xbest-MV*BF2);
其中,
Figure FDA0003568863300000031
BF1和BF2表示受益因子,为随机数。
7.根据权利要求5所述的系统,其特征在于,在S807中,Xwnew=Xw+rand(-1,1)*(Xw-Xe)。
8.根据权利要求5所述的系统,其特征在于,所述适应度包括平均绝对误差、均方根误差和平均绝对百分比误差中的任一种。
9.根据权利要求1至8任一项所述的系统,其特征在于,所述工艺运行数据包括温度、压力、流量,所述工艺介质数据包括铁离子浓度、氯离子浓度、铵根离子浓度、硫离子浓度、pH。
CN202210315466.5A 2022-03-28 2022-03-28 基于多源数据的腐蚀速率预测系统 Pending CN114565185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210315466.5A CN114565185A (zh) 2022-03-28 2022-03-28 基于多源数据的腐蚀速率预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210315466.5A CN114565185A (zh) 2022-03-28 2022-03-28 基于多源数据的腐蚀速率预测系统

Publications (1)

Publication Number Publication Date
CN114565185A true CN114565185A (zh) 2022-05-31

Family

ID=81718916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210315466.5A Pending CN114565185A (zh) 2022-03-28 2022-03-28 基于多源数据的腐蚀速率预测系统

Country Status (1)

Country Link
CN (1) CN114565185A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115899595A (zh) * 2023-03-08 2023-04-04 成都秦川物联网科技股份有限公司 一种智慧燃气管道防腐优化方法、物联网系统及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034641A (zh) * 2018-08-10 2018-12-18 中国石油大学(北京) 管道缺陷预测方法及装置
CN112348264A (zh) * 2020-11-10 2021-02-09 南京钢铁股份有限公司 一种基于随机森林算法的碳钢腐蚀速率预测方法
US20210215594A1 (en) * 2018-05-24 2021-07-15 Nippon Telegraph And Telephone Corporation Corrosion Rate Estimating Device and Method
CN113268883A (zh) * 2021-06-03 2021-08-17 西安建筑科技大学 一种基于pca-abc-svm模型的海底原油管道腐蚀速率预测方法
CN113807598A (zh) * 2021-09-26 2021-12-17 辽宁石油化工大学 基于pso-woa混合优化的svm稠油管道腐蚀速率预测方法
CN114121174A (zh) * 2021-11-19 2022-03-01 武汉材料保护研究所有限公司 一种碳钢腐蚀速率预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210215594A1 (en) * 2018-05-24 2021-07-15 Nippon Telegraph And Telephone Corporation Corrosion Rate Estimating Device and Method
CN109034641A (zh) * 2018-08-10 2018-12-18 中国石油大学(北京) 管道缺陷预测方法及装置
CN112348264A (zh) * 2020-11-10 2021-02-09 南京钢铁股份有限公司 一种基于随机森林算法的碳钢腐蚀速率预测方法
CN113268883A (zh) * 2021-06-03 2021-08-17 西安建筑科技大学 一种基于pca-abc-svm模型的海底原油管道腐蚀速率预测方法
CN113807598A (zh) * 2021-09-26 2021-12-17 辽宁石油化工大学 基于pso-woa混合优化的svm稠油管道腐蚀速率预测方法
CN114121174A (zh) * 2021-11-19 2022-03-01 武汉材料保护研究所有限公司 一种碳钢腐蚀速率预测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115899595A (zh) * 2023-03-08 2023-04-04 成都秦川物联网科技股份有限公司 一种智慧燃气管道防腐优化方法、物联网系统及存储介质
CN115899595B (zh) * 2023-03-08 2023-05-23 成都秦川物联网科技股份有限公司 一种智慧燃气管道防腐优化方法、物联网系统及存储介质
US11982613B2 (en) 2023-03-08 2024-05-14 Chengdu Qinchuan Iot Technology Co., Ltd. Methods and internet of things (IOT) systems for corrosion protection optimization of pipeline of smart gas

Similar Documents

Publication Publication Date Title
CN114399032B (zh) 一种电能表计量误差预测方法及系统
CN114547974B (zh) 基于输入变量选择与lstm神经网络的动态软测量建模方法
Rady et al. Time series forecasting using tree based methods
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
CN112231980B (zh) 一种发动机寿命预测方法、存储介质及计算设备
CN114565185A (zh) 基于多源数据的腐蚀速率预测系统
CN111639304B (zh) 基于Xgboost回归模型的CSTR故障定位方法
CN115130600A (zh) 基于堆叠习惯化自编码器的高维动态数据流异常检测方法
CN118246368B (zh) 负离子浓度控制方法、装置、设备及存储介质
Ghobadi et al. Developing a multivariate approach to monitor fuzzy quality profiles
Dubey et al. Time series missing value prediction: algorithms and applications
CN112711912B (zh) 基于云计算和机器学习算法的空气质量监测与告警方法、系统、装置和介质
CN117633504B (zh) 一种油浸变压器状态的光纤传感评估方法和装置
Zhang et al. Neural networks-based hybrid beneficial variable selection and modeling for soft sensing
CN105894138A (zh) 一种制造业发货量的最优加权组合预测方法
JP5457737B2 (ja) プラント制御情報生成装置及び方法、並びにそのためのコンピュータプログラム
CN116227952B (zh) 一种关键信息缺失下的来袭目标防御策略选择方法及装置
Kabiri et al. A bayesian approach for recognition of control chart patterns
Kadtan et al. GUI based Prediction of Heart Stroke Stages by finding the accuracy using Machine Learning algorithm
Zhao et al. Multi-mode process monitoring based on a novel weighted local standardization strategy and support vector data description
Moghadam et al. A novel phase I fuzzy profile monitoring approach based on fuzzy change point analysis
CN113850418B (zh) 时间序列中异常数据的检测方法和装置
Zhang et al. Dynamic industrial process monitoring based on concurrent fast and slow‐time‐varying feature analytics
Xie et al. Fault detection based on probabilistic kernel partial least square regression for industrial processes
Zhou et al. Hybrid Modeling Method for Soft Sensing of Key Process Parameters in Chemical Industry.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination