CN109669017B - 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法 - Google Patents

基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法 Download PDF

Info

Publication number
CN109669017B
CN109669017B CN201710964729.4A CN201710964729A CN109669017B CN 109669017 B CN109669017 B CN 109669017B CN 201710964729 A CN201710964729 A CN 201710964729A CN 109669017 B CN109669017 B CN 109669017B
Authority
CN
China
Prior art keywords
layer
data
rbm
time
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710964729.4A
Other languages
English (en)
Other versions
CN109669017A (zh
Inventor
牛鲁娜
胡海军
兰正贵
李云
韩磊
张钰
屈定荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Qingdao Safety Engineering Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Qingdao Safety Engineering Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Qingdao Safety Engineering Institute filed Critical China Petroleum and Chemical Corp
Priority to CN201710964729.4A priority Critical patent/CN109669017B/zh
Publication of CN109669017A publication Critical patent/CN109669017A/zh
Application granted granted Critical
Publication of CN109669017B publication Critical patent/CN109669017B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,主要解决现有技术中由于提供数据不及时而导致的人力和时间成本较高的问题。本发明通过采用一种首先根据所有监检测数据的最小时间尺度进行时间同步;针对非量化数据进行量化处理,并进行数据归一化,组建因素表X和对照表Y;建立包含多层限制玻尔兹曼机RBM的深度置信网络;通过逐层学习,获得深度置信网络的最优参数,最后一层RBM输出结果为
Figure DDA0001436068540000013
运用支持向量机回归分析方法建立
Figure DDA0001436068540000012
与Y之间非线性映射关系的技术方案较好地解决了上述问题,可用于炼厂蒸馏塔顶切水离子浓度预测中。

Description

基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法
技术领域
本发明涉及一种基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法。
背景技术
常减压装置是炼油企业的龙头装置,腐蚀是影响装置安全、稳定运行的关键问题,对水质进行检测分析是判断和预测腐蚀发展趋势的重要方法。但是,由于检测技术和条件的限制,炼厂还不能做到对水样进行实时在线监测,当工艺条件或原料发生变化时往往不能及时了解水质的改变情况。因此需要开发一种技术能根据现有的状态监测和检测数据预测水中关键离子浓度。由于工艺过程、腐蚀机理的复杂性,很难简单的根据经验模型或解析方法获得水质参数,如铁离子含量、pH等,进而导致对塔顶最为关心的腐蚀评价预测不准确。近年来有对装置关键离子浓度进行预测的研究,顾敏等[BP神经网络在炼油污水回用于循环水系统中腐蚀率的预测.当代化工,2014,43(11):2358-2361.]运用BP神经网络预测循环冷却水腐蚀速率;李皎等[炼油装置的腐蚀监测管理体系[J].腐蚀与防护,2016,37(10):847]针对加氢裂化装置的腐蚀监测数据,运用BP人工神经网络建立了铁离子浓度预测模型。然而,这些研究主要针对有限的腐蚀监检测数据进行分析,忽视了设备工艺、原料及产品采样数据,分析数据样本有限,研究结果也只能在有限范围内得到验证,导致预测结果准确性欠佳,所用方法仅局限于传统数据分析方法。
深度学习是一种模拟人脑的多层感知结构来认识数据模式的学习算法。近年来作为数据挖掘的一个新兴领域,在处理图像识别、语音识别以及人工智能领域取得了卓越的效果。和传统的机器学习方法相比,深度学习的适应面广、效率高、计算结果更准确。目前暂无利用深度学习方法对炼厂水质数据进行分析预测的技术。
发明内容
本发明所要解决的技术问题是现有技术中由于提供数据不及时而导致的人力和时间成本较高的问题,提供一种新的基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法。该方法具有提供数据及时、人力和时间成本较低的优点。
为解决上述问题,本发明采用的技术方案如下:一种基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,首先根据所有监检测数据的最小时间尺度进行时间同步,即通过插入数据的方法使得在任一时间点所有监检测变量都有数据,数据根据现行插值算法得出;针对非量化数据进行量化处理,并进行数据归一化,组建因素表X和对照表Y;建立包含多层限制玻尔兹曼机RBM的深度置信网络,第一层RBM的可视层的节点数与因素表X的总列数一致,最后一层RBM的隐藏层的节点数不小于因素表X的总列数的一半,中间层RBM的可视层和隐藏层的节点数相同,整个深度置信网络包含RBM总层数不小于2层;通过逐层学习,获得深度置信网络的最优参数,最后一层RBM输出结果为
Figure GDA0002979697420000011
运用支持向量机回归分析方法建立
Figure GDA0002979697420000012
与Y之间非线性映射关系;具体包括如下步骤:
(1)数据的收集和预处理
收集常减压装置的工艺生产实时数据、侧线油品分析化验数据和水质分析数据,对数据进行预处理,包括如下步骤:
1)对数据进行时间同步
针对数据时间尺度不一致的情况,按最小时间尺度对数据集进行补充;
2)对非量化数据的处理
监测和检测数据中,部分数据采用非量化的描述,根据数据集中存在非量化的状态总数M,则将这些非量化描述转换成量化整数i(i=1~M);
3)对数据进行补全
如果某个时段采集数据中有缺失,则通过线性插值方法进行补充;
4)数据归一化
针对分析的数据集,选择每列数据的最大值和最小值,通过线性方法将数据变换到0~1范围内;
5)将所有数据根据时间组装成因数表和对照表,因素表中的每一列代表一个因素的时序集,每一行代表一个时间点上因素集;对照表中每一列代表需要预测的变量的时序集,每一行代表一个时间点上多个预测变量的集和;
(2)采用深度学习对数据进行训练
1)组建深度置信网络,深度置信网络由多层限制玻尔兹曼机RBM叠加而成组成;
2)逐层训练
对深度置信网络的每层RBM进行训练;
3)采用支持向量机回归分析方法对塔顶切水浓度进行预测;
4)重复上述步骤直至对照表中所有的浓度都获得SVR的最优解,至此,建立了基于深度学习的塔顶切水浓度预测方法;
5)离子浓度预测数据预测
将新采集的数据进行预处理,并输入深度置信网络的第一层RBM的可视层,经过计算后,将最后一层RBM隐藏层的结果代入计算公式,计算出的结果即为塔顶切水中离子浓度的预测值。
上述技术方案中,优选地,组建深度置信网络,深度置信网络由多层限制玻尔兹曼机RBM叠加而成组成,每个RBM层包括可视层和隐藏层。
上述技术方案中,优选地,对深度置信网络的每层RBM进行训练;首先将训练数据输入第1层RBM,经过训练后,固定其网格参数,将第1层RBM隐含层作为第2层RBM的可视层,数据样本经过第1层RBM抽取初步特征数据,再输入第2层RBM的可见层;第2层RBM采用同样的方法进行训练,训练结束后将第2层RBM隐藏层的输出作为第3层RBM的可见层;这样,逐层进行训练到最后一层,使整个置信网格参数稳定;训练数据经过深度置信网络计算后,输出结果为最后一层RBM的隐藏层数据。
上述技术方案中,优选地,所述计算公式为:
Figure GDA0002979697420000021
即将深度置信网络最后一层RBM的输出
Figure GDA0002979697420000023
和对照表中的Yj做为支持向量机回归分析方法的训练样本,构造回归函数;其中,j为第j个需要预测的浓度,
Figure GDA0002979697420000022
为非线性映射函数,w为权向量,s为常数。
上述技术方案中,优选地,如果j>1,则重复上述步骤直至对照表中所有的浓度都获得SVR的最优解。
上述技术方案中,优选地,采用的限制玻尔兹曼机的能量函数为:E(v,h|a,b,W)=-∑i,jWijvihj-∑ibivi-∑jajhj
其中,v和h代表可视层和隐藏层,a和b为网络的偏置,W为连接权重,i和j为分别代表可视层和隐藏层的节点编号。
上述技术方案中,优选地,线性插值方法为
Figure GDA0002979697420000031
其中,x为t时刻需要补全的值,x1为t1时刻的测量值,x2为t2时刻的测量值。
本发明是通过以下技术方案实现的:
1、数据的收集和预处理
收集常减压装置的工艺生产实时数据、侧线油品分析化验数据和水质分析数据,对数据进行预处理,方法如下:
(1)对数据进行时间同步
针对数据时间尺度不一致的情况,按最小时间尺度对数据集进行补充。
(2)对非量化数据的处理
监测和检测数据中,部分数据采用非量化的描述(如硫化物浓度<1.0mg/L),根据数据集中存在非量化的状态总数(如M种),则将这些非量化描述转换成量化整数i(i=1~M)。
(3)对数据进行补全
如果某个时段采集数据中有缺失(没有采集),则通过线性插值方法进行补充,即:
Figure GDA0002979697420000032
其中,x为t时刻需要补全的值,x1为t1时刻的测量值,x2为t2时刻的测量值。
(4)数据归一化
针对分析的数据集,选择每列数据的最大值和最小值,通过线性方法将数据变换到0~1范围内,即,
Figure GDA0002979697420000033
其中,
Figure GDA0002979697420000034
为归一化值,x为原始值,xLow为最小值,xMax为最大值。
(5)将所有数据根据时间组装成因数表(二维向量X)和对照表(二维向量Y),因素表中的每一列代表一个因素的时序集,每一行代表一个时间点上因素集。对照表中每一列代表需要预测的变量的时序集,每一行代表一个时间点上多个预测变量的集和。
2、采用深度学习对数据进行训练
(1)组建深度置信网络(Deep Belief Nets,DBNs)。深度置信网络由多层限制玻尔兹曼机(Restricted Boltzmann Machine,RBM)叠加而成组成,每个RBM层包括可视层v和隐藏层h。
采用的限制玻尔兹曼机的能量函数为:
E(v,h|a,b,W)=-∑i,jWijvihj-∑ibiυi-∑jajhj (3)
式中,v和h代表可视层和隐藏层,a和b为网络的偏置,W为连接权重,i和j为分别代表可视层和隐藏层的节点编号。基于该能量模型,可以得到v和h的联合分布概率为,
Figure GDA0002979697420000035
给定可视层v,第j个隐藏层节点被激活的概率为:
Figure GDA0002979697420000041
给定隐藏层h,第i个可视层节点被激活的概率为:
Figure GDA0002979697420000042
将给定训练样本输入至可见层节点时,根据上述激活概率,逐层对隐含层进行激活。对深度置信网络的参数进行调整,调整幅度为:
ΔWij=ε(<υihj>data-<υihj>recon) (7)
Δai=ε(<υi>data-<υi>recon) (8)
Δbi=ε(<hj>data-<hj>recon) (9)
式中,ε为学习率,<·>data表示训练数据集所定义分布之上的数学期望,<·>recon表示重构后深度置信网络输出的分布上的数学期望。经过多次调整后,深度置信网络参数达到最优。
计算中,第一层RBM的可视层的节点数与训练数据(因素表X)的总列数一致。最后一层RBM的隐藏层的节点数不小于因素表X的总列数一半。中间层RBM的可视层和隐藏层的节点数相同,可以与第一层RBM的可视层的节点数相同。整个深度置信网络包含RBM总层数不小于2层。
(2)逐层训练
运用上述的参数调整方法,对深度置信网络的每层RBM进行训练。首先将训练数据(因素表X)输入第1层RBM,经过训练后,固定其网格参数,将第1层RBM隐含层作为第2层RBM的可视层,数据样本经过第1层RBM抽取初步特征数据,再输入第2层RBM的可见层。第2层RBM采用同样的方法进行训练,训练结束后将第2层RBM隐藏层的输出作为第3层RBM的可见层。这样,逐层进行训练到最后一层,使整个置信网格参数稳定。训练数据(因素表X)经过深度置信网络计算后,输出结果为
Figure GDA0002979697420000048
(即最后一层RBM的隐藏层数据)。
3、采用支持向量机回归分析方法(support vector regression,SVR)对塔顶切水浓度进行预测。
将深度置信网络最后一层RBM的输出
Figure GDA0002979697420000043
和对照表中的Yj(第j个需要预测的浓度)做为SVR的训练样本,构造回归函数
Figure GDA0002979697420000044
式中,
Figure GDA0002979697420000045
为非线性映射函数,w为权向量,s为常数。建立无约束优化函数
Figure GDA0002979697420000046
式中,C为惩罚参数,
Figure GDA0002979697420000047
ε不敏感损失函数的参数,i为对照表的行数,j为对照表的列数(需要预测量的序号)。式(11)对w和s取偏导,当导数为0时,得到的w*为w的最优解,得到s*为s的最优解。
4)如果j>1,则按步骤3)重复直至对照表中所有的浓度都获得SVR的最优解。至此,基于深度学习的塔顶切水浓度预测方法建立成功。
5)离子浓度预测数据预测
将新采集的数据按照步骤1)进行预处理,并输入深度置信网络的第一层RBM的可视层,经过计算后,将最后一层RBM隐藏层的结果代入式(10),计算出的结果为塔顶切水中离子浓度的预测值。
本发明利用深度学习方法对常减压装置塔顶切水中离子浓度进行预测,首先根据所有监检测数据的最小时间尺度进行时间同步,即通过插入数据的方法使得在任一时间点所有监检测变量都有数据,数据根据现行插值算法得出。针对非量化数据进行量化处理,并进行数据归一化,组建因素表X和对照表Y。建立包含多层限制玻尔兹曼机(RBM)的深度置信网络。第一层RBM的可视层的节点数与因素表0的总列数一致,最后一层RBM的隐藏层的节点数不小于因素表0的总列数的一半,中间层RBM的可视层和隐藏层的节点数相同,整个深度置信网络包含RBM总层数不小于2层。通过逐层学习,获得深度置信网络的最优参数,最后一层RBM输出结果为
Figure GDA0002979697420000051
其次,运用支持向量机回归分析方法建立
Figure GDA0002979697420000052
与Y之间非线性映射关系,从而建立蒸馏塔顶切水浓度预测方法。本发明旨在提供一种基于深度学习方法的炼厂蒸馏塔顶切水离子浓度预测方法,该方法运用深度学习方法对常减压装置中的工艺数据、水质监测数据进行无监督学习,获得这些数据的最优特征表达,再运用支持向量机回归方法建立离子浓度与特征表达之间的联系,从而开发水质预测方法。相对于现有的人工智能方法,基于深度学习的预测方法计算结果更准、适用性更好。
本发明采用深度学习和支持向量回归方法建立了炼厂常减压装置塔顶切水离子浓度预测方法,该方法对常减压装置的工艺数据和水质数据进行分析和预处理,针对采集数据时间尺度不一致的问题,利用线性插值方法对数据进行补充,并进行量化处理和归一化,组成因素表和对照表。建立包含多层RBM的深度置信网络,将因素表的数据输入第一层RBM,通过逐层学习训练,获得这些数据的最优特征表达。再运用支持向量机回归方法建立这些最优表达与水样离子浓度的非线性关系,从而完成塔顶切水离子浓度的预测方法。本发明从海量的、复杂数据(生产实时数据、油品分析化验、水质分析数据)中预测塔顶切水介质的浓度,计算可靠、速度快,可以及时的向炼油企业的工艺防腐和腐蚀预测提供可靠的数据支持,节省时间和人力物力成本,取得了较好的技术效果。
附图说明
图1为本发明流程图;
图2为深度置信网络图;
图3常压塔顶切水pH的预测值和测量值对比图;
图4常压塔顶切水Fe2+的预测值和测量值对比图;
下面通过实施例对本发明作进一步的阐述,但不仅限于本实施例。
具体实施方式
【实施例1】
一种基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,如图1-3所示,首先根据所有监检测数据的最小时间尺度进行时间同步,即通过插入数据的方法使得在任一时间点所有监检测变量都有数据,数据根据现行插值算法得出;针对非量化数据进行量化处理,并进行数据归一化,组建因素表X和对照表Y;建立包含多层限制玻尔兹曼机RBM的深度置信网络,第一层RBM的可视层的节点数与因素表X的总列数一致,最后一层RBM的隐藏层的节点数不小于因素表X的总列数的一半,中间层RBM的可视层和隐藏层的节点数相同,整个深度置信网络包含RBM总层数不小于2层;通过逐层学习,获得深度置信网络的最优参数,最后一层RBM输出结果为
Figure GDA0002979697420000061
运用支持向量机回归分析方法建立
Figure GDA0002979697420000062
与Y之间非线性映射关系。
具体包括如下步骤:
1、数据的收集和预处理
选取某炼油厂常减压装置的2016年1月1日至2016年10月26日的工艺数据和水质分析数据,其中工艺数据包括常减压塔自身的工艺数据和塔侧线分析数据,水质分析数据包括常顶切水、减顶切水、常压电脱盐切水、常压含油污水等数据,水质分析数据中的铁离子和pH值是工艺防腐的重要参数,需要根据其他数据进行预测。所采集的数据共有107个变量。
(1)对数据进行时间同步
常减压塔的工艺数据(从企业LIMS系统读取)是1小时采集1次,侧线数据是1天采集2次,水质分析是1天1次,则最小时间尺度为1小时,在水质分析、侧线监测的数据集中添加数据统一补充到1天24行数据,并按步骤(2)对数据进行补全。
(2)对非量化数据的处理
上述数据中,部分数据(如硫化物浓度<1.0mg/L)采用非量化的描述,根据数据集中存在非量化的状态总数(如硫化物浓度共有5种),则将这些非量化描述转换成量化整数i(i=1~5)。
(3)对数据进行补全
对于采集数据中有缺失的时段,则通过线性插值方法进行补充,即:
Figure GDA0002979697420000063
其中,x为t时刻需要补全的值,x1为t1时刻的测量值,x2为t2时刻的测量值。如常压塔塔顶切水pH于9月1日9:00采集的值为8.2,9月7日9:00采集的值为8.6,则x1=8.2,t1=2016.9.1 9:00,x2=8.6,t2=2016.9.7 9:00,按1小时间隔在(t1,t2)内插入多个时间点,每个时间点的pH值用式(1)计算得出。
(4)数据归一化
针对分析的数据集,选择每列数据的最大值和最小值,通过线性方法将数据变换到0~1范围内,即,
Figure GDA0002979697420000064
其中,
Figure GDA0002979697420000065
为归一化值,x为原始值,xLow为最小值,xMax为最大值。
(5)将所有数据根据时间组装成因数表(二维向量X,共101列,7199行)和对照表(二维向量Y,共6列,7199行,为常减压塔顶切水和电脱盐切水的Fe2+、pH),因素表中的每一列代表一个因素的时序集,每一行代表一个时间点上因素集。对照表中每一列代表需要预测的变量的时序集,每一行代表一个时间点上多个预测变量的集和。
2、采用深度学习对数据进行训练
(1)组建深度置信网络。深度置信网络由多层限制玻尔兹曼机叠加而成组成,每个RBM层包括可视层v和隐藏层h。
采用的限制玻尔兹曼机的能量函数为:
E(υ,h|a,b,W)=-∑i,jWijυihj-∑ibivi-∑jajhj (3)
式中,v和h代表可视层和隐藏层,a和b为网络的偏置,W为连接权重,i和j为分别代表可视层和隐藏层的节点编号。基于该能量模型,可以得到v和h的联合分布概率为,
Figure GDA0002979697420000071
给定可视层v,第j个隐藏层节点被激活的概率为:
Figure GDA0002979697420000072
给定隐藏层h,第i个可视层节点被激活的概率为:
Figure GDA0002979697420000073
将给定训练样本输入至可见层节点时,根据上述激活概率,逐层对隐含层进行激活。对深度置信网络的参数进行调整,调整幅度为:
ΔWij=ε(<υihj>data-<vihj>recon) (7)
Δai=ε(<υi>data-<υi>recon) (8)
Δbi=ε(<hj>data-<hj>recon) (9)
式中,ε为学习率,<·>data表示训练数据集所定义分布之上的数学期望,<·>recon表示重构后深度置信网络输出的分布上的数学期望。经过多次调整后,深度置信网络参数达到最优。
计算中,第一层RBM的可视层的节点数与训练数据(因素表X)的总列数一致,为101个,最后一层RBM的隐藏层的节点数为51个。中间层RBM的可视层和隐藏层的节点数相同,可以与第一层RBM的可视层的节点数相同。整个深度置信网络包含RBM总层数为5层。
(2)逐层训练
运用上述的参数调整方法,对深度置信网络的每层RBM进行训练。首先将训练数据(因素表X)输入第1层RBM,经过训练后,固定其网格参数,将第1层RBM隐含层作为第2层RBM的可视层,数据样本经过第1层RBM抽取初步特征数据,再输入第2层RBM的可见层。第2层RBM采用同样的方法进行训练,训练结束后将第2层RBM隐藏层的输出作为第3层RBM的可见层。这样,逐层进行训练到最后一层,使整个置信网格参数稳定。训练数据(因素表X)经过深度置信网络计算后,输出结果为
Figure GDA0002979697420000074
(即最后一层RBM的隐藏层数据)。
3、采用支持向量机回归分析方法对塔顶切水浓度进行预测。
将深度置信网络最后一层RBM的输出
Figure GDA0002979697420000075
和对照表中的Yj(第j个需要预测的浓度,j=1...8)做为SVR的训练样本,构造回归函数
Figure GDA0002979697420000076
式中,
Figure GDA0002979697420000077
为非线性映射函数,w为权向量,s为常数。建立无约束优化函数
Figure GDA0002979697420000078
式中,C为惩罚参数,
Figure GDA0002979697420000079
ε不敏感损失函数的参数,i为对照表的行数,j为对照表的列数(需要预测量的序号)。式(11)对w和s取偏导,当导数为0时,得到的w*为w的最优解,得到s*为s的最优解。
4、则按步骤3再重复7次,直至对照表中所有的浓度都获得SVR的最优解。至此,基于深度学习的塔顶切水pH和铁离子浓度预测方法建立成功。
5、离子浓度预测数据预测
将新采集的数据按照步骤1进行预处理,并输入深度置信网络的第一层RBM的可视层,经过计算后,将最后一层RBM隐藏层的结果代入式(10),计算出的结果为切水中介质浓度的预测值。其中,常压塔顶切水pH值预测值和测量值对比图如图3所示,常压塔顶切水铁离子值预测值和测量值对比图如图4所示,结果表明,本发明的方法可以非常准确的预测离子浓度。
本发明采用深度学习和支持向量回归方法建立了炼厂常减压装置塔顶切水离子浓度预测方法,该方法对常减压装置的工艺数据和水质数据进行分析和预处理,针对采集数据时间尺度不一致的问题,利用线性插值方法对数据进行补充,并进行量化处理和归一化,组成因素表和对照表。建立包含多层RBM的深度置信网络,将因素表的数据输入第一层RBM,通过逐层学习训练,获得这些数据的最优特征表达。再运用支持向量机回归方法建立这些最优表达与水样离子浓度的非线性关系,从而完成塔顶切水离子浓度的预测方法。本发明从海量的、复杂数据(生产实时数据、油品分析化验、水质分析数据)中预测塔顶切水介质的浓度,计算可靠、速度快,可以及时的向炼油企业的工艺防腐和腐蚀预测提供可靠的数据支持,节省时间和人力物力成本,取得了较好的技术效果。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无法对所有的实施方式予以穷举。凡是属于本发明的技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (7)

1.一种基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,包括如下步骤:首先根据所有监检测数据的最小时间尺度进行时间同步,即通过插入数据的方法使得在任一时间点所有监检测变量都有数据,数据根据现行插值算法得出;针对非量化数据进行量化处理,并进行数据归一化,组建因素表X和对照表Y;建立包含多层限制玻尔兹曼机RBM的深度置信网络,第一层RBM的可视层的节点数与因素表X的总列数一致,最后一层RBM的隐藏层的节点数不小于因素表X的总列数的一半,中间层RBM的可视层和隐藏层的节点数相同,整个深度置信网络包含RBM总层数不小于2层;通过逐层学习,获得深度置信网络的最优参数,最后一层RBM输出结果为
Figure FDA0002979697410000011
运用支持向量机回归分析方法建立
Figure FDA0002979697410000012
与Y之间非线性映射关系;具体包括如下步骤:
(1)数据的收集和预处理
收集工艺生产实时数据、侧线油品分析化验数据和水质分析数据,对数据进行预处理,包括如下步骤:
1)对数据进行时间同步
针对数据时间尺度不一致的情况,按最小时间尺度对数据集进行补充;
2)对非量化数据的处理
监测和检测数据中,部分数据采用非量化的描述,根据数据集中存在非量化的状态总数M,则将这些非量化描述转换成量化整数i(i=1~M);
3)对数据进行补全
如果某个时段采集数据中有缺失,则通过线性插值方法进行补充;
4)数据归一化
针对分析的数据集,选择每列数据的最大值和最小值,通过线性方法将数据变换到0~1范围内;
5)将所有数据根据时间组装成因数表和对照表,因素表中的每一列代表一个因素的时序集,每一行代表一个时间点上因素集;对照表中每一列代表需要预测的变量的时序集,每一行代表一个时间点上多个预测变量的集和;
(2)采用深度学习对数据进行训练
1)组建深度置信网络,深度置信网络由多层限制玻尔兹曼机RBM叠加而成组成;
2)逐层训练
对深度置信网络的每层RBM进行训练;
3)采用支持向量机回归分析方法对塔顶切水浓度进行预测;
4)重复上述步骤直至对照表中所有的浓度都获得SVR的最优解,至此,建立了基于深度学习的塔顶切水浓度预测方法;
5)离子浓度预测数据预测
将新采集的数据进行预处理,并输入深度置信网络的第一层RBM的可视层,经过计算后,将最后一层RBM隐藏层的结果代入建立的非线性映射关系式中,计算出的结果即为塔顶切水中离子浓度的预测值。
2.根据权利要求1所述基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,其特征在于组建深度置信网络,深度置信网络由多层限制玻尔兹曼机RBM叠加而成组成,每个RBM层包括可视层和隐藏层。
3.根据权利要求1所述基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,其特征在于对深度置信网络的每层RBM进行训练;首先将训练数据输入第1层RBM,经过训练后,固定其网格参数,将第1层RBM隐含层作为第2层RBM的可视层,数据样本经过第1层RBM抽取初步特征数据,再输入第2层RBM的可见层;第2层RBM采用同样的方法进行训练,训练结束后将第2层RBM隐藏层的输出作为第3层RBM的可见层;这样,逐层进行训练到最后一层,使整个置信网格参数稳定;训练数据经过深度置信网络计算后,输出结果为最后一层RBM的隐藏层数据。
4.根据权利要求1所述基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,其特征在于所述计算公式为:
Figure FDA0002979697410000021
即将深度置信网络最后一层RBM的输出
Figure FDA0002979697410000022
和对照表中的Yj做为支持向量机回归分析方法的训练样本,构造回归函数;其中,j为第j个需要预测的浓度,
Figure FDA0002979697410000023
为非线性映射函数,w为权向量,s为常数。
5.根据权利要求4所述基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,其特征在于如果j>1,则重复上述步骤直至对照表中所有的浓度都获得SVR的最优解。
6.根据权利要求1所述基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,其特征在于采用的限制玻尔兹曼机的能量函数为:E(v,h|a,b,W)=-∑i,jWijvihj-∑ibivi-∑jajhj,其中,v和h代表可视层和隐藏层,a和b为网络的偏置,W为连接权重,i和j为分别代表可视层和隐藏层的节点编号。
7.根据权利要求1所述基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法,其特征在于线性插值方法为
Figure FDA0002979697410000024
其中,x为t时刻需要补全的值,x1为t1时刻的测量值,x2为t2时刻的测量值。
CN201710964729.4A 2017-10-17 2017-10-17 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法 Active CN109669017B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710964729.4A CN109669017B (zh) 2017-10-17 2017-10-17 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710964729.4A CN109669017B (zh) 2017-10-17 2017-10-17 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法

Publications (2)

Publication Number Publication Date
CN109669017A CN109669017A (zh) 2019-04-23
CN109669017B true CN109669017B (zh) 2021-04-27

Family

ID=66139741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710964729.4A Active CN109669017B (zh) 2017-10-17 2017-10-17 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法

Country Status (1)

Country Link
CN (1) CN109669017B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852514A (zh) * 2019-11-15 2020-02-28 重庆邮电大学 一种基于bp神经网络的可获能传感器节点能量预测方法
CN114911279B (zh) * 2021-02-08 2024-05-28 中国石油化工股份有限公司 存储器、蒸馏装置塔顶pH值调控方法、装置及设备
TWI787971B (zh) * 2021-08-24 2022-12-21 台灣化學纖維股份有限公司 腐蝕率預測裝置、方法及其電腦程式產品
CN114970375B (zh) * 2022-07-29 2022-11-04 山东飞扬化工有限公司 一种基于实时采样数据的精馏过程监测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923083A (zh) * 2009-06-17 2010-12-22 复旦大学 基于支持向量机和神经网络的污水化学需氧量软测量方法
CN103942457A (zh) * 2014-05-09 2014-07-23 浙江师范大学 基于关联向量机回归的水质参数时间序列预测方法
CN104616033A (zh) * 2015-02-13 2015-05-13 重庆大学 基于深度学习和支持向量机的滚动轴承故障诊断方法
CN106198909A (zh) * 2016-06-30 2016-12-07 中南大学 一种基于深度学习的水产养殖水质预测方法
CN106709640A (zh) * 2016-12-15 2017-05-24 华南理工大学 基于深度学习与支持向量回归的船舶能耗预测方法
CN107132325A (zh) * 2017-04-14 2017-09-05 华南理工大学 一种基于粒子群算法和支持向量机的废水厌氧处理系统出水挥发性脂肪酸的软测量方法
CN107203810A (zh) * 2017-05-22 2017-09-26 河海大学 一种基于深度网络的降水量预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923083A (zh) * 2009-06-17 2010-12-22 复旦大学 基于支持向量机和神经网络的污水化学需氧量软测量方法
CN103942457A (zh) * 2014-05-09 2014-07-23 浙江师范大学 基于关联向量机回归的水质参数时间序列预测方法
CN104616033A (zh) * 2015-02-13 2015-05-13 重庆大学 基于深度学习和支持向量机的滚动轴承故障诊断方法
CN106198909A (zh) * 2016-06-30 2016-12-07 中南大学 一种基于深度学习的水产养殖水质预测方法
CN106709640A (zh) * 2016-12-15 2017-05-24 华南理工大学 基于深度学习与支持向量回归的船舶能耗预测方法
CN107132325A (zh) * 2017-04-14 2017-09-05 华南理工大学 一种基于粒子群算法和支持向量机的废水厌氧处理系统出水挥发性脂肪酸的软测量方法
CN107203810A (zh) * 2017-05-22 2017-09-26 河海大学 一种基于深度网络的降水量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CURRENT CORROSION MONITORING TRENDS IN THE PETROCHEMICAL INDUSTRY;H.J. DE BRUYN;《ht. J. Pres. Ves. & Piping 》;19961231;第66卷;第293-303页 *
Multi-model based process condition monitoring of offshore oil and gas production process;Sathish Natarajan等;《Chemical Engineering Research and Design》;20101231;第88卷;第572–591页 *
炼油设备腐蚀预测技术研究及实现;姚庆;《中国优秀硕士学位论文全文数据库 工程科技I辑》;20170315(第3期);第B019-815页 *

Also Published As

Publication number Publication date
CN109669017A (zh) 2019-04-23

Similar Documents

Publication Publication Date Title
CN109669017B (zh) 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法
Zhu et al. Comparison of two optimized machine learning models for predicting displacement of rainfall-induced landslide: A case study in Sichuan Province, China
Juntunen et al. Cluster analysis by self-organizing maps: An application to the modelling of water quality in a treatment process
CN111340110B (zh) 一种基于工业过程运行状态趋势分析的故障预警方法
CN112288021B (zh) 一种医疗废水监测数据质控方法、装置及系统
CN108399248A (zh) 一种时序数据预测方法、装置及设备
EP0521643A1 (en) Method of automated learning, an apparatus therefor, and a system incorporating such an apparatus
CN103412557A (zh) 一种适于非线性过程在线监控的工业故障检测与诊断方法
CN114821296A (zh) 地下病害探地雷达图像识别方法、系统、存储介质及终端
CN111125186B (zh) 一种基于调查问卷的数据处理方法及系统
Tarapoulouzi et al. Heavy metals detection at chemometrics-powered electrochemical (bio) sensors
CN110390132B (zh) 基于过程状态空间的有色冶金单元工序数字化和建模方法
Yang et al. Teacher-student uncertainty autoencoder for the process-relevant and quality-relevant fault detection in the industrial process
CN114217025A (zh) 评估空气质量浓度预测中气象数据对其影响的分析方法
CN109960146A (zh) 提高软测量仪表模型预测精度的方法
CN112651173A (zh) 一种基于跨域光谱信息的农产品品质无损检测方法及可泛化系统
Alfaleh et al. Is the entropy-weighted water quality index a suitable index for evaluating the groundwater quality in Ha'il, Saudi Arabia?
Eo et al. Deep learning framework with essential pre-processing techniques for improving mixed-gas concentration prediction
KR20210126378A (ko) 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템
CN115598164A (zh) 一种集成机器学习的土壤重金属浓度检测方法及系统
CN114624411A (zh) 一种水源地取水口附近水域的水质预警方法
CN114841416A (zh) 基于长短期记忆网络的酱油发酵过程氨基酸态氮预测方法
CN114492551A (zh) 一种基于改进gwo-svm的软测量策略
Mojtahedi et al. Spatiotemporal deep learning approach for estimating water content profiles in soil layers
Topalian et al. Forecasting Operational Conditions: A case-study from dewatering of biomass at an industrial wastewater treatment plant

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant