CN109214268B - 一种基于集成流形学习的填料塔液泛状态在线监测方法 - Google Patents

一种基于集成流形学习的填料塔液泛状态在线监测方法 Download PDF

Info

Publication number
CN109214268B
CN109214268B CN201810761103.8A CN201810761103A CN109214268B CN 109214268 B CN109214268 B CN 109214268B CN 201810761103 A CN201810761103 A CN 201810761103A CN 109214268 B CN109214268 B CN 109214268B
Authority
CN
China
Prior art keywords
monitoring
data
training
sample
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810761103.8A
Other languages
English (en)
Other versions
CN109214268A (zh
Inventor
刘毅
刘凯新
高增梁
徐东伟
宣琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810761103.8A priority Critical patent/CN109214268B/zh
Publication of CN109214268A publication Critical patent/CN109214268A/zh
Application granted granted Critical
Publication of CN109214268B publication Critical patent/CN109214268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Feedback Control In General (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

一种基于集成流形学习的填料塔液泛状态在线监测方法,分为离线学习与在线监测两步,(一)离线学习:通过传感器获得塔设备运行正常工况下的过程变量数据;基于等距离映射算法构建离线流形学习模型,对子训练集进行降维处理;随后建立集成流形学习模型,用多个子训练集训练同一个ISOMAP流形学习模型,最后将结果集成分析处理;最后对集成流形学习模型进行评估,确定是否满足液泛监测要求;(二)在线监测:在每一喷淋密度下,都会计算得到T2与SPE统计量;然后将T2与SPE统计量与离线模型在此喷淋密度下的T2与SPE控制线比较,实现液泛状态的在线监测。本发明提高了塔设备运行状态中液泛监测的及时性、准确性。

Description

一种基于集成流形学习的填料塔液泛状态在线监测方法
技术领域
本发明涉及一种基于集成流形学习的填料塔液泛状态在线监测方法,特别涉及一种化工生产中填料塔设备液泛过程数据的处理和分析方法。
背景技术
填料塔是用于气体吸收、分离等操作的一种塔设备,由于它有效率高、处理能力强、能源利用率高等特点,所以被广泛的使用。在现代化生产中,为了达到效益最大化,通常要求填料塔的效率保持在最高点附近。但在填料塔运行中,在效率最高点附近往往会发生液泛,液泛会使填料塔设备的生产效率下降,严重时甚至会让塔设备停止工作,损害塔设备。
为了更好的进行生产,就需要监测填料塔是否发生液泛。一般在填料塔内监控的参数包括风流量、塔内压差等在内的十多个参数,显然,对于收集到的过程数据,仅通过人来进行监测、处理是十分困难,而且人工处理会受到各方面的影响,这种不稳定性在工业上是不被允许的。为了更好的监测填料塔的工况,同时提高监测的可靠性,近几年,寻找高维数据内部的低维流形规律的流形学习在过程监测中得到成功应用。事实上,常用的线性降维方法如主成分分析(PCA)、多维尺度分析(MDS)等都属于广义的流形学习算法,在过程监测中也已得到成功应用。
等距离映射算法(ISOMAP)是一种非迭代的全局优化算法,它是依靠分析全局数据的信息来实现数据的非线性降维,该算法通过构造距离矩阵反映样本点之间的测地距离。由于测地距离一般能够较好地反映数据的本质流形几何特征,所以ISOMAP可以成功地找到高维数据所对应的低维输出。因此,能够求解高维数据的集成ISOMAP流形算法对于填料塔液泛监测数据的非线性结构应当会有更好的效果。
发明内容
针对已有的液泛监测方法的不足和缺陷,本发明提出一种基于集成流形学习的填料塔液泛状态在线监测方法,该方法提高了塔设备运行状态中液泛监测的及时性、准确性,利用集成流形学习技术对填料塔运行过程中的变量数据进行处理和分析,最终实现对其运行中液泛状态的在线监测。
本发明解决其技术问题所采用的技术方案是:
一种基于集成流形学习的填料塔液泛状态在线监测方法,包括以下步骤:
(一)离线学习,构建集成学习模型,过程如下:
(1)通过传感器获得塔设备运行正常工况下的过程变量数据
运行填料塔设备,并通过传感器获取不同喷淋密度下的过程数据变量;在同一喷淋密度下测量不同风频的填料塔工况,然后改变喷淋密度,测量得到多组不同喷淋密度、不同风频的填料塔工况数据;
(2)对采集到的过程变量数据进行数据预处理
测量数据不能直接用于集成流形学习的直接分析处理,需要对这些数据进行预处理,包括:选择稳定数据平均化处理、去除数据中重复作用相关变量和数据自标定处理;利用处理后的数据制作总数据集,然后经过随机取样获得一定样本的子训练集,监测样本集;
(3)基于ISOMAP构建离线流形学习模型,对子训练集进行降维处理
ISOMAP算法先利用k近邻算法(k-NN)通过寻找欧式距离距该点最近的k个点来构造邻域图;接着使用如迪杰斯特拉算法(Dijkstra)来计算所有样本点之间的最短距离;最后再使用MDS算法对该矩阵进行处理,实现高维数据的降维;
(4)建立集成流形学习模型,用不同子训练集训练构建好的ISOMAP流形学习模型,将训练结果集成分析
在每一监测样本集下,用多个子训练集分别单独训练构建的ISOMAP流形学习模型,构建主元子空间的Hotelling-T2统计量(T2统计量)和平方预测误差(SPE统计量)来确定子样本集下填料塔的监测泛点;在每一监测样本集下,获得此监测样本集的唯一最优泛点,保存最优泛点及获得此泛点模型的T2和SPE的控制限,从而得到用多个训练集训练同一流形学习模型后的集成效果;
(5)对集成流形学习模型进行评估,确定是否满足液泛监测
分别采用均方根误差(RMSE)、相对均方根误差(RE)和最大绝对误差(MAE)评价指标评估离线模型对泛点监测的准确性;
(二)在线监测:液泛状态辨识
(6)利用离线学习的模型对塔设备液泛状态进行在线监测
利用离线学习的集成流形学习模型对塔设备运行时采集到的新数据进行分析处理,在每一喷淋密度下,都会计算得到T2与SPE统计量的值,通过与离线模型在此喷淋密度下的T2与SPE控制线比较,实现液泛状态的在线监测。
再进一步,所述步骤2的过程为:
步骤2.1:选择稳定数据平均化处理
传感器的采样频率非常高,所以在利用数据进行ISOMAP数值模拟之前需要对采集到的样本进行处理,选取每组稳定状态下风频的Z个数据,对这些数据进行每b个求平均值作为一个训练样本的处理方法,在保证数据特征的情况下,优化数据结构,降低计算复杂度。一个风机频率下获得Z/b组数据;
步骤2.2:去除数据中重复作用的相关变量
采集的数据包含多个变量,这些变量之间存在一定的相关性。有些变量的相关性极大,其本身认为是一个变量;而有些变量与其他变量相关性很小,一般为人为设定固定值。因此,可选择去除与液泛发生的无关变量,保留剩下的几个变量用于监测;
步骤2.3:数据自标定
自标定是指以某种方式使过程变量标准化,标定过程分为两个步骤:第一步是将每个变量减去样本均值,得到每个数据相对于平均值的变化量;第二步是把经中心化处理后的数据的每个变量除以它的标准差。这一阶段把每个变量都标定到单位方差上,保证变化范围大的过程变量不会占主导地位。实质即是采用z-score标准化处理,如下所示:
Figure BDA0001727875440000051
式中,x'是经z-score标准化处理后的数据;x是通过传感器实际采集的数据经步骤2.1,2.2处理后的过程变量数据;μ是过程变量的均值;σ是过程变量数据的标准差。
步骤2.4:制作数据集,得到总训练集、子训练集、监测样本集
提取每一喷淋密度下的所有未液泛的样本,作为总的训练集,对总的训练集中不同喷淋密度的样本进行整体随机取样多次,获得多个子训练集,总训练集用来获得多个子训练集,子训练集分别用来训练模型,不同喷淋密度的数据集可分别单独作为监测样本集,用来监测某一喷淋密度下的液泛状况。
更进一步,所述步骤3的过程为:
步骤3.1:在高维数据空间,构造邻域图
首先定义X∈Rm×n为输入子训练集空间,其中m代表样本个数,n代表变量数量;Xi和Xj为输入空间中的样本点,其中下标i、j为样本点序号;定义dX(i,j)为二样本点之间的欧氏距离,构造邻域图的过程如下:
计算输入空间中的每个样本点Xi和其他样本点之间的欧式距离,当点Xj是点Xi的k个近邻点之一时,认为Xi和Xj是相邻的,定义输入空间中每一样本点与其k个近邻点一一连接形成的图称为邻域图,记为G;邻域图上两样本点之间的连线称为邻域图的边,记为ei,j,令边ei,j的权值等于Xi和Xj两点之间的欧式距离dX(i,j);邻域图上任意两点之间的最短路径,记为dG(i,j);
步骤3.2:计算dG(i,j),得到流形M上的测地线距离dM(i,j)
邻域图中,若点Xi和Xj之间有边ei,j,则这两点之间的最短路径dG(i,j)=dX(i,j);若点Xi和Xj之间没有边ei,j,则这两点之间的最短路径dG(i,j)=∞。然后在邻域图G上,利用Dijkstra求得最短路径距离矩阵,记为DG
步骤3.3:执行经典MDS算法,计算d维嵌入矩阵Y
3.2.1)计算平方距离矩阵S:
S=(DG)2 (2)
式中,DG为最短路径距离矩阵。
3.2.2)计算中心矩阵H:
Figure BDA0001727875440000061
式中,δij为0-1矩阵,下标i、j为样本点序号,
Figure BDA0001727875440000062
m为样本点个数。
3.2.3)计算最短距离矩阵DG的特征值τG
Figure BDA0001727875440000063
式中,H为中心矩阵;S为平方距离矩阵。
3.2.4)对τG做特征值分解,由于τG具有对称性,所以有:
τG=CTΛC (5)
式中,C是个正交矩阵;Λ是一个特征值从大到小排列的对角阵。
3.2.5)计算嵌入矩阵Y:
Figure BDA0001727875440000071
式中,Cd为取C的前d行和前n列组成的矩阵;Λd为取Λ的前d行和前d列组成的矩阵,
Figure BDA0001727875440000072
为对Λd开算术平方(对角线元素依次取算术平方根)。
再进一步,所述步骤4的过程为:
步骤4.1:构建两个统计量T2和SPE来进行填料塔液泛监测
4.1.1)构建T2统计量过程
定义负荷矩阵P:
P=[ξd] (7)
式中,ξd表示降序排列的前d个特征值对应的特征向量;。
定义得分矩阵T:
T=XP (8)
对于第i个样本点Xi,T2统计量按下式进行计算:
Figure BDA0001727875440000073
式中,ti是得分矩阵T中的第i行;Λd是d个特征值构成的主对角矩阵;Ti 2是第i个样本对应的T2统计量值;
4.1.2)构建SPE统计量过程
对于第i个样本点Xi,Q统计量按下式进行计算:
Figure BDA0001727875440000081
式中,Xi是子训练集的第i个样本;P是负荷矩阵;I是单位矩阵;Qi是第i个样本对应的SPE统计量值;
由于T2和SPE的分布未知,通过核密度估计得出T2和SPE的控制限;
步骤4.2:用不同子训练集训练构建好的ISOMAP流形学习模型,最后将训练结果集成
4.2.1)在每一监测样本集下,用多个子训练集分别训练构建的ISOMAP流形学习模型,构建T2和SPE两个统计量,利用T2和SPE的控制限,通过观察监测样本集中训练统计量与控制线图,得到此样本集下填料塔的监测泛点;
4.2.2)在每一监测样本集下,每一子训练集训练后都会得到相应的监测泛点,即同一监测样本集最终会得到多个监测泛点。最后利用取众数的方式投票获得此监测样本集下的唯一泛点,并保存此时的T2、SPE控制线作为此喷淋密度在线监测时的统计量控制线,于是得到了用多个训练集训练同一流形学习模型后的集成效果。
本发明将ISOMAP这一非线性降维算法集成应用于填料塔的液泛监测中,主要过程就是采集实验数据并利用ISOMAP进行集成处理,利用处理后的数据来构建T2统计量和SPE统计量进行监测和判断填料塔的液泛。
本发明的有益效果主要表现在:本发明结合化工过程变量数据的特点,提出一种集成ISOMAP流形学习模型以综合、优化多个单一模型训练结果,首先利用ISOMAP算法训练,然后集成多个模型的训练结果作为最优模型效果,离线建模,最后采用模型评价指标对模型性能进行评估,效果良好应用于在线监测,其结果可以应用到填料塔运行状态的在线监测中。
附图说明
图1是对本发明方法的流程图;
图2a是本发明提出的集成流形学习方法在喷淋密度为43的条件下的基于T2统计量的泛点监测图;
图2b是本发明提出的集成流形学习方法在喷淋密度为43的条件下的基于SPE统计量的泛点监测图;
图2c是本发明提出的集成流形学习方法在喷淋密度为46的条件下的基于T2统计量的泛点监测图;
图2d是本发明提出的集成流形学习方法在喷淋密度为46的条件下的基于SPE统计量的泛点监测图;
图3a为集成ISOMAP、ISOMAP、PCA三种方法的T2监测泛点偏离程度对比图;
图3b为集成ISOMAP、ISOMAP、PCA三种方法的SPE监测泛点偏离程度对比图;
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图3b,一种基于集成流形学习的液泛状态在线监测方法,包括以下步骤:
(一)离线学习:构建集成学习模型
(1)通过传感器获得塔设备运行正常工况下的过程变量数据
运行填料塔设备,并通过传感器获取不同喷淋密度下的数据变量。首先选择在同一喷淋密度下测量不同风频的填料塔工况,然后改变喷淋密度,测量得到多组不同喷淋密度不同风频的填料塔工况。
(2;)对采集到的过程变量数据进行数据预处理,过程如下:
步骤2.1:选择稳定数据平均化处理
选取每组稳定状态下风频的Z个数据,对这些数据进行每b个求平均值作为一个训练样本的处理方法,在保证数据特征的情况下,优化数据结构,降低计算复杂度,一个风机频率下获得Z/b组数据;
步骤2.2:去除数据中重复作用的相关变量
采集的数据包含多个变量,这些个变量之间存在一定的相关性。有些变量的相关性极大,其本身认为是一个变量,而有些变量与其他变量相关性很小,一般为人为设定固定值;因此,可选择去除与液泛发生的无关变量,保留剩下的几个变量用于监测。因此,本文去除风流量、水流量、F因子以及阀门开度,保留剩下的几个变量用于监测;
步骤2.3:数据自标定
自标定是指以某种方式使过程变量标准化。此处需特别注意,对新得到的数据样本进行自标定时,作为减数的均值和作为除数的标准差都是取自训练集(填料塔处于正常运行工况,而且外界没有噪声干扰的情况下得到的过程数据样本)。本发明中采用z-score标准化处理,如下所示:
Figure BDA0001727875440000111
式中,x'是经z-score标准化处理后的数据;x是通过传感器实际采集的数据经步骤2.1,2.2处理后的过程变量数据;μ是过程变量的均值;σ是过程变量数据的标准差;
步骤2.4:制作总数据集,得到总训练集、子训练集、监测样本集
提取每一喷淋密度下的所有未液泛的样本,作为总的训练集,对总的训练集中不同喷淋密度的样本进行整体随机取样10次,获得10个子训练集,总训练集用来获得多个子训练集,10个子训练集分别用来训练模型,不同喷淋密度的数据集可分别单独作为监测样本集,用来监测某一喷淋密度下的液泛状况。
(3)基于ISOMAP构建离线流形学习模型,对子训练集进行降维处理,过程如下:
步骤3.1:在高维数据空间,构造邻域图
首先定义X∈Rm×n为输入子训练集空间,其中m代表样本个数,n代表变量数量;Xi和Xj为输入空间中的样本点,其中下标i、j为样本点序号;定义dX(i,j)为二样本点之间的欧氏距离。构造邻域图过程如下:
计算输入空间中的每个样本点Xi和其他样本点之间的欧式距离,当点Xj是点Xi的k个近邻点之一时,认为Xi和Xj是相邻的,定义输入空间中每一样本点与其k个近邻点一一连接形成的图称为邻域图,记为G;邻域图上两样本点之间的连线称为邻域图的边,记为ei,j,令边ei,j的权值等于Xi和Xj两点之间的欧式距离dX(i,j);邻域图上任意两点之间的最短路径,记为dG(i,j);
步骤3.2:计算dG(i,j),得到流形M上的测地线距离dM(i,j)
邻域图中,若点Xi和Xj之间有边ei,j,则这两点之间的最短路径dG(i,j)=dX(i,j);若点Xi和Xj之间没有边ei,j,则这两点之间的最短路径dG(i,j)=∞,然后在邻域图G上,利用Dijkstra求得最短路径距离矩阵,记为DG
步骤3.3:执行经典MDS算法,计算d维嵌入矩阵Y
3.2.1)计算平方距离矩阵S:
S=(DG)2 (2)
式中,DG为最短路径距离矩阵。
3.2.2)计算中心矩阵H:
Figure BDA0001727875440000121
式中,δij为0-1矩阵,下标i、j为样本点序号,
Figure BDA0001727875440000122
m为样本点个数;
3.2.3)计算最短距离矩阵DG的特征值τG
Figure BDA0001727875440000131
式中,H为中心矩阵;S为平方距离矩阵;
3.2.4)对τG做特征值分解,由于τG具有对称性,所以有:
τG=CTΛC (5)
式中,C是个正交矩阵;Λ是一个特征值从大到小排列的对角阵;
3.2.5)计算嵌入矩阵Y:
Figure BDA0001727875440000132
式中,Cd为取C的前d行和前n列组成的矩阵;Λd为取Λ的前d行和前d列组成的矩阵,
Figure BDA0001727875440000133
为对Λd开算术平方(对角线元素依次取算术平方根);
(4)用不同训练集训练构建好的ISOMAP流形学习模型,最后将训练结果集成,其步骤为:
步骤4.1:构建两个统计量T2和SPE来进行填料塔液泛监测
ISOMAP流形学习用于过程监测中,需要确定相应的监测统计量以衡量过程是否处于正常运行状态。
4.1.1)构建T2统计量过程
定义负荷矩阵P:
P=[ξd] (7)
式中,ξd表示降序排列的前d个特征值对应的特征向量。
定义得分矩阵T:
T=XP (8)
对于第i个样本点Xi,T2统计量按下式进行计算:
Figure BDA0001727875440000141
式中,ti是得分矩阵T中的第i行;Λd是d个特征值构成的主对角矩阵;Ti 2是第i个样本对应的T2统计量值。
4.1.2)构建SPE统计量过程
对于第i个样本点Xi,Q统计量按下式进行计算:
Figure BDA0001727875440000142
式中,Xi是子训练集的第i个样本;P是负荷矩阵;I是单位矩阵;Qi是第i个样本对应的SPE统计量值。
由于T2和SPE的分布未知,通过核密度估计得出T2和SPE的控制限。
步骤4.2:用不同子训练集训练构建好的ISOMAP流形学习模型,最后将训练结果集成
4.2.1)在每一监测样本集下,用多个子训练集分别训练构建的ISOMAP流形学习模型,构建T2和SPE两个统计量,利用T2和SPE的控制限,通过观察监测样本集中训练统计量与控制线图,得到此样本集下填料塔的监测泛点;
4.2.2)在每一监测样本集下,每一训练集训练后都会得到相应的监测泛点,即同一监测样本集最终会得到10个监测泛点。最后利用取众数的方式投票获得此监测样本集下的唯一泛点,并保存此时的T2、SPE控制线作为此喷淋密度在线监测时的统计量控制线,于是得到了用多个训练集训练同一流形学习模型后的集成效果。
(5)对集成流形学习模型进行评估,判断是否满足监测要求
应对离线训练好的的模型在监测样本集上进行监测,通过比较监测泛点对于实际泛点的准确性、及时性来评估模型,评估指标为RMSE、RE和MAE,如公式11、12和13所示。
Figure BDA0001727875440000151
Figure BDA0001727875440000152
Figure BDA0001727875440000153
式中,u为实验不同喷淋密度的数量编号(u=1,2,…,W),W为喷淋密度数量值;yu为实际泛点;
Figure BDA0001727875440000154
为监测泛点。如果模型满足要求,则利用其进行在线监测;否则,需要重新建立模型。
(二)在线监测:液泛状态辨识
(6)利用离线学习的模型对塔设备液泛状态进行在线监测
利用离线学习的集成流形学习模型对塔设备运行时采集到的新数据进行分析处理,在每一喷淋密度下,都会计算得到T2与SPE统计量的值,通过与离线模型在此喷淋密度下的T2与SPE控制线比较,统计量超越控制线即表示过程出现异常,塔设备发生液泛,从而实现液泛状态的在线监测。
实例:一种基于集成流形学习的填料塔液泛状态在线监测方法,包括以下步骤:
(一)离线学习:构建集成学习模型
(1)进行实验并获取实验数据
运行填料塔设备,并通过传感器获取不同喷淋密度下的数据变量。测量得到多组不同喷淋密度不同风频的填料塔工况,同一喷淋密度下任一风频采集的数据共有11个变量:风流量、塔内压差、水流量、F因子、喷淋密度、进风流速、进水流速、风温、水温、塔内温度、水阀开共11个变量。
(2)对采集到的过程变量数据进行数据预处理
步骤2.1:选择稳定数据平均化处理
选取每组稳定状态下风频的3500个数据,对这些数据进行每100个求平均值作为一个训练样本的处理方法,因此,一个风机频率下可以获得35组数据。
步骤2.2:去除数据中重复作用的相关变量
采集的数据包含11个变量,这11个变量之间存在一定的相关性。有些变量的相关性极大,其本身认为是一个变量。因此,本实验去除风流量、水流量、F因子以及阀门开度,保留剩下的7个变量用于监测。
步骤2.3:数据自标定
采用z-score标准化处理,如下所示:
Figure BDA0001727875440000161
其中,x'是经z-score标准化处理后的数据;x是通过传感器实际采集的数据经步骤2.1,2.2处理后的过程变量数据;μ是过程变量的均值;σ是过程变量数据的标准差。
步骤2.4:制作总数据集,得到总训练集、子训练集、监测样本集
提取每一喷淋密度下的所有未液泛的样本,作为总的训练集,对总的训练集中不同喷淋密度的样本进行整体随机取样10次,获得10个子训练集,总训练集用来获得多个子训练集,10个训练集分别用来训练模型,不同喷淋密度的数据集可分别单独作为监测样本集,用来监测某一喷淋密度下的液泛状况。
(3)基于ISOMAP构建离线流形学习模型,对子训练集进行降维处理
ISOMAP算法先利用k-NN算法通过寻找欧式距离距该点最近的k个点来构造邻域图G;接着使用Dijkstra来计算所有样本点之间的最短距离dG(i,j);最后再使用MDS算法对该矩阵进行处理,实现高维数据的降维,得到d维嵌入矩阵Y。
(4)用不同训练集训练构建好的ISOMAP流形学习模型,最后将训练结果集成,
基于ISOMAP算法构建集成流形学习模型,其结构图如附图1所示。首先,在每一监测样本集下,用10个子训练集分别训练构建的ISOMAP流形学习模型,得到10个监测泛点。如附图2a是集成ISOMAP流形学习方法对在喷淋密度为43、基于T2统计量上的泛点监测图;附图2b是集成ISOMAP流形学习方法对在喷淋密度为43、基于SPE统计量的泛点监测图。然后,利用取众数的方式投票获得此监测样本集下的唯一最优泛点,并保存此时的T2、SPE控制线作为此喷淋密度在线监测时的统计量控制线,获得用多个训练集训练同一流形学习模型后的集成效果。最后,不同喷淋密度下的泛点监测结果如表1所示。
Figure BDA0001727875440000181
表1
分析上表可知,基于SPE统计量的监测泛点相比于实际泛点是提前的,这可以起到一定的预警效果,T2统计量的监测泛点相比于实际液泛点会有一定的延迟。从单个统计量的角度看的话,SPE统计量比T2统计量更适合于实际工况的监测。但若是两者相结合共同来监测填料塔的工况的话,应该比单个的统计量监测来的准确和稳定。如附图3a为集成ISOMAP、ISOMAP、PCA三种方法的T2监测泛点偏离程度对比图;附图3b为集成ISOMAP、ISOMAP、PCA三种方法的SPE监测泛点偏离程度对比图;
(5)对集成流形学习模型进行评估,判断是否满足监测要求
应对离线训练好的的模型在监测样本集上进行监测,评估指标为RMSE、RE和MAE,选择不同的喷淋密度进行填料塔液泛监测实验,并将采用集成ISOMAP模型和ISOMAP和PCA的监测模型的监测结果进行对比,基于T2与SPE统计量监测的结果分别如表2、3所示。
Figure BDA0001727875440000191
表2
Figure BDA0001727875440000192
表3
从表2和表3结果可知,基于ISOMAP的集成流形学习方法无论是基于T2统计量的泛点监测情况,还是基于SPE统计量的泛点监测情况,对应的各项评估指标都要好于其他两种方法,因此基于ISOMAP算法离线建立的此模型可用于液泛状态在线监测。
(二)在线监测:液泛状态辨识
运行离线建立好的模型对在线采集的新样本数据进行分析处理,得到新的T2和SPE统计量,与离线模型学习到的T2、SPE控制线比较,统计量超越控制线即表示过程出现异常,塔设备发生液泛,因此基于集成流形学习方法实现了塔设备液泛的在线监测。
因此,用于填料塔液泛在线监测的基于ISOMAP算法的集成流形学习方法,具有通用性强、准确度高的特点,能够分析全局数据的信息并实现数据的非线性降维。能够对化工生产中填料塔设备液泛过程进行在线监测,同时也为其他过程监测提供了一种有效的新方法。

Claims (3)

1.一种基于集成流形学习的填料塔液泛状态在线监测方法,其特征在于,所述方法包括以下步骤:
(一)离线学习:构建集成学习模型
(1)通过传感器获得塔设备运行正常工况下的过程变量数据
运行填料塔设备,并通过传感器获取不同喷淋密度下的过程数据变量;在同一喷淋密度下测量不同风频的填料塔工况,然后改变喷淋密度,测量得到多组不同喷淋密度、不同风频的填料塔工况数据;
(2)对采集到的过程变量数据进行数据预处理
测量数据不能直接用于集成流形学习的直接分析处理,需要对这些数据进行预处理,包括:选择稳定数据平均化处理、去除数据中重复作用相关变量和数据自标定处理;利用处理后的数据制作总数据集,然后经过随机取样获得一定样本的子训练集,监测样本集;
(3)基于ISOMAP构建离线流形学习模型,对子训练集进行降维处理,过程为:
步骤3.1:在高维数据空间,构造邻域图
首先定义X∈Rm×n为输入子训练集空间,其中m代表样本个数,n代表变量数量;Xi和Xj为输入空间中的样本点,其中下标i、j为样本点序号;定义dX(i,j)为二样本点之间的欧氏距离,构造邻域图过程如下:
计算输入空间中的每个样本点Xi和其他样本点之间的欧式距离,当点Xj是点Xi的k个近邻点之一时,认为Xi和Xj是相邻的,定义输入空间中每一样本点与其k个近邻点一一连接形成的图称为邻域图,记为G;邻域图上两样本点之间的连线称为邻域图的边,记为ei,j,令边ei,j的权值等于Xi和Xj两点之间的欧式距离dX(i,j);邻域图上任意两点之间的最短路径,记为dG(i,j);
步骤3.2:计算dG(i,j),得到流形M上的测地线距离dM(i,j)
其中若点Xi和Xj之间有边ei,j,则这两点之间的最短路径dG(i,j)=dX(i,j);若点Xi和Xj之间没有边ei,j,则这两点之间的最短路径dG(i,j)=∞,然后在邻域图G上,利用Dijkstra求得最短路径距离矩阵,记为DG
步骤3.3:执行经典MDS算法,计算d维嵌入矩阵Y
3.2.1)计算平方距离矩阵S:
S=(DG)2 (2)
式中,DG为最短路径距离矩阵;
3.2.2)计算中心矩阵H:
Figure FDA0003058649160000021
式中,δij为0-1矩阵,下标i、j为样本点序号,
Figure FDA0003058649160000022
m为样本点个数;
3.2.3)计算最短距离矩阵DG的特征值τG
Figure FDA0003058649160000023
式中,H为中心矩阵;S为平方距离矩阵;
3.2.4)对τG做特征值分解,由于τG具有对称性,所以有:
τG=CTΛC (5)
式中,C是个正交矩阵;Λ是一个特征值从大到小排列的对角阵;
3.2.5)计算嵌入矩阵Y:
Figure FDA0003058649160000024
式中,Cd为取C的前d行和前n列组成的矩阵;Λd为取Λ的前d行和前d列组成的矩阵,
Figure FDA0003058649160000025
为对Λd开算术平方;
(4)建立集成流形学习模型,用不同子训练集训练构建好的ISOMAP流形学习模型,将训练结果集成分析
在每一监测样本集下,用多个子训练集分别单独训练构建的ISOMAP流形学习模型,构建主元子空间的Hotelling-T2统计量和平方预测误差来确定子样本集下填料塔的监测泛点,所述平方预测误差为SPE统计量;在每一监测样本集下,获得此监测样本集的唯一最优泛点,保存最优泛点及获得此泛点模型的Hotelling-T2统计量和SPE统计量的控制限,从而得到用多个训练集训练同一流形学习模型后的集成效果;
构建两个统计量Hotelling-T2和SPE来进行填料塔液泛监测,过程为:ISOMAP流形学习用于过程监测中,需要确定相应的监测统计量以衡量过程是否处于正常运行状态;
4.1.1)构建Hotelling-T2统计量过程
定义负荷矩阵P:
P=[ξd] (7)
式中,ξd表示降序排列的前d个特征值对应的特征向量;
定义得分矩阵T:
T=XP (8)
对于第i个样本点Xi,Hotelling-T2统计量按下式进行计算:
Figure FDA0003058649160000031
式中,ti是得分矩阵T中的第i行;Λd是d个特征值构成的主对角矩阵;Ti 2是第i个样本对应的T2统计量值;
4.1.2)构建SPE统计量过程
对于第i个样本点Xi,Q统计量按下式进行计算:
Figure FDA0003058649160000032
式中,Xi是训练集的第i个样本;P是负荷矩阵;I是单位矩阵;Qi是第i个样本对应的SPE统计量值;
由于Hotelling-T2和SPE的分布未知,通过核密度估计得出Hotelling-T2和SPE的控制限;
(5)对集成流形学习模型进行评估,确定是否满足液泛监测
分别采用均方根误差RMSE、相对均方根误差RE和最大绝对误差MAE评价指标评估离线模型对泛点监测的准确性;
(二)在线监测:液泛状态辨识
(6)利用离线学习的模型对塔设备液泛状态进行在线监测
利用离线学习的集成流形学习模型对塔设备运行时采集到的新数据进行分析处理,在每一喷淋密度下,都会计算得到Hotelling-T2统计量与SPE统计量的值,通过与离线模型在此喷淋密度下的Hotelling-T2统计量与SPE控制线比较,实现液泛状态的在线监测。
2.如权利要求1所述的基于集成流形学习的填料塔液泛状态在线监测方法,其特征在于,所述步骤(2)的过程为:
步骤2.1:选择稳定数据平均化处理
选取每组稳定状态下风频的Z个数据,对这些数据进行每b个求平均值作为一个训练样本的处理方法,一个风机频率下获得Z/b组数据;
步骤2.2:去除数据中重复作用的相关变量
选择在同一喷淋密度下测量不同风频的填料塔工况,去除风流量、水流量、F因子以及阀门开度;
步骤2.3:数据自标定
自标定使过程变量标准化,标定过程分为两个步骤:第一步是将每个变量减去样本均值,得到每个数据相对于平均值的变化量;第二步是把经中心化处理后的数据的每个变量除以它的标准差;这一阶段把每个变量都标定到单位方差上,保证变化范围大的过程变量不会占主导地位;此处需特别注意,对新得到的数据样本进行自标定时,作为减数的均值和作为除数的标准差都是取自训练集;实质即是采用z-score标准化处理,如下所示:
Figure FDA0003058649160000041
其中,x'是经z-score标准化处理后的数据;x是通过传感器实际采集的数据经步骤2.1,2.2处理后的过程变量数据;μ是过程变量的均值;σ是过程变量数据的标准差;
步骤2.4:制作总数据集,得到总训练集、子训练集、监测样本集提取每一喷淋密度下的所有未液泛的样本,作为总的训练集,对总的训练集中不同喷淋密度的样本进行整体随机取样多次,获得多个子训练集,总训练集用来获得多个子训练集,子训练集分别用来训练模型,不同喷淋密度的数据集可分别单独作为监测样本集,用来监测某一喷淋密度下的液泛状况。
3.如权利要求1或2所述的基于集成流形学习的填料塔液泛状态在线监测方法,其特征在于,所述步骤4中的过程为:
步骤4.1:构建两个统计量Hotelling-T2和SPE来进行填料塔液泛监测;
步骤4.2:用不同训练集训练构建好的ISOMAP流形学习模型,最后将训练结果集成;
4.2.1)在每一监测样本集下,用多个子训练集分别训练构建的ISOMAP流形学习模型,构建Hotelling-T2和SPE两个统计量,利用Hotelling-T2和SPE的控制限,通过观察监测样本集中训练统计量与控制线图,得到此样本集下填料塔的监测泛点;
4.2.2)在每一监测样本集下,每一训练集训练后都会得到相应的监测泛点,即同一监测样本集最终会得到多个监测泛点;最后利用取众数的方式投票获得此监测样本集下的唯一泛点,并保存此时的Hotelling-T2、SPE控制线作为此喷淋密度在线监测时的统计量控制线,于是得到了用多个训练集训练同一流形学习模型后的集成效果。
CN201810761103.8A 2018-07-12 2018-07-12 一种基于集成流形学习的填料塔液泛状态在线监测方法 Active CN109214268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810761103.8A CN109214268B (zh) 2018-07-12 2018-07-12 一种基于集成流形学习的填料塔液泛状态在线监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810761103.8A CN109214268B (zh) 2018-07-12 2018-07-12 一种基于集成流形学习的填料塔液泛状态在线监测方法

Publications (2)

Publication Number Publication Date
CN109214268A CN109214268A (zh) 2019-01-15
CN109214268B true CN109214268B (zh) 2021-08-03

Family

ID=64990489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810761103.8A Active CN109214268B (zh) 2018-07-12 2018-07-12 一种基于集成流形学习的填料塔液泛状态在线监测方法

Country Status (1)

Country Link
CN (1) CN109214268B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110045714B (zh) * 2019-04-08 2022-05-17 沈阳化工大学 一种基于权重近邻规则的工业过程监控方法
CN114004645B (zh) * 2021-10-29 2024-07-26 浙江省民营经济发展中心(浙江省广告监测中心) 融媒体广告智慧监测平台和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706871A (zh) * 2009-11-05 2010-05-12 上海交通大学 基于等距映射的人脸图像识别方法
CN102184349A (zh) * 2011-04-29 2011-09-14 河海大学 基于流形学习的基因表达数据的聚类系统及方法
CN103279635A (zh) * 2013-04-02 2013-09-04 浙江工业大学 散堆填料中液泛气速的建模和预报方法
CN106604229A (zh) * 2016-12-27 2017-04-26 东南大学 一种基于流形学习与改进支持向量机的室内定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101706871A (zh) * 2009-11-05 2010-05-12 上海交通大学 基于等距映射的人脸图像识别方法
CN102184349A (zh) * 2011-04-29 2011-09-14 河海大学 基于流形学习的基因表达数据的聚类系统及方法
CN103279635A (zh) * 2013-04-02 2013-09-04 浙江工业大学 散堆填料中液泛气速的建模和预报方法
CN106604229A (zh) * 2016-12-27 2017-04-26 东南大学 一种基于流形学习与改进支持向量机的室内定位方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
即时局部建模在填料塔液泛气速预测的应用;周丽春等;《化工学报》;20160331;第67卷(第3期);第1070-1075页 *
填料塔液泛在线监测的改进主元分析方法研究;王文文;《中国优秀硕士学位论文全文数据库(电子期刊)工程科技I辑》;20160615(第6期);B015-23 *
填料塔液泛预测的深度学习建模研究;范煜;《中国优秀硕士学位论文全文数据库(电子期刊)工程科技I辑》;20180315(第3期);B015-51 *
数据驱动的填料塔液泛气速预测模型与实时监测研究;杨捷;《中国博士学位论文全文数据库(电子期刊)工程科技I辑》;20130715(第7期);B015-1 *

Also Published As

Publication number Publication date
CN109214268A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN109308306B (zh) 一种基于孤立森林的用户用电异常行为检测方法
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
CN109460574A (zh) 一种航空发动机剩余寿命的预测方法
CN104699077B (zh) 一种基于嵌套迭代费舍尔判别分析的故障变量隔离方法
CN107403196B (zh) 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法
CN105607631B (zh) 间歇过程弱故障模型控制限建立方法及弱故障监测方法
CN111914889B (zh) 一种基于简略核主元分析的精馏塔异常状态识别方法
CN109214268B (zh) 一种基于集成流形学习的填料塔液泛状态在线监测方法
CN108445867B (zh) 一种基于分散式icr模型的非高斯过程监测方法
CN108345284A (zh) 一种基于两变量块的质量相关故障检测方法
CN110751217B (zh) 基于主元分析的设备能耗占比预警分析方法
CN114757269A (zh) 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法
CN108469805A (zh) 一种基于动态性最优选择的分散式动态过程监测方法
CN112000081A (zh) 基于多块信息提取和马氏距离的故障监测方法及系统
CN110427019B (zh) 一种基于多变量判别分析的工业过程故障分类方法及控制装置
CN106405683B (zh) 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
Song et al. Plant-wide process fine-scale monitoring via distributed static magnitude-dynamic difference
CN110045714B (zh) 一种基于权重近邻规则的工业过程监控方法
CN112381145A (zh) 基于最近相关谱聚类的高斯过程回归多模型融合建模方法
CN110033175B (zh) 一种基于集成多核偏最小二乘回归模型的软测量方法
CN115828129A (zh) 基于卷积特征聚类的智能用电系统故障检测方法及系统
CN108536943B (zh) 一种基于多生产单元变量交叉相关解耦策略的故障监测方法
CN110674461B (zh) 基于多块投影非负矩阵分解的化工生产过程监控方法
CN113688895A (zh) 一种基于简化keca的陶瓷辊道窑烧成带异常检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant