CN114239321A - 一种基于大数据的炼油过程模式识别及优化方法 - Google Patents

一种基于大数据的炼油过程模式识别及优化方法 Download PDF

Info

Publication number
CN114239321A
CN114239321A CN202210022589.XA CN202210022589A CN114239321A CN 114239321 A CN114239321 A CN 114239321A CN 202210022589 A CN202210022589 A CN 202210022589A CN 114239321 A CN114239321 A CN 114239321A
Authority
CN
China
Prior art keywords
data
matrix
ellipse
confidence
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210022589.XA
Other languages
English (en)
Inventor
钟伟民
钱锋
杜文莉
李智
杨明磊
隆建
范琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202210022589.XA priority Critical patent/CN114239321A/zh
Publication of CN114239321A publication Critical patent/CN114239321A/zh
Priority to PCT/CN2023/070795 priority patent/WO2023131257A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes

Abstract

本发明涉及一种基于大数据的炼油过程模式识别及优化方法,包括以下步骤:对炼油过程中所采集到的历史数据进行预处理,得到标准化数据;运用主成分分析法处理标准化数据,利用得分矩阵建立模型并绘制置信椭圆;对实时采集得到的新样本计算得分矩阵,将其投影到置信椭圆上;投影到椭圆内的样本为正常点,可将其添加到历史数据中建立新模型,实现模型自适应更新;投影到椭圆外的样本则为异常点,可根据故障贡献率进行故障溯源;进一步可根据置信椭圆中的点对应的原始变量,采用改进的路径优化算法,求解操作变量调整方式和路径。

Description

一种基于大数据的炼油过程模式识别及优化方法
技术领域
本发明属于炼油过程监控技术领域,具体涉及一种基于大数据的炼油过程模式识别及优化方法。
背景技术
随着现代信息技术的不断完善,数据采集系统可以通过各种测量仪表在炼油过程中收集到大量的数据。这些数据的变化往往与过程的不同生产模态相关,因此对这些数据进行有效地监控对提高炼油过程的生产效益以及保障其生产安全有着重要的意义。
炼油过程中的催化重整、催化裂化、硫磺回收、渣油加氢、常减压、加氢裂化等生产过程具有多变量、强干扰、大滞后、强耦合等特点,是非常复杂的大工业系统,如何从包含众多的操作变量和原料性质变量的历史过程数据中,挖掘出可以充分反映各参数变量对生产过程的影响,明晰装置生产模式类型,甄别在各类生产模式下装置的优劣运行区域,是具有难度的事情。另外,根据当前装置运行数据,判断装置运行状态所处级别,及时调整过程参数,实现生产过程的优化运行,是具有挑战的工作。
目前,基于单个时间点的状态以及时间段内的单因素曲线的过程操作方式已经不能满足对炼油过程多个模态的变化进行实时地监控。为了综合考量过程中所采集的数据具有众多变量以及各个变量对过程的监控重要性随时间而变的特点,需要考虑可以随着时间变化的多因素模态控制方式,实现模式在时间维度和空间维度的集合表现,并且可以动态地监控各个关键变量,将故障诊断、故障预报、操作安全、动态优化和静态优化等在模式的概念下统一处理。
发明内容
本发明的目的在于针对现有方法中存在的不足,提出一种基于大数据的炼油过程模式识别及优化方法,通过引入主元分析方法,提取过程中众多变量的关键特征,并绘制置信椭圆,利用实时采集到的数据在椭圆中的映射位置,实现对炼油过程的在线监控。该方法可用于对炼油过程的生产模式进行监控、故障检测和溯源。可进一步采用改进的路径优化算法,通过置信椭圆中当前工况位置和最优效益对应位置间的路径优化,可以给出关键变量的优化方向。
具体而言,本发明的第一个方面提供一种基于大数据的炼油过程模式识别方法,所述方法包括以下步骤:
(1)将炼油过程中所采集到的历史数据组成建模用的训练样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为样本集的样本个数,n为样本集的变量个数;
(2)对训练数据样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)对X运用主元分析法将其从n维降到k维,并得到得分矩阵T∈Rm×k和负载矩阵P∈Rn×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;
(5)采集新的在线实时数据Y∈RN×n,采用步骤(2)对训练样本进行预处理时所得到的样本平均值和样本方差对Y进行预处理得到标准化数据Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则说明此时炼油过程所处的工况为正常工况;若样本点映射到椭圆外,则说明此时炼油过程存在异常。
在一个或多个实施方案中,步骤(2)中,所述的预处理方法采用Z-score标准化方法,计算公式为:
Figure BDA0003463227610000021
式中,Z=[z1,z2,...,zm]为训练数据矩阵,X表示标准化后的数据矩阵,μ为训练数据的均值,σ为训练数据的标准差,μ和σ计算公式为:
Figure BDA0003463227610000022
Figure BDA0003463227610000023
在一个或多个实施方案中,步骤(3)中,对经过预处理所得到的X运用主元分析法进行降维处理,具体按如下步骤进行:
(3-a)计算矩阵X的协方差矩阵,协方差矩阵的计算公式为:
Figure BDA0003463227610000024
X是m×n的矩阵,m是训练样本个数,n是特征个数,T表示转置,所以得到的协方差矩阵C是一个n×n维的矩阵;
(3-b)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序,计算公式为:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵,得:
特征值矩阵:
Figure BDA0003463227610000031
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
(3-c)建立主元模型,计算公式为:
计算每个主元包括信息比:
Figure BDA0003463227610000032
计算最大的k个主元包括的信息比:
Figure BDA0003463227610000033
(3-d)保留对应k个最大特征值的特征向量,得到负载矩阵P=[p1,p2,p3,...,pk]∈Rn×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
ti的本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
在一个或多个实施方案中,步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆的步骤如下:
(4-a)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
(4-b)计算xdat每一列的平均值得xm∈R1×2,并将xdat每一列的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
(4-c)计算公式xd×s·×xd,并对所得矩阵每行进行求和,得到rd∈Rm×1
(4-d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度Ci,对rd进行升序排序后,得到rd第Ci个位置所对应的值r∈R,优选的Ci为95%;
(4-e)计算步骤(4-a)所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000041
特征向量矩阵为
Figure BDA0003463227610000042
(4-f)利用步骤(4-d)中的r以及步骤(4-e)中的D,即可得到置信椭圆的长轴以及短轴,计算公式为:
Figure BDA0003463227610000043
Figure BDA0003463227610000044
其中,a为长轴,b为短轴;
(4-g)以步骤(4-b)中的xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,椭圆的公式为:
Figure BDA0003463227610000045
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值。
在一个或多个实施方案中,步骤(6)中,scorey的计算公式为:
scorey=Ym×[p1,p2] (13)
式中,[p1,p2]∈Rn×2是负载矩阵P的前两列。
在一个或多个实施方案中,步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一个或多个实施方案中,步骤(7)还包括将收集到的正常工况下的数据加入到历史数据重新建模。
在一个或多个实施方案中,步骤(7)还包括将收集到的正常工况下的数据加入到历史数据并剔除相同数量的早期历史数据重新建模。
在一个或多个实施方案中,步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源;
优选地,采用如下方法对异常数据计算SPE贡献率来进行故障溯源:
假设异常数据为x∈R1×n,其SPE贡献率的计算公式为:
Figure BDA0003463227610000046
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000047
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量。
在一个或多个实施方案中,步骤(4)还包括:将历史数据结合现场工艺知识对所绘制的置信椭圆进行插旗处理实现对不同性能等级数据的区域划分,所述区域划分优选包括:首先根据工艺知识和历史效益统计数据,根据时间序列找到工况对应的效益,根据效益高低进行不同等级的划分,再找到各个等级所对应的历史数据在椭圆中的分布并加以不同的标记,例如用不同的颜色加以标记。
在一个或多个实施方案中,步骤(4)还包括:根据炼油过程的性能指标,对不同性能等级的历史数据设置不同的标签,将历史数据的得分矩阵的前两列投影到置信椭圆上,通过不同区域数据点所带的标签对置信椭圆进行划分。
本发明还提供一种基于大数据的炼油过程模式优化方法,所述基于大数据的炼油过程模式优化方法包括如本文任一实施方案所述的基于大数据的炼油过程模式识别方法,且所述基于大数据的炼油过程模式识别方法中的步骤(7)还包括:对于映射在椭圆内部的样本,根据其所处位置结合步骤(4)中对椭圆进行的区域划分判断当前所处的性能等级,若其处于非最优区域,则通过调整关键变量使其转换到所期望的更优的性能等级;优选地,将主元中所对应的系数最大的变量设定为优化时所要调整的关键变量,然后根据关键变量与在线数据在置信椭圆中的投影点位置变化之间的相关性,确定调整方向,实现对生产过程的优化;优选地,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对炼油过程的生产模式进行调整,并通过实时监控观察数据是否往所期望的区域移动。
本发明还提供另一种基于大数据的炼油过程模式优化方法,所述基于大数据的炼油过程模式优化方法包括如本文任一实施方案所述的基于大数据的炼油过程模式识别方法,和步骤(8):利用主成分分析过程中得到的标准差和均值求得置信椭圆中的点对应的原始变量,从而得到该点对应的效益值;在置信椭圆中区分效益值高低的分布;当工况运行模式位于置信椭圆中的某一点时,采用路径优化算法,获得当前位置向最优位置最快移动轨迹,将轨迹对应的点进行反变换,获得操作条件的改变方式,从而指导生产装置操作优化。
在一个或多个实施方案中,步骤(8)中,利用公式(15)计算原始变量Xori
Xori=(defen×PCT)·×std(Xm)+mean(Xm) (15)
其中,defen=(x,y)∈R1×2为置信椭圆中的点的横纵坐标,PC=[p1,p2]∈RJ×2为主成分分析建模时负载矩阵的前两列,std(Xm)为主成分分析采用的基础样本的方差,mean(Xm)为主成分分析采用的基础样本的均值,m为样本个数,Xori为椭圆中defen=(x,y)∈R1×2位置对应的反变换后的原始变量;
根据公式(16)计算投入产出效益指标:
Figure BDA0003463227610000051
其中,
Figure BDA0003463227610000061
为第i种产品的产量,
Figure BDA0003463227610000062
为第i种产品的价格,
Figure BDA0003463227610000063
为第i种原料的投料量,
Figure BDA0003463227610000064
为第i种原料的价格,profit为效益指标。
在一个或多个实施方案中,步骤(8)中,所述路径优化算法采用改进的A*算法,通过如式(17)所示的改进的评估函数f(x)来确定搜索方向和下一个到达的节点:
Figure BDA0003463227610000065
其中,g(x)是代价函数,代表从起始节点到达当前节点x的实际所需代价;h(x)是启发式函数,代表从当前节点x到达目标节点估计所需的代价;profit(x)表示所选节点对应的经济效益。
在一个或多个实施方案中,所述炼油过程为催化重整过程、催化裂化过程、硫磺回收过程、渣油加氢过程、常减压过程或加氢裂化过程,特别是催化重整过程。
本发明的第二个方面提供一种基于数据驱动的催化裂化装置运行状态识别及优化方法,所述方法包括以下步骤:
(1)将包含操作数据和原料数据的正常工况状态下的催化裂化装置生产过程历史数据组成建模用的训练数据样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为训练数据的样本个数,n为训练数据的变量个数;
(2)对训练数据样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)对X运用主元分析法将其从n维降到k维,并计算得分矩阵T∈Rm×k和负载矩阵P∈Rn×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;定义生产模式,设定定义的生产模式下的评价指标,根据需求对定义的生产模式下的评价指标进行等级划分,筛选出处于优化运行状态的数据,将处于优化运行状态的数据对应的样本投影到二维置信椭圆上,得到定义的生产模式下的优化区域;
(5)采集在线实时数据Y∈RN×n,采用步骤(2)对训练数据进行预处理时所得到的平均值和方差对Y进行预处理得到Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则表示此时催化裂化装置处于正常工况状态;若样本点映射到椭圆外,则表示此时催化裂化装置运行状态可能存在异常;进一步地,对于映射在二维置信椭圆内部的样本,根据其所处位置判断其是否在定义的生产模式的优化区域内;如果映射点在优化区域内,则表明此时装置处于定义的生产模式下的优化运行状态;如果映射点不在优化区域内,则表明此时装置处于定义的生产模式下的非优化运行状态。
在一个或多个实施方案中,所述步骤(2)中的预处理方法如本发明的第一个方面的步骤(2)所述。
在一个或多个实施方案中,所述步骤(3)中,对经过预处理所得到的X运用主元分析法进行降维处理,具体按如下步骤进行,具体操作步骤如本发明的第一个方面的步骤(3)所述。
在一个或多个实施方案中,所述步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆,具体操作步骤如本发明的第一个方面的步骤(4)所述。
在一个或多个实施方案中,所述步骤(4)中,定义生产模式,设定定义的生产模式下的评价指标,根据定义的生产模式的评价指标,对历史数据设置不同的标签,在对历史数据的得分矩阵进行投影时通过不同区域数据点所带的标签对置信椭圆进行区域划分;或根据需求对定义的生产模式下的评价指标进行等级划分,筛选出处于优化运行状态的数据,将处于优化运行状态的数据对应的样本投影到二维置信椭圆上,得到定义的生产模式下的优化区域。
在一个或多个实施方案中,所述步骤(6)中,scorey的计算公式如本发明的第一个方面的步骤(6)所述。
在一个或多个实施方案中,所述步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一个或多个实施方案中,所述步骤(7)还包括将收集到的正常工况下的数据加入到历史数据重新建模。
在一个或多个实施方案中,所述步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源,具体操作方法如本发明的第一个方面的步骤(7)所述。
在一个或多个实施方案中,所述步骤(7)中,对于映射在二维置信椭圆内部的样本,根据其所处位置判断其是否在定义的生产模式的优化区域内;如果映射点在优化区域内,则表明此时装置处于定义的生产模式下的优化运行状态;如果映射点不在优化区域内,则表明此时装置处于定义的生产模式下的非优化运行状态。
在一个或多个实施方案中,所述方法还包括步骤(8):对于处于非优化运行状态的在线实时数据,通过观察该数据在定义的生产模式下在二维置信椭圆中的投影位置,从由装置操作数据和原料数据降维得到的各主元成分中,找到各主元所对应的系数最大的变量1~3个,作为调整催化裂化装置运行状态的核心变量,根据核心变量与投影点位置变化之间的相关性,确定调整方向,改变核心变量的数值,实现对生产过程的优化。
在一个或多个实施方案中,所述步骤(8)中,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对催化裂化装置的生产模式进行调整,并通过实时监控观察数据是否往期望的区域移动。
在一个或多个实施方案中,本发明的第二个方面的步骤(1)-(8)如本发明的第一个方面的任一实施方案所述。
本发明的第三个方面提供一种基于数据驱动的硫磺回收装置运行状态识别及优化方法,所述方法包括以下步骤:
(1)将正常工况状态下的硫磺回收装置生产过程历史数据组成建模用的训练数据样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为训练数据的样本个数,n为训练数据的变量个数;
(2)对训练数据样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)运用主元分析法将X从n维降到k维,计算得分矩阵T∈Rm×k和负载矩阵P∈Rn×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;设定硫磺回收装置的生产模式,根据所设定的生产模式下的关键指标变量和生产需求,对所设定的生产模式进行等级划分,筛选出处于优化运行状态的数据,将处于优化运行状态的数据对应的样本投影到二维置信椭圆上,得到所设定的生产模式下的优化区域;
(5)采集在线实时数据Y∈RN×n,采用步骤(2)对训练数据进行预处理时所得到的平均值和方差对Y进行预处理得到Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则表示此时硫磺回收装置处于正常工况状态;若样本点映射到椭圆外,则表示此时硫磺回收装置运行状态可能存在异常。
在一个或多个实施方案中,所述步骤(2)中的预处理方法如本发明的第一个方面的步骤(2)所述。
在一个或多个实施方案中,所述步骤(3)中,运用主元分析法对经过预处理所得到的X进行降维处理,具体操作步骤如本发明的第一个方面的步骤(3)所述。
在一个或多个实施方案中,所述步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆,具体操作步骤如本发明的第一个方面的步骤(4)所述。
在一个或多个实施方案中,所述步骤(4)中,根据所设定的硫磺回收装置生产模式的关键表征指标,对历史数据设置不同的标签,在对历史数据的得分矩阵进行投影时通过不同区域数据点所带的标签将置信椭圆划分为优化区域和非优化区域。
在一个或多个实施方案中,所述步骤(6)中,scorey的计算公式如本发明的第一个方面的步骤(6)所述。
在一个或多个实施方案中,所述步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一个或多个实施方案中,所述步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源,具体操作方法如本发明的第一个方面的步骤(7)所述。
在一个或多个实施方案中,所述步骤(7)中,对于映射在二维置信椭圆内部的样本,根据其所处位置判断其是否在定义的生产模式的优化区域内;如果映射点在优化区域内,则表明此时装置处于定义的生产模式下的优化运行状态;如果映射点不在优化区域内,则表明此时装置处于定义的生产模式下的非优化运行状态。
在一个或多个实施方案中,所述方法还包括步骤(8):对于处于非优化运行状态的在线实时数据,通过观察该数据在定义的生产模式下在二维置信椭圆中的投影位置,从各主元成分中,找到各主元所对应的系数最大的变量1~3个,作为调整硫磺回收装置运行状态的核心变量,根据核心变量与投影点位置变化之间的相关性,确定调整方向,改变核心变量的数值,实现对生产过程的优化。
在一个或多个实施方案中,所述步骤(8)中,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对硫磺回收装置的生产模式进行调整,并通过实时监控观察数据是否往期望的区域移动。
在一些实施方案中,本发明的基于数据驱动的硫磺回收装置运行状态识别及优化方法包括:采集硫磺回收装置过程中包含过程操作、原料评价、氢气组成分析以及装置产品分布等历史过程数据,筛选出包含装置操作变量和因变量的生产数据若干组;采取主成分分析法对上述数据进行降维,绘制出二维置信椭圆;根据硫磺回收率、净化尾气中H2S含量等指标,设定装置多种生产模式,并根据指标和历史数据,筛选出各模式下装置优化运行状态区域;采集装置运行实时生产数据,通过上述方法映射至二维置信区间,识别装置当前运行状态是否处于运行优化区域;若装置处于非优化运行状态,则通过计算各变量的SPE贡献率,找出其数值较大的变量进行调控,使装置生产状态逐步、及时回到对应生产模式下最优运行区域。
在一个或多个实施方案中,本发明的第三个方面的步骤(1)-(8)如本发明的第一个方面的任一实施方案所述。
本发明的第四个方面提供一种基于数据驱动的渣油加氢处理装置运行状态识别及优化方法,所述方法包括以下步骤:
(1)将渣油加氢处理装置生产过程历史数据组成建模用的训练数据样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为训练数据的样本个数,n为训练数据的变量个数;
(2)对训练数据样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)运用主元分析法将X从n维降到k维,计算得分矩阵T∈Rm×k和负载矩阵P∈Rn×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;设定渣油加氢处理装置的生产模式,根据所设定的生产模式下的指标变量,对数据进行等级划分,筛选出处于优化运行状态的数据,将处于优化运行状态的数据对应的样本投影到二维置信椭圆上,得到所设定的生产模式下的优化区域;
(5)采集在线实时数据Y∈RN×n,采用步骤(2)对训练数据进行预处理时所得到的平均值和方差对Y进行预处理得到Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则表示此时渣油加氢处理装置处于正常工况状态;若样本点映射到椭圆外,则表示此时渣油加氢处理装置运行状态可能存在异常。
在一个或多个实施方案中,所述步骤(2)中的预处理方法如本发明的第一个方面的步骤(2)所述。
在一个或多个实施方案中,所述步骤(3)中,运用主元分析法对经过预处理所得到的X进行降维处理,具体操作步骤如本发明的第一个方面的步骤(3)所述。
在一个或多个实施方案中,所述步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆,具体操作步骤如本发明的第一个方面的步骤(4)所述。
在一个或多个实施方案中,所述步骤(4)中,根据所设定的渣油加氢处理装置生产模式的关键表征指标,对历史数据设置不同的标签,在对历史数据的得分矩阵进行投影时通过不同区域数据点所带的标签将置信椭圆划分为优化区域和非优化区域。
在一个或多个实施方案中,所述步骤(6)中,scorey的计算公式如本发明的第一个方面的步骤(6)所述。
在一个或多个实施方案中,所述步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一个或多个实施方案中,所述步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源,具体操作方法如本发明的第一个方面的步骤(7)所述。
在一个或多个实施方案中,所述步骤(7)中,对于映射在二维置信椭圆内部的样本,根据其所处位置判断其是否在设定的生产模式的优化区域内;如果映射点在优化区域内,则表明此时装置处于设定的生产模式下的优化运行状态;如果映射点不在优化区域内,则表明此时装置处于设定的生产模式下的非优化运行状态。
在一个或多个实施方案中,所述方法还包括步骤(8):对于处于非优化运行状态的在线实时数据,通过观察该数据在定义的生产模式下在二维置信椭圆中的投影位置,从各主元成分中,找到各主元所对应的系数最大的变量1~3个,作为调整渣油加氢处理装置运行状态的核心变量,根据核心变量与投影点位置变化之间的相关性,确定调整方向,改变核心变量的数值,实现对生产过程的优化。
在一个或多个实施方案中,步骤(8)中,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对渣油加氢处理装置的生产模式进行调整,并通过实时监控观察数据是否往期望的区域移动。
在一个或多个实施方案中,本发明的基于数据驱动的渣油加氢装置运行状态识别及优化方法包括:采集渣油加氢处理装置过程中包含过程操作、原料和产品性质分析以及装置产品分布等历史过程数据,筛选出包含装置操作变量和因变量的生产数据若干组;根据装置运行特性和数据,定义渣油加氢处理装置生产优化运行模式,如装置效益最大、能耗最小等;运用主成分分析法处理不同生产模式下的数据,利用得分矩阵建立模型并绘制置信椭圆;将实时采集得到的新样本计算得分矩阵投影到模型椭圆中,根据样本点在椭圆中的位置,判断目前装置生产过程所处在该生产模式下是否处于优化状态;将投影到椭圆内的样本添加到历史数据中建立新模型,实现模型自适应更新;若样本点投影到二维置信椭圆外则表明装置处于非优化运行状态,此时需根据故障贡献率对模型输入变量分析,实现故障溯源;筛选出对故障贡献率大的变量,按照主元和得分结果进行调控,使装置生产状态逐步、及时回到对应生产模式下最优运行区域,实现装置的优化。
在一个或多个实施方案中,本发明的第四个方面的步骤(1)-(8)如本发明的第一个方面的任一实施方案所述。
本发明的第五个方面提供一种基于大数据的常减压过程模式监控和优化方法,所述方法包括以下步骤:
(1)将常减压过程的历史数据组成建模用的训练样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为样本集的样本个数,n为样本集的变量个数;
(2)对训练数据样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)对X运用主元分析法将其从n维降到k维,并得到得分矩阵T∈Rm×k和负载矩阵P∈Rn×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;
(5)采集新的在线实时数据Y∈RN×n,采用步骤(2)对训练样本进行预处理时所得到的样本平均值和样本方差对Y进行预处理得到标准化数据Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则说明此时常减压过程所处的工况为正常工况;若样本点映射到椭圆外,则说明此时常减压过程存在异常。
在一个或多个实施方案中,所述步骤(2)中的预处理方法如本发明的第一个方面的步骤(2)所述。
在一个或多个实施方案中,所述步骤(3)中,运用主元分析法对经过预处理所得到的X进行降维处理,具体操作步骤如本发明的第一个方面的步骤(3)所述。
在一个或多个实施方案中,所述步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆,具体操作步骤如本发明的第一个方面的步骤(4)所述。
在一个或多个实施方案中,所述步骤(6)中,scorey的计算公式如本发明的第一个方面的步骤(6)所述。
在一个或多个实施方案中,所述步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一个或多个实施方案中,所述步骤(7)还包括将收集到的正常工况下的数据加入到历史数据重新建模。
在一个或多个实施方案中,所述步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源,具体操作方法如本发明的第一个方面的步骤(7)所述。
在一个或多个实施方案中,所述步骤(4)还包括:将历史数据结合现场工艺知识对所绘制的置信椭圆进行插旗处理实现对不同性能等级数据的区域划分,所述区域划分优选包括:首先根据工艺知识计算历史数据中各项性能指标(包括经济效益、生产能耗、产品产率等)的KPI值(效益值),然后对KPI值依据实际工艺进行不同等级的划分,再找到各个等级所对应的历史数据在椭圆中的分布并用不同的颜色加以标记(例如颜色标记)。效益值在历史数据中可以查到或根据历史数据计算得到。
在一个或多个实施方案中,步骤(4)中,根据常减压过程的性能指标,对历史数据设置不同的标签,因此在对历史数据的得分矩阵进行投影时可以通过不同区域数据点所带的标签对置信椭圆进行划分。
在一个或多个实施方案中,所述方法还包括步骤(8):对于映射在椭圆内部的样本,根据其所处位置结合步骤(4)中对椭圆进行的区域划分判断当前所处的性能等级。
在一个或多个实施方案中,所述步骤(8)还包括:对于处于非最优性能等级的样本,通过调整关键变量使其转换到所期望的更优的性能等级;优选地,将主元中所对应的系数最大的变量设定为优化时所要调整的关键变量,然后根据关键变量与在线数据在置信椭圆中的投影点位置变化之间的相关性,确定调整方向,实现对生产过程的优化;优选地,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对常减压过程的生产模式进行调整,并通过实时监控观察数据是否往所期望的区域移动。
在一个或多个实施方案中,本发明的基于大数据的常减压过程模式监控和优化方法包括:将常减压过程中所采集到的大量历史数据,根据其不同物理意义进行分类,并定义为不同的生产模式;运用主成分分析法处理不同生产模式下的数据,利用得分矩阵建立模型并绘制置信椭圆;将实时采集得到的新样本计算得分矩阵投影到模型中,根据样本点在椭圆中的位置判断目前过程所处的生产模式;将投影到椭圆内的样本添加到历史数据中建立新模型,实现模型自适应更新;投影到椭圆外的样本则为异常点,并根据故障贡献率进行故障溯源;建模时可以得到不同生产模式下对过程状态变化起主要作用的变量,对这些变量进行调整实现模式优化。
在一个或多个实施方案中,本发明的第五个方面的步骤(1)-(8)如本发明的第一个方面的任一实施方案所述。
本发明的第六个方面提供一种基于大数据的加氢裂化过程模式识别和优化方法,所述方法包括以下步骤:
(1)利用加氢裂化过程的历史数据构建建模用的训练数据样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为样本集的样本个数,n为样本集的变量个数;
(2)对训练数据样本集进行预处理,得到方差为1、均值为0的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)运用主元分析法将X从n维降到k维,并得到得分矩阵T∈Rm×k和负载矩阵P∈Rn ×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;
(5)采集在线实时数据Y∈RN×n,采用步骤(2)对训练样本进行预处理时所得到的样本平均值和样本方差对Y进行预处理得到标准化数据Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则说明此时加氢裂化过程所处的工况为正常工况;若样本点映射到椭圆外,则说明此时加氢裂化过程存在异常。
在一个或多个实施方案中,所述步骤(2)中的预处理方法如本发明的第一个方面的步骤(2)所述。
在一个或多个实施方案中,所述步骤(3)中,运用主元分析法对经过预处理所得到的X进行降维处理,具体操作步骤如本发明的第一个方面的步骤(3)所述。
在一个或多个实施方案中,所述步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆,具体操作步骤如本发明的第一个方面的步骤(4)所述。
在一个或多个实施方案中,所述步骤(4)中,将历史数据结合现场工艺知识可以对所绘制的置信椭圆进行插旗处理实现对不同性能等级数据的区域划分。在一些实施方案中,区域划分包括:首先根据工艺知识计算历史数据中各项性能指标(包括经济效益、生产能耗、产品产率等)的KPI值(效益值),然后对KPI值依据实际工艺进行不同等级的划分,再找到各个等级所对应的历史数据在椭圆中的分布并加以不同的标记(例如颜色标记)。效益值在历史数据中可以查到或根据历史数据计算得到。
在一个或多个实施方案中,所述步骤(4)中,根据加氢裂化过程的性能指标,对历史数据设置不同的标签,因此在对历史数据的得分矩阵进行投影时可以通过不同区域数据点所带的标签对置信椭圆进行划分。
在一个或多个实施方案中,所述步骤(6)中,scorey的计算公式如本发明的第一个方面的步骤(6)所述。
在一个或多个实施方案中,所述步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一个或多个实施方案中,所述步骤(7)还包括将收集到的正常工况下的数据加入到历史数据重新建模。
在一个或多个实施方案中,所述步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源,具体操作方法如本发明的第一个方面的步骤(7)所述。
在一个或多个实施方案中,所述步骤(4)还包括:将历史数据结合现场工艺知识对所绘制的置信椭圆进行插旗处理实现对不同性能等级数据的区域划分,所述区域划分优选包括:首先根据工艺知识计算历史数据中性能指标的KPI值,然后对KPI值依据实际工艺进行不同等级的划分,再找到各个等级所对应的历史数据在椭圆中的分布并加以不同的标记。
在一个或多个实施方案中,所述方法还包括步骤(8):对于映射在椭圆内部的样本,根据其所处位置结合步骤(4)中对椭圆进行的区域划分判断当前所处的性能等级。
在一个或多个实施方案中,所述步骤(8)还包括:对于处于非最优性能等级的样本,通过调整关键变量使其转换到所期望的更优的性能等级;优选地,将主元中所对应的系数最大的变量设定为优化时所要调整的关键变量,然后根据关键变量与在线数据在置信椭圆中的投影点位置变化之间的相关性,确定调整方向,实现对生产过程的优化;优选地,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对加氢裂化过程的生产模式进行调整,并通过实时监控观察数据是否往所期望的区域移动。
在一个或多个实施方案中,本发明的基于大数据的加氢裂化过程模式识别和优化方法包括:将加氢裂化过程中所采集到的大量历史数据,根据其不同物理意义进行分类,并定义为不同的生产模式;运用主成分分析法处理不同生产模式下的数据,利用得分矩阵建立模型并绘制置信椭圆;将实时采集得到的新样本计算得分矩阵投影到模型中,根据样本点在椭圆中的位置判断目前过程所处的生产模式;将投影到椭圆内的样本添加到历史数据中建立新模型,实现模型自适应更新;投影到椭圆外的样本则为异常点,并根据故障贡献率进行故障溯源;建模时可以得到不同生产模式下对过程状态变化起主要作用的变量,对这些变量进行调整实现模式优化。
在一个或多个实施方案中,本发明的第六个方面的步骤(1)-(8)如本发明的第一个方面的任一实施方案所述。
附图说明
图1是催化重整工艺流程示意图。
图2是本发明的炼油过程模式识别及优化方法的总体流程框图。
图3是实施例1中正常数据所绘制的置信椭圆。
图4是实施例1中置信椭圆根据不同模式数据的分区图。
图5是实施例1中故障点的SPE贡献率图。
图6是实施例1中历史数据对应效益曲线。
图7是实施例1中历史数据在置信椭圆中的投影和高效益点对应的投影区间。
图8是实施例1中历史数据在置信椭圆中的投影和低效益点对应的投影区间。
图9是实施例1中操作变量优化移动轨迹。
图10是本发明的催化裂化装置运行状态识别及优化方法的总体流程框图。
图11是实施例2中根据催化裂化装置的生产数据所绘制的置信椭圆。
图12是实施例2中根据优化目标变量——经济效益折线选出的装置优化运行区域(折线中带圈的点)。
图13是实施例2中某种生产模式对应的优化区域数据在置信椭圆上的投影图。
图14是实施例2中变量对生产模式评价目标的贡献率图。
图15是实施例2中催化裂化装置调优轨迹。
图16是本发明的硫磺回收装置运行状态识别及优化方法的总体流程框图。
图17是实施例3中硫磺回收装置生产数据所绘制的置信椭圆。
图18是实施例3中根据优化目标变量折线(硫回收率)选出的装置优化运行区域。
图19是实施例3中某种生产模式对应的优化区域数据在置信椭圆上的投影图。
图20是实施例3中变量对生产模式评价目标的贡献率图。
图21是实施例3中硫磺回收装置调优轨迹。
图22是本发明的基于数据驱动的渣油加氢处理装置运行状态识别及优化方法的总体流程框图。
图23是实施例4中根据渣油加氢处理装置生产数据所绘制的置信椭圆。
图24是实施例4中渣油加氢处理装置不同生产模式的分布。
图25是实施例4中注重加氢重油收率的生产样本对应的优化区域数据在置信椭圆上的投影图。
图26是实施例4中变量对生产模式评价目标的贡献率图。
图27是实施例4中渣油加氢处理装置调优轨迹。
图28是常减压工艺流程示意图。
图29是本发明的基于大数据的常减压过程模式监控和优化方法的总体流程框图。
图30是实施例5中根据正常数据所绘制的置信椭圆。
图31是实施例5中置信椭圆根据以能耗为优化目标的模式数据的分区图。
图32是实施例5中置信椭圆根据以轻收调优为优化目标的模式数据的分区图。
图33是实施例5中置信椭圆根据以总拔为优化目标的模式数据的分区图。
图34是实施例5中实时采集的数据在椭圆上的投影。
图35是实施例5中故障点的SPE贡献率图。
图36是加氢裂化的工艺过程流程图。
图37是本发明的基于大数据的加氢裂化过程模式识别和优化方法的总体流程框图。
图38是实施例6中根据正常数据所绘制的置信椭圆。
图39是实施例6中置信椭圆根据以总液收为优化目标的模式数据的分区图。
图40是实施例6中置信椭圆根据以中间油收率为优化目标的模式数据的分区图。
图41是实施例6中置信椭圆根据以价值增量为优化目标的模式数据的分区图。
图42是实施例6中实时采集的数据在椭圆上的投影。
图43是实施例6中故障点的SPE贡献率图。
具体实施方式
为使本领域技术人员可了解本发明的特点及效果,以下谨就说明书及权利要求书中提及的术语及用语进行一般性的说明及定义。除非另有指明,否则文中使用的所有技术及科学上的字词,均为本领域技术人员对于本发明所了解的通常意义,当有冲突情形时,应以本说明书的定义为准。
本文中,为使描述简洁,未对各个实施方案或实施例中的各个技术特征的所有可能的组合都进行描述。因此,只要这些技术特征的组合不存在矛盾,各个实施方案或实施例中的各个技术特征可以进行任意的组合,所有可能的组合都应当认为是本说明书记载的范围。
本发明的基于大数据的炼油过程模式识别方法包括以下步骤:
(1)将炼油过程中所采集到的历史数据组成建模用的训练样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为样本集的样本个数,n为样本集的变量个数;
(2)对训练数据样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)对X运用主元分析法将其从n维降到k维,并得到得分矩阵T∈Rm×k和负载矩阵P∈Rn×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;
(5)采集新的在线实时数据Y∈RN×n,采用步骤(2)对训练样本进行预处理时所得到的样本平均值和样本方差对Y进行预处理得到标准化数据Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则说明此时炼油过程所处的工况为正常工况;若样本点映射到椭圆外,则说明此时炼油过程存在异常。
本文中,炼油过程具有本领域常规的含义,通常是指石油炼制过程中原油及其中间产物经历的一系列工艺加工过程,包括但不限于常压蒸馏、减压蒸馏、催化裂化、催化重整、加氢裂化、硫磺回收、渣油加氢、常减压、延迟焦化、炼厂气加工和烷基化等。在一些实施方案中,炼油过程为催化重整过程、催化裂化过程、硫磺回收过程、渣油加氢过程、常减压过程或加氢裂化过程。
本文中,炼油过程模式包括炼油过程的工况和生产模式。工况可以分为正常工况(无故障发生的工况)和异常工况(有故障发生的工况)。。正常工况可以根据不同的工艺和性能评价指标划分成的不同生产模式,例如经济效益模式、装置能耗模式、产品产率模式等。根据各种生产模式所对应的不同评价指标,可将各生产模式划分为优化运行状态和非优化运行状态,例如经济效益模式可划分为高经济效益模式和低经济效益模式,装置能耗模式可划分为高装置能耗模式和低装置能耗模式,产品产率模式可划分为高产品产率模式和低产品产率模式等。
步骤(1)中,采用炼油过程中所采集到的历史数据作为训练样本集。本文中,一个样本通常是指在某个时间点对所选取的各个变量进行采集得到的一组数据,包括多个变量。当样本集以矩阵的形式呈现时,矩阵中的一行数据(行向量)通常表示一个样本,矩阵中的各列数据(列向量)通常分别对应于不同的变量,变量的个数(列数)即为数据的维度。变量包括自变量(本文又称操作变量)和因变量。训练样本集可以来自工厂实时数据库中的历史数据。通常,训练样本为正常运行状态下的历史数据。可根据装置数据记录点位和性质分析项目,批量采集工厂生产过程历史数据,根据先验知识粗略筛选出数据正常、对装置生产过程可能有影响的操作点(操作数据)和原料性质项(原料数据),将包含这类操作数据和原料数据的催化裂化装置生产过程历史数据作为建模用的训练数据。
步骤(2)中,通过求取训练样本集的平均值和标准差来对训练样本进行标准化处理,得到标准化的数据。本发明中,基于平均值和标准差对数据进行标准化处理的方法是本领域常规的。标准化后的数据呈现均值为0、方差为1的正态分布。在一些实施方案中,预处理方法采用Z-score标准化方法,计算公式为:
Figure BDA0003463227610000191
式中,Z=[z1,z2,...,zm]为训练数据矩阵,X表示标准化后的数据矩阵,μ为训练数据的均值,σ为训练数据的标准差,μ和σ计算公式为:
Figure BDA0003463227610000192
Figure BDA0003463227610000201
步骤(3)中,利用主元分析法对X进行降维,并得到得分矩阵T∈Rm×k和负载矩阵P∈Rn×k可以采用本领域已知的方法或本发明提供的方法。在一些实施方案中,对经过预处理所得到的X运用主元分析法进行降维处理按如下步骤进行:
(3-a)计算矩阵X的协方差矩阵,公式为:
Figure BDA0003463227610000202
X是m×n的矩阵,m是训练样本个数,n是特征个数,T表示转置,所以得到的协方差矩阵C是一个n×n维的矩阵;
(3-b)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序,计算公式为:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵,得:
特征值矩阵:
Figure BDA0003463227610000203
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
(3-c)建立主元模型,选取主元个数原则:将最大的方差归纳到模型空间,将最小的方差留给噪声空间,计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000204
最大的k个主元包括的信息比:
Figure BDA0003463227610000205
(3-d)保留对应k个最大特征值的特征向量,得到负载矩阵P=[p1,p2,p3,...,pk]∈Rn×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
其本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
步骤(4)中,利用得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2绘制置信椭圆。在一些实施方案中,利用矩阵xdat绘制置信椭圆的步骤如下:
(4-a)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2;xdat的协方差矩阵可参照前述公式(4)计算;
(4-b)计算xdat每一列的平均值得xm∈R1×2,并将xdat每一列的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
(4-c)计算公式xd×s·×xd,并对所得矩阵每行进行求和,得到rd∈Rm×1
(4-d)绘制xdat的曲线图,得分矩阵的前两列呈现经验分布,根据其经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度Ci,对rd进行升序排序后,以rd第Ci个位置所对应的值作为r∈R,优选的Ci为95%;
(4-e)计算步骤(4-a)所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000211
特征向量矩阵为
Figure BDA0003463227610000212
矩阵S的特征值和对应的特征向量可参照前述公式(5)和公式(6)计算;
(4-f)利用步骤(4-d)中的r以及步骤(4-e)中的D,即可得到置信椭圆的长轴以及短轴,计算公式为:
Figure BDA0003463227610000213
Figure BDA0003463227610000214
其中,a为长轴,b为短轴;
(4-g)以步骤(4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴即可绘制置信椭圆,椭圆的公式为:
Figure BDA0003463227610000215
其中xm1为xdat第一列的平均值,xm2为xdat第二列的平均值。
不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域,根据炼油过程的性能指标,可以根据历史工况对应的效益分级对历史数据设置不同的标签。效益值在历史统计数据中可以查到。将历史数据的得分矩阵的前两列进行投影,可以通过不同区域数据点所带的标签对置信椭圆进行划分。
步骤(4)中,利用得分矩阵T的前两列,绘制二维置信椭圆。置信度优选设置为95%。可以根据历史数据和生产需求,完成与生产模式定义有关的关键表征指标变量设定和数据整理,如经济效益、装置能耗、产品产率等,采用作图法,根据需求对生产模式指标的等级进行划分,筛选出处于优化状态数据,将此类数据对应的样本在二维置信椭圆上完成投影得到定义生产模式下的优化区域,并以不同的颜色加以标记。
在一些实施方案中,步骤(4)还包括对置信椭圆按照性能等级进行区域划分。在一些实施方案中,区域划分包括:将历史数据结合现场工艺知识对所绘制的置信椭圆进行插旗处理实现对不同性能等级数据的区域划分,所述区域划分优选包括:首先根据工艺知识和历史效益统计数据,根据时间序列找到工况对应的效益,根据效益高低进行不同等级的划分,再找到各个等级所对应的历史数据在椭圆中的分布并用不同的颜色加以标记。在一些实施方案中,区域划分包括:根据炼油过程的性能指标,对不同性能等级的历史数据设置不同的标签,将历史数据的得分矩阵的前两列投影到置信椭圆上,通过不同区域数据点所带的标签对置信椭圆进行划分。
步骤(5)中,参照公式(1)采用步骤(2)中对训练样本进行预处理时所得到的均值和方差对Y进行预处理。
步骤(6)中,scorey的计算公式为:
scorey=Ym×[p1,p2] (13)
式中,[p1,p2]∈Rn×2是负载矩阵P的前两列。
步骤(7)中,可以通过判断样本点是否映射在椭圆内,考虑是否将此样本点视为装置正常工况纳入到历史数据中重新建模,提高模型的适应性;若样本映射点在此椭圆内,则纳入数据库中更新模型,否则表明此时装置生产过程可能存在异常,可对异常数据计算SPE贡献率来进行故障溯源。
步骤(7)中,可将scorey中的每一组数据代入前述公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
在一些实施方案中,步骤(7)还包括将收集到的正常工况下的数据加入到历史数据重新建模;优选地,在加入收集到的正常工况下的数据的同时,剔除相同数量的早期历史数据。
在一些实施方案中,步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源。计算SPE贡献率可采用本领域已知的方法或本发明提供的方法。在一些实施方案中,假设异常数据为x∈R1×n,其SPE贡献率的计算公式为:
Figure BDA0003463227610000221
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000222
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量。
在一些实施方案中,步骤(7)还包括:对于映射在椭圆内部的样本,根据其所处位置结合步骤(4)中对椭圆进行的区域划分判断当前所处的性能等级,若其处于非最优的性能等级,则通过调整关键变量使其转换到所期望的更优的性能等级;优选地,将主元中所对应的系数最大的变量设定为优化时所要调整的关键变量,然后根据关键变量与在线数据在置信椭圆中的投影点位置变化之间的相关性,确定调整方向,实现对生产过程的优化;优选地,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对炼油过程的生产模式进行调整,并通过实时监控观察数据是否往所期望的区域移动。在这类实施方案中,本发明的方法可以实现对炼油过程模式的优化。
在本发明的基于大数据的炼油过程模式识别方法的基础上引入如下的步骤(8)也可以实现对炼油过程模式的优化:
(8)通过主成分分析过程中得到的标准差和均值求得置信椭圆中的点对应的原始变量,从而得到该点对应的效益值;在置信椭圆中区分效益值高低的分布;当工况运行模式位于置信椭圆中的某一点时,采用路径优化算法,获得当前位置向最优位置最快移动轨迹,将轨迹对应的点进行反变换,获得操作条件的改变方式,从而指导生产装置操作优化。
因此,本发明还包括基于大数据的炼油过程模式优化方法,所述基于大数据的炼油过程模式优化方法包括如本文任一实施方案所述的炼油过程模式识别方法和如本文任一实施方案所述的步骤(8)。
置信椭圆中,每一个点都可以通过主成分分析过程中得到的标准差和均值求得对应的原始变量,从而可以得到该点对应的效益值。效益值高低的分布即可在置信椭圆中进行区分。当工况运行模式位于置信椭圆中的某一点时,采用路径优化算法,获得当前位置向最优位置最快移动轨迹,将轨迹对应的点进行反变换,获得操作条件的改变方式,即可指导生产装置操作优化。
在一些实施方案中,步骤(8)中,针对置信椭圆中的当前工况点defen=(x,y)∈R1 ×2,利用公式(15)计算原始变量Xori
Xori=(defen×PCT)·×std(Xm)+mean(Xm) (15)
其中,defen=(x,y)∈R1×2为置信椭圆中的点的横纵坐标,PC=[p1,p2]∈RJ×2为主成分分析建模时负载矩阵的前两列,std(Xm)为主成分分析采用的基础样本的方差,mean(Xm)为主成分分析采用的基础样本的均值,m为样本个数,Xori为椭圆中defen=(x,y)∈R1×2位置对应的反变换后的原始变量。
生产过程中的统计信息包括进料量、产品产量等,根据价格信息即可得到简化的投入产出效益指标。在一些实施方案中,步骤(8)中,根据公式(16)计算投入产出效益指标:
Figure BDA0003463227610000241
其中,
Figure BDA0003463227610000242
为第i种产品的产量,
Figure BDA0003463227610000243
为第i种产品的价格,
Figure BDA0003463227610000244
为第i种原料的投料量,
Figure BDA0003463227610000245
为第i种原料的价格,profit为效益指标。
置信椭圆中的点均可通过式(15)的变换后得到原始工况并根据式(16)得到一个对应的效益值,同时可以找到效益最优值对应的点。根据效益值可以在置信椭圆中划分高效益区和低效益区。
步骤(8)中,路径优化可以采用本领域已知的算法(例如常规的A*算法)或采用本发明提供的改进的A*算法。A*算法是一种确定起始点后,找到从起始点到目标点所有可达路径中的最优路径的优化算法。常规的A*算法通过评估函数f(x)来确定搜索方向和下一个到达的节点,评估函数的一般形式如下所示:
f(x)=g(x)+h(x) (17-1)
其中,g(x)是代价函数,代表从起始节点到达当前节点x的实际所需代价;h(x)是启发式函数,代表从当前节点x到达目标节点估计所需的代价。
在优选的实施方案中,采用本发明的改进的A*算法进行路径优化,所述改进的A*算法对评估函数f(x)进行了改进:
Figure BDA0003463227610000246
其中,profit(x)表示所选节点对应的经济效益,g(x)是代价函数,代表从起始节点到达当前节点x的实际所需代价;h(x)是启发式函数,代表从当前节点x到达目标节点估计所需的代价。采用本发明的改进的A*算法进行路径优化可以使优化过程中保持较高的经济效益。采用本发明的改进的A*算法可以获得带优化的工况点到高效益点的最优路径。
获得优化路径后,可根据采用式(15)进行变换而得到的操作变量的原始值进行优化操作。
本发明的有益效果如下:
1.炼油生产中包含大量过程数据,例如温度、压力、液位、流量以及物料性质等,这些变量都会对过程造成一定的影响。但是在海量的数据中,有些数据对过程的影响较为显著,有些则影响较小。采用大数据降维方法对炼油过程海量数据进行降维,获取可以表征炼油过程状态的关键变量,可以有效提高监控和优化方法的效率,降低计算代价。
2.在建模的过程中,不断地将实时采集到的正常数据加入到建模数据中,并剔除早期的历史数据使建模数据总量保持不变,提高了模型适应性,使模型随着过程的运行进行调整,所监控的关键变量也随之改变。
3.通过绘制置信椭圆对炼油过程进行实时监测,采用这种可视化的方式,方便操作人员更加直观地了解过程所处的运行状态并进行相关操作。
4.正常状态下的炼油过程根据其工艺工况和性能指标可以分为不同的生产模式,例如高经济效益模式或低经济效益模式,不同生产模式的数据会映射在置信椭圆内不同的区域,通过将这些模式下的历史数据映射在椭圆中对椭圆进行划分,在实时监控时,通过实时采集的数据映射在椭圆中的位置来判断当前炼油过程所处的生产模式,并且可以通过路径优化和模式点反变换得到的操作变量调整方式指导炼油装置生产操作优化。
5.本发明采用A*算法作为优化算法,可以在优劣区间找到一条最优路径,同时可以通过路径上的点反推出最优操作条件。
下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,本领域技术人员根据本发明的内容作出的一些非本质的改进和调整,仍属于本发明的保护范围。
实施例1
本实施例将本发明的基于大数据的炼油过程模式优化方法应用到催化重整(CCR)工艺过程中。图1给出了催化重整的工艺过程流程图。催化重整工艺由预加氢单元、重整单元以及催化剂再生系统组成,在以生产芳烃为目的时,还包括芳烃抽提和精馏装置。经过预处理后的原料进入重整工段,与循环氢混合并加热之后进入反应器,反应器由3至4个串联,其间设有加热炉,以补偿反应所吸收的热量。离开反应器的物料进入分离器分离出氢循环气(多余部分排出),所得液体由稳定塔脱去轻组分后作为重整汽油,是高辛烷值汽油组分,或送往芳烃抽提装置生产芳烃。
CCR模型包括51个输入变量和16个输出变量。通过对输入变量进行控制可以得到不同运行状态的CCR模型,其中对输出结果影响较大的输入变量有反应温度、压力、进料流量等,产物的性能指标主要通过观察输出变量中的氢气、纯氢、干气、液化气、碳5、碳6、碳7+、苯质量流量以及芳烃的量来进行判断。表1列出了本实施例所涉及的操作变量。
表1:操作变量
变量 描述 单位
1 一段反应温度
2 二段反应温度
3 三段反应温度
4 四段反应温度
5 循环氢量 STD_m<sup>3</sup>/h
6 预加氢进料总量 tonne/h
7 压缩机压力 Mpa
8 T201塔板温度
9 T201回流量 tonne/h
10 T201塔板温度
11 T601塔底温度
12 抽出二甲苯 tonne/h
13 重整进料负荷 tonne/h
采用本发明的基于大数据的炼油过程模式优化方法对CCR过程进行监控和优化,如图2所示,包括以下步骤:
1.采集一段时间CCR过程正常运行状态下的样本数据Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,zi=[z1i,z2i,...,zmi]T代表第i个测量变量的m个样本。
2.对采集的数据进行预处理,得到均值为0、方差为1的标准化数据集X=[x1,x2,...,xn]∈Rm×n,计算公式为:
Figure BDA0003463227610000261
式中,μ为取自训练数据的均值:
Figure BDA0003463227610000262
σ为取自训练数据的标准差:
Figure BDA0003463227610000263
3.对经过标准化处理后所得到的X运用主元分析法进行降维处理,具体按如下步骤进行:
a)计算矩阵X的协方差矩阵,公式为:
Figure BDA0003463227610000264
X是m×n的矩阵,m是训练样本个数,n是特征个数,所以得到的协方差矩阵C是一个n×n维的矩阵;
b)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序,计算公式为:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵,得:
特征值矩阵:
Figure BDA0003463227610000271
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
c)建立主元模型,选取主元个数原则:将最大的方差归纳到模型空间,将最小的方差留给噪声空间,计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000272
最大的k个主元包括的信息比:
Figure BDA0003463227610000273
d)保留对应k个最大特征值的特征向量,得到负载矩阵P=[p1,p2,p3,...,pk]∈Rn ×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
其本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用该矩阵具体绘制置信度为95%的置信椭圆的步骤如下:
a)参照公式(4)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
b)计算xdat每一列的平均值得xm∈R1×2,并将每一行的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
c)计算公式xd×s·×xd,并将所得矩阵每行进行求和,得到rd∈Rm×1
d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,因为所要绘制的置信椭圆的置信度为95%,对rd进行升序排序后,将rd第95%个位置所对应的值作为r∈R;
e)计算4-a)中所得矩阵s的特征值和对应的特征向量,计算公式与式(5)和式(6)类似,得特征值矩阵为
Figure BDA0003463227610000281
特征向量矩阵为
Figure BDA0003463227610000282
f)利用4-d)中的r以及4-e)中的D,可求得置信椭圆的长轴以及短轴,计算公式为:
Figure BDA0003463227610000283
Figure BDA0003463227610000284
其中,a为长轴,b为短轴;
g)以4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴即可绘制置信椭圆,椭圆的公式为:
Figure BDA0003463227610000285
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值,绘制的椭圆如图3所示。
5.不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域,根据CCR过程的性能指标,根据历史工况对应的效益分级对历史数据设置不同的标签,效益值在历史统计数据中可以查到,将历史数据的得分矩阵的前两列进行投影,可以通过不同区域数据点所带的标签对置信椭圆进行划分,并以不同颜色进行区分如图4所示。
6.将CCR过程在正常工况下运行一段时间后通过调整操作变量中压缩机压力的值使过程偏离正常状态,并收集数据得到Y∈RN×n,对所采集的数据运用训练数据计算所得的平均值和标准差进行归一化处理得到Ym∈RN×n
7.将Ym乘以3-d)所得负载矩阵P的前两列,计算公式为:
scorey=Ym×[p1,p2] (13)
8.将scorey中每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
9.假设故障数据点为x∈R1×n,其SPE贡献率的计算公式为:
Figure BDA0003463227610000286
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000287
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量,SPE贡献率如图5所示,根据图5可以判定故障产生的原因主要是由第七个变量即压缩机压力起主要作用,与实际操作情况相符。
10.催化重整生产过程的经济效益分别与液化气流量(x1)、氢气流量(x2)、干气流量(x3)、碳5(x4)、碳6(x5)、芳烃(x6)以及重整进料负荷(x7)有关,这些物质的价格如表2所示:
表2:催化重整经济效指标各物质价格
物质/m<sup>3</sup>·s<sup>-1</sup> 进料负荷 液化气 氢气 干气 碳5 碳6 芳烃
价格/元 3092 4153 8489.57 2505 3690 4298 4573
因此催化重整生产过程经济效益的计算公式可以表示如下:
profit=(4153x1+8489.57x2+2505x3+3690x4+4298x5+4573x6)-3092x7 (16-1)
根据历史样本即可绘制如图6所示效益值,从而可以在置信椭圆中划分高效益区和低效益区,分别如图7和图8所示。图7中,绿色点(浅色点)所在位置代表高效益区。图8中,绿色点(浅色点)所在位置代表低效益区。
针对置信椭圆中的当前工况点defen=(x,y)∈R1×2,可以采用下式获得原始变量:
Xori=(defen×PCT)·×std(Xm)+mean(Xm) (15)
其中,defen=(x,y)∈R1×2为置信椭圆中的点的横纵坐标,PC=[p1,p2]∈RJ×2为主成分分析建模时负载矩阵的前两列,std(Xm)为主成分分析采用的基础样本的方差,mean(Xm)为主成分分析采用的基础样本的均值,m为样本个数,Xori为椭圆中defen=(x,y)∈R1×2位置对应的反变换后的原始变量。
为了获得该变量到高效益点的最优路径,采用改进的A*算法实现路径优化。该改进方法的评估函数如下所示:
Figure BDA0003463227610000291
其中,g(x)是代价函数,它代表从起始节点到达当前节点x的实际所需代价;h(x)是启发式函数,代表从当前节点x到达目标节点估计所需的代价,中profit(x)表示所选节点对应的经济效益,可以使优化过程中保持较高的经济效益。路径优化后得到的模式移动轨迹如图9所示,采用式(15)进行变换即可得到操作变量的原始值。如表3所示。采用上述模式优化方法得到的操作条件进行优化操作,可以将效益从257584元/小时提高到259272元/小时。
表3:优化过程中对应操作变量的值和效益结果
Figure BDA0003463227610000292
Figure BDA0003463227610000301
实施例2
本实施例根据某180万吨/年的工业催化裂化生产历史数据,如表4所示,选择88个装置自变量数据点作为模型输入变量和20个装置因变量数据点作为模型对应的输出变量,对生产历史数据进行采集和预处理。
本实施例采用本发明的一种基于数据驱动的催化裂化装置运行状态识别及优化方法对催化裂化装置运行状态进行识别及优化,如图10所示,包括以下步骤:
1.采集装置实际生产历史数据,相关变量名称见表4。利用催化裂化装置正常运行状态下大量数据组合构建样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中zi=[z1i,z2i,...,zmi]T代表第i个测量变量的m个样本。
表4:催化装置模型变量名称
Figure BDA0003463227610000302
Figure BDA0003463227610000311
Figure BDA0003463227610000321
2.对样本集数据进行预处理,得到方差为1、均值为0的标准数据集X=[x1,x2,...,xn]∈Rm×n,标准数据集的计算公式为:
Figure BDA0003463227610000322
式中,μ为训练数据的均值,其计算公式为:
Figure BDA0003463227610000323
σ为训练数据的标准差,其计算公式为:
Figure BDA0003463227610000324
3.按如下步骤进行对标准数据集X运用主元分析法进行降维:
a)根据公式(4)计算矩阵X的协方差矩阵:
Figure BDA0003463227610000325
其中,X是m×n的矩阵,m是训练样本个数,n是特征个数,因此协方差矩阵C是一个n×n维的矩阵;
b)根据公式(5)和公式(6)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵;
特征值矩阵:
Figure BDA0003463227610000331
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
c)建立主元模型,选取主元个数原则:将最大的方差归纳到模型空间,将最小的方差留给噪声空间,其计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000332
最大的k个主元包括的信息比:
Figure BDA0003463227610000333
d)保留与k个最大特征值相对应的k个特征向量,得到负载矩阵P=[p1,p2,p3,...p,k]∈Rn×k,其中特征向量按照特征值降序排序,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
ti的本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,按照以下步骤利用该矩阵具体绘制置信度为95%的置信椭圆:
a)参照公式(4)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
b)计算xdat每一列的平均值得xm∈R1×2,并将每一行的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
c)计算公式xd×s·×xd,并将所得矩阵每行进行求和,得到rd∈Rm×1
d)绘制xdat的曲线图,根据得分矩阵的前两列呈现经验分布的特点,计算矩阵rd的百分位数,由于所要绘制的置信椭圆的置信度为95%,对rd求第5%个位置所对应的值,得到r∈R;
e)参照式(5)和式(6)计算4-a)中所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000334
特征向量矩阵为
Figure BDA0003463227610000335
f)利用4-d)中r以及4-e)中D,按照公式(10)和公式(11)计算置信椭圆的长轴以及短轴:
Figure BDA0003463227610000341
Figure BDA0003463227610000342
其中,a为长轴,b为短轴;
g)以4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,置信椭圆的公式为:
Figure BDA0003463227610000343
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值,绘制的椭圆如图11所示。
5.不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域。如图12所示,根据催化裂化过程的性能指标,对历史数据设置不同的标签,进行优化目标变量——经济效益折线绘制,从中选出装置的优化运行区域。将历史数据的得分矩阵的前两列进行投影,通过不同区域数据点所带的标签对置信椭圆进行划分,并以不同颜色进行区分。图13给出了本实施例的置信椭圆区域划分结果,绿色(浅色)点所在区域为经济效益最优的生产模式对应的区域。
6.将催化裂化装置在正常工况下运行一段时间后,通过调整操作变量中烧焦罐下部密度使过程偏离正常状态,并收集数据得到Y∈RN×n,对所采集的数据运用训练数据计算所得的平均值和标准差进行归一化处理得到Ym∈RN×n
7.按照公式(13)将Ym乘以3-d)所得负载矩阵P的前两列,得到scorey:
scorey=Ym×[p1,p2] (13)
8.将scorey中每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内;
9.设故障数据点为x∈R1×n,根据公式(14)计算故障数据点的SPE贡献率:
Figure BDA0003463227610000344
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000345
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量,SPE贡献率如图14所示。根据图14可以判定故障产生的原因主要是由第10个变量(即烧焦罐下部密度)起主要作用,与步骤(6)的实际操作情况相符。
10.根据负载矩阵P的第一列中绝对值最大的烧焦罐下部密度变量,通过调整该变量所对应的值,对催化裂化过程的生产状态进行调整,并通过实时监控可以观察数据是否往期望的区域移动,从而使装置运行状态回到优化运行状态,调整轨迹如图15所示。图15中,绿色(浅色)点所在区域对应于优化运行状态。
实施例3
本实施例根据某60万吨/年的工业硫磺回收生产历史数据,如表5所示,选择75个装置数据点,其中55个为模型输入变量,20个作为输出变量,对生产历史数据进行采集和预处理。
本实施例采用本发明的一种基于数据驱动的硫磺回收装置运行状态识别及优化方法对硫磺回收装置运行状态进行识别和优化,如图16所示,包括以下步骤:
1.采集硫磺回收装置实际生产历史数据,部分自变量名称见表5。利用硫磺回收装置正常运行状态下大量数据组合构建样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,zi=[z1i,z2i,...,zmi]T代表第i个测量变量的m个样本。
表5:硫磺装置变量名称
Figure BDA0003463227610000351
Figure BDA0003463227610000361
2.对样本集进行标准化处理,得到方差为1、均值为0的标准化处理后的数据集X=[x1,x2,...,xn]∈Rm×n,标准化处理的计算公式为:
Figure BDA0003463227610000362
式中,μ为训练数据的均值,其计算公式为:
Figure BDA0003463227610000363
σ为训练数据的标准差,其计算公式为:
Figure BDA0003463227610000364
3.按如下步骤进行对标准化处理后的数据集X运用主元分析法进行降维:
a)根据公式(4)计算矩阵X的协方差矩阵:
Figure BDA0003463227610000371
其中,X是m×n的矩阵,m是训练样本个数,n是特征个数,因此协方差矩阵C是一个n×n维的矩阵;
b)根据公式(5)和公式(6)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵;
特征值矩阵:
Figure BDA0003463227610000372
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
c)按照将最大的方差归纳到模型空间、将最小的方差留给噪声空间的原则选取主元个数k,其计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000373
最大的k个主元包括的信息比:
Figure BDA0003463227610000374
d)保留与k个最大特征值相对应的k个特征向量,得到负载矩阵P=[p1,p2,p3,...p,k]∈Rn×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
ti的本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,按照以下步骤利用该矩阵具体绘制置信度为95%的置信椭圆:
a)参照公式(4)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
b)计算xdat每一列的平均值得xm∈R1×2,并将每一行的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
c)计算公式xd×s·×xd,并将所得矩阵每行进行求和,得到rd∈Rm×1
d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度为95%,对rd进行升序排序后,将rd第95%个位置所对应的值作为r∈R;
e)参照式(5)和式(6)计算4-a)中所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000381
特征向量矩阵为
Figure BDA0003463227610000382
f)利用4-d)中r以及4-e)中D,按照公式(10)和公式(11)计算置信椭圆的长轴以及短轴:
Figure BDA0003463227610000383
Figure BDA0003463227610000384
其中,a为长轴,b为短轴;
g)以4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,置信椭圆的公式为:
Figure BDA0003463227610000385
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值,绘制的椭圆如图17所示。
5.不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域。如图18所示,根据硫磺回收过程的装置特性,对历史数据设置硫回收率最大的优化目标进行标签后,进行相应优化目标变量折线绘制,从中选出装置的优化运行区域(硫回收率>99.5%)。将历史数据的得分矩阵的前两列进行投影,通过不同区域数据点所带的标签对置信椭圆进行划分,并以不同颜色进行区分。图19给出了本实施例的置信椭圆区域划分结果,绿色(浅色)点所在区域为追求硫回收率最高的生产模式对应的区域。
6.将硫磺回收装置在正常工况下运行一段时间后,通过调整操作变量中制硫炉温度使过程偏离正常状态,并收集数据得到Y∈RN×n,对所采集的数据运用步骤(2)所得的训练数据的平均值和标准差进行归一化处理得到Ym∈RN×n
7.按照公式(13)将Ym乘以3-d)所得负载矩阵P的前两列,得到scorey:
scorey=Ym×[p1,p2] (13)
8.将scorey中每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内;
9.设故障数据点为x∈R1×n,根据公式(14)计算故障数据点的SPE贡献率:
Figure BDA0003463227610000386
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000391
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量,SPE贡献率如图20所示。根据图20可以判定故障产生的原因主要是由第11个变量(即制硫炉温度)起主要作用,与实际操作情况相符。
10.根据负载矩阵P的第一列中绝对值最大的制硫炉温度变量,通过调整该变量所对应的值,对硫磺回收过程的生产状态进行调整,并通过实时监控可以观察数据是否往期望的区域移动,从而使硫磺回收装置运行状态回到优化运行状态,调整轨迹如图21所示。图21中,绿色(浅色)点所在区域对应于优化运行状态。
实施例4
本实施例以170万吨/年的渣油加氢处理装置为识别和优化对象,采集2018年5月1日至2019年5月1日的历史生产数据,并剔除异常波动数据。经筛选处理后,将数据整理为85变量3925组。表6列出了本实施例涉及的变量。
表6:实施例4涉及的变量
Figure BDA0003463227610000392
Figure BDA0003463227610000401
采用本发明的基于数据驱动的渣油加氢处理装置运行状态识别及优化方法对该渣油加氢处理装置的运行状态进行识别和优化,如图22所示,包括以下步骤:
1.采集渣油加氢处理装置实际生产历史数据。利用渣油加氢处理装置正常运行状态下大量数据组合构建样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,zi=[z1i,z2i,...,zmi]T代表第i个测量变量的m个样本。
2.按照公式(1)对样本集数据进行标准化处理,得到均值为0、方差为1的标准化处理后的数据集X=[x1,x2,...,xn]∈Rm×n
Figure BDA0003463227610000411
式中,μ为训练数据的均值,其计算公式为:
Figure BDA0003463227610000412
σ为训练数据的标准差,其计算公式为:
Figure BDA0003463227610000413
3.按如下步骤进行对经过标准化处理后的数据集X运用主元分析法进行降维:
a)根据公式(4)计算矩阵X的协方差矩阵:
Figure BDA0003463227610000414
其中,X是m×n的矩阵,m是训练样本个数,n是特征个数,T表示转置,因此协方差矩阵C是一个n×n维的矩阵;
b)根据公式(5)和公式(6)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵;
特征值矩阵:
Figure BDA0003463227610000415
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
c)按照将最大的方差归纳到模型空间、将最小的方差留给噪声空间的原则选取主元个数k,其计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000416
最大的k个主元包括的信息比:
Figure BDA0003463227610000421
d)保留与k个最大特征值相对应的k个特征向量,得到负载矩阵P=[p1,p2,p3,...p,k]∈Rn×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
其本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用该矩阵具体绘制置信度为95%的置信椭圆的步骤如下:
a)参照公式(4)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
b)计算xdat每一列的平均值得xm∈R1×2,并将每一行的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
c)计算公式xd×s·×xd,并将所得矩阵每行进行求和,得到rd∈Rm×1
d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度为95%,对rd进行升序排序后,将rd第95%个位置所对应的值作为r∈R;
e)参照式(5)和式(6)计算4-a)中所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000422
特征向量矩阵为
Figure BDA0003463227610000423
f)利用4-d)中的r以及4-e)中的D,按照公式(10)和公式(11)计算置信椭圆的长轴以及短轴:
Figure BDA0003463227610000424
Figure BDA0003463227610000425
其中,a为长轴,b为短轴;
g)以4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,置信椭圆的公式为:
Figure BDA0003463227610000426
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值,绘制的椭圆如图23所示。
5.不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域。如图24所示,根据渣油加氢处理过程的不同性能指标,将历史数据设置以加氢重油收率最大为目标的模式、以装置效益最大为目标的模式和以自装置外来新氢体积流量最小为目标分为三种模式。通过将历史数据的得分矩阵的前两列进行投影,通过不同区域数据点所带的标签对置信椭圆进行划分。图25中绿色(浅色)点代表注重加氢重油收率的生产样本对应的优化区域数据在置信椭圆上的投影位置,这些位置即为以加氢重油收率最大为目标的模式所对应的优化区域。
6.待渣油加氢处理装置在正常工况下运行一段时间后,通过调整操作变量中罐区冷渣流量使过程偏离正常状态,并收集数据得到Y∈RN×n,对所采集的数据运用根据训练数据计算所得的平均值和标准差进行归一化处理得到Ym∈RN×n
7.按照公式(13)将Ym乘以3-d)所得负载矩阵P的前两列,得到scorey:
scorey=Ym×[p1,p2] (13)
8.将scorey中每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内;
9.设故障数据点为x∈R1×n,根据公式(14)计算故障数据点的SPE贡献率:
Figure BDA0003463227610000431
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000432
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量,SPE贡献率如图26所示。根据图26可以判定故障产生的原因主要是由第20个变量(即罐区冷渣流量)起主要作用,与实际操作情况相符。
10.根据负载矩阵P的第一列中绝对值最大的罐区冷渣流量变量,通过调整该变量所对应的值,可以对渣油加氢处理过程的生产状态进行调整,并通过实时监控可以观察数据是否往期望的区域移动,从而使装置运行状态回到优化运行状态,调整轨迹见图27中的浅色点。
实施例5
本实施例中,基于大数据的常减压过程模式监控和优化方法被应用于某炼油厂的常减压实际工艺过程中。图28给出了常减压的工艺过程流程简图。常减压工艺过程分为五个部分,分别是电脱盐部分、初馏部分、常压部分、减压部分、轻烃回收部分,其中最重要的是初馏、常压和减压这三个部分。原油初馏主要为了拔出部分轻馏分,为后续常减压装置分担一定的装置压力,能够降低整套常减压装置的能耗。常压蒸馏装置的主要作用则是拔出沸点较低的石脑油以及煤油和柴油等馏分。从常压塔底馏出的较为重质的常压渣油,会被送至减压塔进行减压蒸馏,分离出润滑油、蜡油、沥青等二次加工的原料。减压塔底馏出的减压渣油会被送往催化裂化、延迟焦化等装置进行深加工。
常减压模型包括60个输入变量和20个输出变量。其中输入变量包括52组装置操作变量和8组原料性质变量。通过对输入变量进行控制可以得到不同运行状态的CDU模型,其中对输出结果影响较大的输入变量有反应温度、压力、进料性质等,产物的性能指标主要通过观察输出变量来进行判断。如在以总拔收率为目标的生产模式中,总拔收率主要由石脑油、常一线、柴油、蜡油和减四线的收率共同组合,而这些收率的计算可以通过输出变量中的气体质量流量、初顶油出装置流量、常顶油出装置流量、常一线抽出流量、常二线抽出流量、常三线抽出流量、减一线抽出流量、冷蜡油抽出流量、去I催蜡油流量、去Ⅱ催蜡油流量、减四线抽出流量、渣油抽出流量来进行计算。表7列出了本实施例涉及的所有操作变量和原料性质变量。
表7:实施例5涉及的操作变量
Figure BDA0003463227610000441
Figure BDA0003463227610000451
采用本发明的基于大数据的常减压过程模式监控和优化方法对该常减压过程进行模式监控和优化,如图29所示,包括以下步骤:
1.采集一段时间CDU过程正常运行状态下的样本数据Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,zi=[z1i,z2i,...,zmi]T代表第i个测量变量的m个样本;
2.按照公式(1)对采集的数据进行预处理,得到均值为0、方差为1的标准数据集X=[x1,x2,...,xn]∈Rm×n
Figure BDA0003463227610000452
式中,μ为采集的数据的均值,其计算公式为:
Figure BDA0003463227610000453
σ为采集的数据的标准差,其计算公式为:
Figure BDA0003463227610000454
3.按如下步骤进行对经过标准数据集X运用主元分析法进行降维:
a)根据公式(4)计算矩阵X的协方差矩阵:
Figure BDA0003463227610000455
其中,X是m×n的矩阵,m是训练样本个数,n是特征个数,T表示转置,因此协方差矩阵C是一个n×n维的矩阵;
b)根据公式(5)和公式(6)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵;
得到特征值矩阵:
Figure BDA0003463227610000456
其中λ1>λ2>...>λn
得到特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
c)选取主元个数原则:将最大的方差归纳到模型空间,将最小的方差留给噪声空间,计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000461
最大的k个主元包括的信息比:
Figure BDA0003463227610000462
d)保留与k个最大特征值相对应的k个特征向量,得到负载矩阵P=[p1,p2,p3,...p,k]∈Rn×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
其本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用该矩阵具体绘制置信度为95%的置信椭圆的步骤如下:
a)参照公式(4)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
b)计算xdat每一列的平均值得xm∈R1×2,并将每一行的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
c)计算公式xd×s·×xd,并将所得矩阵每行进行求和,得到rd∈Rm×1
d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度为95%,对rd进行升序排序后,将rd第95%个位置所对应的值作为r∈R;
e)参照式(5)和式(6)计算4-a)中所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000463
特征向量矩阵为
Figure BDA0003463227610000464
f)利用4-d)中的r以及4-e)中的D,按照公式(10)和公式(11)计算置信椭圆的长轴以及短轴:
Figure BDA0003463227610000465
Figure BDA0003463227610000466
其中,a为长轴,b为短轴;
g)以4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,置信椭圆的公式为:
Figure BDA0003463227610000471
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值,绘制的椭圆如图30所示。
5.不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域,根据CDU过程的性能指标,对历史数据设置不同的标签,将历史数据的得分矩阵的前两列进行投影,可以通过不同区域数据点所带的标签对置信椭圆进行划分,并以不同颜色进行框定,图31、图32和图33分别示出了对应以能耗为优化目标的模式、以轻收调优为目标的模式和以总拔为优化目标的模式的划分区间。图中框选出的区域分别对应能耗最低的50%数据点,轻收最高的50%数据点和总拔最高的50%数据点。
6.将CDU过程在正常工况下运行一段时间后,通过调整操作变量初馏塔顶压力的值使过程偏离正常状态,并收集数据得到Y∈RN×n,对所采集的数据运用步骤(2)计算所得的平均值和标准差进行归一化处理得到Ym∈RN×n
7.按照公式(13)将Ym乘以3-d)所得负载矩阵P的前两列,得到scorey:
scorey=Ym×[p1,p2] (13)
8.将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内,如图34所示。
9.设故障数据点为x∈R1×n,根据公式(14)计算故障数据点的SPE贡献率:
Figure BDA0003463227610000472
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000473
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量,SPE贡献率如图35所示。根据图35可以判定故障产生的原因主要是由第3个变量(即初馏塔顶压力)起主要作用,与实际操作情况相符(其中变量1为原料性质变量,在实际操作中难以直接调整)。
实施例6
本实施例中,基于大数据的加氢裂化过程模式识别和优化方法被应用于国内某炼油企业加氢裂化(HCR)工艺过程中。图36给出了加氢裂化的工艺过程流程图。加氢裂化工艺过程由加氢精制、加氢裂化和分馏部分组成。在单段串联工艺中,原料油和循环氢分别达到加氢加压反应条件后混合进入加氢精制反应器,在加氢精制催化剂的作用下进行脱硫、脱氮、脱氧和部分脱芳烃反应。精制反应产物经注冷氢调整至裂化反应所需温度后进入加氢裂化反应器进行裂化反应,将重质馏分油转化为轻质馏分油。反应产物在冷高压分离器中进行气、油、水三相分离,经过循环氢脱硫塔脱硫后送至低压分离器,闪蒸出低分气体。低分油经换热进入脱丁烷塔,塔顶分离出含硫气体和轻烃,塔底油进入产品分离塔进行产品分离,分离出轻重石脑油、航煤、柴油和尾油等产品。
HCR模型包括32个输入变量和24个输出变量。通过对输入变量进行控制可以得到不同运行状态的HCR模型,其中对输出结果影响较大的输入变量有氢油比、反应温度、压力、进料流量和进料性质等,产物的性能指标主要通过观察输出变量中的干气、液化气、轻端、轻石脑油、重石脑油、航煤、柴油和尾油出装置的量来进行判断。表8给出了本实施例的HCR模型的操作变量。
表8:HCR模型的操作变量
变量 描述 单位 变量 描述 单位
1 罐区轻蜡油流量 tonne/h 17 原料油硫含量
2 常减压蜡油总流量 tonne/h 18 原料油氮含量 ppmwt
3 催化柴油累计流量 tonne/h 19 原料油碱性氮 ppmwt
4 循环尾油质量流量 tonne/h 20 原料油初馏点 C
5 新氢流量 STD_m3/h 21 原料油10%回收温度 C
6 供吹扫循环氢流量 STD_m3/h 22 原料油50%回收温度 C
7 氢油比 23 原料油90%回收温度 C
8 R101一床层入口温度 C 24 原料油终馏点 C
9 R101二床层入口温度 C 25 轻柴油密度(20℃)
10 R101三床层入口温度 C 26 轻柴油硫含量
11 R102一床层入口温度 C 27 轻柴油初馏点 C
12 R102二床层入口温度 C 28 轻柴油10%回收温度 C
13 R102三床层入口温度 C 29 轻柴油50%回收温度 C
14 R102四床层入口温度 C 30 轻柴油90%回收温度 C
15 R101塔顶压力 MPa 31 轻柴油95%回收温度 C
16 原料油密度(20℃) 32 新氢氢气
采用本发明的基于大数据的加氢裂化过程模式识别和优化方法对该加氢裂化过程进行模式识别和优化,如图37所示,包括以下步骤:
1.采集一段时间HCR过程正常运行状态下的样本数据Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,zi=[z1i,z2i,...,zmi]T代表第i个测量变量的m个样本;
2.对采集的数据进行预处理,得到均值为0、方差为1的标准数据集X=[x1,x2,...,xn]∈Rm×n,计算公式为:
Figure BDA0003463227610000491
式中,μ为采集的数据的均值,其计算公式为:
Figure BDA0003463227610000492
σ为采集的数据的标准差,其计算公式为:
Figure BDA0003463227610000493
3.对标准数据集X运用主元分析法进行降维,按如下步骤进行:
a)根据公式(4)计算矩阵X的协方差矩阵:
Figure BDA0003463227610000494
其中,X是m×n的矩阵,m是训练样本个数,n是特征个数,T表示转置,因此协方差矩阵C是一个n×n维的矩阵;
b)根据公式(5)和公式(6)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵;
得到特征值矩阵:
Figure BDA0003463227610000495
其中λ1>λ2>...>λn
得到特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
c)选取主元个数原则:将最大的方差归纳到模型空间,将最小的方差留给噪声空间,计算公式为:
每个主元包括信息比:
Figure BDA0003463227610000496
最大的k个主元包括的信息比:
Figure BDA0003463227610000501
d)保留与k个最大特征值相对应的k个特征向量,得到负载矩阵P=[p1,p2,p3,...p,k]∈Rn×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
其本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用该矩阵具体绘制置信度为95%的置信椭圆的步骤如下:
a)参照公式(4)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
b)计算xdat每一列的平均值得xm∈R1×2,并将每一行的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
c)计算公式xd×s·×xd,并将所得矩阵每行进行求和,得到rd∈Rm×1
d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度为95%,对rd进行升序排序后,将rd第95%个位置所对应的值作为r∈R;
e)参照式(5)和式(6)计算4-a)中所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure BDA0003463227610000502
特征向量矩阵为
Figure BDA0003463227610000503
f)利用4-d)中的r以及4-e)中的D,按照公式(10)和公式(11)计算置信椭圆的长轴以及短轴:
Figure BDA0003463227610000504
Figure BDA0003463227610000505
其中,a为长轴,b为短轴;
g)以4-b)中xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,置信椭圆的公式为:
Figure BDA0003463227610000506
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值,绘制的椭圆如图38所示。
5.不同生产模式下的数据在置信椭圆中的投影会分布在不同的区域,根据HCR过程的性能指标,对历史数据设置不同的标签,将历史数据的得分矩阵的前两列进行投影,可以通过不同区域数据点所带的标签对置信椭圆进行划分,并以不同颜色进行框定,图39、图40和图41分别示出了对应以总液收为优化目标的模式、以中间油收率为目标的模式和以价值增量为优化目标的模式的划分区间。其中,红色大框为按对应目标选取的前10%数据点,红色小框为前5%数据点。
6.将HCR过程在正常工况下运行一段时间后,通过调整操作变量氢油比的值使过程偏离正常状态,并收集数据得到Y∈RN×n,对所采集的数据运用步骤(2)计算所得的平均值和标准差进行归一化处理得到Ym∈RN×n
7.将Ym乘以3-d)所得负载矩阵P的前两列得到scorey,计算公式为:
scorey=Ym×[p1,p2] (13)
8.将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内,如图42所示。
9.设故障数据点为x∈R1×n,根据公式(14)计算故障数据点的SPE贡献率:
Figure BDA0003463227610000511
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure BDA0003463227610000512
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量,SPE贡献率如图43所示。根据图43可以判定故障产生的原因主要是由第1个变量(即氢油比)起主要作用,与实际操作情况相符。

Claims (12)

1.一种基于大数据的炼油过程模式识别及优化方法,其特征在于,所述方法包括以下步骤:
(1)将炼油过程中所采集到的历史数据组成建模用的训练样本集Z=[z1,z2,...,zi,...,zn]∈Rm×n,其中,m为样本集的样本个数,n为样本集的变量个数;
(2)对训练样本集进行预处理,得到均值为0、方差为1的标准化数据X=[x1,x2,...,xn]∈Rm×n
(3)对X运用主元分析法将其从n维降到k维,并得到得分矩阵T∈Rm×k和负载矩阵P∈Rn ×k
(4)利用得分矩阵T的前两列,绘制二维置信椭圆;
(5)采集新的在线实时数据Y∈RN×n,采用步骤(2)对训练样本集进行预处理时所得到的样本平均值和样本方差对Y进行预处理得到标准化数据Ym∈RN×n
(6)将Ym乘以步骤(3)所得的负载矩阵P的前两列,得到Ym根据训练样本所得的前两列得分矩阵scorey∈RN×2
(7)以scorey的第一列作为x轴的数据,以scorey的第二列作为y轴的数据,将scorey映射到步骤(4)所绘制的置信椭圆上;若样本点映射到椭圆内,则说明此时炼油过程所处的工况为正常工况;若样本点映射到椭圆外,则说明此时炼油过程存在异常;
(8)利用主成分分析过程中得到的标准差和均值求得置信椭圆中的点对应的原始变量,从而得到该点对应的效益值;在置信椭圆中区分效益值高低的分布;当工况运行模式位于置信椭圆中的某一点时,采用路径优化算法,获得当前位置向最优位置最快移动轨迹,将轨迹对应的点进行反变换,获得操作条件的改变方式,从而指导生产装置操作优化;其中,所述路径优化算法采用改进的A*算法,通过如式(17)所示的改进的评估函数来确定搜索方向和下一个到达的节点:
Figure FDA0003463227600000011
其中,g(x)是代价函数,代表从起始节点到达当前节点x的实际所需代价;h(x)是启发式函数,代表从当前节点x到达目标节点估计所需的代价;profit(x)表示所选节点对应的经济效益。
2.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(2)中,所述的预处理方法采用Z-score标准化方法,计算公式为:
Figure FDA0003463227600000021
式中,Z=[z1,z2,...,zm]为训练数据矩阵,X表示标准化后的数据矩阵,μ为训练数据的均值,σ为训练数据的标准差,μ和σ计算公式为:
Figure FDA0003463227600000022
Figure FDA0003463227600000023
3.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(3)中,对经过预处理所得到的X运用主元分析法进行降维处理,具体按如下步骤进行:
(3-a)计算矩阵X的协方差矩阵,协方差矩阵的计算公式为:
Figure FDA0003463227600000024
X是m×n的矩阵,m是训练样本个数,n是特征个数,T表示转置,所以得到的协方差矩阵C是一个n×n维的矩阵;
(3-b)计算协方差矩阵C的特征值λi和特征向量pi,并按特征值降序排序,计算公式为:
det(C-Iλ)=0 (5)
Cpi=λipi (6)
式(5)中,I为单位矩阵,得:
特征值矩阵:
Figure FDA0003463227600000025
其中λ1>λ2>...>λn
特征向量:V=[p1,p2,p3,...,pn]∈Rn×n
(3-c)建立主元模型,计算公式为:
计算每个主元包括信息比:
Figure FDA0003463227600000031
计算最大的k个主元包括的信息比:
Figure FDA0003463227600000032
(3-d)保留对应k个最大特征值的特征向量,得到负载矩阵P=[p1,p2,p3,...,pk]∈Rn ×k,得分矩阵的计算公式为:
ti=Xpi,i=1,2,...,k (9)
ti的本质是X向量在pi方向上的投影,得分矩阵T=[t1,t2,...,tk]∈Rm×k
4.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(4)中,令得分矩阵T的前两列为xdat=[t1,t2]∈Rm×2,利用矩阵xdat具体绘制置信椭圆的步骤如下:
(4-a)计算xdat的协方差矩阵,并对协方差矩阵求逆,得s∈R2×2
(4-b)计算xdat每一列的平均值得xm∈R1×2,并将xdat每一列的数值减去对应的平均值进行中心化处理,得到xd∈Rm×2
(4-c)计算公式xd×s·×xd,并对所得矩阵每行进行求和,得到rd∈Rm×1
(4-d)绘制xdat的曲线图,根据xdat呈经验分布的特点,计算矩阵rd的百分位数,根据所要绘制的置信椭圆的置信度Ci,对rd进行升序排序后,得到rd第Ci个位置所对应的值r∈R,优选的Ci为95%;
(4-e)计算步骤(4-a)所得矩阵s的特征值和对应的特征向量,得特征值矩阵为
Figure FDA0003463227600000033
特征向量矩阵为
Figure FDA0003463227600000034
(4-f)利用步骤(4-d)中的r以及步骤(4-e)中的D,即可得到置信椭圆的长轴以及短轴,计算公式为:
Figure FDA0003463227600000035
Figure FDA0003463227600000036
其中,a为长轴,b为短轴;
(4-g)以步骤(4-b)中的xm为椭圆的中心点,根据中心点以及椭圆的长轴和短轴绘制置信椭圆,椭圆的公式为:
Figure FDA0003463227600000037
其中,xm1为xdat第一列的平均值,xm2为xdat第二列的平均值。
5.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(6)中,scorey的计算公式为:
scorey=Ym×[p1,p2] (13)
式中,[p1,p2]∈Rn×2是负载矩阵P的前两列。
6.如权利要求4所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(7)中,将scorey中的每一组数据代入公式(12)中与数值1进行比较,若大于1,则表示该组数据映射在椭圆外,若小于等于1,则表示该组数据映射在椭圆内。
7.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(7)还包括将收集到的正常工况下的数据加入到历史数据重新建模。
8.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(7)还包括对异常数据计算SPE贡献率来进行故障溯源;
优选地,采用如下方法对异常数据计算SPE贡献率来进行故障溯源:
假设异常数据为x∈R1×n,其SPE贡献率的计算公式为:
Figure FDA0003463227600000041
其中,contspe(i)表示第i个变量所对应的SPE贡献,ξi表示n维单位矩阵的第i列,T表示转置,
Figure FDA0003463227600000042
I为单位矩阵,P为训练样本所得负载矩阵,n为变量数,所求的SPE贡献率最大的变量即为发生故障的变量。
9.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(4)还包括:将历史数据结合现场工艺知识对所绘制的置信椭圆进行插旗处理实现对不同性能等级数据的区域划分,所述区域划分优选包括:首先根据工艺知识和历史效益统计数据,根据时间序列找到工况对应的效益,根据效益高低进行不同等级的划分,再找到各个等级所对应的历史数据在椭圆中的分布并加以不同的标记;或者,步骤(4)还包括:根据炼油过程的性能指标,对不同性能等级的历史数据设置不同的标签,将历史数据的得分矩阵的前两列投影到置信椭圆上,通过不同区域数据点所带的标签对置信椭圆进行划分。
10.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(7)还包括:对于映射在椭圆内部的样本,根据其所处位置结合步骤(4)中对椭圆进行的区域划分判断当前所处的性能等级,若其处于非最优的性能等级,则通过调整关键变量使其转换到所期望的更优的性能等级;优选地,将主元中所对应的系数最大的变量设定为优化时所要调整的关键变量,然后根据关键变量与在线数据在置信椭圆中的投影点位置变化之间的相关性,确定调整方向,实现对生产过程的优化;优选地,关键变量为负载矩阵P的第一列中绝对值最大的变量,通过调整该变量所对应的值,对炼油过程的生产模式进行调整,并通过实时监控观察数据是否往所期望的区域移动。
11.如权利要求1所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,步骤(8)中,利用公式(15)计算原始变量Xori
Xori=(defen×PCT)·×std(Xm)+mean(Xm) (15)
其中,defen=(x,y)∈R1×2为置信椭圆中的点的横纵坐标,PC=[p1,p2]∈RJ×2为主成分分析建模时负载矩阵的前两列,std(Xm)为主成分分析采用的基础样本的方差,mean(Xm)为主成分分析采用的基础样本的均值,m为样本个数,Xori为椭圆中defen=(x,y)∈R1×2位置对应的反变换后的原始变量;
根据公式(16)计算投入产出效益指标:
Figure FDA0003463227600000051
其中,
Figure FDA0003463227600000052
为第i种产品的产量,
Figure FDA0003463227600000053
为第i种产品的价格,
Figure FDA0003463227600000054
为第i种原料的投料量,
Figure FDA0003463227600000055
为第i种原料的价格,profit为效益指标。
12.如权利要求11所述的基于大数据的炼油过程模式识别及优化方法,其特征在于,所述炼油过程为催化重整过程、催化裂化过程、硫磺回收过程、渣油加氢过程、常减压过程或加氢裂化过程。
CN202210022589.XA 2022-01-10 2022-01-10 一种基于大数据的炼油过程模式识别及优化方法 Pending CN114239321A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210022589.XA CN114239321A (zh) 2022-01-10 2022-01-10 一种基于大数据的炼油过程模式识别及优化方法
PCT/CN2023/070795 WO2023131257A1 (zh) 2022-01-10 2023-01-06 一种基于大数据的炼油过程模式识别及优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210022589.XA CN114239321A (zh) 2022-01-10 2022-01-10 一种基于大数据的炼油过程模式识别及优化方法

Publications (1)

Publication Number Publication Date
CN114239321A true CN114239321A (zh) 2022-03-25

Family

ID=80746302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210022589.XA Pending CN114239321A (zh) 2022-01-10 2022-01-10 一种基于大数据的炼油过程模式识别及优化方法

Country Status (2)

Country Link
CN (1) CN114239321A (zh)
WO (1) WO2023131257A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023131257A1 (zh) * 2022-01-10 2023-07-13 华东理工大学 一种基于大数据的炼油过程模式识别及优化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116664018B (zh) * 2023-07-28 2023-10-31 华能济南黄台发电有限公司 一种发电厂设备运行状态评价平台
CN117831659B (zh) * 2024-03-04 2024-05-03 山东钢铁股份有限公司 宽厚板质量在线检测的方法、装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10176802B1 (en) * 2016-03-21 2019-01-08 Amazon Technologies, Inc. Lattice encoding using recurrent neural networks
CN109062196B (zh) * 2018-10-31 2020-12-15 东北大学 一种集成pca-ica的高炉过程监测及故障诊断方法
CN110187990B (zh) * 2019-05-31 2021-11-16 东北大学 一种基于模式转移的虚拟机混合备用动态可靠性评估方法
CN111796576B (zh) * 2020-06-16 2023-03-31 北京工业大学 一种基于双核t分布随机近邻嵌入的过程监测可视化方法
CN113311803B (zh) * 2021-05-17 2022-05-17 北京航空航天大学 一种基于核主元分析的在轨航天器飞轮故障检测方法
CN114239321A (zh) * 2022-01-10 2022-03-25 华东理工大学 一种基于大数据的炼油过程模式识别及优化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023131257A1 (zh) * 2022-01-10 2023-07-13 华东理工大学 一种基于大数据的炼油过程模式识别及优化方法

Also Published As

Publication number Publication date
WO2023131257A1 (zh) 2023-07-13

Similar Documents

Publication Publication Date Title
CN114239321A (zh) 一种基于大数据的炼油过程模式识别及优化方法
CN104765346B (zh) 一种炼油过程全流程建模方法
CN109814513B (zh) 一种基于数据模型的催化裂化装置优化方法
CN110456756B (zh) 一种适用于连续生产过程全局运行状况在线评估的方法
CN103713604B (zh) 一种基于数据驱动的工业裂解炉实时操作优化与控制方法
CN106845796B (zh) 一种加氢裂化流程产品质量在线预测方法
CN106709654A (zh) 一种加氢裂化流程全局运行状况评估与质量追溯方法
CN104804761B (zh) 一种加氢裂化装置的收率实时预测方法
CN104484714B (zh) 一种催化重整装置收率的实时预测方法
CN103524284B (zh) 一种乙烯裂解原料配置的预测和优化方法
CN113724800A (zh) 一种基于分子级机理模型与大数据技术的催化裂化装置模拟预测方法
CN103927412A (zh) 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104789256A (zh) 一种催化裂化装置的收率实时预测方法
CN111598306B (zh) 一种炼油厂生产计划优化方法及装置
WO2023003609A1 (en) Predictive control systems and methods with hydrocracker conversion optimization
CN108446358B (zh) 基于miv与关联规则的优化方法及石化设备的数据建模方法
CN111475957A (zh) 一种基于装置机理的炼油过程生产计划优化方法
Yuan et al. A comparative study of adaptive soft sensors for quality prediction in an industrial refining hydrocracking process
CN115034465B (zh) 一种基于人工智能的焦炭质量预测方法
CN106202910A (zh) 一种渣油加氢处理装置的收率实时预测方法及其应用
CN101727609B (zh) 基于支持向量机的热裂解产物收率的预测方法
CN108287474B (zh) 基于原料不确定性的催化重整反应器鲁棒操作优化方法
CN110134088A (zh) 一种基于增量支持向量回归的自适应质量预报方法
CN115312130A (zh) 面向增产催化裂化高附加值产品模拟的混合建模方法
CN106597853A (zh) 一种加氢裂化流程中主动式动态调控方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination