CN113205121A - 一种基于局部特征异常因子的初馏塔采样数据粗差判别方法 - Google Patents
一种基于局部特征异常因子的初馏塔采样数据粗差判别方法 Download PDFInfo
- Publication number
- CN113205121A CN113205121A CN202110440193.2A CN202110440193A CN113205121A CN 113205121 A CN113205121 A CN 113205121A CN 202110440193 A CN202110440193 A CN 202110440193A CN 113205121 A CN113205121 A CN 113205121A
- Authority
- CN
- China
- Prior art keywords
- data
- vector
- sample data
- gross error
- primary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开一种基于局部特征异常因子的初馏塔采样数据粗差判别方法,通过设计一种局部特征异常因子来量化各个样本数据的异常程度,从而可以将局部特征异常因子较大的样本数据判别为粗差。本发明方法需要先通过为各个样本数据找到多个近邻样本数据,然后以近邻样本数据为参考数据集,通过优化得到能区分该样本数据与其近邻之间差异的局部特征,从而计算得到局部特征异常因子。本发明方法未曾涉及计算马氏距离,而是寻找各个样本数据的近邻样本数据,并通过变换向量最大化两者之间的差异,从而通过局部特征与原点之间的距离来判别各个样本是否为粗差。因此,本发明方法可同时给出样本数据是否为粗差数据及其采样数据集中有多少个粗差数据的判别。
Description
技术领域
本发明涉及一种采样数据粗差判别方法,特别涉及一种基于局部特征异常因子的初馏塔采样数据粗差判别方法。
背景技术
初馏塔是炼油厂常减压装置的龙头,其控制的好坏直接影响原油收率的提高和后续工序的操作稳定。初顶石脑油干点是初馏塔重要的控制指标,但该指标无合适的在线分析仪进行测定,只能离线分析且时间长。因此初顶石脑油干点软测量模型的建立可以为生产操作条件及时调整提供指导。而影响初顶石脑油干点的各个因素数据的准确性又直接关系到软测量模型的性能。因此确保这些数据的正确无误,去除采样数据中的粗差数据是非常重要的。
因测量仪表和计算机技术的广泛应用,初馏塔以及其他化工生产单元会每隔几分钟会采样并存储过程数据。在数据采集的过程中,因内在或外在因素导致采样数据存在较大的偏差,但是通过单个测量变量来看又在其允许的变化内。这些特殊的采样数据被称为粗差数据,采样数据中存在粗差数据会严重影响后续的基于数据的分析与建模,实际使用采样数据时是绝对不能采用粗差数据的。
在初馏塔生产运行过程中,能够影响初顶馏分干点的几个主要的测量变量包括:初馏塔处理量、塔顶温度、塔顶压力、顶回流带出能量、回流比、初顶石脑油流量、初顶循带出能量、初中段带出能量、及进料温度。由于生产过程积累了海量的、高维样本数据对所有数据逐个人为判断是否为粗差。然而,建立初顶馏分干点软测量模型时,又要求这些采样数据不能存在粗差数据。此外,初馏塔的采样数据中是否存在粗差数据,以及到底存在多少个粗差数据是无法预知和确认的,这给初馏塔采样数据粗差判别任务带来了严峻的挑战。
虽然现有科研文献与专利技术材料中,有不同种类的粗差判别方法技术。这些粗差判别方法要么依赖于平方马氏距离,要么依赖于计算采样数据的协方差矩阵。因此,若是采样数据之间线性相关性较强,其相应的协方差矩阵会存在不可逆的情况。而且,初馏塔采样数据运行的动态性,会导致采样数据分布情况复杂,不能简单的依靠马氏距离所定义的椭圆来一概而论。
发明内容
本发明所要解决的主要技术问题是:如何通过局部特征异常因子来判别出初馏塔采样数据中的粗差数据。具体来讲,本发明方法通过设计一种局部特征异常因子来量化各个样本数据的异常程度,从而可以将局部特征异常因子较大的样本数据判别为粗差。本发明方法涉及的局部特征异常因子,需要先通过为各个样本数据找到多个近邻样本数据,然后以近邻样本数据为参考数据集,通过优化得到能区分该样本数据与其近邻之间差异的判别型特征,从而计算得到局部特征异常因子。
本发明方法解决上述问题所采用的技术方案为:一种基于局部特征异常因子的初馏塔采样数据粗差判别方法,包括以下所示步骤。
步骤(1):确定初馏塔中影响初顶馏分干点的9个变量,具体包括:初馏塔进料流量,进料温度,塔顶温度,塔顶压力,塔顶回流带出能量,回流比、初顶石脑油流量,初顶循带出能量,初中断带出能量;采集初馏塔这9个变量的N组样本数据x1,x2,…,xN,并将其组成为一个N×9维的数据矩阵X∈RN×9;其中,RN×9表示N×9维的实数矩阵,R表示实数集,xi∈R1×9表示第i个样本数据,R1×9表示1×9维的实数向量,i∈{1,2,…,N}。
步骤(2):根据公式分别为数据矩阵X中的列向量z1,z2,…,z9实施抗差标准化处理,得到抗差标准化处理后的数据矩阵其中,zk和分别表示X和中第k列的列向量,k∈{1,2,…,9}表示变量的序号,μ(zk)表示计算列向量zk中所有元素的中位数,表示计算列向量zk中所有元素的中位绝对差,列向量表示计算列向量中所有元素的中位数,|zk-μ(zk)|表示计算zk-μ(zk)的绝对值。
步骤(3):按照如下所示步骤(3.1)至步骤(3.5)依次计算当i分别等于1,2,…,N时的局部特征异常因子L1,L2,…,LN。
步骤(3.5):判断是否满足i<N;若是,则设置i=i+1后返回步骤(3.2);若否,则得到N个局部特征异常因子L1,L2,…,LN。
步骤(4):计算N个局部特征异常因子L1,L2,…,LN的中位数μ(L)以及中位绝对差δ(L)后,再确定局部特征异常因子的变化上限Llim=μ(L)+3×δ(L);其中,L=[L1,L2,…,LN]。
步骤(5):根据如下所示步骤(5.1)至步骤(5.3)逐个判别初馏塔采样数据中的粗差数据。
步骤(5.1):初始化i=1。
步骤(5.2):判断是否满足条件Li>Llim;若是,则将第i个样本数据xi判别为粗差数据;若否,则第i个样本数据不是粗差数据。
步骤(5.3):判断是否满足i<N;若是,则设置i=i+1后返回步骤(5.2);若否,则结束初馏塔采样数据的粗差判别。
值得说明的是,上述步骤(3.3)求解广义特征值问题的实施过程实际上是为寻找到能最大化程度区分与其近邻组成的参考矩阵之间差异的变换向量wi。为了最大化程度的实现区分,需要通过寻找变换向量wi,将相应的行向量xi及其参考矩阵经过wi变换后的局部特征从距离上最大化的分开来,即可得到如下所示的最大问题:
上式①通过将参考矩阵对应的特征向量约束成单位长度的向量,并同时最大化经wi变换后的局部特征与原点之间的距离。上式①的求解可使用经典的朗格朗日乘子法,即通过拉格朗日乘子λi构造如下所示的朗格朗日函数J。
在本发明方法的实施步骤(3.3)中,先通过求解广义特征值问题的特征向量pi后,再计算变换向量wi=pi/||pi||。不仅完成了在线特征分析技术所涉及的广义特征问题的求解,而且还进一步将变换向量wi归一化成单位长度。
通过以上所述实施步骤,本发明方法的优势介绍如下。
本发明方法未曾涉及计算马氏距离,而是寻找各个样本数据的近邻样本数据,并通过变换向量最大化两者之间的差异,从而通过局部特征与原点之间的距离来判别各个样本是否为粗差。从这个角度上看,本发明方法避免了协方差矩阵不可逆的问题,并同时给出样本数据是否为粗差数据及其采样数据集中有多少个粗差数据的判别。
附图说明
图1为本发明方法的实施流程示意图。
图2为粗差识别可视化图像。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
如图1所示,本发明公开了一种基于局部特征异常因子的初馏塔采样数据粗差判别方法。下面结合一个具体应用实例来说明本发明方法的具体实施方式。
采集某炼油厂常减压装置初馏塔中能影响初顶馏分干点的9个变量的200组样本数据,即N=200。这200组样本数据中是否存在粗差数据,以及存在几个粗差数据是未知的。通过本发明方法实施粗差判别。
步骤(1):确定初馏塔中影响初顶馏分干点的9个变量,具体包括:初馏塔进料流量,进料温度,塔顶温度,塔顶压力,塔顶回流带出能量,回流比、初顶石脑油流量,初顶循带出能量,初中断带出能量;采集初馏塔这9个变量的N组样本数据x1,x2,…,xN,并将其组成为一个N×9维的数据矩阵X∈RN×9。
步骤(3):按照如下所示步骤(3.1)至步骤(3.5)依次计算当i分别等于1,2,…,N时的局部特征异常因子L1,L2,…,LN。
步骤(3.2):根据公式计算行向量与数据矩阵中其它行的行向量之间的平方距离,并将中与之间平方距离最小的C个行向量组成参考矩阵其中,表示数据矩阵中第j行的行向量,j∈{1,2,…,N}且j≠i,上标号T为矩阵或向量的转置符号。
步骤(3.5):判断是否满足i<N;若是,则设置i=i+1后返回步骤(3.2);若否,则得到N个局部特征异常因子L1,L2,…,LN。
步骤(4):计算N个局部特征异常因子L1,L2,…,LN的中位数μ(L)以及中位绝对差δ(L)后,再确定局部特征异常因子的变化上限Llim=μ(L)+3×δ(L);其中,L=[L1,L2,…,LN]。
步骤(5):根据如下所示步骤(5.1)至步骤(5.3)逐个判别初馏塔采样数据中的粗差数据。
步骤(5.1):初始化i=1。
步骤(5.2):判断是否满足条件Li>Llim;若是,则将第i个样本数据xi判别为粗差数据;若否,则第i个样本数据不是粗差数据。
步骤(5.3):判断是否满足i<N;若是,则设置i=i+1后返回步骤(5.2);若否,则结束初馏塔采样数据的粗差判别。
将得到的200个局部特征异常因子L1,L2,…,L200以及变化上限Llim绘制于图2中。在图2中,横线表示局部特征异常因子的变化上限Llim,根据步骤(5)可知超出变化上限的样本数据即为粗差数据。因此,从图2中可以发现,哪几个样本数据通过本发明方法判别为粗差。
Claims (1)
1.一种基于局部特征异常因子的初馏塔采样数据粗差判别方法,其特征在于,具体包括以下所示步骤:
步骤(1):确定初馏塔中影响初顶馏分干点的9个变量,具体包括:初馏塔进料流量,进料温度,塔顶温度,塔顶压力,塔顶回流带出能量,回流比、初顶石脑油流量,初顶循带出能量,初中断带出能量;采集初馏塔这9个变量的N组样本数据x1,x2,…,xN,并将其组成为一个N×9维的数据矩阵X∈RN×9;其中,RN×9表示N×9维的实数矩阵,R表示实数集,xi∈R1×9表示第i组样本数据,R1×9表示1×9维的实数向量,i∈{1,2,…,N};
步骤(2):根据公式分别为数据矩阵X中的列向量z1,z2,…,z9实施抗差标准化处理,得到抗差标准化处理后的数据矩阵其中,zk和分别表示X和中第k列的列向量,k∈{1,2,…,9}表示变量的序号,μ(zk)表示计算列向量zk中所有元素的中位数,中位绝对差表示计算列向量中所有元素的中位数,|zk-μ(zk)|表示计算zk-μ(zk)的绝对值;
步骤(3):按照如下所示步骤(3.1)至步骤(3.5)依次计算当i分别等于1,2,…,N时的局部特征异常因子L1,L2,…,LN;
步骤(3.5):判断是否满足i<N;若是,则设置i=i+1后返回步骤(3.2);若否,则得到N个局部特征异常因子L1,L2,…,LN;
步骤(4):计算N个局部特征异常因子L1,L2,…,LN的中位数μ(L)以及中位绝对差δ(L)后,再确定局部特征异常因子的变化上限Llim=μ(L)+3×δ(L);其中,L=[L1,L2,…,LN];
步骤(5):根据如下所示步骤(5.1)至步骤(5.3)逐个判别初馏塔采样数据中的粗差数据;
步骤(5.1):初始化i=1;
步骤(5.2):判断是否满足条件Li>Llim;若是,则将第i个样本数据xi判别为粗差数据;若否,则第i个样本数据不是粗差数据;
步骤(5.3):判断是否满足i<N;若是,则设置i=i+1后返回步骤(5.2);若否,则结束初馏塔采样数据的粗差判别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110440193.2A CN113205121B (zh) | 2021-04-18 | 2021-04-18 | 一种基于局部特征异常因子的初馏塔采样数据粗差判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110440193.2A CN113205121B (zh) | 2021-04-18 | 2021-04-18 | 一种基于局部特征异常因子的初馏塔采样数据粗差判别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113205121A true CN113205121A (zh) | 2021-08-03 |
CN113205121B CN113205121B (zh) | 2023-10-03 |
Family
ID=77028036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110440193.2A Active CN113205121B (zh) | 2021-04-18 | 2021-04-18 | 一种基于局部特征异常因子的初馏塔采样数据粗差判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113205121B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201331A (zh) * | 2007-11-28 | 2008-06-18 | 华东理工大学 | 一种在线确定初馏塔顶石脑油质量指标的软测量方法 |
US20110022241A1 (en) * | 2009-07-23 | 2011-01-27 | Robert Higgins | Qualification system and method for chilled water plant operations |
CN103059954A (zh) * | 2011-10-21 | 2013-04-24 | 中国石油化工股份有限公司 | 一种降低催化裂化汽油硫含量的方法 |
CN109978059A (zh) * | 2019-03-28 | 2019-07-05 | 南京富岛信息工程有限公司 | 一种原油蒸馏过程初馏塔冲塔故障预警方法 |
-
2021
- 2021-04-18 CN CN202110440193.2A patent/CN113205121B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201331A (zh) * | 2007-11-28 | 2008-06-18 | 华东理工大学 | 一种在线确定初馏塔顶石脑油质量指标的软测量方法 |
US20110022241A1 (en) * | 2009-07-23 | 2011-01-27 | Robert Higgins | Qualification system and method for chilled water plant operations |
CN103059954A (zh) * | 2011-10-21 | 2013-04-24 | 中国石油化工股份有限公司 | 一种降低催化裂化汽油硫含量的方法 |
CN109978059A (zh) * | 2019-03-28 | 2019-07-05 | 南京富岛信息工程有限公司 | 一种原油蒸馏过程初馏塔冲塔故障预警方法 |
Non-Patent Citations (3)
Title |
---|
CHUANKUN LI等: "Research on the soft-sensing modeling method for the naphtha dry point of an atmospheric tower", 《2018 37TH CHINESE CONTROL CONFERENCE (CCC)》, pages 8060 - 8066 * |
刘桂英等: "常减压装置初馏塔顶产品干点软测量的应用研究", 《计算机与应用化学》, vol. 25, no. 5, pages 587 - 590 * |
颜学峰等: "基于SOM的高维化工过程数据粗差判别", 《油化工高等学校学报》, vol. 21, no. 04, pages 84 - 86 * |
Also Published As
Publication number | Publication date |
---|---|
CN113205121B (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108803520B (zh) | 一种基于变量非线性自相关性剔除的动态过程监测方法 | |
CN108062565B (zh) | 基于化工te过程的双主元-动态核主元分析故障诊断方法 | |
CN109389314B (zh) | 一种基于最优近邻成分分析的质量软测量与监测方法 | |
CN108508865B (zh) | 一种基于分散式osc-pls回归模型的故障检测方法 | |
CN108345284B (zh) | 一种基于两变量块的质量相关故障检测方法 | |
CN111914889A (zh) | 一种基于简略核主元分析的精馏塔异常状态识别方法 | |
CN114757269A (zh) | 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法 | |
CN105868164A (zh) | 一种基于有监督的线性动态系统模型的软测量建模方法 | |
CN111914887B (zh) | 一种新型多模态化工过程异常状态检测方法 | |
CN114936528A (zh) | 一种基于变量加权自适应局部构图的极限学习机半监督软测量建模方法 | |
CN111912638B (zh) | 一种在线故障根源识别的精馏塔故障诊断方法 | |
CN108572639B (zh) | 一种基于主成分自相关性剔除的动态过程监测方法 | |
CN116821695B (zh) | 一种半监督神经网络软测量建模方法 | |
CN111913415B (zh) | 一种基于时序数据分析的连续搅拌反应釜运行状态监测方法 | |
CN113205121A (zh) | 一种基于局部特征异常因子的初馏塔采样数据粗差判别方法 | |
Xu et al. | Similarity and sparsity collaborative embedding and its application to robust process monitoring | |
CN109214268B (zh) | 一种基于集成流形学习的填料塔液泛状态在线监测方法 | |
CN113033683B (zh) | 一种基于静态与动态联合分析的工业系统工况监测方法和系统 | |
CN111914214B (zh) | 一种基于缩减kpls模型的pta生产过程软测量方法 | |
CN114611606A (zh) | 基于核混合空间投影的故障检测方法 | |
CN108415372B (zh) | 精密机床热误差补偿方法 | |
CN112381145A (zh) | 基于最近相关谱聚类的高斯过程回归多模型融合建模方法 | |
CN113065583B (zh) | 一种基于在线非线性判别特征分析的精馏过程异常监测方法 | |
CN111914210B (zh) | 一种基于相关特征分析的复杂化工过程状态监测方法 | |
Haoguang et al. | Study on soft sensing technology of penicillin fermentation based on PLS and SVR |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |