CN116882140A - 结合在线更新策略的仪表校正软测量方法 - Google Patents
结合在线更新策略的仪表校正软测量方法 Download PDFInfo
- Publication number
- CN116882140A CN116882140A CN202310761851.7A CN202310761851A CN116882140A CN 116882140 A CN116882140 A CN 116882140A CN 202310761851 A CN202310761851 A CN 202310761851A CN 116882140 A CN116882140 A CN 116882140A
- Authority
- CN
- China
- Prior art keywords
- data
- variables
- formula
- instrument
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims abstract description 35
- 238000000691 measurement method Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000012544 monitoring process Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 26
- 230000002159 abnormal effect Effects 0.000 claims abstract description 20
- 238000005259 measurement Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000005192 partition Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000010238 partial least squares regression Methods 0.000 claims description 2
- 238000012824 chemical production Methods 0.000 abstract description 11
- 238000001311 chemical methods and process Methods 0.000 abstract description 10
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012628 principal component regression Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D18/00—Testing or calibrating apparatus or arrangements provided for in groups G01D1/00 - G01D15/00
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Hardware Design (AREA)
- Algebra (AREA)
- Geometry (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的结合在线更新策略的仪表校正软测量方法,重点考虑到了化工生产过程中数据非线性、共线性和多工况等特征,提高了数据校正的精度,提高了仪表监测的可靠性。能够及时、准确的监测化工过程仪表的异常情况,并且实时提供预测结果,为后续的化工过程监测系统提供可靠保障,同时为操作人员提供及时可靠的变量信息。
Description
技术领域
本发明属于煤化工中甲醇制烯烃(DMTO)工业过程的仪表监测和数据校正的软测量方法技术领域,具体涉及一种结合在线更新策略的仪表校正软测量方法。
背景技术
化工过程仪表技术在化工生产过程中起到至关重要的作用。它们用于监测和控制化工过程中的各种参数,如温度、压力、流量、液位等等。可以确保生产过程的安全性和稳定性。随着仪表技术的不断发展和DCS集散控制系统的广泛应用,从仪表采集到的数据均被储存下来。这些储存的仪表数据往往包含着丰富的过程历史信息。技术人员通过对这些数据进行研究和分析,可以监测工业生产的运行情况,这为数据驱动的化工过程监测方法提供了重要保障。
在化工生产过程中,存在一些关键的变量可以直接或者间接反映出生产系统的运行状态,因此这些变量对于操作人员判断生产装置的运行状况十分重要。但是受到测量手段或者仪表故障等因素的影响,某些关键变量可能出现无法获取或者数据异常等问题,会影响操作人员判断生产工况,进而影响到生产的稳定性。因此,采用软测量的技术方法可以通过提取历史数据中的关键变量与其他变量之间的关系,建立回归模型,从而实现对于关键变量的预测,避免了由于关键变量数据缺失或者数据异常等问题带来的影响。
化工过程中常见的仪表故障有以下四种:流量仪表故障、温度仪表故障、液位仪表故障和压力仪表故障。早期的仪表监测主要依靠维护工人的定期巡检,这就导致工厂无法及时获取仪表故障信息。随着如今化工生产的智能化和数字化,大量的测量仪表被布置在化工生产的各个流程中,基于仪表采集到的数据来判断仪表是否处于正常工作状态成为了主要的仪表监测方法。因此,基于仪表测量数据,采用基于过程经验和数据分析相结合的方法来进行仪表异常监测,并且根据化工过程的特点,选择适当的仪表软测量技术在仪表异常的情况下,对关键变量的缺失值和异常值进行数据校正,是一种有效的仪表监测和数据校正的策略。
在建立软测量模型时,辅助变量和回归方法的选取会直接影响到模型的预测效果。化工生产过程中的变量众多,如果将所有的相关变量全部作为输入建立软测量模型,不仅会导致数据的冗余,增加模型的运算量,而且会降低模型的预测性能。目前大部分软测量方法均使用皮尔逊相关系数等线性相关度量准则分析过程变量和目标变量之间的关系,然后线性回归模型提取变量之间的关系。但是在实际工业过程中,装置通常是在非稳态工况下运行,绝大多数变量之间的关系十分复杂,存在多重共线性和非线性等问题。因此使用简单的线性相关度量准则无法很好的考虑到变量之间线性和非线性的关系。同时实际化工生产过程中部分变量间的多重共线性使得传统的回归模型的预测结果精确度下降,此外,由于工况的频繁调整使得建立好的模型无法针对多种工况进行监测,因此在建立实际化工过程的仪表监测和数据校正软测量模型时,如果同时能考虑变量之间的多重共线性和非线性问题,同时对模型进行实时更新,应该可以提高软测量模型的预测性能。
发明内容
本发明的目的在于提供一种结合在线更新策略的仪表校正软测量方法,能够及时、准确的监测化工过程仪表的异常情况,并且实时提供预测结果。
本发明所采用的技术方案是:结合在线更新策略的仪表校正软测量方法,包括以下步骤:
步骤1、获取历史运行数据及DMTO过程可采集变量;
步骤2、选取DMTO过程的关键变量并基于步骤1所得可采集变量选取与关键变量相关的辅助变量;
步骤3、通过MIC从步骤2所得关键变量及其相关辅助变量中选取合适的辅助变量用于PLS软测量建模;具体包括以下步骤:
步骤3.1、将两个变量的样本绘制成散点图,对散点图进行网格划分,在各个网格分区内用数据点出现在分区内的频率代替概率,得到相应网格划分下的联合概率密度和边际概率密度,再通过公式(1)计算出相应网格划分下的互信息值:
式(1)中,为变量/>和/>的互信息,/>和/>是各自变量的边际概率密度函数,/>为变量/>与变量/>之间的联合概率密度函数;
步骤3.2、改变各个网格的大小或总网格数,得到不同种网格划分的互信息值,记录其中最大的互信息值为
步骤3.3、通过公式(2)对互信息值进行归一化处理,归一化后的值区间在[0,1]之间:
式(2)中,为归一化后的做大互信息值,a和b是在x轴和y轴上划分格子的个数;
步骤3.4、通过公式(3)计算最大互信息值:
式(3)中,B(n)为网格划分的上限个数,B(n)=n0.6,n为数据规模;
步骤3.5、针对每一个需要进行仪表校正的变量,分别计算其与其余采集的变量之间的MIC值,选取MIC值大于0.3的变量作为待仪表校正变量软测量时的辅助变量X;
步骤4、建立PLS软测量模型,输入步骤3所得辅助变量进行训练;具体包括以下步骤:
步骤4.1、通过公式(4)对步骤3中筛选的辅助变量X和目标变量Y做Z-score标准化处理:
式(4)中,xi表示第i个变量的原始数据,μi表示第i个变量的均值,σi表示第i个变量的方差;
步骤4.2、通过公式(5)对标准化后的X和Y做降维处理,获得X和Y的第一主元p1和q1:
XTYYTXp1=λpp1
YTXXTYq1=λqq1 (5)
式(5)中,p1和q1分别为矩阵XTYYTX和YTXXY最大特征值所对应的特征向量,λp、λq为特征值;
步骤4.3、通过公式(6)计算X和Y的潜变量u1和v1:
u1=Xp1
v1=Yq1 (6)
步骤4.4、通过公式(7),使用Y的第一潜变量u1对Y进行回归:
Y=u1c1 T+Yc (7)
式(7)中,Yc为原始矩阵Y的残差矩阵;
步骤4.5、对于残差矩阵重复上述步骤,可以获得更多的潜变量,并得到如公式(8)的PLS回归模型:
式(8)中,F为原始矩阵Y的残差矩阵,k为潜变量个数,将式(8)写成矩阵形式:
Y=UCT+F=XPCT+F=XB+F (9)
步骤4.6、当实时数据传入时,首先使用式(4)对实时数据进行标准化处理,然后使用式(9)对目标变量Y进行预测,并通过公式(10)对预测数据反标准化:
式(10)中,μ表示Y的训练集数据的均值,σ表示的训练集数据的方差;
步骤5、优化步骤4所得模型的参数,实现模型在线更新;具体包括以下步骤:
步骤5.1、选取一段长度为l的历史运行数据作为基准窗口数据,计算基准窗口数据内辅助变量X和目标变量Y的均值和方差μi和σi;
步骤5.2、当有新的实时数据传输时,对该窗口内的数据进行更新,并删除最早的数据,使窗口长度始终保持为l;
步骤5.3、通过公式(11)计算目标变量Y预测值和真实值的残差标准误差:
式(11)中,yi表示预测变量的原始数据,为预测变量回归值,/>为预测变量的平均值;
步骤5.4、当RSE持续超出设定阈值时,计算此时窗口l内原始数据的均值与方差,μi和σi,并更新步骤4中的标准化与反标准化参数,实现模型参数的更新;
步骤6、建立故障知识库,基于故障知识库建立仪表故障监测判别标准;
步骤7、基于步骤6所得仪表故障监测判别标准监测获得的仪表实时数据,仪表实时数据异常时,将仪表实时数据相关的关键变量输入步骤5所得模型进行预测,得到仪表实时数据异常点的预测值并基于预测值进行数据校正;具体包括以下步骤:
步骤7.1、基于步骤6所得仪表故障监测判别标准,对每个仪表进行如下判断:1)是否读数连续为-1或0;2)是否读数连续超出仪表量程,满足以上任意一条,则认为仪表出现故障,需要校正;
步骤7.2、获取当前时刻采集到的数据,并选取故障仪表作为目标变量Y,对应的辅助变量X由历史数据计算相关性获得;
步骤7.3、将当前时刻辅助变量X的数据输入到式(9)中,得到当前时刻故障仪表Y的读数。
本发明的有益效果是:本发明的结合在线更新策略的仪表校正软测量方法,重点考虑到了化工生产过程中数据非线性、共线性和多工况等特征,提高了数据校正的精度,提高了仪表监测的可靠性。能够及时、准确的监测化工过程仪表的异常情况,并且实时提供预测结果,为后续的化工过程监测系统提供可靠保障,同时为操作人员提供及时可靠的变量信息。
附图说明
图1是本发明的结合在线更新策略的仪表校正软测量方法的流程示意图;
图2是变量X,Y的散点图以及不同网格数下合理的划分方式示意图;
图3是仪表数据缺失案例图;
图4是实施例2的仪表数据软测量结果图;
图5是仪表数据超出量程案例图;
图6是实施例3的仪表数据软测量结果图。
具体实施方式
下面结合附图以及具体实施方式对本发明进行详细说明。
实施例1
本发明提供了一种结合在线更新策略的仪表校正软测量方法,如图1所示,主要包括历史数据建模和实时数据预测两个部分,历史数据建模部分如下所述:
1、从工厂的历史数据库中获取历史运行数据,并且根据具体的工艺选择DMTO过程中所有可以采集到的变量。
2、与工程师交流实际生产经验,了解实际生产过程中的关键变量,以及与其可能相关的辅助变量,进一步和工程师确认,当仪表发生故障或者出现仪表数据异常时,判断的依据。
3、建立故障知识库,将与工程师交流所得到的所有故障相关信息统一,建立仪表故障监测的判别标准,用于后续实时数据传输时数据异常的判断依据。
4、针对所有选取的辅助变量和目标变量之间建立分析MIC系数确定相关性,选择合适的辅助变量用于数据校正软测量建模。
5、经过变量分析后,所有相关辅助变量作为PLS模型的建模数据进行训练,建立软测量模型,训练好的模型能够实现对关键变量的仪表数据的准确预测。然后此模型会根据生产状况的变动,及时调整模型的参数,实现模型的在线更新。
特征的选择和软测量模型的选择对于仪表数据的校正具有至关重要的作用。当仪表故障发生时,软测量技术的基本思路是根据最优化准则,从众多的过程变量中筛选相关变量,然后以辅助变量作为输入,以目标变量作为输出,通过选择合适的模型,提取出内在的特征关系,实现对目标变量的数据校正。通过深入结合DMTO反应装置的过程特点,本发明使用了基于MIC的辅助变量选取方法和基于PLS的回归方法,以实现降低数据校正误差的目的。
最大信息系数(Max Information Coefficient,MIC)是一种基于信息熵理论的相关性测量方法,它适用于线性、周期性等多种非线性的数据,其相比于目前常用的Person系数等线性相关度量准则,更加适用于实际化工生产中的非线性的过程,MIC能够综合考虑变量之间的线性和非线性关系,从而实现更加准确的变量相关性分析。MIC的取值范围在0和1之间,取值越大,则表示两个变量之间的相关性越强。在变量的选择过程中,可以通过设定阈值来确定两个变量之间是否存在相关性。阈值的选择需要根据实际工况进行相应的调整。一般来说阈值的设置越大,则选择的变量越少,相关性越高,较小的阈值可以保留更多的变量,但是也会导致数据的噪声较强。因此在使用MIC选择变量时,需要根据化工生产的过程特点确定合理的阈值。
MIC利用互信息和网格划分的方法来进行计算,因为其原理涉及到互信息(MutualInformation,MI)的计算,因此首先给出关于MI的数学计算公式,如式(1)所示:
其中,I(x;y)为变量x和y的互信息,p_(x)和p_(y)是各自变量的边际概率密度函数,p_(x,y)为变量X与变量Y之间的联合概率密度函数。联合概率密度函数是指对于多个随机变量,它们在同一次试验中出现各种取值的概率密度分布。对于随机变量X和Y,它们的联合概率密度函数可以用二元函数P(x,y)表示,其中P(x,y)表示X取值为x,Y取值为y的概率密度。边际概率密度函数则是指在联合概率密度函数中,只关注其中一个或部分随机变量的概率密度函数。例如,对于随机变量X和Y的联合概率密度函数P(x,y),X的边际概率密度函数可以通过将P(x,y)关于Y积分得到边际概率密度函数也可以用于判断两个随机变量是否独立,如果两个随机变量独立,则它们的联合概率密度函数可以表示为两个随机变量的边际概率密度函数的乘积。但是,变量X和Y的联合概率密度很难直接计算,为了得到概率密度,可以将两个变量的样本绘制成散点图,对散点图进行网格划分,在各个网格分区内用数据点出现在分区内的频率代替概率,从而得到该网格划分下的联合概率密度和边际概率密度。这样就可以计算出在该种网格划分下的互信息值,然后改变网格划分方式(改变各个网格的大小或改变总网格数),得到不同种网格划分的互信息值,记录其中最大的互信息值为I(D,x,y)。
如图2所示为变量X,Y在二维平面的分布方式及在不同的网格数下较为合理的网格划分方式。当网格只有一个时,一个网格包含了所有的点,无法挖掘变量间的关系;而当网格数量为无限时,每个网格内只有一个或没有数据点,也很难挖掘变量间的关系且会导致计算效率低下。只有在合适的网格数下(如图2下面的两个图),所有的数据点集中在浅橙色网格中,可以用一条近似的抛物线进行拟合,即表明变量X和Y之间存在类似抛物线的关系。这就是最大信息系数(MIC)网格划分原理。
为了便于比较不同维度之间的值,需要对互信息进行归一化处理,保证其值控制在0和1之间,归一化公式如式(2)所示:
假设有限的有序集合D的样本量为n,那么集合D中的变量X与Y的最大信息系数公式如(3)所示:
其中a,b是在x,y方向上划分格子的个数,B为网格划分的上限值。在实际应用中,选取中等相关及以上(MIC>0.3)的变量作为辅助变量。
偏最小二乘法(PLS)是一种常用的软测量模型,与普通的最小二乘方法不同,偏最小二乘采用了一种降维的策略。可以在保留原始数据的主要信息的情况下,减少自变量的数量,提高回归模型的预测性能。
PLS的基本思想是将自变量和因变量都投影到一个新的空间中,使得在这个新空间中,自变量和因变量的相关性最大。然后使用这个新空间的投影结果来建立回归模型,这一过程中可以减少自变量的数量,从而避免自变量之间的多重共线性,从而提高了模型的稳定性和可靠性。具体的公式推导如下:
设原始特征数据X0为m维矩阵,Y0为n维矩阵,即共有N个样本对,X0中样本特征为m维,Y0中样本特征为n维。而X和Y是原始数据经过标准化之后生成的数据。设X和Y的第一个主成分轴向量分别为w1和c1,则由w1和c1可以表示出X和Y的第一对主成分t1和u1,其中t1和u1由下式可得:
t1=X*w1,u1=Y*c1 (4)
根据上面的假设,典型相关分析(CCA)的求解思想是使t1和u1之间的相关性最大化,而主成分分析(PCA)的求解思想是分别使得t1和u1的方差最大。综合上述两种方法的思想,PLS的求解思想如公式(5)和(6)所示:
maximize<Xw1,Yc1>,Subjectto:||w1||=1,||c1||=1 (6)
然后引入拉格朗日乘子的方法求出w1和c1,最后可以求得w1是对称矩阵XTYYTX的最大特征值对应的特征向量,c1是YTXXTY的最大特征值对应的特征向量。在求出w1和c1后,可以求得X,Y的第一对相关的主成分t1和u1如公式(7)所示:
t1=Xw1,u1=Yc1 (7)
根据主成分回归思想可以把X,Y分别对他们的主成分t1和u1进行回归建模如下:
这里的p1和q1不同于w1和c1,但是之间存在一定的关系,E和G为残差矩阵。因为直接用上面的两个式子无法建立X和Y之间的关系,所以在此利用t1和u1之间的相关性把Y改为对X的主成分进行建模:
采用最小二乘的方法对上式进行计算:
从而可以从求出的结果之中推导出w1和p1之间的关系为:
其中w1是X投影出t1的方向向量,p1是根据最小二乘法求得。之后将X中的主成分t1的残差部分E作为新的X,Y中的主成分t1,另一个残差F作为新的Y,按照前面的方法进行迭代,残差F达到要求。设最后一共有k个成分,则一系列向量可以表示为:
w1,w2,...,wk;c1,c2,...,ck;t1,t2,...,tk;u1,u2,...,uk;r1,r2,...rk (15)
最终可以将原始X和Y表示为:
根据以下条件:
上式可以改写为:
X=TPT+E (19)
Y=TRT+F=XWRT+F=XA+F (20)
通过X和Y之间的回归方程就可以通过计算W,R的值来进行预测。
仪表数据的实时监测和数据校正部分如下所述:
1、监测获得的仪表数据会实时输入故障知识库进行判断和分类,确定仪表的数据是否发生异常,若分类为正常数据则跳过数据校正这一阶段,反之则进行下一步的数据校正。
2、当仪表数据发生异常时,此时在线更新的PLS模型将会选择相关变量作为模型的输入,实时预测出数据异常点的预测值,然后以此预测值来进行数据异常/缺失的校正。数据的异常通常根据工程师经验通常包含以下两种情况,分别是仪表读数突然丢失或者仪表读数超过量程范围,这两种情况的数据异常若不能及时处理和发现,会导致监测系统的误报等情况发生。下面将针对从实时数据中发现的两种异常情况分别进行距离分析。
实施例2(仪表数据突然缺失情况下的数据校正)
下面以从某大型工厂的DMTO运行装置的实时运行数据中的某一仪表为例,说明仪表监测和数据校正是如何在实际工业案例中成功实施。以1190TI1405为例,从系统中可以实施的监测到该仪表数据的采集情况。从图3中可以看出,该仪表在第50个数据点位处数据突然缺失。此时通过故障数据库就可以判断出第50个点位的数据进入了PLS软测量模型,获取第50个点位后的实时预测值。待到采集的数据恢复正常后,预测结束。具体的预测结果见图4。
实施例3(仪表读数超过量程范围情况下的数据校正)
以1190TI1101D为例,从系统中可以实施的监测到该仪表数据的采集情况。从图5中可以看出,该仪表在第50个数据点位处数据突然超过量程范围,此时也可认为仪表状态出现异常。通过故障数据库就可以判断出第50个点位的数据进入了PLS软测量模型,获取第50个点位后的实时预测值。待到采集的数据恢复正常后,预测结束。具体的预测结果见图6。
通过上述方式,本发明实现了模型的在线更新功能。与传统的仪表校正方法相比,该策略需要较低的人工和时间成本,同时数据校正的误差最低,基于该策略,我们将该方法应用于中国某实际化工厂的大型DMTO装置的仪表校正模块,并且取得了良好效果。该技术能够有效识别仪表数据中的异常和缺失值,然后自动输入软测量模型,并且实时提供预测值以实现数据校正的功能,确保了过程监测模型的长期稳定的运行。该技术的性能与操作人员的观察相比,可以尽早的发现仪表数据的异常值,减少由于仪表故障等问题导致的过程监测报警,从而促进过程监测技术的广泛应用,提高经济效益,降低生产事故发生率。
Claims (5)
1.结合在线更新策略的仪表校正软测量方法,其特征在于,包括以下步骤:步骤1、获取历史运行数据及DMTO过程可采集变量;步骤2、选取DMTO过程的关键变量并基于步骤1所得可采集变量选取与关键变量相关的辅助变量;步骤3、通过MIC从步骤2所得关键变量及其相关辅助变量中选取辅助变量用于PLS软测量建模;步骤4、建立PLS软测量模型,输入步骤3所得辅助变量进行训练;步骤5、优化步骤4所得模型的参数,实现模型在线更新;步骤6、建立并基于故障知识库建立仪表故障监测判别标准;步骤7、基于步骤6所得仪表故障监测判别标准监测获得的仪表实时数据,仪表实时数据异常时,将仪表实时数据相关的关键变量输入步骤5所得模型进行预测,得到仪表实时数据异常点的预测值并基于预测值进行数据校正。
2.如权利要求1所述的结合在线更新策略的仪表校正软测量方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3.1、将两个变量的样本绘制成散点图,对散点图进行网格划分,在各个网格分区内用数据点出现在分区内的频率代替概率,得到相应网格划分下的联合概率密度和边际概率密度,再通过公式(1)计算出相应网格划分下的互信息值:
式(1)中,为变量/>和/>的互信息,/>和/>是各自变量的边际概率密度函数,/>为变量/>与变量/>之间的联合概率密度函数;
步骤3.2、改变各个网格的大小或总网格数,得到不同种网格划分的互信息值,记录其中最大的互信息值为
步骤3.3、通过公式(2)对互信息值进行归一化处理,归一化后的值区间在[0,1]之间:
式(2)中,为归一化后的做大互信息值,a和b是在x轴和y轴上划分格子的个数;
步骤3.4、通过公式(3)计算最大互信息值:
式(3)中,B(n)为网格划分的上限个数,(n)=0.,n为数据规模;
步骤3.5、针对每一个需要进行仪表校正的变量,分别计算其与其余采集的变量之间的MIC值,选取MIC值大于0.3的变量作为待仪表校正变量软测量时的辅助变量X。
3.如权利要求2所述的结合在线更新策略的仪表校正软测量方法,其特征在于,所述步骤4具体包括以下步骤:
步骤4.1、通过公式(4)对步骤3中筛选的辅助变量X和目标变量Y做Z-score标准化处理:
式(4)中,i表示第i个变量的原始数据,μi表示第i个变量的均值,σi表示第i个变量的方差;
步骤4.2、通过公式(5)对标准化后的X和Y做降维处理,获得X和Y的第一主元p1和q1:
XTYYTXp1=λpp1
YTXXTYq1=λqq1 (5)
式(5)中,p1和q1分别为矩阵XTYYTX和YTXXY最大特征值所对应的特征向量,λp、λq为特征值;
步骤4.3、通过公式(6)计算X和Y的潜变量u1和v1:
u1=Xp1
v1=Yq1 (6)
步骤4.4、通过公式(7),使用Y的第一潜变量u1对Y进行回归:
Y=u1c1 T+Yc (7)
式(7)中,Yc为原始矩阵Y的残差矩阵;
步骤4.5、对于残差矩阵重复上述步骤,获得其他潜变量,并得到如公式(8)的PLS回归模型:
式(8)中,F为原始矩阵Y的残差矩阵,k为潜变量个数,将式(8)写成矩阵形式:
Y=UCT+F=XPCT+F=XB+F (9)
步骤4.6、当实时数据传入时,首先使用式(4)对实时数据进行标准化处理,然后使用式(9)对目标变量Y进行预测,并通过公式(10)对预测数据反标准化:
式(10)中,μ表示Y的训练集数据的均值,σ表示的训练集数据的方差。
4.如权利要求3所述的结合在线更新策略的仪表校正软测量方法,其特征在于,所述步骤5具体包括以下步骤:
步骤5.1、选取一段长度为l的历史运行数据作为基准窗口数据,计算基准窗口数据内辅助变量X和目标变量Y的均值和方差μi和σi;
步骤5.2、当有新的实时数据传输时,对该窗口内的数据进行更新,并删除最早的数据,使窗口长度始终保持为l;
步骤5.3、通过公式(11)计算目标变量Y预测值和真实值的残差标准误差:
式(11)中,yi表示预测变量的原始数据,为预测变量回归值,/>为预测变量的平均值;
步骤5.4、当RSE持续超出设定阈值时,计算此时窗口l内原始数据的均值与方差,μi和σi,并更新步骤4中的标准化与反标准化参数,实现模型参数的更新。
5.如权利要求4所述的结合在线更新策略的仪表校正软测量方法,其特征在于,所述步骤7具体包括以下步骤:
步骤7.1、基于步骤6所得仪表故障监测判别标准,对每个仪表进行如下判断:1)是否读数连续为-1或0;2)是否读数连续超出仪表量程,满足以上任意一条,则认为仪表出现故障,需要校正;
步骤7.2、获取当前时刻采集到的数据,并选取故障仪表作为目标变量Y,对应的辅助变量X由历史数据计算相关性获得;
步骤7.3、将当前时刻辅助变量X的数据输入到式(9)中,得到当前时刻故障仪表Y的读数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310761851.7A CN116882140A (zh) | 2023-06-26 | 2023-06-26 | 结合在线更新策略的仪表校正软测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310761851.7A CN116882140A (zh) | 2023-06-26 | 2023-06-26 | 结合在线更新策略的仪表校正软测量方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116882140A true CN116882140A (zh) | 2023-10-13 |
Family
ID=88255960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310761851.7A Pending CN116882140A (zh) | 2023-06-26 | 2023-06-26 | 结合在线更新策略的仪表校正软测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116882140A (zh) |
-
2023
- 2023-06-26 CN CN202310761851.7A patent/CN116882140A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109459993B (zh) | 一种流程工业过程在线自适应故障监测与诊断方法 | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
EP1982301B1 (en) | Method of condition monitoring | |
JP2019527413A (ja) | 根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 | |
CN111008363B (zh) | 多变量因果驱动的复杂机电系统服役安全态势评估方法 | |
KR101086027B1 (ko) | 베이지안 통계기법을 이용한 발전설비 고장예측방법 | |
CN112284440B (zh) | 一种传感器数据偏差自适应修正方法 | |
CN112598172A (zh) | 一种风电机组轴承温度预警方法 | |
CN114936504A (zh) | 基于贝叶斯多源数据融合的设备剩余寿命预测方法及系统 | |
CN116992346A (zh) | 一种基于人工智能大数据分析的企业生产数据处理系统 | |
CN113408659A (zh) | 一种基于数据挖掘的建筑能耗集成分析方法 | |
CN115718880A (zh) | 一种复杂装备退化阶段的预测方法 | |
CN117977536A (zh) | 一种智能电网负荷辨识方法 | |
CN117553840A (zh) | 一种基于智能化管理的仪表及其系统 | |
CN117609716A (zh) | 基于状态健康信息的电力设备剩余寿命远程预测方法及系统 | |
CN109522657B (zh) | 一种基于相关性网络和svdd的燃气轮机异常检测方法 | |
RU2703874C1 (ru) | Способ контроля и прогнозирования работы газотурбинной установки с использованием матрицы дефектов | |
CN116882140A (zh) | 结合在线更新策略的仪表校正软测量方法 | |
CN116151799A (zh) | 一种基于bp神经网络的配电线路多工况故障率快速评估方法 | |
CN113283157A (zh) | 智能冲压压力机部件生命周期预测系统、方法、终端、介质 | |
CN118213997B (zh) | 一种基于ahp-灰色模糊算法的城市电网负荷预测方法 | |
Ingole et al. | Investigation of Different Regression Models For The Predictive Maintenance of Aircraft's Engine | |
CN112180893B (zh) | Cstr过程中故障相关分布式正交邻域保持嵌入模型的构建方法及其故障监控方法 | |
CN118137492B (zh) | 一种短期电力负荷预测方法及系统 | |
Szpytko et al. | Measuring Dependencies in Degradation Data: Digital Platform for Coordinating Maintenance Activities on Cranes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |