CN114330845A - 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 - Google Patents

基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 Download PDF

Info

Publication number
CN114330845A
CN114330845A CN202111538098.2A CN202111538098A CN114330845A CN 114330845 A CN114330845 A CN 114330845A CN 202111538098 A CN202111538098 A CN 202111538098A CN 114330845 A CN114330845 A CN 114330845A
Authority
CN
China
Prior art keywords
sample
drift
model
value
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111538098.2A
Other languages
English (en)
Inventor
汤健
许超凡
徐喆
夏恒
乔俊飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202111538098.2A priority Critical patent/CN114330845A/zh
Publication of CN114330845A publication Critical patent/CN114330845A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于多窗口概念漂移检测的MSWI过程二噁英排放预测方法属于城市固废焚烧领域。二噁英(DXN)是城市固废焚烧(MSWI)过程排放的巨毒污染物。实际工业过程采用软测量模型以实现DXN预测,但工业过程的时变特性导致软测量模型的预测精度降低。首先,基于历史数据建立随机森林(RF)软测量模型和主成分分析(PCA)漂移检测模型;其次,通过多窗口概念漂移检测策略对新样本进行漂移检测,以确定新样本是否为漂移样本;最后,对上述的漂移样本进行去冗处理并判断其数量是否满足设定的阈值,若满足则重新训练PCA模型及RF模型,否则继续采用历史模型对新样本进行预测。采用工业过程数据验证了所提方法的有效性。

Description

基于多窗口概念漂移检测的MSWI过程二噁英排放预测方法
技术领域
本发明属于城市固废焚烧技术领域。
背景技术
城镇化过程的不断推进使得城市固废(Municipal Solid Waste,MSW)的产生量逐年上升,如何对其进行有效处理已成为目前城市污染防控战略最为关键的一环。具有减量化、高效化、低污染等优势的城市固废焚烧(MSW Incineration,MSWI)技术,已在世界范围内广泛应用,其典型工艺流程如图1所示。
如图1所示,MSWI过程包括固废储运、固废焚烧、蒸汽发电、烟气处理等工艺环节。MSW通常由市政运输车运至存放池中进行堆酵,再通过抓斗投入料斗后,由给料器推入炉排;在炉内经过干燥、燃烧和燃烬3个阶段后,将焚烧残渣进行冷却并收集至填埋场,将燃烧产生的高温烟气对余热锅炉加热后产生过热蒸汽以推动汽轮机发电;锅炉出口烟气进入反应器中和后,其中飞灰类物质进入飞灰罐,而烟气进入袋式除尘器中被脱去烟气颗粒、中和反应物及活性炭吸附物,再经处理后分为三个部分:飞灰掉入飞灰罐,部分烟灰混合物加水后重新输入反应器,尾部烟气经引风机通过烟囱排出,后者含有CO、HCL、SO2、NOx、及二噁英(DXN)等污染气体。
DXN是MSWI过程排放的被称为“世纪之毒”的有机类污染物,其在生物体内存在累积效应,对生态环境具有潜在的巨大危害。常用的DXN检测方法包括:(1)基于激光质谱的离线直接检测法,其原理是基于激光波长电离相关分子后,在实验室通过质谱仪实现直接检测,其缺点是仅能在实验室进行且需要获取待检测DXN同类物的光谱结构,进而造成检测严重滞后且存在不能对未知DXN结构进行检测的缺点;(2)基于指示物/关联物的在线间接检测法,其原理是先在线检测关联物浓度后,再通过DXN与关联物之间的映射模型进行预测,其缺点是指示物检测装置复杂性高且难以维护,关联物和DXN的映射关系极为复杂且依赖离线检测化验值,导致该方法难以推广;(3)软测量法,其通过容易测得的相关数据变量与难测参数间的映射关系构建软测量系统,能够实现DXN浓度的实时在线预测。
实际工业过程常采用高成本、长周期的在线采样和离线化验相结合的方式检测DXN排放浓度,显然难以支撑MSWI过程的实时反馈控制。对此问题,已有众多研究人员多采用历史样本构建软测量模型实现DXN的实时检测。通常,软测量模型采用基于特定分布的有限数量的历史样本构建。显然,复杂工业过程中固有的工况波动会导致软测量模型检测精度的下降。
目前,研究学者将工作环境改变、物料变化和设备老化等因素导致的历史模型泛化性能变差的现象称为概念漂移。类似地,MSWI过程中的概念漂移也会导致新样本表征的分布相对于历史样本发生变化,导致表征旧分布的软测量模型难以适用于表征新工况状态的漂移样本。除此之外,工业过程数据通常具有非线性,也存在噪声、缺失及不确定性等问题,这使得概念漂移问题更为复杂。显然,概念漂移对DXN预测的影响体现在,基于历史数据构建的软测量模型难以覆盖工况波动后的样本分布,这使得基于历史数据构建的软测量模型在实际应用中存在偏差,预测结果难以反映真实的情况。因此,实现DXN排放浓度在线实时检测的前提是能够对MSWI过程的工况漂移现象进行准确识别,并采用这些能够表征工况漂移的样本更新软测量模型以提高预测精度。显然,DXN浓度的高精度预测首先需要解决MSWI过程的漂移识别问题。
目前已有研究均未在样本预测和漂移检测前对工业现场可能存在的离群样本进行识别及预处理,也未考虑如何对特征空间及输出空间识别到的漂移样本间存在的冗余性问题进行处理。
针对上述问题,本文提出一种基于多窗口概念漂移检测的DXN排放预测方法。首先,基于标准化历史数据建立基于随机森林(RF)的软测量模型和基于主成分分析(PCA)的漂移检测模型;其次,通过多窗口概念漂移检测策略对新样本进行漂移检测,其中,在离群样本检测窗口中判断新样本是否为离群样本并进行标准化处理,在特征空间漂移检测窗口中计算新样本的T2和SPE以确定其是否为特征空间漂移样本,在输出空间漂移检测窗口中实现对新样本的预测并依据误差确定其是否为输出空间漂移样本;最后,对上述的漂移样本进行去冗处理并判断其数量是否满足设定的阈值,若满足则重新训练PCA模型及RF模型,否则继续采用历史模型对新样本进行预测。采用工业过程数据验证了所提方法的有效性。
MSWI过程中固废焚烧阶段、烟气处理阶段和烟气排放阶段均会生成DXN。MSWI过程中产生的DXN存在于炉渣、飞灰及烟气中,其中以烟气中的DXN浓度最高,DXN主要通过固废不完全焚烧及新规合成反应产生,其排放流程可分为:产生DXN时的烟气G1、吸附处理后的烟气G2及最终排放的烟气G3共3个阶段,示意如图2所示。
由图2可知,余热锅炉的出口烟气G1进入脱酸反应器中进行中和反应,再经袋式除尘器后产生烟气G2,尾部烟气经由引风机通过烟囱排放烟气G3。研究表明,MSWI过程中DXN生成和吸附阶段的机理复杂不清。在生成阶段为保证DXN的有效分解,通常要求炉内烟气温度至少达到850摄氏度并保持两秒。在吸附阶段,为吸附DXN,在脱酸反应器中加入消石灰和活性炭,接着由袋式除尘过滤后通过引风机经由烟囱排出;此外,该阶段存在难以解释的DXN记忆效应,其也会导致DXN浓度发生变化。由上述工艺流程可知,DXN排放浓度与MSWI过程中的众多变量相关。显然,这些相关变量的异常波动会影响DXN排放浓度软测量模型的预测结果。可见,为实现DXN的在线实时精准预测,首先需要及时检测概念漂移,以便有效地更新DXN软测量模型。
发明内容
根据上述分析,本文提出基于多窗口概念漂移检测的DXN排放预测方法,其算法策略如图3所示。
如图3所示,将历史样本表示为
Figure BDA0003413138770000031
其也可描述为,
Figure BDA0003413138770000032
其中,
Figure BDA0003413138770000033
表示第i个历史样本向量,
Figure BDA0003413138770000034
表示所有历史样本的第m个特征组成的向量,
Figure BDA0003413138770000035
表示为第i个历史样本中的第m个特征;m=1,…,M,i=1,…,k,k为样本数量,M为特征数量。历史样本输出为
Figure BDA0003413138770000036
Figure BDA0003413138770000037
表示第i个历史样本的输出。进而,历史建模样本集Sold可表示为,
Figure BDA0003413138770000038
首先,进行数据递推预处理,以第n个特征
Figure BDA0003413138770000039
为例,如下:
Figure BDA00034131387700000310
Figure BDA00034131387700000311
其中,
Figure BDA00034131387700000312
表示第n个特征的均值,
Figure BDA00034131387700000313
表示第n个特征的标准差,k为样本数量。则全部特征的均值
Figure BDA00034131387700000314
及标准差
Figure BDA00034131387700000315
如下:
Figure BDA0003413138770000041
Figure BDA0003413138770000042
其中,m=1,…,M。
接着,将历史数据
Figure BDA0003413138770000043
标准化为标准历史数据Xk,如下所示,
Figure BDA0003413138770000044
其中
Figure BDA0003413138770000045
Figure BDA0003413138770000046
表示样本均值及样本标准差。
最后,标准历史数据可表示为
Figure BDA0003413138770000047
xi表示第i个标准历史样本向量,xm表示所有标准历史样本的第m个特征组成的向量,xmi表示为第i个标准历史样本中的第m个特征;其中,m=1,…,M,i=1,…,k,k为样本数量,M为特征数量。
本文采用随机森林(RF)构建DXN软测量模型,其构建过程如图4所示。
由图4可知,构建过程可描述为:对标准历史数据Xk采用自助随机抽样,有放回的随机抽取子数据集作为训练集;从其M个特征中随机选取若干个特征,作为分裂节点的依据;多次训练得到不同的CART树;接着,将各个CART树输出值的均值作为RF的预测结果。
由上述过程,通过标准历史数据Xk训练得到DXN软测量模型
Figure BDA0003413138770000048
PCA能够从标准历史数据Xk的高维特征中提取关键变化信息,能够以较少的潜在特征更集中地反映原始高维变量的变化。标准历史数据Xk由具有M个特征的k个样本组成,即Xk∈Rk×M,Rk×M表示全部数据集,Xk按下式分解:
Figure BDA0003413138770000049
其中,th和ph分别是得分向量和负荷向量。
ph为相关系数矩阵Rk的第h个主元向量,如下式所示:
Figure BDA00034131387700000410
(Rkk)Pk=0 (11)
其中,λk为Rk的特征值,Pk为λk对应的特征向量,E为单位矩阵。λk可通过下式解得,如下:
λkE-Rk|=0 (12)
而分解后的Xk即可表示为,
Figure BDA0003413138770000051
其中,
Figure BDA0003413138770000052
Figure BDA0003413138770000053
分别是PCA的模型部分和残差部分;
Figure BDA0003413138770000054
是由Rk的前h个主元向量组成的负荷矩阵,其覆盖的空间称为主元子空间(PCS);
Figure BDA0003413138770000055
是Xk
Figure BDA0003413138770000056
上的投影,称为得分矩阵;
Figure BDA0003413138770000057
称为残差负荷矩阵,其覆盖的空间称为残差子空间(RS);
Figure BDA0003413138770000058
为残差得分。
通过上述过程,获得特征空间的漂移检测模型
Figure BDA0003413138770000059
进一步,由上述模型可计算得到置信度为1-α的两条控制限
Figure BDA00034131387700000510
Figure BDA00034131387700000511
Figure BDA00034131387700000512
Figure BDA00034131387700000513
为特征空间的漂移检测限,其可通过下式获得:
Figure BDA00034131387700000514
Figure BDA00034131387700000515
其中,规定h0及θr可通过下式计算:
Figure BDA00034131387700000516
Figure BDA00034131387700000517
其中,λj表示非主元特征值,r=1,2,3,且此处显著性水平α定义为:
Figure BDA00034131387700000518
P{F(M,M-h)>Fα(M,M-h)}=α (19)
N(0,1)为标准正态分布,Cα是标准正态分布的置信极限,Fα(M,M-h)是服从第一自由度为M,第二自由度为M-h的F分布。
本文中的概念漂移检测模块分为3个窗口,即离群样本检测窗口、特征空间检测窗口及输出空间检测窗口,第1个窗口实现离群样本识别及新样本标准化,后2个窗口实现模型预测输出和漂移样本识别。
3.2.1离群样本检测窗口
首先对新采集的样本
Figure BDA0003413138770000061
进行预处理,此时需要考虑新样本对历史建模样本均值和方差的影响。因此,需要首先对历史均值和标准差进行递推更新,如下:
Figure BDA0003413138770000062
Figure BDA0003413138770000063
Figure BDA0003413138770000064
为第k+1个样本均值与第k个样本的差,利用递推更新后的均值
Figure BDA0003413138770000065
及标准差
Figure BDA0003413138770000066
判断新样本是否为离群样本,通过计算第n个特征
Figure BDA0003413138770000067
的递推更新值,可知存在如下两种情况:
(1)若存在下式成立,
Figure BDA0003413138770000068
则该样本为离群样本,
Figure BDA0003413138770000069
表示新样本的第n个特征值,
Figure BDA00034131387700000610
Figure BDA00034131387700000611
表示新样本影响下的第n个特征对应的均值和标准差。
此外,取前两个时刻的均值作为内插值代替新样本数据,仍通过计算第n个特征
Figure BDA00034131387700000612
可知,
Figure BDA00034131387700000613
其中,
Figure BDA00034131387700000614
表示第k个历史样本的第n个特征值,
Figure BDA00034131387700000615
表示第k-1个历史样本的第n个特征值,
Figure BDA00034131387700000616
表示补入正常值后的新样本数据。
针对输入数据
Figure BDA00034131387700000617
依据公式(20)和(21)重新计算均值及标准差,进而得到均值
Figure BDA00034131387700000618
及标准差
Figure BDA00034131387700000619
进一步,获取标准化数据
Figure BDA00034131387700000620
即对
Figure BDA00034131387700000621
进行标准化,如下:
Figure BDA00034131387700000622
(2)若不满足式(22),则新样本
Figure BDA00034131387700000623
判定为未异常样本,直接对
Figure BDA00034131387700000624
依据历史均值和标准差进行标准化以获得
Figure BDA00034131387700000625
如下:
Figure BDA00034131387700000626
由上可知,针对新样本是否为离群点,此处将标准化的数据分别表示为
Figure BDA00034131387700000627
Figure BDA00034131387700000628
为便于描述,下文将两者统一表示为xk+1
3.2.2特征空间检测窗口
首先,将新样本xk+1分解为
Figure BDA0003413138770000071
Figure BDA0003413138770000072
两部分,如下:
Figure BDA0003413138770000073
Figure BDA0003413138770000074
Figure BDA0003413138770000075
式中,Ι为单位矩阵,
Figure BDA0003413138770000076
Figure BDA0003413138770000077
分别是xk+1在PCA主元子空间和残差子空间中的投影,
Figure BDA0003413138770000078
为负荷矩阵。
通常,统计量
Figure BDA0003413138770000079
能够衡量新样本在主元子空间中的变化程度,统计量SPEk+1能够衡量新样本在残差子空间中偏离程度。因此,基于
Figure BDA00034131387700000710
在置信度为1-α时,计算新样本xk+1
Figure BDA00034131387700000711
和SPEk+1,如下:
Figure BDA00034131387700000712
Figure BDA00034131387700000713
Figure BDA00034131387700000714
Figure BDA00034131387700000715
Figure BDA00034131387700000716
Figure BDA00034131387700000717
其中,Ι为单位矩阵,
Figure BDA00034131387700000718
表示得分向量,λh表示前h个主元特征值,
Figure BDA00034131387700000719
是由Xk中前h个主元组成的特征向量,
Figure BDA00034131387700000720
是PCA模型得分矩阵。
本文提出的特征空间漂移样本判别函数如下:
Figure BDA00034131387700000721
即,当满足
Figure BDA00034131387700000722
时,
Figure BDA00034131387700000723
取值为1;当满足
Figure BDA00034131387700000724
时,
Figure BDA00034131387700000725
取值为0。其中,若
Figure BDA00034131387700000726
的值为1时表示新样本能够表征漂移,进而得到特征空间的漂移样本
Figure BDA00034131387700000727
Figure BDA00034131387700000728
的值为0时表示未发生概念漂移。
3.2.3输出空间检测窗口
利用DXN软测量模型
Figure BDA0003413138770000081
对新样本xk+1进行预测,进而得到预测值
Figure BDA0003413138770000082
即下式:
Figure BDA0003413138770000083
通过比较预测值
Figure BDA0003413138770000084
与真实值yk+1以确定该样本是否能够表征漂移。在本实验中,由经验可设定判别阈值为θy=0.01,并提出判别函数如下:
Figure BDA0003413138770000085
即,当满足Δyk+1≥θy时,φPEB(Δyk+1y)取值为1;当满足Δyk+1<θy时,φPEB(Δyk+1y)取值为0。Δyk+1的计算公式如下:
Figure BDA0003413138770000086
其中,
Figure BDA0003413138770000087
Figure BDA0003413138770000088
表示历史样本的真值和预测值。本文此处采用绝对误差方式确定Δyk+1。由式(37)可知,若φ(Δyk+1y)的值为1时表示新样本能够表征概念漂移,进而得到输出空间的漂移样本
Figure BDA0003413138770000089
φ(Δyk+1y)的值为0时则表示未发生概念漂移。
3.3模型更新判别模块
将从特征空间和输出空间检测到的漂移样本合并进行去冗处理后,得到最终漂移样本集Scd,其计算如下:
Figure BDA00034131387700000810
其中,fCD(·)表示对特征空间和输出空间漂移样本进行去冗处理的函数,本文此处采用去重处理模式。
将最终漂移样本集Scd的数量记为Ncd。且由经验可设定
Figure BDA00034131387700000811
用于判别是否更新历史模型,存在以下两种情况:
(1)若Ncd小于阈值
Figure BDA00034131387700000812
Figure BDA00034131387700000813
则不执行模型更新。此时,采用
Figure BDA00034131387700000814
Figure BDA00034131387700000815
进行新样本递推更新,并基于历史模型
Figure BDA00034131387700000816
Figure BDA00034131387700000817
进行输出预测和漂移检测,。
(2)若Ncd大于等于阈值
Figure BDA00034131387700000818
Figure BDA00034131387700000819
将漂移样本集Scd与历史样本集
Figure BDA00034131387700000820
合并,重新训练软测量预测和特征空间漂移检测模型。此时,新建模样本集
Figure BDA00034131387700000821
可表示为:
Figure BDA00034131387700000822
重新训练DXN软测量模型和特征空间漂移检测模型,过程如下:
Figure BDA0003413138770000091
Figure BDA0003413138770000092
其中,
Figure BDA0003413138770000093
表示新建模样本集
Figure BDA0003413138770000094
的输入,
Figure BDA0003413138770000095
Figure BDA0003413138770000096
分别表示DXN软测量模型和特征空间漂移检测模型的训练过程,
Figure BDA0003413138770000097
Figure BDA0003413138770000098
表示更新后的DXN软测量模型和特征空间漂移检测模型。
此外,考虑到漂移样本集Scd对历史均值和标准差的影响,为保证针对第
Figure BDA0003413138770000099
个新样本的正常预测和检测,按下式进行赋值更新:
Figure BDA00034131387700000910
Figure BDA00034131387700000911
Figure BDA00034131387700000912
其中,
Figure BDA00034131387700000913
Figure BDA00034131387700000914
分别表示更新后的均值和标准差,
Figure BDA00034131387700000915
Figure BDA00034131387700000916
表示更新后漂移检测限的值。
通过上述更新后,所提软测量模型能够更好的适应MSWI过程的动态变化。
附图说明
图1城市固废焚烧工艺流程图
图2面向MSWI过程的DXN生成示意图
图3基于多窗口概念漂移检测的策略图
图4DXN软测量模型构建过程框图
图5历史数据RF的DXN预测与真值
图6更新后的T2和SPE
图7
Figure BDA00034131387700000917
和T2值对比图
图8
Figure BDA00034131387700000918
和SPE值对比图
图9输出空间预测误差
图10模型更新后预测值与真值
具体实施方式
本节建模数据为北京某MWSI电厂某条线近6年来的真实DXN排放浓度数据,其中包括来自固废焚烧系统、烟气处理系统、锅炉系统、固废储运系统、蒸汽发电系统等的121个过程变量,如表1所示。
表1 DXN排放浓度数据121个过程变量明细
Figure BDA0003413138770000101
Figure BDA0003413138770000111
Figure BDA0003413138770000121
Figure BDA0003413138770000131
Figure BDA0003413138770000141
本次实验共采用33个标记数据,并将其分为2部分,其中2/3用作训练集,1/3用作测试集。
在离线建模窗口,通过历史数据构建DXN软测量模型及特征空间漂移检测模型,对历史数据进行预测与真实值对比如图5所示。
此处,设置参数α=0.05,θy=0.01,θcd=1。
真实训练数据经过特征空间漂移检测模型时,计算置信度为95%的两条漂移检测限的值分别为
Figure BDA0003413138770000142
Figure BDA0003413138770000143
首先,对测试样本进行离群点分析,得到测试样本满足
Figure BDA0003413138770000144
时的离群样本共有1个,即测试数据集中存在1个异常样本并补入正常值。
接着,在特征空间检测窗口计算得到DXN的测试样本的T2和SPE,与特征空间漂移检测限
Figure BDA0003413138770000145
Figure BDA0003413138770000146
判别是否为特征空间漂移样本。同时,在输出空间检测窗口对测试数据预测并计算预测误差得到输出空间漂移样本。特征空间和输出空间的漂移样本进行去冗处理后更新训练模型及参数。
每个漂移样本检出后需进行更新模型和参数。其中,特征空间检测模型更新后的两条漂移检测限T2和SPE的值如图6所示。
如图7和8所示,为更新后的特征空间漂移检测限与各测试样本对应的T2和SPE的值。
由图7和8可知,特征空间的漂移样本共10个。
本次实验统计每个测试样本在输出空间检测时相应的预测值及真值,并计算相应的预测误差,与输出空间漂移检测限θy对比,如图9所示。
由图9可知,输出空间的漂移样本共9个。
本次实验中,输出空间检出的漂移检测样本共9个,特征空间检出的漂移样本共10个,全部漂移样本经过判别、合并和去冗后可知,进而可知,测试样本中存在10个漂移样本。
采用每次更新的模型
Figure BDA0003413138770000151
对样本进行预测,得到测试数据的预测值,与真值对比如图10所示。
通过漂移样本更新后,预测模型的对真值的拟合程度提高,证明了所提算法的有效性。
本次实验过程中,分别采用本次算法与离线模型、仅基于输出空间误差与仅基于特征空间的方法进行比较。实验结果如下表2所示。本文采用均方根误差(root meansquared error,RMSE),R2、MAE等三个指标进行度量。
表2不同概念漂移检测算法的性能对比
Figure BDA0003413138770000152
根据上述结果可知,本节方法可有效检测DXN预测数据中所存在的概念漂移现象并通过更新模型能够提高DXN的预测精度,进而显著提高软测量模型在漂移环境中的适应性。
本发明的方法利用多窗口并行检测能够显著提高漂移检测精度的原理,提出了一种用于MSWI过程DXN排放预测建模的概念漂移检测方法,采用多窗口概念漂移检测实现对漂移样本的精确检测,同时及时更新预测模型提高预测精度。实验数据证明,在给定11个真实DXN排放浓度数据下,应用本方法能够精确检测出10个漂移样本,其中特征空间检测出的漂移样本为10个,输出空间检测的漂移样本为9个,联合特征空间与输出空间漂移样本去冗机制后能够确定共10个漂移样本。同时其均方根误差RMSE=0.0062,决定系数R2=0.8800,平均绝对误差MAE=0.0051,具有较高的准确率,因此,在MSWI过程数据的应用背景下也具有较高的预测准确率。

Claims (1)

1.基于多窗口概念漂移检测的MSWI过程二噁英排放预测方法,其特征在于,
将历史样本表示为
Figure FDA0003413138760000011
描述为,
Figure FDA0003413138760000012
其中,
Figure FDA0003413138760000013
表示第i个历史样本向量,
Figure FDA0003413138760000014
表示所有历史样本的第m个特征组成的向量,
Figure FDA0003413138760000015
表示为第i个历史样本中的第m个特征;m=1,…,M,i=1,…,k,k为样本数量,M为特征数量;历史样本输出为
Figure FDA0003413138760000016
Figure FDA0003413138760000017
表示第i个历史样本的输出;进而,历史建模样本集Sold表示为,
Figure FDA0003413138760000018
首先,进行数据递推预处理,以第n个特征
Figure FDA0003413138760000019
为例,如下:
Figure FDA00034131387600000110
Figure FDA00034131387600000111
其中,
Figure FDA00034131387600000112
表示第n个特征的均值,
Figure FDA00034131387600000113
表示第n个特征的标准差,k为样本数量;则全部特征的均值
Figure FDA00034131387600000114
及标准差
Figure FDA00034131387600000115
如下:
Figure FDA00034131387600000116
Figure FDA00034131387600000117
其中,m=1,…,M;
接着,将历史数据
Figure FDA00034131387600000118
标准化为标准历史数据Xk,如下所示,
Figure FDA00034131387600000119
其中
Figure FDA00034131387600000120
Figure FDA00034131387600000121
表示样本均值及样本标准差;
最后,标准历史数据可表示为
Figure FDA00034131387600000122
xi表示第i个标准历史样本向量,xm表示所有标准历史样本的第m个特征组成的向量,xmi表示为第i个标准历史样本中的第m个特征;其中,m=1,…,M,i=1,…,k,k为样本数量,M为特征数量;
采用随机森林(RF)构建DXN软测量模型,构建过程描述为:对标准历史数据Xk采用自助随机抽样,有放回的随机抽取子数据集作为训练集;从其M个特征中随机选取若干个特征,作为分裂节点的依据;多次训练得到不同的CART树;接着,将各个CART树输出值的均值作为RF的预测结果;
由上述过程,通过标准历史数据Xk训练得到DXN软测量模型
Figure FDA00034131387600000123
PCA能够从标准历史数据Xk的高维特征中提取关键变化信息,能够以较少的潜在特征更集中地反映原始高维变量的变化;标准历史数据Xk由具有M个特征的k个样本组成,即Xk∈Rk ×M,Rk×M表示全部数据集,Xk按下式分解:
Figure FDA00034131387600000124
其中,th和ph分别是得分向量和负荷向量;
ph为相关系数矩阵Rk的第h个主元向量,如下式所示:
Figure FDA0003413138760000021
(Rkk)Pk=0 (11)
其中,λk为Rk的特征值,Pk为λk对应的特征向量,E为单位矩阵;λk可通过下式解得,如下:
kE-Rk|=0 (12)
而分解后的Xk即可表示为,
Figure FDA0003413138760000022
其中,
Figure FDA0003413138760000023
Figure FDA0003413138760000024
分别是PCA的模型部分和残差部分;
Figure FDA0003413138760000025
是由Rk的前h个主元向量组成的负荷矩阵,其覆盖的空间称为主元子空间(PCS);
Figure FDA0003413138760000026
是Xk
Figure FDA0003413138760000027
上的投影,称为得分矩阵;
Figure FDA0003413138760000028
称为残差负荷矩阵,其覆盖的空间称为残差子空间(RS);
Figure FDA0003413138760000029
称为残差得分;
通过上述过程,获得特征空间的漂移检测模型
Figure FDA00034131387600000210
进一步,由上述模型可计算得到置信度为1-α的两条控制限
Figure FDA00034131387600000211
Figure FDA00034131387600000212
Figure FDA00034131387600000213
Figure FDA00034131387600000214
为特征空间的漂移检测限,其可通过下式获得:
Figure FDA00034131387600000215
Figure FDA00034131387600000216
其中,规定h0及θr可通过下式计算:
Figure FDA00034131387600000217
Figure FDA00034131387600000218
其中,λj表示非主元特征值,r=1,2,3,且此处显著性水平α定义为:
Figure FDA00034131387600000219
P{F(M,M-h)>Fα(M,M-h)}=α (19)
N(0,1)为标准正态分布,Cα是标准正态分布的置信极限,Fα(M,M-h)是服从第一自由度为M,第二自由度为M-h的F分布;
概念漂移检测模块分为3个窗口,即离群样本检测窗口、特征空间检测窗口及输出空间检测窗口,第1个窗口实现离群样本识别及新样本标准化,后2个窗口实现模型预测输出和漂移样本识别;
3.2.1离群样本检测窗口
首先对新采集的样本
Figure FDA0003413138760000031
进行预处理,此时需要考虑新样本对历史建模样本均值和方差的影响;因此,需要首先对历史均值和标准差进行递推更新,如下:
Figure FDA0003413138760000032
Figure FDA0003413138760000033
Figure FDA0003413138760000034
为第k+1个样本均值与第k个样本的差,利用递推更新后的均值
Figure FDA0003413138760000035
及标准差
Figure FDA0003413138760000036
判断新样本是否为离群样本,通过计算第n个特征
Figure FDA0003413138760000037
的递推更新值,可知存在如下两种情况:
(1)若存在下式成立,
Figure FDA0003413138760000038
则该样本为离群样本,
Figure FDA0003413138760000039
表示新样本的第n个特征值,
Figure FDA00034131387600000310
Figure FDA00034131387600000311
表示新样本影响下的第n个特征对应的均值和标准差;
此外,取前两个时刻的均值作为内插值代替新样本数据,仍通过计算第n个特征
Figure FDA00034131387600000312
可知,
Figure FDA00034131387600000313
其中,
Figure FDA00034131387600000314
表示第k个历史样本的第n个特征值,
Figure FDA00034131387600000315
表示第k-1个历史样本的第n个特征值,
Figure FDA00034131387600000316
表示补入正常值后的新样本数据;
针对输入数据
Figure FDA00034131387600000317
依据公式(20)和(21)重新计算均值及标准差,进而得到均值
Figure FDA00034131387600000318
及标准差
Figure FDA00034131387600000319
进一步,获取标准化数据
Figure FDA00034131387600000320
即对
Figure FDA00034131387600000321
进行标准化,如下:
Figure FDA00034131387600000322
(2)若不满足式(22),则新样本
Figure FDA00034131387600000323
判定为未异常样本,直接对
Figure FDA00034131387600000324
依据历史均值和标准差进行标准化以获得
Figure FDA00034131387600000325
如下:
Figure FDA00034131387600000326
由上可知,针对新样本是否为离群点,此处将标准化的数据分别表示为
Figure FDA00034131387600000327
Figure FDA00034131387600000328
为便于描述,下文将两者统一表示为xk+1
3.2.2特征空间检测窗口
首先,将新样本xk+1分解为
Figure FDA00034131387600000329
Figure FDA00034131387600000330
两部分,如下:
Figure FDA00034131387600000331
Figure FDA00034131387600000332
Figure FDA00034131387600000333
式中,Ι为单位矩阵,
Figure FDA00034131387600000334
Figure FDA00034131387600000335
分别是xk+1在PCA主元子空间和残差子空间中的投影,
Figure FDA00034131387600000336
为负荷矩阵;
统计量
Figure FDA0003413138760000041
能够衡量新样本在主元子空间中的变化程度,统计量SPEk+1能够衡量新样本在残差子空间中偏离程度;因此,基于
Figure FDA0003413138760000042
在置信度为1-α时,计算新样本xk+1
Figure FDA0003413138760000043
和SPEk+1,如下:
Figure FDA0003413138760000044
Figure FDA0003413138760000045
Figure FDA0003413138760000046
Figure FDA0003413138760000047
Figure FDA0003413138760000048
Figure FDA0003413138760000049
其中,Ι为单位矩阵,
Figure FDA00034131387600000410
表示得分向量,λh表示前h个主元特征值,
Figure FDA00034131387600000411
是由Xk中前h个主元组成的特征向量,
Figure FDA00034131387600000412
是PCA模型得分矩阵;
特征空间漂移样本判别函数如下:
Figure FDA00034131387600000413
即,当满足
Figure FDA00034131387600000414
时,
Figure FDA00034131387600000415
取值为1;当满足
Figure FDA00034131387600000416
时,
Figure FDA00034131387600000417
取值为0;其中,若
Figure FDA00034131387600000418
的值为1时表示新样本能够表征漂移,进而得到特征空间的漂移样本
Figure FDA00034131387600000419
Figure FDA00034131387600000420
的值为0时表示未发生概念漂移;
3.2.3输出空间检测窗口
利用DXN软测量模型
Figure FDA00034131387600000421
对新样本xk+1进行预测,进而得到预测值
Figure FDA00034131387600000422
即下式:
Figure FDA00034131387600000423
通过比较预测值
Figure FDA00034131387600000424
与真实值yk+1以确定该样本是否能够表征漂移;设定判别阈值为θy=0.01,并提出判别函数如下:
Figure FDA00034131387600000425
即,当满足Δyk+1≥θy时,φPEB(Δyk+1y)取值为1;当满足Δyk+1<θy时,φPEB(Δyk+1y)取值为0;Δyk+1的计算公式如下:
Figure FDA00034131387600000426
其中,
Figure FDA00034131387600000427
Figure FDA00034131387600000428
表示历史样本的真值和预测值;此处采用绝对误差方式确定Δyk+1;由式(37)可知,若φ(Δyk+1y)的值为1时表示新样本能够表征概念漂移,进而得到输出空间的漂移样本
Figure FDA00034131387600000429
φ(Δyk+1y)的值为0时则表示未发生概念漂移;
模型更新判别模块
将从特征空间和输出空间检测到的漂移样本合并进行去冗处理后,得到最终漂移样本集Scd,其计算如下:
Figure FDA0003413138760000051
其中,fCD(·)表示对特征空间和输出空间漂移样本进行去冗处理的函数,采用去重处理模式;
将最终漂移样本集Scd的数量记为Ncd;设定
Figure FDA0003413138760000052
用于判别是否更新历史模型,存在以下两种情况:
(1)若Ncd小于阈值
Figure FDA0003413138760000053
Figure FDA0003413138760000054
则不执行模型更新;此时,采用
Figure FDA0003413138760000055
Figure FDA0003413138760000056
进行新样本递推更新,并基于历史模型
Figure FDA0003413138760000057
Figure FDA0003413138760000058
进行输出预测和漂移检测,;
(2)若Ncd大于等于阈值
Figure FDA0003413138760000059
Figure FDA00034131387600000510
将漂移样本集Scd与历史样本集
Figure FDA00034131387600000511
合并,重新训练软测量预测和特征空间漂移检测模型;此时,新建模样本集
Figure FDA00034131387600000512
可表示为:
Figure FDA00034131387600000513
重新训练DXN软测量模型和特征空间漂移检测模型,过程如下:
Figure FDA00034131387600000514
Figure FDA00034131387600000515
其中,
Figure FDA00034131387600000516
表示新建模样本集
Figure FDA00034131387600000517
的输入,
Figure FDA00034131387600000518
Figure FDA00034131387600000519
分别表示DXN软测量模型和特征空间漂移检测模型的训练过程,
Figure FDA00034131387600000520
Figure FDA00034131387600000521
表示更新后的DXN软测量模型和特征空间漂移检测模型;
考虑到漂移样本集Scd对历史均值和标准差的影响,为保证针对第
Figure FDA00034131387600000522
个新样本的正常预测和检测,按下式进行赋值更新:
Figure FDA00034131387600000523
Figure FDA00034131387600000524
Figure FDA00034131387600000525
其中,
Figure FDA00034131387600000526
Figure FDA00034131387600000527
分别表示更新后的均值和标准差,
Figure FDA00034131387600000528
Figure FDA00034131387600000529
表示更新后漂移检测限的值。
CN202111538098.2A 2021-12-15 2021-12-15 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 Pending CN114330845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111538098.2A CN114330845A (zh) 2021-12-15 2021-12-15 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111538098.2A CN114330845A (zh) 2021-12-15 2021-12-15 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法

Publications (1)

Publication Number Publication Date
CN114330845A true CN114330845A (zh) 2022-04-12

Family

ID=81051726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111538098.2A Pending CN114330845A (zh) 2021-12-15 2021-12-15 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法

Country Status (1)

Country Link
CN (1) CN114330845A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114935627A (zh) * 2022-05-07 2022-08-23 金川集团信息与自动化工程有限公司 一种用于预测合成炉出口氯化氢纯度的方法
CN115513951A (zh) * 2022-11-17 2022-12-23 山东建筑大学 一种基于概念漂移检测的电力负荷预测方法及系统
CN116128136A (zh) * 2023-02-01 2023-05-16 华能国际电力股份有限公司上海石洞口第二电厂 一种基于LSO-CatBoost的燃煤电厂锅炉NOX排放预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114935627A (zh) * 2022-05-07 2022-08-23 金川集团信息与自动化工程有限公司 一种用于预测合成炉出口氯化氢纯度的方法
CN115513951A (zh) * 2022-11-17 2022-12-23 山东建筑大学 一种基于概念漂移检测的电力负荷预测方法及系统
CN115513951B (zh) * 2022-11-17 2023-04-18 山东建筑大学 一种基于概念漂移检测的电力负荷预测方法及系统
CN116128136A (zh) * 2023-02-01 2023-05-16 华能国际电力股份有限公司上海石洞口第二电厂 一种基于LSO-CatBoost的燃煤电厂锅炉NOX排放预测方法

Similar Documents

Publication Publication Date Title
CN108549792B (zh) 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
CN114330845A (zh) 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法
CN111461355B (zh) 基于随机森林的二噁英排放浓度迁移学习预测方法
CN111260149B (zh) 一种二噁英排放浓度预测方法
CN110135057B (zh) 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法
CN112464544B (zh) 一种城市固废焚烧过程二噁英排放浓度预测模型构建方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN114225662B (zh) 一种基于滞后模型的烟气脱硫脱硝优化控制方法
Ceylan et al. Biomass higher heating value prediction analysis by ANFIS, PSO-ANFIS and GA-ANFIS
CN113780383A (zh) 基于半监督随机森林和深度森林回归集成的二噁英排放浓度预测方法
CN112733876A (zh) 基于模块化神经网络的城市固废焚烧过程氮氧化物软测量方法
CN107944173A (zh) 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统
Yang et al. Quality-related monitoring of papermaking wastewater treatment processes using dynamic multiblock partial least squares
CN111882230B (zh) 一种基于神经网络的二噁英排放在线监测方法
CN114266461A (zh) 基于可视化分布gan的mswi过程二噁英排放风险预警方法
CN116380816A (zh) 一种煤质在线检测系统故障判定方法、程序以及存储介质
Wang et al. Multiblock dynamic enhanced canonical correlation analysis for industrial MSW combustion state monitoring
CN116312869A (zh) 催化裂化再生烟气氮氧化物预测方法、装置及系统
CN113536601A (zh) 一种提高连续重整装置催化剂碳含量预估精度的方法
Ren et al. Fault detection and process monitoring of industrial process based on spherical kernel T-PLS
CN112816377B (zh) 基于ftir技术的烟气检测方法
CN115183248B (zh) 一种基于rto装置的化工废气燃烧处理方法及系统
CN116110506A (zh) 一种mswi过程二噁英排放浓度在线软测量方法
CN114112374A (zh) 一种基于正交子块投影的武器装备系统的故障诊断方法
CN116954124A (zh) 锅炉控制系统、方法、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination