CN114330845A - 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 - Google Patents
基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 Download PDFInfo
- Publication number
- CN114330845A CN114330845A CN202111538098.2A CN202111538098A CN114330845A CN 114330845 A CN114330845 A CN 114330845A CN 202111538098 A CN202111538098 A CN 202111538098A CN 114330845 A CN114330845 A CN 114330845A
- Authority
- CN
- China
- Prior art keywords
- sample
- drift
- model
- value
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于多窗口概念漂移检测的MSWI过程二噁英排放预测方法属于城市固废焚烧领域。二噁英(DXN)是城市固废焚烧(MSWI)过程排放的巨毒污染物。实际工业过程采用软测量模型以实现DXN预测,但工业过程的时变特性导致软测量模型的预测精度降低。首先,基于历史数据建立随机森林(RF)软测量模型和主成分分析(PCA)漂移检测模型;其次,通过多窗口概念漂移检测策略对新样本进行漂移检测,以确定新样本是否为漂移样本;最后,对上述的漂移样本进行去冗处理并判断其数量是否满足设定的阈值,若满足则重新训练PCA模型及RF模型,否则继续采用历史模型对新样本进行预测。采用工业过程数据验证了所提方法的有效性。
Description
技术领域
本发明属于城市固废焚烧技术领域。
背景技术
城镇化过程的不断推进使得城市固废(Municipal Solid Waste,MSW)的产生量逐年上升,如何对其进行有效处理已成为目前城市污染防控战略最为关键的一环。具有减量化、高效化、低污染等优势的城市固废焚烧(MSW Incineration,MSWI)技术,已在世界范围内广泛应用,其典型工艺流程如图1所示。
如图1所示,MSWI过程包括固废储运、固废焚烧、蒸汽发电、烟气处理等工艺环节。MSW通常由市政运输车运至存放池中进行堆酵,再通过抓斗投入料斗后,由给料器推入炉排;在炉内经过干燥、燃烧和燃烬3个阶段后,将焚烧残渣进行冷却并收集至填埋场,将燃烧产生的高温烟气对余热锅炉加热后产生过热蒸汽以推动汽轮机发电;锅炉出口烟气进入反应器中和后,其中飞灰类物质进入飞灰罐,而烟气进入袋式除尘器中被脱去烟气颗粒、中和反应物及活性炭吸附物,再经处理后分为三个部分:飞灰掉入飞灰罐,部分烟灰混合物加水后重新输入反应器,尾部烟气经引风机通过烟囱排出,后者含有CO、HCL、SO2、NOx、及二噁英(DXN)等污染气体。
DXN是MSWI过程排放的被称为“世纪之毒”的有机类污染物,其在生物体内存在累积效应,对生态环境具有潜在的巨大危害。常用的DXN检测方法包括:(1)基于激光质谱的离线直接检测法,其原理是基于激光波长电离相关分子后,在实验室通过质谱仪实现直接检测,其缺点是仅能在实验室进行且需要获取待检测DXN同类物的光谱结构,进而造成检测严重滞后且存在不能对未知DXN结构进行检测的缺点;(2)基于指示物/关联物的在线间接检测法,其原理是先在线检测关联物浓度后,再通过DXN与关联物之间的映射模型进行预测,其缺点是指示物检测装置复杂性高且难以维护,关联物和DXN的映射关系极为复杂且依赖离线检测化验值,导致该方法难以推广;(3)软测量法,其通过容易测得的相关数据变量与难测参数间的映射关系构建软测量系统,能够实现DXN浓度的实时在线预测。
实际工业过程常采用高成本、长周期的在线采样和离线化验相结合的方式检测DXN排放浓度,显然难以支撑MSWI过程的实时反馈控制。对此问题,已有众多研究人员多采用历史样本构建软测量模型实现DXN的实时检测。通常,软测量模型采用基于特定分布的有限数量的历史样本构建。显然,复杂工业过程中固有的工况波动会导致软测量模型检测精度的下降。
目前,研究学者将工作环境改变、物料变化和设备老化等因素导致的历史模型泛化性能变差的现象称为概念漂移。类似地,MSWI过程中的概念漂移也会导致新样本表征的分布相对于历史样本发生变化,导致表征旧分布的软测量模型难以适用于表征新工况状态的漂移样本。除此之外,工业过程数据通常具有非线性,也存在噪声、缺失及不确定性等问题,这使得概念漂移问题更为复杂。显然,概念漂移对DXN预测的影响体现在,基于历史数据构建的软测量模型难以覆盖工况波动后的样本分布,这使得基于历史数据构建的软测量模型在实际应用中存在偏差,预测结果难以反映真实的情况。因此,实现DXN排放浓度在线实时检测的前提是能够对MSWI过程的工况漂移现象进行准确识别,并采用这些能够表征工况漂移的样本更新软测量模型以提高预测精度。显然,DXN浓度的高精度预测首先需要解决MSWI过程的漂移识别问题。
目前已有研究均未在样本预测和漂移检测前对工业现场可能存在的离群样本进行识别及预处理,也未考虑如何对特征空间及输出空间识别到的漂移样本间存在的冗余性问题进行处理。
针对上述问题,本文提出一种基于多窗口概念漂移检测的DXN排放预测方法。首先,基于标准化历史数据建立基于随机森林(RF)的软测量模型和基于主成分分析(PCA)的漂移检测模型;其次,通过多窗口概念漂移检测策略对新样本进行漂移检测,其中,在离群样本检测窗口中判断新样本是否为离群样本并进行标准化处理,在特征空间漂移检测窗口中计算新样本的T2和SPE以确定其是否为特征空间漂移样本,在输出空间漂移检测窗口中实现对新样本的预测并依据误差确定其是否为输出空间漂移样本;最后,对上述的漂移样本进行去冗处理并判断其数量是否满足设定的阈值,若满足则重新训练PCA模型及RF模型,否则继续采用历史模型对新样本进行预测。采用工业过程数据验证了所提方法的有效性。
MSWI过程中固废焚烧阶段、烟气处理阶段和烟气排放阶段均会生成DXN。MSWI过程中产生的DXN存在于炉渣、飞灰及烟气中,其中以烟气中的DXN浓度最高,DXN主要通过固废不完全焚烧及新规合成反应产生,其排放流程可分为:产生DXN时的烟气G1、吸附处理后的烟气G2及最终排放的烟气G3共3个阶段,示意如图2所示。
由图2可知,余热锅炉的出口烟气G1进入脱酸反应器中进行中和反应,再经袋式除尘器后产生烟气G2,尾部烟气经由引风机通过烟囱排放烟气G3。研究表明,MSWI过程中DXN生成和吸附阶段的机理复杂不清。在生成阶段为保证DXN的有效分解,通常要求炉内烟气温度至少达到850摄氏度并保持两秒。在吸附阶段,为吸附DXN,在脱酸反应器中加入消石灰和活性炭,接着由袋式除尘过滤后通过引风机经由烟囱排出;此外,该阶段存在难以解释的DXN记忆效应,其也会导致DXN浓度发生变化。由上述工艺流程可知,DXN排放浓度与MSWI过程中的众多变量相关。显然,这些相关变量的异常波动会影响DXN排放浓度软测量模型的预测结果。可见,为实现DXN的在线实时精准预测,首先需要及时检测概念漂移,以便有效地更新DXN软测量模型。
发明内容
根据上述分析,本文提出基于多窗口概念漂移检测的DXN排放预测方法,其算法策略如图3所示。
其中,表示第i个历史样本向量,表示所有历史样本的第m个特征组成的向量,表示为第i个历史样本中的第m个特征;m=1,…,M,i=1,…,k,k为样本数量,M为特征数量。历史样本输出为 表示第i个历史样本的输出。进而,历史建模样本集Sold可表示为,
其中,m=1,…,M。
最后,标准历史数据可表示为
xi表示第i个标准历史样本向量,xm表示所有标准历史样本的第m个特征组成的向量,xmi表示为第i个标准历史样本中的第m个特征;其中,m=1,…,M,i=1,…,k,k为样本数量,M为特征数量。
本文采用随机森林(RF)构建DXN软测量模型,其构建过程如图4所示。
由图4可知,构建过程可描述为:对标准历史数据Xk采用自助随机抽样,有放回的随机抽取子数据集作为训练集;从其M个特征中随机选取若干个特征,作为分裂节点的依据;多次训练得到不同的CART树;接着,将各个CART树输出值的均值作为RF的预测结果。
PCA能够从标准历史数据Xk的高维特征中提取关键变化信息,能够以较少的潜在特征更集中地反映原始高维变量的变化。标准历史数据Xk由具有M个特征的k个样本组成,即Xk∈Rk×M,Rk×M表示全部数据集,Xk按下式分解:
其中,th和ph分别是得分向量和负荷向量。
ph为相关系数矩阵Rk的第h个主元向量,如下式所示:
(Rk-λk)Pk=0 (11)
其中,λk为Rk的特征值,Pk为λk对应的特征向量,E为单位矩阵。λk可通过下式解得,如下:
λkE-Rk|=0 (12)
而分解后的Xk即可表示为,
其中,和分别是PCA的模型部分和残差部分;是由Rk的前h个主元向量组成的负荷矩阵,其覆盖的空间称为主元子空间(PCS);是Xk在上的投影,称为得分矩阵;称为残差负荷矩阵,其覆盖的空间称为残差子空间(RS);称
为残差得分。
其中,规定h0及θr可通过下式计算:
其中,λj表示非主元特征值,r=1,2,3,且此处显著性水平α定义为:
P{F(M,M-h)>Fα(M,M-h)}=α (19)
N(0,1)为标准正态分布,Cα是标准正态分布的置信极限,Fα(M,M-h)是服从第一自由度为M,第二自由度为M-h的F分布。
本文中的概念漂移检测模块分为3个窗口,即离群样本检测窗口、特征空间检测窗口及输出空间检测窗口,第1个窗口实现离群样本识别及新样本标准化,后2个窗口实现模型预测输出和漂移样本识别。
3.2.1离群样本检测窗口
(1)若存在下式成立,
3.2.2特征空间检测窗口
本文提出的特征空间漂移样本判别函数如下:
3.2.3输出空间检测窗口
即,当满足Δyk+1≥θy时,φPEB(Δyk+1,θy)取值为1;当满足Δyk+1<θy时,φPEB(Δyk+1,θy)取值为0。Δyk+1的计算公式如下:
其中,和表示历史样本的真值和预测值。本文此处采用绝对误差方式确定Δyk+1。由式(37)可知,若φ(Δyk+1,θy)的值为1时表示新样本能够表征概念漂移,进而得到输出空间的漂移样本φ(Δyk+1,θy)的值为0时则表示未发生概念漂移。
3.3模型更新判别模块
将从特征空间和输出空间检测到的漂移样本合并进行去冗处理后,得到最终漂移样本集Scd,其计算如下:
其中,fCD(·)表示对特征空间和输出空间漂移样本进行去冗处理的函数,本文此处采用去重处理模式。
重新训练DXN软测量模型和特征空间漂移检测模型,过程如下:
通过上述更新后,所提软测量模型能够更好的适应MSWI过程的动态变化。
附图说明
图1城市固废焚烧工艺流程图
图2面向MSWI过程的DXN生成示意图
图3基于多窗口概念漂移检测的策略图
图4DXN软测量模型构建过程框图
图5历史数据RF的DXN预测与真值
图6更新后的T2和SPE
图9输出空间预测误差
图10模型更新后预测值与真值
具体实施方式
本节建模数据为北京某MWSI电厂某条线近6年来的真实DXN排放浓度数据,其中包括来自固废焚烧系统、烟气处理系统、锅炉系统、固废储运系统、蒸汽发电系统等的121个过程变量,如表1所示。
表1 DXN排放浓度数据121个过程变量明细
本次实验共采用33个标记数据,并将其分为2部分,其中2/3用作训练集,1/3用作测试集。
在离线建模窗口,通过历史数据构建DXN软测量模型及特征空间漂移检测模型,对历史数据进行预测与真实值对比如图5所示。
此处,设置参数α=0.05,θy=0.01,θcd=1。
接着,在特征空间检测窗口计算得到DXN的测试样本的T2和SPE,与特征空间漂移检测限和判别是否为特征空间漂移样本。同时,在输出空间检测窗口对测试数据预测并计算预测误差得到输出空间漂移样本。特征空间和输出空间的漂移样本进行去冗处理后更新训练模型及参数。
每个漂移样本检出后需进行更新模型和参数。其中,特征空间检测模型更新后的两条漂移检测限T2和SPE的值如图6所示。
如图7和8所示,为更新后的特征空间漂移检测限与各测试样本对应的T2和SPE的值。
由图7和8可知,特征空间的漂移样本共10个。
本次实验统计每个测试样本在输出空间检测时相应的预测值及真值,并计算相应的预测误差,与输出空间漂移检测限θy对比,如图9所示。
由图9可知,输出空间的漂移样本共9个。
本次实验中,输出空间检出的漂移检测样本共9个,特征空间检出的漂移样本共10个,全部漂移样本经过判别、合并和去冗后可知,进而可知,测试样本中存在10个漂移样本。
通过漂移样本更新后,预测模型的对真值的拟合程度提高,证明了所提算法的有效性。
本次实验过程中,分别采用本次算法与离线模型、仅基于输出空间误差与仅基于特征空间的方法进行比较。实验结果如下表2所示。本文采用均方根误差(root meansquared error,RMSE),R2、MAE等三个指标进行度量。
表2不同概念漂移检测算法的性能对比
根据上述结果可知,本节方法可有效检测DXN预测数据中所存在的概念漂移现象并通过更新模型能够提高DXN的预测精度,进而显著提高软测量模型在漂移环境中的适应性。
本发明的方法利用多窗口并行检测能够显著提高漂移检测精度的原理,提出了一种用于MSWI过程DXN排放预测建模的概念漂移检测方法,采用多窗口概念漂移检测实现对漂移样本的精确检测,同时及时更新预测模型提高预测精度。实验数据证明,在给定11个真实DXN排放浓度数据下,应用本方法能够精确检测出10个漂移样本,其中特征空间检测出的漂移样本为10个,输出空间检测的漂移样本为9个,联合特征空间与输出空间漂移样本去冗机制后能够确定共10个漂移样本。同时其均方根误差RMSE=0.0062,决定系数R2=0.8800,平均绝对误差MAE=0.0051,具有较高的准确率,因此,在MSWI过程数据的应用背景下也具有较高的预测准确率。
Claims (1)
1.基于多窗口概念漂移检测的MSWI过程二噁英排放预测方法,其特征在于,
其中,表示第i个历史样本向量,表示所有历史样本的第m个特征组成的向量,表示为第i个历史样本中的第m个特征;m=1,…,M,i=1,…,k,k为样本数量,M为特征数量;历史样本输出为 表示第i个历史样本的输出;进而,历史建模样本集Sold表示为,
其中,m=1,…,M;
最后,标准历史数据可表示为
xi表示第i个标准历史样本向量,xm表示所有标准历史样本的第m个特征组成的向量,xmi表示为第i个标准历史样本中的第m个特征;其中,m=1,…,M,i=1,…,k,k为样本数量,M为特征数量;
采用随机森林(RF)构建DXN软测量模型,构建过程描述为:对标准历史数据Xk采用自助随机抽样,有放回的随机抽取子数据集作为训练集;从其M个特征中随机选取若干个特征,作为分裂节点的依据;多次训练得到不同的CART树;接着,将各个CART树输出值的均值作为RF的预测结果;
PCA能够从标准历史数据Xk的高维特征中提取关键变化信息,能够以较少的潜在特征更集中地反映原始高维变量的变化;标准历史数据Xk由具有M个特征的k个样本组成,即Xk∈Rk ×M,Rk×M表示全部数据集,Xk按下式分解:
其中,th和ph分别是得分向量和负荷向量;
ph为相关系数矩阵Rk的第h个主元向量,如下式所示:
(Rk-λk)Pk=0 (11)
其中,λk为Rk的特征值,Pk为λk对应的特征向量,E为单位矩阵;λk可通过下式解得,如下:
|λkE-Rk|=0 (12)
而分解后的Xk即可表示为,
其中,和分别是PCA的模型部分和残差部分;是由Rk的前h个主元向量组成的负荷矩阵,其覆盖的空间称为主元子空间(PCS);是Xk在上的投影,称为得分矩阵;称为残差负荷矩阵,其覆盖的空间称为残差子空间(RS);称为残差得分;
其中,规定h0及θr可通过下式计算:
其中,λj表示非主元特征值,r=1,2,3,且此处显著性水平α定义为:
P{F(M,M-h)>Fα(M,M-h)}=α (19)
N(0,1)为标准正态分布,Cα是标准正态分布的置信极限,Fα(M,M-h)是服从第一自由度为M,第二自由度为M-h的F分布;
概念漂移检测模块分为3个窗口,即离群样本检测窗口、特征空间检测窗口及输出空间检测窗口,第1个窗口实现离群样本识别及新样本标准化,后2个窗口实现模型预测输出和漂移样本识别;
3.2.1离群样本检测窗口
(1)若存在下式成立,
3.2.2特征空间检测窗口
特征空间漂移样本判别函数如下:
3.2.3输出空间检测窗口
即,当满足Δyk+1≥θy时,φPEB(Δyk+1,θy)取值为1;当满足Δyk+1<θy时,φPEB(Δyk+1,θy)取值为0;Δyk+1的计算公式如下:
其中,和表示历史样本的真值和预测值;此处采用绝对误差方式确定Δyk+1;由式(37)可知,若φ(Δyk+1,θy)的值为1时表示新样本能够表征概念漂移,进而得到输出空间的漂移样本φ(Δyk+1,θy)的值为0时则表示未发生概念漂移;
模型更新判别模块
将从特征空间和输出空间检测到的漂移样本合并进行去冗处理后,得到最终漂移样本集Scd,其计算如下:
其中,fCD(·)表示对特征空间和输出空间漂移样本进行去冗处理的函数,采用去重处理模式;
重新训练DXN软测量模型和特征空间漂移检测模型,过程如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111538098.2A CN114330845A (zh) | 2021-12-15 | 2021-12-15 | 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111538098.2A CN114330845A (zh) | 2021-12-15 | 2021-12-15 | 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330845A true CN114330845A (zh) | 2022-04-12 |
Family
ID=81051726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111538098.2A Pending CN114330845A (zh) | 2021-12-15 | 2021-12-15 | 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330845A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114935627A (zh) * | 2022-05-07 | 2022-08-23 | 金川集团信息与自动化工程有限公司 | 一种用于预测合成炉出口氯化氢纯度的方法 |
CN115513951A (zh) * | 2022-11-17 | 2022-12-23 | 山东建筑大学 | 一种基于概念漂移检测的电力负荷预测方法及系统 |
CN116128136A (zh) * | 2023-02-01 | 2023-05-16 | 华能国际电力股份有限公司上海石洞口第二电厂 | 一种基于LSO-CatBoost的燃煤电厂锅炉NOX排放预测方法 |
-
2021
- 2021-12-15 CN CN202111538098.2A patent/CN114330845A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114935627A (zh) * | 2022-05-07 | 2022-08-23 | 金川集团信息与自动化工程有限公司 | 一种用于预测合成炉出口氯化氢纯度的方法 |
CN115513951A (zh) * | 2022-11-17 | 2022-12-23 | 山东建筑大学 | 一种基于概念漂移检测的电力负荷预测方法及系统 |
CN115513951B (zh) * | 2022-11-17 | 2023-04-18 | 山东建筑大学 | 一种基于概念漂移检测的电力负荷预测方法及系统 |
CN116128136A (zh) * | 2023-02-01 | 2023-05-16 | 华能国际电力股份有限公司上海石洞口第二电厂 | 一种基于LSO-CatBoost的燃煤电厂锅炉NOX排放预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549792B (zh) | 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法 | |
CN114330845A (zh) | 基于多窗口概念漂移检测的mswi过程二噁英排放预测方法 | |
CN111461355B (zh) | 基于随机森林的二噁英排放浓度迁移学习预测方法 | |
CN111260149B (zh) | 一种二噁英排放浓度预测方法 | |
CN110135057B (zh) | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 | |
CN112464544B (zh) | 一种城市固废焚烧过程二噁英排放浓度预测模型构建方法 | |
CN112904810B (zh) | 基于有效特征选择的流程工业非线性过程监测方法 | |
CN114225662B (zh) | 一种基于滞后模型的烟气脱硫脱硝优化控制方法 | |
Ceylan et al. | Biomass higher heating value prediction analysis by ANFIS, PSO-ANFIS and GA-ANFIS | |
CN113780383A (zh) | 基于半监督随机森林和深度森林回归集成的二噁英排放浓度预测方法 | |
CN112733876A (zh) | 基于模块化神经网络的城市固废焚烧过程氮氧化物软测量方法 | |
CN107944173A (zh) | 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统 | |
Yang et al. | Quality-related monitoring of papermaking wastewater treatment processes using dynamic multiblock partial least squares | |
CN111882230B (zh) | 一种基于神经网络的二噁英排放在线监测方法 | |
CN114266461A (zh) | 基于可视化分布gan的mswi过程二噁英排放风险预警方法 | |
CN116380816A (zh) | 一种煤质在线检测系统故障判定方法、程序以及存储介质 | |
Wang et al. | Multiblock dynamic enhanced canonical correlation analysis for industrial MSW combustion state monitoring | |
CN116312869A (zh) | 催化裂化再生烟气氮氧化物预测方法、装置及系统 | |
CN113536601A (zh) | 一种提高连续重整装置催化剂碳含量预估精度的方法 | |
Ren et al. | Fault detection and process monitoring of industrial process based on spherical kernel T-PLS | |
CN112816377B (zh) | 基于ftir技术的烟气检测方法 | |
CN115183248B (zh) | 一种基于rto装置的化工废气燃烧处理方法及系统 | |
CN116110506A (zh) | 一种mswi过程二噁英排放浓度在线软测量方法 | |
CN114112374A (zh) | 一种基于正交子块投影的武器装备系统的故障诊断方法 | |
CN116954124A (zh) | 锅炉控制系统、方法、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |