CN113780384A - 基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法 - Google Patents

基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法 Download PDF

Info

Publication number
CN113780384A
CN113780384A CN202111000553.3A CN202111000553A CN113780384A CN 113780384 A CN113780384 A CN 113780384A CN 202111000553 A CN202111000553 A CN 202111000553A CN 113780384 A CN113780384 A CN 113780384A
Authority
CN
China
Prior art keywords
submodel
model
gbdt
bsf
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111000553.3A
Other languages
English (en)
Other versions
CN113780384B (zh
Inventor
汤健
王天峥
夏恒
乔俊飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202111000553.3A priority Critical patent/CN113780384B/zh
Publication of CN113780384A publication Critical patent/CN113780384A/zh
Application granted granted Critical
Publication of CN113780384B publication Critical patent/CN113780384B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法。城市固体废物焚烧(MSWI)过程的稳定运行取决于三个关键被控变量,即炉温、烟气含氧量和锅炉蒸汽流量。本文针对三个被控变量构建了基于集成决策树算法的数据驱动模型,其是随机森林(RF)和梯度提升决策树(GBDT)的集成组合。首先,采用随机样本和特征抽样对MSWI过程数据进行预处理,获得建模数据子集;其次,采用这些子集构建RF模型,接着使用梯度迭代RF模型构建具有串行结构的GBDT模型;最后,通过简单加权平均RF子模型和GBDT子模型的预测输出以获得三个被控关键变量的最终预测值。基于实际MSWI过程中获得的运行数据验证方法的有效性。

Description

基于集成决策树算法的城市固废焚烧过程关键被控变量预测 方法
技术领域
本发明属于智能控制领域。
背景技术
经济的快速发展和城镇化的不断提升,导致城市固体废物(MSW)的产生量迅速增加。MSW焚烧(MSWI)发电是实现MSW减量化、资源化、无害化的典型处理方式之一。目前,我国MSWI发电厂的总数正在逐渐增加,已达到500多座。
在现有技术中,主要通过现场监控和人工控制进行MSWI的运行控制。建立被控对象模型是研究MSWI过程的智能优化控制首先需要解决的问题。在MSWI过程中,与运行工况直接相关的工艺参数主要体现在炉温(FT)、烟气含氧量(OC)和锅炉蒸汽流量(BSF)这三个被控变量上。因此FT、OC和BSF是电厂中的关键被控变量,例如MSWI和燃煤电厂。
因此,本文采用RF模型和GBDT模型相结合的方式,建立基于过程数据的被控对象模型。首先,采用随机样本和特征抽样对MSWI过程数据进行预处理,获得建模数据子集;其次,采用这些子集构建RF模型,接着使用梯度迭代RF模型构建具有串行结构的GBDT模型;最后,通过简单加权平均RF子模型和GBDT子模型的预测输出以获得三个被控关键变量的最终预测值。基于实际MSWI过程中获得的过程数据验证了所提方法的有效性。
附录图1中给出了北京某MSWI电厂工艺流程图。
由图可知,MSW由车辆运输,经地磅称重后排入固废池;经过3~7天的生物发酵脱水后,固废池中的MSW被抓斗抛入料斗中;然后,进料器将MSW推向焚烧炉炉排,经过干燥、燃烧、燃烬三个阶段;最后,焚烧产生的灰渣通过捞渣机输送到渣坑并会由车辆运输至指定地点填埋;燃烧过程中会产生高温烟气,其温度应控制在850℃以上,以保证有害气体的分解燃烧。二次风产生高度湍流,保证烟气停留2秒以上,进一步分解有害气体。之后,高温烟气进入余热锅炉,热产生的高温蒸汽带动汽轮发电机组发电。随后,与石灰和活性炭混合的烟气进入脱酸反应器,发生中和反应以吸附烟气中的DXN和重金属。接下来,在袋式过滤器中去除烟道气颗粒、中和反应物和活性炭吸附剂。混合器中加水与部分烟灰混合物混合后,再次进入脱酸反应器。来自反应器和袋式过滤器的飞灰被输送到飞灰罐进行进一步处理。最后,含有粉尘、CO、NOx、SO2、HCL、HF、Hg、Cd和DXN等其他物质的废气通过烟囱排入大气。
MSWI过程中伴随着大量有害物质的生成,为了能够将这些有害物质进行处理,出口前的烟气处理是重中之重。但由于MSWI运行周期长,维修困难,难免会造成设备老化的情况。因此,能够在有害物质产生之前进行有效地针对处理是解决有害物质排放量的关键。为确保在MSWI过程中有害物质能够被分解和中和,炉膛温度必须控制在850℃以上,并提供适当的氧气浓度保证MSW能够充分燃烧,以使得排放烟气中有毒物质含量降低。同时,在炉膛温度高温状态下,为确保能源的有效利用以及工厂收益,通常采用焚烧产生的热能将锅炉水转换成蒸汽推动汽轮机组发电。因此,建立FT模型、OC模型和BSF模型是保证MSWI电厂稳定运行与提升收益的关键。
发明内容
本文提出的建模策略包括Bootstrap与随机子空间法(Random Sub-spaceMethod,RSM)模块和模型构建模块,其中:后者由FT模型、OC模型和BSF模型组成,每个模型构建模块包括RF子模块、GBDT子模块和平均集成子模块,如附录图2所示,输入通过OPC采集得到的MSWI过程变量,经过两个模块后输出FT、OC和BSF的预测值。
在图2中,
Figure BDA0003234890920000021
表示采集自MSWI过程的建模样本(N表示过程变量特征数量,M表示样本数量),其包含一次风风量等37个在DCS系统中可实时采集的过程变量,本文所采用的过程变量如表1所示;
表1 37个过程变量明细
Figure BDA0003234890920000022
Figure BDA0003234890920000031
Figure BDA0003234890920000041
图中,
Figure BDA0003234890920000042
Figure BDA0003234890920000043
分别表示FT模型、OC模型和BSF模型中第n个样本的真实值(本文中因模型参数取值不同,FT、OC和BSF标记仅作为区分使用,在对应模型中具体含义不受此脚标影响);
Figure BDA0003234890920000044
Figure BDA0003234890920000045
分别表示FT模型、OC模型和BSF模型的J个训练集;J是训练子集和RF子模型的数量;
Figure BDA0003234890920000046
Figure BDA0003234890920000047
分别表示在第j个RF子模型
Figure BDA0003234890920000048
中FT、OC和BSF的预测值;
Figure BDA0003234890920000049
Figure BDA00032348909200000410
分别表示第j个RF子模型的预测值与各自真值之间的误差;
Figure BDA00032348909200000411
Figure BDA00032348909200000412
Figure BDA00032348909200000413
分别表示第一个GBDT子模型的预测值与各自输出空间
Figure BDA00032348909200000414
Figure BDA00032348909200000415
之间的误差;
Figure BDA00032348909200000416
Figure BDA00032348909200000417
分别表示第i个GBDT子模型的预测值和各自输入空间
Figure BDA00032348909200000418
Figure BDA00032348909200000419
Figure BDA00032348909200000420
之间的误差;
Figure BDA00032348909200000421
Figure BDA00032348909200000422
分别为GBDT子模型中FT模型、OC模型和BSF模型的预测输出,I表示GBDT子模型中的模型数,即迭代次数;
Figure BDA00032348909200000423
Figure BDA00032348909200000424
分别代表平均集成子模块中FT模型、OC模型和BSF模型的预测输出。
本文的建模问题被描述如式1所示,其目的是通过调整参数,如最小样本数(MinSamples)、特征数量(FeaturesNum)、决策树数量(Tn)和迭代次数(Iteration),最小化三个被控变量模型预测误差的平方根,进而建立高精度模型。
Figure BDA00032348909200000425
Figure BDA00032348909200000426
(1)Bootstrap与RSM模块:从MSWI过程数据
Figure BDA0003234890920000051
中选取MFT个输入特征,随机采样NFT次生成JFT个训练子集
Figure BDA0003234890920000052
(2)模型构建模块:
①RF子模型模块:利用生成的训练子集
Figure BDA0003234890920000053
建立RF子模型
Figure BDA0003234890920000054
然后用真值
Figure BDA0003234890920000055
减去预测值
Figure BDA0003234890920000056
得到预测误差
Figure BDA0003234890920000057
②GBDT子模型模块:以误差
Figure BDA0003234890920000058
为训练子集迭代IFT次后,构建了IFT×JFT的GBDT子模型
Figure BDA0003234890920000059
③平均集成子模块:RF子模型的预测输出
Figure BDA00032348909200000510
和GBDT子模型的预测输出
Figure BDA00032348909200000511
经过简单的平均集成,从而获得最终FT模型的预测输出
Figure BDA00032348909200000512
针对OC模型,对不同模块的功能进行描述如下:
(1)Bootstrap与RSM模块:从MSWI过程数据
Figure BDA00032348909200000513
中选取MOC个输入特征,随机采样NOC次生成JOC个训练子集
Figure BDA00032348909200000514
(2)模型构建模块:
①RF子模型模块:利用生成的训练子集
Figure BDA00032348909200000515
建立RF子模型
Figure BDA00032348909200000516
然后用真值
Figure BDA00032348909200000517
减去预测值
Figure BDA00032348909200000518
得到预测误差
Figure BDA00032348909200000519
②GBDT子模型模块:以误差
Figure BDA00032348909200000520
为训练子集迭代IOC次后,构建了IOC×JOC的GBDT子模型
Figure BDA00032348909200000521
③平均集成子模块:RF子模型的预测输出
Figure BDA00032348909200000522
和GBDT子模型的预测输出
Figure BDA00032348909200000523
经过简单的平均集成,从而获得最终OC模型的预测输出
Figure BDA00032348909200000524
针对BSF模型,对不同模块的功能进行描述如下:
(1)Bootstrap与RSM模块:从MSWI过程数据
Figure BDA00032348909200000525
中选取MBSF个输入特征,随机采样NBSF次生成JBSF个训练子集
Figure BDA00032348909200000526
(2)模型构建模块:
①RF子模型模块:利用生成的训练子集
Figure BDA00032348909200000527
建立RF子模型
Figure BDA00032348909200000528
然后用真值
Figure BDA00032348909200000529
减去预测值
Figure BDA00032348909200000530
得到预测误差
Figure BDA00032348909200000531
②GBDT子模型模块:以误差
Figure BDA00032348909200000532
为训练子集迭代IBSF次后,构建了IBSF×JBSF的GBDT子模型
Figure BDA00032348909200000533
③平均集成子模块:RF子模型的预测输出
Figure BDA0003234890920000061
和GBDT子模型的预测输出
Figure BDA0003234890920000062
经过简单的平均集成,从而获得最终BSF模型的预测输出
Figure BDA0003234890920000063
方法实现
3.1.1 Bootstrap与RSM模块
首先采用Bootstrap提取与建模数据具有相同样本数的训练子集,以减少子模型之间的相关性;然后使用RSM机制随机选择特征;最后,生成包含N个样本和Mj个特征的J个训练子集。
训练子集的生成过程可以表示为:
Figure BDA0003234890920000064
其中,
Figure BDA0003234890920000065
是第j次选择的针对第Mtype个被控变量的训练子集,Mtype={FT,OC,BSF},
Figure BDA0003234890920000066
表示第j个训练子集的第n个输入样本,Mj表示第j个训练子集中包含的输入特征的数量。
3.1.2模型构建模块
3.2.2.1针对FT模型
a)RF子模型模块
步骤一,在训练子集
Figure BDA0003234890920000067
中去除因随机抽样产生的重复样本,并将其标记为
Figure BDA0003234890920000068
其中,nsel表示当前抽取选择的样本,Nsel表示抽样选择样本的总数量;然后,以第m次输入特征
Figure BDA0003234890920000069
作为分割变量,以第nsel个样本对应的值
Figure BDA00032348909200000610
作为分割点,将输入特征空间分为两个区域
Figure BDA00032348909200000611
Figure BDA00032348909200000612
Figure BDA0003234890920000071
基于以下准则,通过遍历找到最优分割变量和分割点,
Figure BDA0003234890920000072
其中,
Figure BDA0003234890920000073
Figure BDA0003234890920000074
分别代表区域
Figure BDA0003234890920000075
Figure BDA0003234890920000076
中第jFT个训练子集的真实值;
Figure BDA0003234890920000077
Figure BDA0003234890920000078
分别代表区域
Figure BDA0003234890920000079
Figure BDA00032348909200000710
中真实值的平均值。
步骤二,根据公式(4)通过遍历找到最优分割变量和分割点,从而将输入特征空间划分为两个区域;然后,对划分的区域重复遍历,进而找到此区域中最优分割变量和分割点,直到叶节点训练样本数小于依经验设定的阈值θRF·FT;最后,将输入特征空间划分为K个区域并标记为R1,...,Rk,...,RK
步骤三,基于CART回归树构建的RF子模型可以表示为:
Figure BDA00032348909200000711
Figure BDA00032348909200000712
其中,
Figure BDA00032348909200000713
表示区域Rk中包含的样本数,
Figure BDA00032348909200000714
是区域Rk中第jFT个训练子集的第
Figure BDA00032348909200000715
个真实值;I(·)表示指示函数,当
Figure BDA00032348909200000716
存在时为1,否则为0。
步骤四,训练子集构建的RF子模型的预测误差为:
Figure BDA00032348909200000717
其中,
Figure BDA00032348909200000718
表示第n个训练样本的预测误差。
通过重复上述步骤一至步骤四,构建JFT个RF子模型
Figure BDA00032348909200000719
最后,用真实值
Figure BDA00032348909200000720
减去RF子模型的预测输出
Figure BDA00032348909200000721
得到输出误差
Figure BDA00032348909200000722
b)GBDT子模型模块
步骤一,构建第一个子模型
Figure BDA00032348909200000723
可以表示为:
Figure BDA00032348909200000724
其中,
Figure BDA00032348909200000725
代表第一个GBDT子模型的输出。
步骤二,构建上述子模型的损失函数定义如下:
Figure BDA0003234890920000081
其中,
Figure BDA0003234890920000082
表示第jFT个训练子集中第n个样本的预测值。
步骤三,计算子模型
Figure BDA0003234890920000083
的输出残差
Figure BDA0003234890920000084
如下:
Figure BDA0003234890920000085
步骤四,
Figure BDA0003234890920000086
作为第二个GBDT子模型
Figure BDA0003234890920000087
中训练子集输出空间的真值。同样,第二个GBDT子模型可以表示为:
Figure BDA0003234890920000088
其中,
Figure BDA0003234890920000089
是第一个GBDT子模型中第n个样本的预测误差。
重复步骤一至步骤四,可以得出第iFT个GBDT子模型可以标记为
Figure BDA00032348909200000810
其残差计算如下:
Figure BDA00032348909200000811
迭代IFT-1次后,第IFT-1个子模型中训练子集的输出空间的真值为:
Figure BDA00032348909200000812
其中,
Figure BDA00032348909200000813
是第IFT-1个子模型
Figure BDA00032348909200000814
的预测输出。
因此,第IFT个子模型可以表示为:
Figure BDA00032348909200000815
其中,
Figure BDA00032348909200000816
表示第IFT-1个GBDT子模型中样本的预测误差。
最后,所有基于第jFT个训练子集的IFT个GBDT子模型都可表示为
Figure BDA00032348909200000817
其输出可表示为
Figure BDA00032348909200000818
c)平均集成子模块
从两个子模块构建过程可以得出,并行构建的RF子模型可表示为
Figure BDA00032348909200000819
同时级联和并行建立的GBDT子模型可以表示为
Figure BDA00032348909200000820
对于第jFT个训练子集,本文构建了IFT个RF子模型和IFT个GBDT子模型,其中子模型串行生成,它们的预测输出之和作为训练子集的整体输出,可表示为:
Figure BDA0003234890920000091
由于JFT个训练子集是平行的,此处通过简单的平均加权方法将上述模型组合起来,最终的FT模型可表示为:
Figure BDA0003234890920000092
3.2.2.2针对OC模型
a)RF子模型模块
步骤一,在训练子集
Figure BDA0003234890920000093
中去除因随机抽样产生的重复样本,并将其标记为
Figure BDA0003234890920000094
其中,nsel表示当前抽取选择的样本,Nsel表示抽样选择样本的总数量;然后,以第m次输入特征
Figure BDA0003234890920000095
作为分割变量,以第nsel个样本对应的值
Figure BDA0003234890920000096
作为分割点,将输入特征空间分为两个区域
Figure BDA0003234890920000097
Figure BDA0003234890920000098
Figure BDA0003234890920000099
基于以下准则,通过遍历找到最优分割变量和分割点,
Figure BDA00032348909200000910
其中,
Figure BDA00032348909200000911
Figure BDA00032348909200000912
分别代表区域
Figure BDA00032348909200000913
Figure BDA00032348909200000914
中第jOC个训练子集的真实值;
Figure BDA00032348909200000915
Figure BDA00032348909200000916
分别代表区域
Figure BDA00032348909200000917
Figure BDA00032348909200000918
中真实值的平均值。
步骤二,根据公式(18)通过遍历找到最优分割变量和分割点,从而将输入特征空间划分为两个区域;然后,对划分的区域重复遍历,进而找到此区域中最优分割变量和分割点,直到叶节点训练样本数小于依经验设定的阈值θRF·OC;最后,将输入特征空间划分为K个区域并标记为R1,...,Rk,...,RK
步骤三,基于CART回归树构建的RF子模型可以表示为:
Figure BDA0003234890920000101
Figure BDA0003234890920000102
其中,
Figure BDA0003234890920000103
表示区域Rk中包含的样本数,
Figure BDA0003234890920000104
是区域Rk中第jOC个训练子集的第
Figure BDA0003234890920000105
个真实值;I(·)表示指示函数,当
Figure BDA0003234890920000106
存在时为1,否则为0。
步骤四,训练子集构建的RF子模型的预测误差为:
Figure BDA0003234890920000107
其中,
Figure BDA0003234890920000108
表示第n个训练样本的预测误差。
通过重复上述步骤一至步骤四,构建JOC个RF子模型
Figure BDA0003234890920000109
最后,用真实值
Figure BDA00032348909200001010
减去RF子模型的预测输出
Figure BDA00032348909200001011
得到输出误差
Figure BDA00032348909200001012
b)GBDT子模型模块
步骤一,构建第一个子模型
Figure BDA00032348909200001013
可以表示为:
Figure BDA00032348909200001014
其中,
Figure BDA00032348909200001015
代表第一个GBDT子模型的输出。
步骤二,构建上述子模型的损失函数定义如下:
Figure BDA00032348909200001016
其中,
Figure BDA00032348909200001017
表示第jOC个训练子集中第n个样本的预测值。
步骤三,计算子模型
Figure BDA00032348909200001018
的输出残差
Figure BDA00032348909200001019
如下:
Figure BDA00032348909200001020
步骤四,
Figure BDA00032348909200001021
作为第二个GBDT子模型
Figure BDA00032348909200001022
中训练子集输出空间的真值。同样,第二个GBDT子模型可以表示为:
Figure BDA00032348909200001023
其中,
Figure BDA00032348909200001024
是第一个GBDT子模型中第n个样本的预测误差。
重复步骤一至步骤四,可以得出第iOC个GBDT子模型可以标记为
Figure BDA0003234890920000111
其残差计算如下:
Figure BDA0003234890920000112
迭代IOC-1次后,第IOC-1个子模型中训练子集的输出空间的真值为:
Figure BDA0003234890920000113
其中,
Figure BDA0003234890920000114
是第IOC-1个子模型
Figure BDA0003234890920000115
的预测输出。
因此,第IOC个子模型可以表示为:
Figure BDA0003234890920000116
其中,
Figure BDA0003234890920000117
表示第IOC-1个GBDT子模型中样本的预测误差。
最后,所有基于第jOC个训练子集的IOC个GBDT子模型都可表示为
Figure BDA0003234890920000118
其输出可表示为
Figure BDA0003234890920000119
c)平均集成子模块
从两个子模块构建过程可以得出,并行构建的RF子模型可表示为
Figure BDA00032348909200001110
同时级联和并行建立的GBDT子模型可以表示为
Figure BDA00032348909200001111
对于第jOC个训练子集,本文构建了IOC个RF子模型和IOC个GBDT子模型,其中子模型串行生成,它们的预测输出之和作为训练子集的整体输出,可表示为:
Figure BDA00032348909200001112
由于jOC个训练子集是平行的,此处通过简单的平均加权方法将上述模型组合起来,最终的OC模型可表示为:
Figure BDA00032348909200001113
3.2.2.3针对BSF模型
a)RF子模型模块
步骤一,在训练子集
Figure BDA0003234890920000121
中去除因随机抽样产生的重复样本,并将其标记为
Figure BDA0003234890920000122
其中,nsel表示当前抽取选择的样本,Nsel表示抽样选择样本的总数量;然后,以第m次输入特征
Figure BDA0003234890920000123
作为分割变量,以第nsel个样本对应的值
Figure BDA0003234890920000124
作为分割点,将输入特征空间分为两个区域
Figure BDA0003234890920000125
Figure BDA0003234890920000126
Figure BDA0003234890920000127
基于以下准则,通过遍历找到最优分割变量和分割点,
Figure BDA0003234890920000128
其中,
Figure BDA0003234890920000129
Figure BDA00032348909200001210
分别代表区域
Figure BDA00032348909200001211
Figure BDA00032348909200001212
中第jBSF个训练子集的真实值;
Figure BDA00032348909200001213
Figure BDA00032348909200001214
分别代表区域
Figure BDA00032348909200001215
Figure BDA00032348909200001216
中真实值的平均值。
步骤二,根据公式(32)通过遍历找到最优分割变量和分割点,从而将输入特征空间划分为两个区域;然后,对划分的区域重复遍历,进而找到找到此区域中最优分割变量和分割点,直到叶节点训练样本数小于依经验设定的阈值θRF·BSF;最后,将输入特征空间划分为K个区域并标记为R1,...,Rk,...,RK
步骤三,基于CART回归树构建的RF子模型可以表示为:
Figure BDA00032348909200001217
Figure BDA00032348909200001218
其中,
Figure BDA00032348909200001219
表示区域Rk中包含的样本数,
Figure BDA00032348909200001220
是区域Rk中第jBSF个训练子集的第
Figure BDA00032348909200001221
个真实值;I(·)表示指示函数,当
Figure BDA00032348909200001222
存在时为1,否则为0。
步骤四,训练子集构建的RF子模型的预测误差为:
Figure BDA00032348909200001223
其中,
Figure BDA00032348909200001224
表示第n个训练样本的预测误差。
通过重复上述步骤一至步骤四,构建JBSF个RF子模型
Figure BDA00032348909200001225
最后,用真实值
Figure BDA0003234890920000131
减去RF子模型的预测输出
Figure BDA0003234890920000132
得到输出误差
Figure BDA0003234890920000133
b)GBDT子模型模块
步骤一,构建第一个子模型
Figure BDA0003234890920000134
可以表示为:
Figure BDA0003234890920000135
其中,
Figure BDA0003234890920000136
代表第一个GBDT子模型的输出。
步骤二,构建上述子模型的损失函数定义如下:
Figure BDA0003234890920000137
其中,
Figure BDA0003234890920000138
表示第jBSF个训练子集中第n个样本的预测值。
步骤三,计算子模型
Figure BDA0003234890920000139
的输出残差
Figure BDA00032348909200001310
如下:
Figure BDA00032348909200001311
步骤四,
Figure BDA00032348909200001312
作为第二个GBDT子模型
Figure BDA00032348909200001313
中训练子集输出空间的真值。同样,第二个GBDT子模型可以表示为:
Figure BDA00032348909200001314
其中,
Figure BDA00032348909200001315
是第一个GBDT子模型中第n个样本的预测误差。
重复步骤一至步骤四,可以得出第iBSF个GBDT子模型可以标记为
Figure BDA00032348909200001316
其残差计算如下:
Figure BDA00032348909200001317
迭代IBSF-1次后,第IBSF-1个子模型中训练子集的输出空间的真值为:
Figure BDA00032348909200001318
其中,
Figure BDA00032348909200001319
是第IBSF-1个子模型
Figure BDA00032348909200001320
的预测输出。
因此,第IBSF个子模型可以表示为:
Figure BDA00032348909200001321
其中,
Figure BDA00032348909200001322
表示第IBSF-1个GBDT子模型中样本的预测误差。
最后,所有基于第jBSF个训练子集的IBSF个GBDT子模型都可表示为
Figure BDA0003234890920000141
其输出可表示为
Figure BDA0003234890920000142
c)平均集成子模块
从两个子模块构建过程可以得出,并行构建的RF子模型可表示为
Figure BDA0003234890920000143
同时级联和并行建立的GBDT子模型可以表示为
Figure BDA0003234890920000144
对于第jBSF个训练子集,本文构建了IBSF个RF子模型和IBSF个GBDT子模型,其中子模型串行生成,它们的预测输出之和作为训练子集的整体输出,可表示为:
Figure BDA0003234890920000145
由于JBSF个训练子集是平行的,此处通过简单的平均加权方法将上述模型组合起来,最终的BSF模型可表示为:
Figure BDA0003234890920000146
附图说明
图1城市固废焚烧工艺流程
图2建模策略图
图3 FT模型测试集的预测曲线
图4 OC模型测试集的预测曲线
图5 BSF模型测试集的预测曲线
具体实施方式
本文建模数据为北京某垃圾焚烧发电厂2#炉的实际过程数据,采用OPC客户端通过隔离采集器获取10万个数据样本,其中包括18个炉排速度,14个一次风风量,1个二次风风量和4个风温,具体如表1所示。数据样本的一半用作训练集,1/4用作验证集,1/4用作测试集。
对于FT模型,不同模型的参数选择和RMSE结果如表2所示。RF、GBDT和本文所提出方法的预测曲线如附录图3所示。
表2不同方法的FT模型统计结果
Figure BDA0003234890920000151
烟气含氧量建模
对于OC模型,不同模型的参数选择和RMSE结果如表3所示。RF、GBDT和所提出方法的预测曲线如附录图4所示。
表3不同方法的OC模型统计结果
Figure BDA0003234890920000152
锅炉蒸汽流量建模
对于BSF模型,不同模型的参数选择和RMSE结果如表4所示。RF、GBDT和所提出方法的预测曲线如图5所示。
表4不同方法的BSF模型统计结果
Figure BDA0003234890920000161
根据以上实验结果可以得出,GBDT相比其他两种方法具有更大的预测误差。主要原因在于GBDT将所有过程变量作为输入特征,而另外两个则针对其进行了一个删减。同时,本文提出的方法与其他方法相比具有更好的预测性能。
本文基于实际过程数据,将RF子模型和GBDT子模型相结合,从而建立了FT、OC、BSF的数据驱动模型,本文的创新点包括:利用RF构建的一级预测子模型可以同时降低维度和模型预测方差;同时,利用GBDT构建由多个预测子模型组成的强学习器作为二级预测子模型可以减少模型预测偏差。与本文提到的其他两种预测方法相比,所提方法的预测效果显著,有利于建立MSWI过程被控对象模型。由于MSWI过程具有强耦合性,下一步的研究工作是如何协调三个模型的参数以进行进一步的优化。

Claims (1)

1.基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法,其特征在于:
建模策略包括Bootstrap与随机子空间法(Random Sub-space Method,RSM)模块和模型构建模块,其中:后者由FT模型、OC模型和BSF模型组成,每个模型构建模块包括RF子模块、GBDT子模块和平均集成子模块,输入通过OPC采集得到的MSWI过程变量,经过两个模块后输出FT、OC和BSF的预测值;
Figure FDA0003234890910000011
表示采集自MSWI过程的建模样本,N表示过程变量特征数量,M表示样本数量,其包含一次风风量等37个在DCS系统中可实时采集的过程变量,过程变量如表1所示;
表1 37个过程变量明细
Figure FDA0003234890910000012
Figure FDA0003234890910000021
Figure FDA0003234890910000022
Figure FDA0003234890910000023
分别表示FT模型、OC模型和BSF模型中第n个样本的真实值;本文中因模型参数取值不同,FT、OC和BSF标记仅作为区分使用;
Figure FDA0003234890910000024
分别表示FT模型、OC模型和BSF模型的J个训练集;J是训练子集和RF子模型的数量;
Figure FDA0003234890910000025
Figure FDA0003234890910000026
分别表示在第j个RF子模型
Figure FDA0003234890910000027
中FT、OC和BSF的预测值;
Figure FDA0003234890910000028
Figure FDA0003234890910000029
分别表示第j个RF子模型的预测值与各自真值之间的误差;
Figure FDA00032348909100000210
Figure FDA00032348909100000211
分别表示第一个GBDT子模型的预测值与各自输出空间
Figure FDA0003234890910000031
Figure FDA0003234890910000032
之间的误差;
Figure FDA0003234890910000033
Figure FDA0003234890910000034
分别表示第i个GBDT子模型的预测值和各自输入空间
Figure FDA0003234890910000035
Figure FDA0003234890910000036
之间的误差;
Figure FDA0003234890910000037
Figure FDA0003234890910000038
Figure FDA0003234890910000039
分别为GBDT子模型中FT模型、OC模型和BSF模型的预测输出,I表示GBDT子模型中的模型数,即迭代次数;
Figure FDA00032348909100000310
Figure FDA00032348909100000311
分别代表平均集成子模块中FT模型、OC模型和BSF模型的预测输出;
建模问题被描述如式1所示,其目的是通过调整参数,如最小样本数(MinSamples)、特征数量(FeaturesNum)、决策树数量(Tn)和迭代次数(Iteration),最小化三个被控变量模型预测误差的平方根,进而建立高精度模型;
Figure FDA00032348909100000312
Figure FDA00032348909100000313
(1)Bootstrap与RSM模块:从MSWI过程数据
Figure FDA00032348909100000314
中选取MFT个输入特征,随机采样NFT次生成JFT个训练子集
Figure FDA00032348909100000315
(2)模型构建模块:
①RF子模型模块:利用生成的训练子集
Figure FDA00032348909100000316
建立RF子模型
Figure FDA00032348909100000317
然后用真值
Figure FDA00032348909100000318
减去预测值
Figure FDA00032348909100000319
得到预测误差
Figure FDA00032348909100000320
②GBDT子模型模块:以误差
Figure FDA00032348909100000321
为训练子集迭代IFT次后,构建了IFT×JFT的GBDT子模型
Figure FDA00032348909100000322
③平均集成子模块:RF子模型的预测输出
Figure FDA00032348909100000323
和GBDT子模型的预测输出
Figure FDA00032348909100000324
经过简单的平均集成,从而获得最终FT模型的预测输出
Figure FDA00032348909100000325
针对OC模型,对不同模块的功能进行描述如下:
(1)Bootstrap与RSM模块:从MSWI过程数据
Figure FDA00032348909100000326
中选取MOC个输入特征,随机采样NOC次生成JOC个训练子集
Figure FDA00032348909100000327
(2)模型构建模块:
①RF子模型模块:利用生成的训练子集
Figure FDA00032348909100000328
建立RF子模型
Figure FDA00032348909100000329
然后用真值
Figure FDA0003234890910000041
减去预测值
Figure FDA0003234890910000042
得到预测误差
Figure FDA0003234890910000043
②GBDT子模型模块:以误差
Figure FDA0003234890910000044
为训练子集迭代IOC次后,构建了IOC×JOC的GBDT子模型
Figure FDA0003234890910000045
③平均集成子模块:RF子模型的预测输出
Figure FDA0003234890910000046
和GBDT子模型的预测输出
Figure FDA0003234890910000047
经过简单的平均集成,从而获得最终OC模型的预测输出
Figure FDA0003234890910000048
针对BSF模型,对不同模块的功能进行描述如下:
(1)Bootstrap与RSM模块:从MSWI过程数据
Figure FDA0003234890910000049
中选取MBSF个输入特征,随机采样NBSF次生成JBSF个训练子集
Figure FDA00032348909100000410
(2)模型构建模块:
①RF子模型模块:利用生成的训练子集
Figure FDA00032348909100000411
建立RF子模型
Figure FDA00032348909100000412
然后用真值
Figure FDA00032348909100000413
减去预测值
Figure FDA00032348909100000414
得到预测误差
Figure FDA00032348909100000415
②GBDT子模型模块:以误差
Figure FDA00032348909100000416
为训练子集迭代IBSF次后,构建了IBSF×JBSF的GBDT子模型
Figure FDA00032348909100000417
③平均集成子模块:RF子模型的预测输出
Figure FDA00032348909100000418
和GBDT子模型的预测输出
Figure FDA00032348909100000419
经过简单的平均集成,从而获得最终BSF模型的预测输出
Figure FDA00032348909100000420
a)3.1.1Bootstrap与RSM模块
首先采用Bootstrap提取与建模数据具有相同样本数的训练子集,以减少子模型之间的相关性;然后使用RSM机制随机选择特征;最后,生成包含N个样本和Mj个特征的J个训练子集;
训练子集的生成过程可以表示为:
Figure FDA00032348909100000421
其中,
Figure FDA00032348909100000424
是第j次选择的针对第Mtype个被控变量的训练子集,Mtype={FT,OC,BSF},
Figure FDA00032348909100000423
表示第j个训练子集的第n个输入样本,Mj表示第j个训练子集中包含的输入特征的数量;
b)3.1.2模型构建模块
(1)3.2.2.1针对FT模型
(a)a)RF子模型模块
步骤一,在训练子集
Figure FDA0003234890910000051
中去除因随机抽样产生的重复样本,并将其标记为
Figure FDA0003234890910000052
其中,nsel表示当前抽取选择的样本,Nsel表示抽样选择样本的总数量;然后,以第m次输入特征
Figure FDA0003234890910000053
作为分割变量,以第nsel个样本对应的值
Figure FDA0003234890910000054
作为分割点,将输入特征空间分为两个区域
Figure FDA0003234890910000055
Figure FDA0003234890910000056
Figure FDA0003234890910000057
基于以下准则,通过遍历找到最优分割变量和分割点,
Figure FDA0003234890910000058
其中,
Figure FDA0003234890910000059
Figure FDA00032348909100000510
分别代表区域
Figure FDA00032348909100000511
Figure FDA00032348909100000512
中第jFT个训练子集的真实值;
Figure FDA00032348909100000513
Figure FDA00032348909100000514
分别代表区域
Figure FDA00032348909100000515
Figure FDA00032348909100000516
中真实值的平均值;
步骤二,根据公式(4)通过遍历找到最优分割变量和分割点,从而将输入特征空间划分为两个区域;然后,对划分的区域重复遍历,进而找到此区域中最优分割变量和分割点,直到叶节点训练样本数小于根据专家经验设定的阈值θRF·FT;最后,将输入特征空间划分为K个区域并标记为R1,...,Rk,...,RK
步骤三,基于CART回归树构建的RF子模型可以表示为:
Figure FDA00032348909100000517
Figure FDA00032348909100000518
其中,
Figure FDA00032348909100000519
表示区域Rk中包含的样本数,
Figure FDA00032348909100000520
是区域Rk中第jFT个训练子集的第
Figure FDA00032348909100000521
个真实值;I(·)表示指示函数,当
Figure FDA00032348909100000522
存在时为1,否则为0;
步骤四,训练子集构建的RF子模型的预测误差为:
Figure FDA0003234890910000061
其中,
Figure FDA0003234890910000062
表示第n个训练样本的预测误差;
通过重复上述步骤一至步骤四,构建JFT个RF子模型
Figure FDA0003234890910000063
最后,用真实值
Figure FDA0003234890910000064
减去RF子模型的预测输出
Figure FDA0003234890910000065
得到输出误差
Figure FDA0003234890910000066
(b)b)GBDT子模型模块
步骤一,构建第一个子模型
Figure FDA0003234890910000067
可以表示为:
Figure FDA0003234890910000068
其中,
Figure FDA0003234890910000069
代表第一个GBDT子模型的输出;
步骤二,构建上述子模型的损失函数定义如下:
Figure FDA00032348909100000610
其中,
Figure FDA00032348909100000611
表示第jFT个训练子集中第n个样本的预测值;
步骤三,计算子模型
Figure FDA00032348909100000612
的输出残差
Figure FDA00032348909100000613
如下:
Figure FDA00032348909100000614
步骤四,
Figure FDA00032348909100000615
作为第二个GBDT子模型
Figure FDA00032348909100000616
中训练子集输出空间的真值;同样,第二个GBDT子模型可以表示为:
Figure FDA00032348909100000617
其中,
Figure FDA00032348909100000618
是第一个GBDT子模型中第n个样本的预测误差;
重复步骤一至步骤四,可以得出第iFT个GBDT子模型可以标记为
Figure FDA00032348909100000619
其残差计算如下:
Figure FDA00032348909100000620
迭代IFT-1次后,第IFT-1个子模型中训练子集的输出空间的真值为:
Figure FDA00032348909100000621
其中,
Figure FDA00032348909100000622
是第IFT-1个子模型
Figure FDA00032348909100000623
的预测输出;
因此,第IFT个子模型表示为:
Figure FDA0003234890910000071
其中,
Figure FDA0003234890910000072
表示第IFT-1个GBDT子模型中样本的预测误差;
最后,所有基于第jFT个训练子集的IFT个GBDT子模型都可表示为
Figure FDA0003234890910000073
其输出可表示为
Figure FDA0003234890910000074
(c)c)平均集成子模块
从两个子模块构建过程可以得出,并行构建的RF子模型可表示为
Figure FDA0003234890910000075
同时级联和并行建立的GBDT子模型可以表示为
Figure FDA0003234890910000076
对于第jFT个训练子集,本文构建了IFT个RF子模型和IFT个GBDT子模型,其中子模型串行生成,它们的预测输出之和作为训练子集的整体输出,可表示为:
Figure FDA0003234890910000077
由于JFT个训练子集是平行的,此处通过简单的平均加权方法将上述模型组合起来,最终的FT模型可表示为:
Figure FDA0003234890910000078
(2)3.2.2.2针对OC模型
(a)a)RF子模型模块
步骤一,在训练子集
Figure FDA0003234890910000079
中去除因随机抽样产生的重复样本,并将其标记为
Figure FDA00032348909100000710
其中,nsel表示当前抽取选择的样本,Nsel表示抽样选择样本的总数量;然后,以第m次输入特征
Figure FDA00032348909100000711
作为分割变量,以第nsel个样本对应的值
Figure FDA00032348909100000712
作为分割点,将输入特征空间分为两个区域
Figure FDA00032348909100000713
Figure FDA00032348909100000714
Figure FDA0003234890910000081
基于以下准则,通过遍历找到最优分割变量和分割点,
Figure FDA0003234890910000082
其中,
Figure FDA0003234890910000083
Figure FDA0003234890910000084
分别代表区域
Figure FDA0003234890910000085
Figure FDA0003234890910000086
中第jOC个训练子集的真实值;
Figure FDA0003234890910000087
Figure FDA0003234890910000088
分别代表区域
Figure FDA0003234890910000089
Figure FDA00032348909100000810
中真实值的平均值;
步骤二,根据公式(18)通过遍历找到最优分割变量和分割点,从而将输入特征空间划分为两个区域;然后,对划分的区域重复遍历,进而找到此区域中最优分割变量和分割点,直到叶节点训练样本数小于根据专家经验设定的阈值θRF·OC;最后,将输入特征空间划分为K个区域并标记为R1,...,Rk,...,RK
步骤三,基于CART回归树构建的RF子模型可以表示为:
Figure FDA00032348909100000811
Figure FDA00032348909100000812
其中,
Figure FDA00032348909100000813
表示区域Rk中包含的样本数,
Figure FDA00032348909100000814
是区域Rk中第jOC个训练子集的第
Figure FDA00032348909100000815
个真实值;I(·)表示指示函数,当
Figure FDA00032348909100000816
存在时为1,否则为0;
步骤四,训练子集构建的RF子模型的预测误差为:
Figure FDA00032348909100000817
其中,
Figure FDA00032348909100000818
表示第n个训练样本的预测误差;
通过重复上述步骤一至步骤四,构建JOC个RF子模型
Figure FDA00032348909100000819
最后,用真实值
Figure FDA00032348909100000820
减去RF子模型的预测输出
Figure FDA00032348909100000821
得到输出误差
Figure FDA00032348909100000822
(b)b)GBDT子模型模块
步骤一,构建第一个子模型
Figure FDA00032348909100000823
可以表示为:
Figure FDA00032348909100000824
其中,
Figure FDA00032348909100000825
代表第一个GBDT子模型的输出;
步骤二,构建上述子模型的损失函数定义如下:
Figure FDA0003234890910000091
其中,
Figure FDA0003234890910000092
表示第jOC个训练子集中第n个样本的预测值;
步骤三,计算子模型
Figure FDA0003234890910000093
的输出残差
Figure FDA0003234890910000094
如下:
Figure FDA0003234890910000095
步骤四,
Figure FDA0003234890910000096
作为第二个GBDT子模型
Figure FDA0003234890910000097
中训练子集输出空间的真值;同样,第二个GBDT子模型可以表示为:
Figure FDA0003234890910000098
其中,
Figure FDA0003234890910000099
是第一个GBDT子模型中第n个样本的预测误差;
重复步骤一至步骤四,可以得出第iOC个GBDT子模型可以标记为
Figure FDA00032348909100000910
其残差计算如下:
Figure FDA00032348909100000911
迭代IOC-1次后,第IOC-1个子模型中训练子集的输出空间的真值为:
Figure FDA00032348909100000912
其中,
Figure FDA00032348909100000913
是第IOC-1个子模型
Figure FDA00032348909100000914
的预测输出;
因此,第IOC个子模型可以表示为:
Figure FDA00032348909100000915
其中,
Figure FDA00032348909100000916
表示第IOC-1个GBDT子模型中样本的预测误差;
最后,所有基于第jOC个训练子集的IOC个GBDT子模型都可表示为
Figure FDA00032348909100000917
其输出可表示为
Figure FDA00032348909100000918
(c)c)平均集成子模块
从两个子模块构建过程可以得出,并行构建的RF子模型可表示为
Figure FDA00032348909100000919
同时级联和并行建立的GBDT子模型可以表示为
Figure FDA00032348909100000920
对于第jOC个训练子集,本文构建了IOC个RF子模型和IOC个GBDT子模型,其中子模型串行生成,它们的预测输出之和作为训练子集的整体输出,可表示为:
Figure FDA0003234890910000101
由于jOC个训练子集是平行的,此处通过简单的平均加权方法将上述模型组合起来,最终的OC模型可表示为:
Figure FDA0003234890910000102
(3)3.2.2.3针对BSF模型
(a)a)RF子模型模块
步骤一,在训练子集
Figure FDA0003234890910000103
中去除因随机抽样产生的重复样本,并将其标记为
Figure FDA0003234890910000104
其中,nsel表示当前抽取选择的样本,Nsel表示抽样选择样本的总数量;然后,以第m次输入特征
Figure FDA0003234890910000105
作为分割变量,以第nsel个样本对应的值
Figure FDA0003234890910000106
作为分割点,将输入特征空间分为两个区域
Figure FDA0003234890910000107
Figure FDA0003234890910000108
Figure FDA0003234890910000109
基于以下准则,通过遍历找到最优分割变量和分割点,
Figure FDA00032348909100001010
其中,
Figure FDA00032348909100001011
Figure FDA00032348909100001012
分别代表区域
Figure FDA00032348909100001013
Figure FDA00032348909100001014
中第jBSF个训练子集的真实值;
Figure FDA00032348909100001015
Figure FDA00032348909100001016
分别代表区域
Figure FDA00032348909100001017
Figure FDA00032348909100001018
中真实值的平均值;
步骤二,根据公式(32)通过遍历找到最优分割变量和分割点,从而将输入特征空间划分为两个区域;然后,对划分的区域重复遍历,进而找到找到此区域中最优分割变量和分割点,直到叶节点训练样本数小于根据专家经验设定的阈值θRF·BSF;最后,将输入特征空间划分为K个区域并标记为R1,...,Rk,...,RK
步骤三,基于CART回归树构建的RF子模型可以表示为:
Figure FDA0003234890910000111
Figure FDA0003234890910000112
其中,
Figure FDA0003234890910000113
表示区域Rk中包含的样本数,
Figure FDA0003234890910000114
是区域Rk中第jBSF个训练子集的第
Figure FDA0003234890910000115
个真实值;I(·)表示指示函数,当
Figure FDA0003234890910000116
存在时为1,否则为0;
步骤四,训练子集构建的RF子模型的预测误差为:
Figure FDA0003234890910000117
其中,
Figure FDA0003234890910000118
表示第n个训练样本的预测误差;
通过重复上述步骤一至步骤四,构建JBSF个RF子模型
Figure FDA0003234890910000119
最后,用真实值
Figure FDA00032348909100001110
减去RF子模型的预测输出
Figure FDA00032348909100001111
得到输出误差
Figure FDA00032348909100001112
(b)b)GBDT子模型模块
步骤一,构建第一个子模型
Figure FDA00032348909100001113
可以表示为:
Figure FDA00032348909100001114
其中,
Figure FDA00032348909100001115
代表第一个GBDT子模型的输出;
步骤二,构建上述子模型的损失函数定义如下:
Figure FDA00032348909100001116
其中,
Figure FDA00032348909100001117
表示第jBSF个训练子集中第n个样本的预测值;
步骤三,计算子模型
Figure FDA00032348909100001118
的输出残差
Figure FDA00032348909100001119
如下:
Figure FDA00032348909100001120
步骤四,
Figure FDA00032348909100001121
作为第二个GBDT子模型
Figure FDA00032348909100001122
中训练子集输出空间的真值;同样,第二个GBDT子模型可以表示为:
Figure FDA00032348909100001123
其中,
Figure FDA00032348909100001124
是第一个GBDT子模型中第n个样本的预测误差;
重复步骤一至步骤四,可以得出第iBSF个GBDT子模型可以标记为
Figure FDA0003234890910000121
其残差计算如下:
Figure FDA0003234890910000122
迭代IBSF-1次后,第IBSF-1个子模型中训练子集的输出空间的真值为:
Figure FDA0003234890910000123
其中,
Figure FDA0003234890910000124
是第IBSF-1个子模型
Figure FDA0003234890910000125
的预测输出;
因此,第IBSF个子模型可以表示为:
Figure FDA0003234890910000126
其中,
Figure FDA0003234890910000127
表示第IBSF-1个GBDT子模型中样本的预测误差;
最后,所有基于第jBSF个训练子集的IBSF个GBDT子模型都可表示为
Figure FDA0003234890910000128
其输出可表示为
Figure FDA0003234890910000129
(c)c)平均集成子模块
从两个子模块构建过程可以得出,并行构建的RF子模型可表示为
Figure FDA00032348909100001210
同时级联和并行建立的GBDT子模型可以表示为
Figure FDA00032348909100001211
对于第jBSF个训练子集,本文构建了IBSF个RF子模型和IBSF个GBDT子模型,其中子模型串行生成,它们的预测输出之和作为训练子集的整体输出,可表示为:
Figure FDA00032348909100001212
由于JBSF个训练子集是平行的,此处通过简单的平均加权方法将上述模型组合起来,最终的BSF模型可表示为:
Figure FDA00032348909100001213
CN202111000553.3A 2021-08-28 2021-08-28 基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法 Active CN113780384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111000553.3A CN113780384B (zh) 2021-08-28 2021-08-28 基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111000553.3A CN113780384B (zh) 2021-08-28 2021-08-28 基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法

Publications (2)

Publication Number Publication Date
CN113780384A true CN113780384A (zh) 2021-12-10
CN113780384B CN113780384B (zh) 2024-05-28

Family

ID=78839746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111000553.3A Active CN113780384B (zh) 2021-08-28 2021-08-28 基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法

Country Status (1)

Country Link
CN (1) CN113780384B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549792A (zh) * 2018-06-27 2018-09-18 北京工业大学 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
CN111260149A (zh) * 2020-02-10 2020-06-09 北京工业大学 一种二噁英排放浓度预测方法
US20200201282A1 (en) * 2017-06-26 2020-06-25 Jiangnan University Energy consumption prediction system and method based on the decision tree for CNC lathe turning
CN111461355A (zh) * 2020-03-20 2020-07-28 北京工业大学 基于随机森林的二噁英排放浓度迁移学习预测方法
CN111462835A (zh) * 2020-04-07 2020-07-28 北京工业大学 一种基于深度森林回归算法的二噁英排放浓度软测量方法
CN112464544A (zh) * 2020-11-17 2021-03-09 北京工业大学 一种城市固废焚烧过程二噁英排放浓度预测模型构建方法
CN112733876A (zh) * 2020-10-28 2021-04-30 北京工业大学 基于模块化神经网络的城市固废焚烧过程氮氧化物软测量方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200201282A1 (en) * 2017-06-26 2020-06-25 Jiangnan University Energy consumption prediction system and method based on the decision tree for CNC lathe turning
CN108549792A (zh) * 2018-06-27 2018-09-18 北京工业大学 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
CN111260149A (zh) * 2020-02-10 2020-06-09 北京工业大学 一种二噁英排放浓度预测方法
CN111461355A (zh) * 2020-03-20 2020-07-28 北京工业大学 基于随机森林的二噁英排放浓度迁移学习预测方法
CN111462835A (zh) * 2020-04-07 2020-07-28 北京工业大学 一种基于深度森林回归算法的二噁英排放浓度软测量方法
CN112733876A (zh) * 2020-10-28 2021-04-30 北京工业大学 基于模块化神经网络的城市固废焚烧过程氮氧化物软测量方法
CN112464544A (zh) * 2020-11-17 2021-03-09 北京工业大学 一种城市固废焚烧过程二噁英排放浓度预测模型构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
桂良明;夏永俊;李海山;谭鹏;张尚志;张成;: "基于RF-GBDT的燃煤锅炉NO_x排放预测", 电站系统工程, no. 02, 15 March 2017 (2017-03-15) *
钟登华;田耕;关涛;崔博;鄢玉玲;: "基于混沌时序-随机森林回归的堆石坝料加水量预测研究", 水力发电学报, no. 08, 8 March 2018 (2018-03-08) *

Also Published As

Publication number Publication date
CN113780384B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
Xia et al. Dioxin emission prediction based on improved deep forest regression for municipal solid waste incineration process
CN108549792B (zh) 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
CN111144609A (zh) 一种锅炉废气排放预测模型建立方法、预测方法及装置
CN111260149B (zh) 一种二噁英排放浓度预测方法
CN112464544B (zh) 一种城市固废焚烧过程二噁英排放浓度预测模型构建方法
CN111461355B (zh) 基于随机森林的二噁英排放浓度迁移学习预测方法
CN110991756B (zh) 基于ts模糊神经网络的mswi炉膛温度预测方法
WO2023138140A1 (zh) 基于宽度混合森林回归的mswi过程二噁英排放软测量方法
CN103729691B (zh) 基于均匀设计的多目标配煤方法
CN111462835B (zh) 一种基于深度森林回归算法的二噁英排放浓度软测量方法
Zahedi et al. Simulation and optimization of electricity generation by waste to energy unit in Tehran
WO2023231667A1 (zh) 基于集成t-s模糊回归树的mswi过程二噁英排放软测量方法
CN114266461A (zh) 基于可视化分布gan的mswi过程二噁英排放风险预警方法
Ding et al. Event-triggered fuzzy neural multivariable control for a municipal solid waste incineration process
WO2024146070A1 (zh) 一种基于改进生成对抗网络的二噁英排放浓度软测量方法
CN113780384B (zh) 基于集成决策树算法的城市固废焚烧过程关键被控变量预测方法
CN117057137A (zh) 用于干化污泥热解气化工艺的碳减排量预测方法及存储介质
CN114958395B (zh) 一种生物质炭化炉余热利用方法及其利用系统
Wang et al. Multiple Input Mulitple Output Control Method Based on Single Neuron Adaptive PID for Municipal Solid Waste Incineration Process
Kang et al. A low carbon treatment technology of green building construction waste based on genetic algorithm
Wang et al. Key controlled variable model of MSWI process based on ensembled decision tree algorithm
CN115755779B (zh) 一种面向控制的数据驱动城市固废焚烧全流程建模方法
Balamurugan et al. ANN-SQP Approach for NOx emission reduction in coal fired Boilers
Li et al. Multi-parameter co-optimization for NOx emissions control from waste incinerators based on data-driven model and improved particle swarm optimization
CN115542740B (zh) 基于数据驱动的城市固废焚烧过程多变量自抗扰控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant