CN110135057A - 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 - Google Patents
基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 Download PDFInfo
- Publication number
- CN110135057A CN110135057A CN201910397710.5A CN201910397710A CN110135057A CN 110135057 A CN110135057 A CN 110135057A CN 201910397710 A CN201910397710 A CN 201910397710A CN 110135057 A CN110135057 A CN 110135057A
- Authority
- CN
- China
- Prior art keywords
- feature
- layer
- subsystem
- selection
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 122
- 230000008569 process Effects 0.000 title claims abstract description 99
- 239000002910 solid waste Substances 0.000 title claims abstract description 9
- 238000000691 measurement method Methods 0.000 title claims abstract description 7
- HGUFODBRKLSHSI-UHFFFAOYSA-N 2,3,7,8-tetrachloro-dibenzo-p-dioxin Chemical compound O1C2=CC(Cl)=C(Cl)C=C2OC2=C1C=C(Cl)C(Cl)=C2 HGUFODBRKLSHSI-UHFFFAOYSA-N 0.000 title claims abstract 4
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 30
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 238000005259 measurement Methods 0.000 claims abstract description 22
- 238000001514 detection method Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 56
- 239000000779 smoke Substances 0.000 claims description 15
- 230000002068 genetic effect Effects 0.000 claims description 9
- 230000035772 mutation Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 210000000349 chromosome Anatomy 0.000 claims description 2
- 238000002790 cross-validation Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 238000003786 synthesis reaction Methods 0.000 claims description 2
- 238000004642 transportation engineering Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- XCWPUUGSGHNIDZ-UHFFFAOYSA-N Oxypertine Chemical compound C1=2C=C(OC)C(OC)=CC=2NC(C)=C1CCN(CC1)CCN1C1=CC=CC=C1 XCWPUUGSGHNIDZ-UHFFFAOYSA-N 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 23
- 230000000007 visual effect Effects 0.000 abstract description 8
- KVGZZAHHUNAVKZ-UHFFFAOYSA-N 1,4-Dioxin Chemical compound O1C=COC=C1 KVGZZAHHUNAVKZ-UHFFFAOYSA-N 0.000 description 68
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 20
- 239000003546 flue gas Substances 0.000 description 20
- 239000007789 gas Substances 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- 239000002956 ash Substances 0.000 description 5
- 239000000428 dust Substances 0.000 description 5
- 239000003517 fume Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000032258 transport Effects 0.000 description 3
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 2
- 235000011941 Tilia x europaea Nutrition 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003344 environmental pollutant Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 239000004571 lime Substances 0.000 description 2
- 230000003446 memory effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000010813 municipal solid waste Substances 0.000 description 2
- 238000006386 neutralization reaction Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 231100000719 pollutant Toxicity 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 239000002893 slag Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 231100000770 Toxic Equivalency Factor Toxicity 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 150000004826 dibenzofurans Chemical class 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 239000002957 persistent organic pollutant Substances 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 150000003071 polychlorinated biphenyls Chemical class 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000002918 waste heat Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0027—General constructional details of gas analysers, e.g. portable test equipment concerning the detector
- G01N33/0036—General constructional details of gas analysers, e.g. portable test equipment concerning the detector specially adapted to detect a particular component
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F23—COMBUSTION APPARATUS; COMBUSTION PROCESSES
- F23G—CREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
- F23G5/00—Incineration of waste; Incinerator constructions; Details, accessories or control therefor
- F23G5/50—Control or safety arrangements
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F23—COMBUSTION APPARATUS; COMBUSTION PROCESSES
- F23G—CREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
- F23G2207/00—Control
- F23G2207/10—Arrangement of sensing devices
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F23—COMBUSTION APPARATUS; COMBUSTION PROCESSES
- F23G—CREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
- F23G2208/00—Safety aspects
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F23—COMBUSTION APPARATUS; COMBUSTION PROCESSES
- F23G—CREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
- F23G2900/00—Special features of, or arrangements for incinerators
- F23G2900/55—Controlling; Monitoring or measuring
- F23G2900/55003—Sensing for exhaust gas properties, e.g. O2 content
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E20/00—Combustion technologies with mitigation potential
- Y02E20/12—Heat utilisation in combustion or incineration of waste
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Food Science & Technology (AREA)
- Combustion & Propulsion (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Mechanical Engineering (AREA)
- Medicinal Chemistry (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
- Incineration Of Waste (AREA)
Abstract
基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法属于软测量领域。本文提出基于多层特征选择的MSWI过程DXN排放浓度软测量方法。首先,从单特征与DXN相关性视角,结合相关系数和互信息构建综合评价值指标,实现MSWI多个子系统过程变量的第1层特征选择;接着,从多特征冗余性和特征选择鲁棒性视角,多次运行基于GA‑PLS的特征选择算法,实现第2层特征选择;最后,结合上层选择特征的统计频次、模型预测性能及机理知识进行第3层特征选择,构建得到DXN排放浓度软测量模型。结合某焚烧厂的多年DXN检测数据验证了所提方法的有效性。
Description
技术领域
本发明属于软测量领域。
背景技术
基于炉排炉的城市固废焚烧(MSWI)技术是目前应用最广泛的生活垃圾资源化处理手段[1,2]。截止2017年,我国大陆已有MSWI电厂303座,其中220座采用基于炉排炉的焚烧技术。目前引进的国外MSWI过程多处于手动控制运行状态,难以保持稳定运行与进行优化控制[3]。针对发展中国家,当前最为紧迫的问题是控制MSWI所造成的污染物排放[4,5],其中排放物二噁英(DXN)是目前世界上毒性最强的污染物[6],也是造成焚烧建厂存在“邻避效应”的主要原因。DXN是多氯代二苯并对二噁英(PCDDs)、多氯代二苯并呋喃(PCDFs)以及部分具有类二噁英性质的多氯联苯所组成的持久性有机污染物的统称,被称为“世纪之毒”[7],其在生物体内具有显著的积累和放大效应[8,9]。
当前,MSWI焚烧企业的主要关注点是如何通过优化控制运行参数实现DXN排放的最小化[10]。为优化固废焚烧过程,实现DXN排放浓度的在线测量非常必要。现阶段主要检测方法包括离线直接检测法、指示物/关联物在线间接检测法和软测量方法,其中:第1种检测方法需要专门实验室和相应化验分析设备,滞后时间尺度为月/周;第2种检测方法分为在线采集烟气、检测指示物/关联物浓度和基于映射模型间接计算DXN排放浓度等3个步骤,需要昂贵复杂的在线化验分析设备,滞后时间尺度为天/小时;第3种检测方法不需要化验分析设备,滞后时间尺度为分钟/秒[11]。本文主要关注第3种方法的研究。
DXN排放浓度软测量的已有研究包括:依据机理和经验选择的输入特征,文献[12,13,14]采用数十年前欧美研究机构针对不同类型焚烧炉采集的小样本数据,基于线性回归、人工神经网络(ANN)、选择性集成(SEN)最小二乘-支持向量机(LS-SVM)等方法构建模型;文献[15]选用台湾某焚烧厂4年多的实际过程数据,综合相关性分析、主成分分析(PCA)和人工神经网络(ANN)等算法,从23个易检测过程变量中选择13个为输入构建DXN软测量模型,指出贡献率较大的输入特征为活性炭注入频率、烟囱排放HCL气体浓度和混合室温度;文献[16]以炉膛温度、锅炉出口烟温、烟气流量、SO2浓度、HCl浓度及颗粒物浓度为输入变量构建基于支持向量机(SVM)的DXN排放浓度与毒性当量预测模型。实际MSWI过程的变量有数百维,这些变量在不同程度上均与DXN的生成、吸收与排放相关[17]。上述过程均未结合MSWI过程的多工序特性和变量间的共线性进行特征选择。此外,DXN软测量的标记样本难以获得,建模中应重点考虑小样本高维数据的特征选择问题。
特征选择的本质就是去除原始数据中的“无关特征”与“冗余特征”,保留重要特征。从消除“无关特征”的视角,应考虑MWSI过程中的单个特征(自变量)和DXN排放浓度(因变量)间的相关程度。文献[18]对高维数据利用相关系数进行维数约简,缩短运算时间和建模复杂度。文献[19]提出基于相关系数的多目标半监督特征选择方法。但研究表明,基于相关系数的线性方法难以描述自变量与因变量间的复杂任意映射关系[20]。文献[21]指出互信息对特征间的相关性具有良好的表征能力。文献[22]提出基于个体最佳互信息的特征选择方法。文献[23]提出基于条件互信息的特征选择方法,能够有效地对上一步所选择的特征进行评价。由此可知,相关系数与互信息均可以表征自变量和因变量间的相关性[24,25];前者的着重点在线性关系,后者的着重点在非线性关系[26,27]。针对实际的复杂工业过程,自变量和因变量间的映射关系难以采用单一的线性或非线性进行统一表征。上述这些方法均未考虑如何进行特征的自适应选择。
在获得与DXN具有较好相关性单输入特征的基础上,从消除“冗余特征”的视角,主要考虑MSWI过程众多过程变量间的冗余性。文献[28]采用相关系数表示已选特征与当前特征之间的冗余性。文献[29]提出PCA解决变量间的共线性问题,但所提取的潜在变量会破坏原始特征自身物理含义。文献[30]提出改进岭回归方法的回归系数为有偏估计量从而处理多重共线性问题。文献[31]验证了偏最小二乘(PLS)对输入特征间的多重共线性问题有良好的解释与分解能力。文献[32]提出了结合遗传算法(GA)全局优化搜索能力和PLS多重共线性处理能力的特征选择方法,即遗传-偏最小二乘算法(GA-PLS)。汤等人的研究表明,GA-PLS对高维谱数据具有良好的选择性[33],但在面对小样本高维数据时,GA的随机性导致其每次特征选择的结果存在着差异性,有必要对多次选择的特征进行统计,以提高鲁棒性和可解释性。
本文进行特征选择的目标是提高软测量模型的预测性能和可解释性。此外,上述特征选择过程主要从数据驱动视角出发,样本数量有限时可能存在偏差。依据已有的研究成果和先验知识,我们需要扩充机理含义明确的重要特征,使得软测量模型更具可解释性并且符合焚烧过程DXN排放特性,进而为后续的优化控制研究提供支撑。
综上,本文提出基于多层特征选择的MSWI过程DXN排放浓度软测量方法。首先,从单特征与DXN相关性视角,结合相关系数和互信息构建综合评价值指标,实现MSWI多个子系统过程变量的第1层特征选择;接着,从多特征冗余性和特征选择鲁棒性视角,多次运行基于GA-PLS的特征选择算法,实现第2层特征选择;最后,结合上层选择特征的统计频次、模型预测性能及机理知识进行第3层特征选择,构建得到DXN排放浓度软测量模型。结合某焚烧厂的多年DXN检测数据验证了所提方法的有效性。
国内某厂的炉排炉焚烧工艺流程如图1所示:
由图1可知,MSW由专用的运输车收集后运至卸料大厅,倾倒至密封的存放池内;由人工操控的吊斗将MSW放入焚烧炉进料斗内,给料机将其推至炉排炉;在焚烧炉的炉排内依次经历干燥、点燃、燃烧和烧尽四个阶段,其中:燃尽后的残渣掉入水冷渣斗内,再由输渣机将其推入炉渣池内,收集后送至填埋场处理;焚烧产生的烟气由废热锅炉转换为高压蒸汽并推动汽轮机组发电,锅炉出口的待处理烟气进入脱酸反应器进行中和反应,并在反应器入口处添加石灰和活性炭以吸附其中的DXN和重金属,其中:飞灰进入飞灰储仓,烟气进入布袋除尘器;烟气在袋式除尘器中被除去烟气颗粒物、中和反应物和活性炭吸附物,处理后分为三个部分,其中:尾部飞灰进入灰仓后再运走进行无害化处理,部分烟灰混合物在混合器中加水后重新进入脱酸反应器,尾部烟气则由引风机经烟囱排入大气,排放的尾气中含有HCL、SO2、NOx、HF和DXN等质。
由上述过程产生的DXN形态包括焚烧灰、飞灰和排放气体3种,其中:焚烧灰量最大但DXN浓度较低、飞灰量稍小但DXN浓度较焚烧灰高,该两类需进行特殊处理;排放气体中的DXN浓度为最高,包括垃圾不完全燃烧和新规合成反应生成(de novo syhthesis)两类[34]。为保证有毒有机物的有效分解,焚烧烟气应达到至少850℃并保持至少2秒。在烟气处理阶段,石灰和活性炭被喷射进入反应器用以移除酸性气体和吸附DXN以及某些重金属,再经袋式过滤器过滤后通过引风机排入烟囱;此外,该阶段存在的DXN记忆效应会导致排放浓度增加。通常,上述炉内焚烧和烟气处理阶段中与DXN产生和吸收相关的过程变量以秒为周期由现场分布式控制系统进行存储。排放烟气中的易检测气体(CO、HCL、SO2、NOx和HF等)浓度通过在线检测仪表实时检测。焚烧企业或环保部门通常以月或季为周期采用离线直接化验法对排放烟气进行DXN浓度检测。
综上可知,DXN排放浓度软测量存在的难点包括:MSW的原始DXN含量未知、DXN生成和吸收阶段的机理复杂不清、烟气处理阶段DXN存在的记忆效应导致测量存在不确定性等。因此,非常有必要对MSWI过程的输入特征进行分区域的特征选择。
发明内容
结合焚烧工艺将MSWI过程分为6个子系统:燃烧处理工程、锅炉设备工程、尾气处理工程、蒸汽发电工程、烟囱排放工程、公用传输工程。
本文中,软测量模型的输入数据X∈RN×P包括N个样本(行)和P个变量(列),其源于MSWI流程的不同子系统。此处,将来自第ith个子系统的输入数据表示为即存在如下关系,
其中,I表示子系统个数,Pi表示第ith个子系统包含的输入特征个数。
相应的,输出数据包括N个样本(行),其来源于采用离线直接检测法得到DXN检测样本。
显然,模型的输入/输出数据在时间尺度上具有较大的差异性:过程变量以秒为单位在DCS系统采集与存储,DXN排放浓度以月/季为周期离线直接化验获得,故存在N<<P。
为便于后文描述和理解,将Xi改写为如下形式,
其中,表示第ith个子系统的第pith个输入特征,表示列向量。
本文提出基于多层特征选择的MSWI过程DXN排放浓度软测量策略,如图2所示。
在图2中,和表示针对第ith个子系统的输入特征采用相关系数和互信息度量所选择的候选特征集合,表示对基于相关系数法和互信息法所选择的候选特征集合采用综合评价值度量所选择的对第ith个子系统的第1层特征,表示串行组合全部子系统的第1层特征所得到的基于单特征相关性的第1层特征,表示运行第jth次GA-PLS算法所选择的基于多特征冗余性的第2层特征,表示第1层特征中第个特征被选择的次数,表示依据特征选择阈值θ3rd和先验知识从中所选择的第3层特征,Mpara表示软测量模型的参数,表示预测值。
算法实现
基于单特征相关性的第1层特征选择
基于相关系数的单特征相关性度量
首先,计算不同原始输入特征与DXN排放浓度间的原始相关系数。此处以第ith个子系统的第pth个输入特征为例进行描述,如下,
其中,分别表示第ith个子系统的第pth个输入特征及DXN排放浓度N个建模样本的平均值。将原始相关系数进行如下预处理,
其中,|·|表示取绝对值。
重复上述过程,获得全部原始输入特征的相关系数并记为设定第ith个子系统的权重因子fi corr,将基于相关系数选择输入特征的阈值采用如下公式计算,
其中,fi corr的最大(fi corr)max和最小值(fi corr)min采用如下公式计算,
其中,max(·)和min(·)分别表示取最大和最小值的函数。
以作为阈值,第ith个子系统的第pith输入特征的选择准则如下所示,
选择其中的特征作为基于相关系数选择的候选特征并将其标记为对第ith个子系统的全部原始输入特征执行上述过程,并将所选择的候选特征标记为,
其中,表示基于相关系数选择的第ith个子系统的过程变量个数。
对全部子系统重复上述过程,基于相关系数度量选择的特征标记为
基于互信息的单特征相关性度量
首先,计算不同原始输入特征与DXN排放浓度间的互信息值。以第ith个子系统的第pth个输入特征为例,如下:
其中,表示联合概率密度,和prob(yn)表示边际概率密度。
重复上述过程,获得全部原始输入特征的互信息值并记为设定第ith个子系统的权重因子fi mi,,将基于互信息选择输入特征的阈值采用如下公式计算,
其中,fi mi的最大(fi mi)max和最小值(fi mi)min采用如下公式计算,
以作为阈值,第ith个系统的第pith输入特征的选择准则如下所示,
选择其中的特征作为基于互信息选择的候选特征并将其表标记为对第ith个子系统的全部输入特征执行上述过程,并将所选择的候选特征标记为:
其中,表示基于互信息选择的第ith个子系统的全部特征的个数。
对全部子系统重复上述过程,基于互信息度量选择的特征可标记为
基于综合评价值的单特征相关性度量
以第ith个子系统为例,同时考虑具有相关系数和互信息贡献度的输入特征在和中得到候选特征集合,其策略为:
其中,∩表示取交集。表示第ith个子系统的第个候选特征,其对应的相关系数值与互信息值为和
为消除不同输入特征的相关系数值和互信息值的大小导致的差异性,按如下公式进行标准化处理,
其中,和表示第ith个子系统的第个标准化的相关系数值和互信息值。
本文新定义一种候选输入特征的综合评价值其表示形式为,
其中,和表示比例系数(默认取值为0.5),其满足
重复上述过程,获得全部候选输入特征的综合评价值并记为
设定第ith个子系统的权重因子fi corr_mi,将基于综合评价值选择输入特征的阈值采用下式计算,
其中,fi corr_mi的最大(fi corr_mi)max和最小值(fi corr_mi)min采用如下公式计算,
以作为阈值,以第ith个子系统的第个候选输入特征为例,按如下规则进行选择,
对全部的原始候选输入特征执行上述过程,选择其中的变量作为基于综合评价值选择的输入特征,并标记为,
重复上述过程完成对全部子系统第1层特征的选择,并串行排列可得到基于单特征相关性的第一层特征
其中,表示第1层特征选择集合中的第个特征,表示全部第1层特征的数量。
基于多特征冗余性的第2层特征选择
上述第1层特征的选择过程仅考虑单输入特征与DXN排放浓度之间的相关性,未考虑多特征间存在的冗余性。此处采用基于GA-PLS的特征选择算法同时考虑多个特征间的冗余性进行第2层特征选择。考虑到DXN排放浓度建模的小样本特点和GA算法的随机性,此处采用如下所示的第2层特征选择策略。
由图3可知:上述策略的输入为第1层选择特征运行第jth次GA-PLS的输出为第2层选择特征最终输出为运行J次GA-PLS后每个第1层输入特征的被选择次数,选择预测误差小于均值的Jsel次第2层特征进行统计处理,其中第个特征的选择次数为相应的全部个第1层特征为J为GA-PLS算法的运行次数,一般取值为100次以上;Jsel为GA-PLS模型预测误差小于J次运行均值的数量。
上述第2层特征选择的步骤如下:
第1步:设定GA-PLS运行次数J,以及GA-PLS算法参数:初始种群数量、最大遗传代数、变异概率、交叉方式、PLS算法潜在变量(LV)数量,一般设定为6;设定j=1,启动第2层的特征选择过程,开始运行。
第2步:判断是否达到运行次数J,若满足,则转到第11步,否则,转到第3步;
第3步:采用二进制方式对特征进行编码,其中染色体的长度为输入特征个数,1表示特征被选中,0表示特征未被选中;
第4步:采用随机方式对种群初始化;
第5步:对种群进行适应度评价,采用留一法交叉验证法计算均方根验证误差RMSECV,值越小表明适应度越好;
第6步:判断是否达到最大遗传代数的终止条件,如不满足,转第7步,否则转第9步;
第7步:进行选择、交叉和变异遗传操作,其中:选择操作采用精英替代策略即采用适应度好的个体替换适应度较差的个体,交叉操作采用单点交叉,变异操作采用单点变异;
第8步:获得新种群,转到执行第5步;
第9步:获得第jth次运行GA-PLS算法的最佳个体,进一步解码得到所选择的第2层特征,并将其记为
第10步:令j=j+1,转到第2步;
第11步:计算全部J次运行得到的预测模型的均方根误差(RMSE)的平均值,将大于此平均值的GA-PLS模型的数量标记为Jsel。对Jsel次所选择的第2层特征进行处理,统计个第1层特征的被选择次数,如下所示,
其中,为第个第1层特征的被选择次数。
基于模型预测性能的第3层特征选择与建模
基于上述步骤得到的全部个第1层特征的被选择次数为结合确定的比例系数确定用于第3层特征选择的阈值下限采用如下公式计算,
其中,floor(·)表示取整函数;值取1时表示阈值下限为全部第1层特征选择次数的均值,其最大值和最小值采用如下公式计算,
第3层特征选择的阈值上限取为全部个第1层特征被选择次数的最大值,
将第3层特征选择的阈值记为其值在和之间。第3层特征的筛选机制为:
其中,表示第个第1层特征经J次GA-PLS算法被选择的次数;μp表示第3层特征选择的阈值筛选标准。选择μp=1的特征变量依次存入中;接着,以为输入构建基于PLS的DXN软测量模型,并计算RMSE。
进一步,在和之间逐个增加值,构建基于PLS算法的DXN软测量模型,选择RMSE最小的作为基于数据驱动选择过程变量的基于PLS的DXN排放浓度软测量模型。
进一步,进一步,检查上述数据驱动软测量模型的输入中是否包括烟囱排放的CO浓度、HCL浓度、O2浓度和NOx浓度,同时去除公用传输系统中的特征;若未包括,则将上述特征进行补选,进而获得第3层的选择特征进一步,构建基于数据驱动与机理结合选择过程变量的基于PLS的DXN软测量模型。。
综上可知,本文所提多层特征选择的过程可表示如下,
附图说明
图1基于炉排炉固废焚烧工艺流程
图2软测量策略
图3基于多特征冗余性的第2层特征选择策略图
图4焚烧子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图5锅炉子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图6烟气处理子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图7蒸汽发电子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图8尾气排放子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图9公用子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
具体实施方式
建模数据描述
本文建模数据源于北京某基于炉排炉的MSWI焚烧企业,包括DXN排放浓度检测样本的数量为34个,变量维数为287维(包含了MSWI过程的全部过程变量)。可见,输入特征数量远远超过建模样本数量,进行维数约简非常有必要。本文中,将焚烧、锅炉、烟气处理、蒸汽发电、烟气排放和公用工程6个子系统标记为Incinerator、Boiler、Flue gas、Steam、Stack和Common。
建模结果
基于单特征相关性的特征选择结果
针对不同的子系统,取相关系数和互信息的特征选择权重因子fi corr、fi mi和fi corr _mi均为0.8,和均取为0.5,不同的子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值如图4-9所示。
由图4-9可知,不同子系统过程变量的相关系数,互信息值和综合指标评价值的间存在差异,其最小值、均值和最大值的统计结果如表1所示。
表1不同子系统过程变量的相关性度量结果统计
由表1可知:(1)子系统过程变量相关系数值、互信息值和综合指标评价值平均值的最大值均源于烟气排放子系统,分别为0.2816、0.7401和0.2500;烟气排放子系统测量的是与DXN同时排放至大气中的气体,如′烟囱排放HCL浓度′、′烟囱排放O2浓度′、′烟囱排放NOx浓度′、′烟囱排放CO浓度′等,这与DXN的产生机理和文献中关于DXN排放检测的综述是相符的[11];(2)子系统过程变量相关系数值、互信息值和综合指标评价值最大值的最大值分别源于焚烧子系统、烟气排放子系统和烟气排放子系统,分别为0.6760、0.8665和0.2827,是与DXN生成过程相关的系统;(3)子系统过程变量相关系数值、互信息值和综合指标评价值最小值的最小值均源于公用工程子系统,从机理上讲,该子系统与DXN产生的物质流不具备直接的联系,但从单特相关性的度量结果可知,,其包含的部分过程变量与DXN间的相关系数值和互信息值还是较大的;(4)上述统计表明了DXN排放工业数据具有一定程度的可靠性,从单特征相关性的视角,排在前3的是与DXN生成、处理和排放相关的系统;但其他子系统的部分过程变量从数据视角也与DXN排放浓度的相关性较大,故需要结合机理知识进行最终的特征选择。
进一步,基于综合指标评价值所选择的过程变量数量如表2所示。
表2基于综合指标评价值所选择的过程变量数量
结合图4-9和表2可知,基于相关系数和互信息选择的特征数量并不相同;基于综合评价值选择的特征变量为132个,数量最多的子系统为焚烧(39)和公用工程(42)。此外,分别从各个子系统进行过程变量的选择保证了每个子系统均能够为下步变量选择贡献特征,也便于后续对不同子系统进行独立分析。
基于多特征冗余性的特征选择结果
对上述过程所选择的132个基于单特征相关性的过程变量,采用GA-PLS算法确定最佳过程变量的组合,去除冗余特征。
GA-PLS所采用的运行参数为:种群数量20、最大遗传代数40、最大LV数量6、遗传变异率0.005、窗口宽度1、收敛百分比98%、变量初始化百分比30%。
基于上述参数运行100次,所得预测模型的RMSE统计结果如表3所示。
表3运行100次GA-PLS的RMSE统计结果
由表3可知,从预测性能的统计结果看,GA-PLS的运行结果具有较大的波动性,这与本论文所采用的建模样本数量小和GA算法自身具有随机性相关。对大于预测均值的GA-PLS算法所获得的预测模型进行统计,可得到用于特征选择频次统计的模型数量为49个。进一步,计算132个过程变量的被选择次数,如下表所示。
表4基于多特征选择的过程变量被选择次数统计表
由表4可知:(1)全部132个过程变量被选择的平均次数为13次,具有最大选择次数的过程变量源于公用工程子系统;(2)具有最大单特征相关性的烟气排放子系统的4个过程变量的被选择次数最大仅为6,可见进行多特征冗余性与单特征相关性的选择结果间存在差异性,同时,也说明GA-PLS算法所存在的随机性;(3)仅是基于数据驱动的特征变量选择还是存在缺陷的,需要机理知识的补充。
基于模型预测性能的特征选择结果
基于上述GA-PLS的运行结果,将特征选择阈值的范围设定为13-48。。
按照特征选择阈值与预测性能间的关系,将阈值确定为18,则所选择的过程变量数量为39个,在各个子系统中所选择的变量如表5所示。
表5基于模型预测性能选择的过程变量统计表
由表4可知,输入特征维数降为39,与DXN产生机理相关的特征为14个(焚烧7个,尾气处理6个,锅炉1个)。采用上述基于数据驱动选择的过程变量构建PLS模型。
依据LV数量与预测性能RMSE间的关系,当LV数量为2,其训练和测试RMSE分别为0.01375和0.01929。不同LV提取的潜在变量贡献率如表6所示。
依据DXN产生的机理可知,焚烧发电子系统和公用工程子系统与DXN排放浓度的相关性不大,烟气排放子系统与DXN相关。此处,结合机理增加烟气排放子系统的4个过程变量(烟囱排放HCL浓度′ ′烟囱排放O2浓度′ ′烟囱排放NOx浓度′ ′烟囱排放CO浓度′)作为输入特征。
采用上述基于数据驱动与机理结合选择的18个过程变量构建PLS模型。
依据LV数量与预测性能RMSE间的关系,当LV数量为2时,其训练和测试RMSE分别为0.01638和0.02048。不同LV提取的变量,贡献率如表6所示。
表6基于不同输入特征PLS模型的LV贡献率
由表6可知,加入基于机理知识确定的过程变量后,LV在输入数据中的贡献率提高了2%,在输出数据中的贡献中降低了2%,可见去除和加入的过程变量对预测性能的影响是有限的。考虑到DXN建模数据预处理中是将24小时的数据进行均值化获得,对应的DXN检测值是连续采样8-9小时在离线化验1周获得的,在处理过程中难免会引入不确定因素。同时,此处以引入较小的预测误差为代价,引入部分机理相关的过程变量是适合的。具体的更深入的机理分析需要结合DXN排放过程的数值仿真研究深入进行。
比较与讨论
由上文可知,所提方法能够均衡的考虑相关系数与互信息度量的贡献度。采用PLS算法建立基于上述不同输入特征的软测量模型,统计结果如表4所示。
表4基于不同输入特征的PLS模型统计结果
由上述结果可知:采用相同LV数量,基于不同输入特征的PLS建模方法在测试数据的预测性能相差不大,但在输入特征的维数约简上却差距明显。输入特征维数由高低分别为:原始特征287维、基于互信息235维、基于相关系数153维、基于综合评价值98维、基于本文数据驱动为39维、基于本文数据驱动与机理混合为18维;可见本文方法在特征数量上缩减了16倍。由此可见,本文所提方法对构建物理含义清晰、可解释的软测量模型是有效的。同时也表明,对工业过程数据的分析需要结合机理知识进行。
本文在进行特征选择时,涉及到多个特征选择系数,这些系数对特征选择结果和模型预测性能的影响还需要进一步的深入分析。此外,本文所采用的建模方法为简单的线性模型,所选择的特征为混合的线性与非线性特征,因此在更为合理的建模策略的选择上也还有待于研究。工业过程数据的可靠性如何度量也是值得深入考虑的问题。针对机理知识明晰的输入特征,需要考虑在遗传算法的初始化中利用先验知识,以保证选择具有较强机理相关性的过程变量,如烟囱排放CO浓度等。
本文针对城市固废焚烧的剧毒副产品DXN的生成与排放机理复杂不清、难以实时在线检测,用于DXN软测量的高维输入特征难以有效选择及建模样本有限等问题,提出了基于多层特征选择的MSWI过程DXN排放浓度软测量方法,主要贡献体现在:(1)定义综合评价值指标进行基于相关性的单特征选择与度量;(2)提出多次运行GA-PLS的面向多特征冗余性的特征选择方法;(3)基于模型预测性能,结合数据驱动和机理知识选择最终输入特征构建软测量模型。结合某焚烧厂的多年DXN检测数据验证了所提方法的有效性。
参考文献
[1]Arafat H A,Jijakli K,Ahsan A.Environmental performance and energyrecovery potential of five processes for municipal solid waste treatment[J].Journal of Cleaner Production,2015,105:233-240
[2]Zhou H,Meng A,Long Y Q,Li Q H,and Zhang Y G.A review of dioxin-related substances during municipal solid waste incineration[J].WasteManagement,36:106-118,2015.
[3]Mukherjee A,Debnath B,Ghosh S K.A Review on Technologies ofRemoval of Dioxins and Furans from Incinerator Flue Gas[J].ProcediaEnvironmental Sciences,2016,35:528-540.
[4]Yuanan H,Hefa C,Shu T.The growing importance of waste-to-energy(WTE)incineration in China′s anthropogenic mercury emissions:Emissioninventories and reduction strategies[J].Renewable and Sustainable EnergyReviews,2018,97:119-137.
[5]Huang T,Zhou L,Liu L,Xia M.Ultrasound-enhanced electrokineticremediation for removal of Zn,Pb,Cu and Cd in municipal solid wasteincineration fly ashes[J].Waste Management,2018,75:226-235.
[6]Jones P H,Degerlache J,Marti E,Mischer G,Scherrer M C,Bontinck MJ,Niessen H J,The global exposure of man to dioxins-a perspective onindustrial-waste incineration[J].Chemosphere,26(1993)1491-1497.
[7]Bai J,Sun X,Zhang C,Gong C,Hu J,Zhang J.Mechanism and kineticsstudy on the ozonolysis reaction of 2,3,7,8-TCDD in the atmosphere[J].Journalof Environmental Sciences,2014,26(1):181-188.
[8]俞明锋,付建英,詹明秀.生活废弃物焚烧处置烟气中二噁英排放特性研宄[J].环境科学学报,2018,38(05):1983-1988.(Yu Ming-Feng,Fu Jian-Yinig,Zhan Ming-Xiu.The research of PCDD/Fs emission characteristics in flue gas frommunicipal solid waste incinerations[J].Acta Scientiae Circumstantiae,2018,38(05):1983-1988.)
[9]Gouin T,Daly T H L,Wania F,Mackay D,Jones K C.Variability ofconcentrations of polybrominated diphenyl ethers and polychlorinatedbiphenyls in air:implications for monitoring,modeling and control[J].Atmospheric Environment,2005,39(1):151-166.
[10]Zhang H J,Ni Y W,Chen J P,Zhang O.Influence of variation in theoperating conditions on PCDD/F distribution in a full-scale MSW incinerator[J].Chemosphere,2008,70(4):721-730.
[11]乔俊飞,郭子豪,汤健.面向城市固废焚烧过程的二噁英排放浓度检测方法综述[J].自动化学报(在审).(Qiao J F,Guo Z H,Tang J.Dioxin Emission ConcentrationMeasurement Approaches for Municipal Solid Wastes Incineration Process:ASurvey[J].Acta Automatica Sinica,in trial)
[12]Chang N B,Huang S H.Statistical modelling for the prediction andcontrol of PCDDs and PCDFs emissions from municipal solid waste incinerators[J].Waste Management&Research,1995,13,379-400.
[13]Chang N B,Chen W C.Prediction of PCDDs/PCDFs emissions frommunicipal incinerators by genetic programming and neural network modeling[J].Waste Management&Research,2000,18(4)41-351.
[14]汤健,乔俊飞.基于选择性集成核学习算法的固废焚烧过程二噁英排放浓度软测量[J],化工学报,2019,70(02):696-706.(Tang J,Qiao J F.Dioxin emissionconcentration soft measuring approach of municipal solid waste incinerationbased on selective ensemble kernel learning algorithm[J],Journal of ChemicalIndustry and Engineering(China),2019,70(02):696-706.)
[15]Bunsan S,Chen W Y,Chen H W,Chuang Y H,Grisdanurak N.Modeling thedioxin emission of a municipal solid waste incinerator using neural networks[J].Chemosphere,2013,92:258-264.
[16]肖晓东,卢加伟,海景,等.垃圾焚烧烟气中二噁英类浓度的支持向量回归预测[J].可再生能源,2017,35(8):1107-1114.(Xiao X D,Lu J W,Hai J.Prediction ofdioxin emissions in flue gas from waste incineration based on support vectorregression[J],Renewable Energy Resources,2017,35(8):1107-1114.)
[17]汤健,乔俊飞,郭子豪.基于潜在特征选择性集成建模的二噁英排放浓度软测量[J],自动化学报(在审).(Tang J,Qiao J F,Guo Z H.Soft Sensing of DioxinEmission Concentration Based on Potential Characteristic Selective IntegratedModeling[J].Acta Automatica Sinica,in trial)
[18]Hasnat A,Molla A U.Feature selection in cancer microarray datausing multi-objective genetic algorithm combined with correlation coefficient[A].2016 International Conference on Emerging Technological Trends (ICETT)[C].2016:1-6.
[19]Coelho F,Braga A P,Verleysen M.Multi-Objective Semi-SupervisedFeature Selection and Model Selection Based on Pearson’s CorrelationCoefficient[A].Iberoamerican Congress on Pattern Recognition.Springer[C],Berlin,Heidelberg,2010:509-516.
[20]Battiti R.Using mutual information for selecting features insupervised neural net learning[J].IEEE Transactions on Neural Networks,1994,5(4):537-550.
[21]Vergara J R,Estévez P A.A review of feature selection methodsbased on mutual information[J].Neural computing and applications,2014,24(1):175-186.
[22]Jain A K,Duin R P W,Mao J.Statistical pattern recognition:Areview[J].IEEE Transactions on pattern analysis and machine intelligence,2000,22(1):4-37.
[23]Fleuret F.Fast binary feature selection with conditional mutualinformation[J].Journal of Machine Learning Research,2004,5:1531-1555.
[24]Coelho F,Braga A P,Verleysen M.Multi-Objective Semi-SupervisedFeature Selection and Model Selection Based on Pearson′s CorrelationCoefficient[J].Lecture Notes in Computer Science,2010,6419:509-516.
[25]Estévez P A,Tesmer M,Perez C A,Zurada J M.Normalized mutualinformation feature selection[J].IEEE Transactions on Neural Networks,2009,20(2):189-201.
[26]Amiri F,Yousefi M M R,Lucas C,Shakery A,Yazdani N.Mutualinformation-based feature selection for intrusion detection systems[J].Journal of Network and Computer Applications,34(2011)1184-1199.
[27]Mohammadi S,Mirvaziri H,Ghazizadehahsaee M.Multivariatecorrelation coefficient and mutual information-based feature selection inintrusion detection[J].Information Security Journal A Global Perspective,2017,26(5):229-239.
[28]Peng H,Long F,Ding C.Feature selection based on mutualinformation criteria of max-dependency,max-relevance,and min-redundancy[J].IEEE Transactions on pattern analysis and machine intelligence,2005,27(8):1226-1238.
[29]汤健,田福庆,贾美英.基于频谱数据驱动的旋转机械设备负荷软测量[M].北京:国防工业出版社,2015.(Tang J,Tian F Q,Jia M Y.Soft Measurement of RotatingMachinery Equipment Load Based on Spectrum Data Drive[M].Beijing:NationalDefense Industry Press,2015.)
[30]Tihonov A N.Solution of incorrectly formulated problems and theregularization method[J].Soviet Math.,1963,4:1035-1038.
[31]Wold S,Ruhe A,Wold H,Dunn III W J.The collinearity problem inlinear regression.The partial least squares(PLS)approach to generalizedinverses[J].SIAM Journal on Scientific and Statistical Computing,1984,5(3):735-743.
[32]Leardi R,Boggia R,Terrile M.Genetic algorithms as a strategy forfeature selection[J].Journal of chemometrics,1992,6(5):267-281.
[33]汤健,柴天佑,赵立杰,岳恒,郑秀萍,融合时频信息的磨矿过程磨机负荷软测量[J],控制理论与应用.2012,29(5):564-570.(TANG J,CHAI T Y,ZHAO L J,YUE H,ZHENGX P.Soft sensing mill load in grinding process by time/frequency informationfusion[J].Control Theory and Applications,2012,29(5):564-570.)
[34]Bunsan S,Chen W Y,Chen H W,Chuang Y H,Grisdanurak N.Modeling thedioxin emission of a municipal solid waste incinerator using neural networks[J].Chemosphere,2013,92:258-264.
Claims (4)
1.基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法,其特征在于:
结合焚烧工艺将基于炉排炉的城市固废焚烧MSWI过程分为6个子系统:燃烧处理工程、锅炉设备工程、尾气处理工程、蒸汽发电工程、烟囱排放工程、公用传输工程;
软测量模型的输入数据X∈RN×P包括N个样本即为行和P个变量即为列,其源于MSWI流程的不同子系统;
此处,将来自第ith个子系统的输入数据表示为即存在如下关系,
其中,I表示子系统个数,Pi表示第ith个子系统包含的输入特征个数;
相应的,输出数据包括N个样本,其来源于采用离线直接检测法得到排放物二噁英DXN检测样本;
过程变量以秒为单位在DCS系统采集与存储,DXN排放浓度以月/季为周期离线直接化验获得,故存在N<<P;
将Xi改写为如下形式,
其中,表示第ith个子系统的第pith个输入特征,表示列向量;
提出基于多层特征选择的MSWI过程DXN排放浓度软测量策略:先介绍以下术语:和表示针对第ith个子系统的输入特征采用相关系数和互信息度量所选择的候选特征集合,表示对基于相关系数法和互信息法所选择的候选特征集合采用综合评价值度量所选择的对第ith个子系统的第1层特征,表示串行组合全部子系统的第1层特征所得到的基于单特征相关性的第1层特征,表示运行第jth次GA-PLS算法所选择的基于多特征冗余性的第2层特征,表示第1层特征中第个特征被选择的次数,表示依据特征选择阈值θ3rd和先验知识从中所选择的第3层特征,Mpara表示软测量模型的参数,表示预测值;
1.1)首先,计算不同原始输入特征与DXN排放浓度间的原始相关系数;此处以第ith个子系统的第pth个输入特征为例进行描述,如下,
其中,分别表示第ith个子系统的第pth个输入特征及DXN排放浓度N个建模样本的平均值;将原始相关系数进行如下预处理,
其中,|·|表示取绝对值;
重复上述过程,获得全部原始输入特征的相关系数并记为设定第ith个子系统权重因子fi corr,将基于相关系数选择输入特征的阈值θi corr采用如下公式计算,
其中,fi corr为最大(fi corr)max和最小值(fi corr)min采用如下公式计算,
其中,max(·)和min(·)分别表示取最大和最小值的函数;
以作为阈值,第ith个子系统的第pith输入特征的选择准则如下所示,
选择其中的特征作为基于相关系数选择的候选特征并将其标记为对第ith个子系统的全部原始输入特征执行上述过程,并将所选择的候选特征标记为,
其中,表示基于相关系数选择的第ith个子系统的过程变量个数;
对全部子系统重复上述过程,基于相关系数度量选择的特征标记为
1.2)基于互信息的单特征相关性度量
首先,计算不同原始输入特征与DXN排放浓度间的互信息值;以第ith个子系统的第pth个输入特征为例,如下:
其中,表示联合概率密度,和prob(yn)表示边际概率密度;
重复上述过程,获得全部原始输入特征的互信息值并记为设定第ith个子系统的权重因子fi mi,将基于互信息选择输入特征的阈值采用如下公式计算,
其中,fi mi的最大(fi mi)max和最小值(fi mi)min采用如下公式计算,
以作为阈值,第ith个系统的第pith输入特征的选择准则如下所示,
选择其中的特征作为基于互信息选择的候选特征并将其表标记为对第ith个子系统的全部输入特征执行上述过程,并将所选择的候选特征标记为:
其中,表示基于互信息选择的第ith个子系统的全部特征的个数;
对全部子系统重复上述过程,基于互信息度量选择的特征可标记为
1.3)基于综合评价值的单特征相关性度量
以第ith个子系统为例,同时考虑具有相关系数和互信息贡献度的输入特征在和中得到候选特征集合,其策略为:
其中,∩表示取交集;表示第ith个子系统的第个候选特征,其对应的相关系数值与互信息值为和
为消除不同输入特征的相关系数值和互信息值的大小导致的差异性,按如下公式进行标准化处理;
其中,和表示第ith个子系统的第个标准化的相关系数值和互信息值;
新定义一种候选输入特征的综合评价值其表示形式为,
其中,和表示比例系数,均取值为0.5,其满足
重复上述过程,获得全部候选输入特征的综合评价值并记为
设定第ith个子系统的权重因子fi corr_mi,将基于综合评价值选择输入特征的阈值采用下式计算,
其中,fi corr_mi的最大(fi ccrr_mi)max和最小值(fi corr_mi)min采用如下公式计算,
以作为阈值,以第ith个子系统的第个候选输入特征为例,按如下规则进行选择,
对全部的原始候选输入特征执行上述过程,选择其中的变量作为基于综合评价值选择的输入特征,并标记为,
重复上述过程完成对全部子系统第1层特征的选择,并串行排列得到基于单特征相关性的第一层特征
其中,表示第1层特征选择集合中的第个特征,表示全部第1层特征的数量;
2)基于多特征冗余性的第2层特征选择
采用基于GA-PLS的特征选择算法同时考虑多个特征间的冗余性进行第2层特征选择;采用如下所示的第2层特征选择策略;
上述策略的输入为第1层选择特征运行第jth次GA-PLS的输出为第2层选择特征最终输出为运行J次GA-PLS后每个第1层输入特征的被选择次数,选择预测误差小于Jsel次均值的第2层特征进行统计处理,其中第个特征的选择次数为相应的全部个第1层特征为J为GA-PLS算法的运行次数,Jsel为GA-PLS模型预测误差小于J次运行均值的数量;
上述第2层特征选择的步骤如下:
第1步:设定GA-PLS运行次数J,以及GA-PLS算法参数:初始种群数量、最大遗传代数、变异概率、交叉方式、PLS算法潜在变量数量;设定j=1,启动第2层的特征选择过程,开始运行;
第2步:判断是否达到运行次数J,若满足,则转到第11步,否则,转到第3步;
第3步:采用二进制方式对特征进行编码,其中染色体的长度为输入特征个数,1表示特征被选中,0表示特征未被选中;
第4步:采用随机方式对种群初始化;
第5步:对种群进行适应度评价,采用留一法交叉验证法计算均方根验证误差RMSECV,值越小表明适应度越好;
第6步:判断是否达到最大遗传代数的终止条件,如不满足,转第7步,否则转第9步;
第7步:进行选择、交叉和变异遗传操作,其中:选择操作采用精英替代策略即采用适应度好的个体替换适应度较差的个体,交叉操作采用单点交叉,变异操作采用单点变异;
第8步:获得新种群,转到执行第5步;
第9步:获得第jth次运行GA-PLS算法的最佳个体,进一步解码得到所选择的第2层特征,并将其记为
第10步:令j=j+1,转到第2步;
第11步:计算全部J次运行得到的预测模型的均方根误差RMSE的平均值,将大于此平均值的GA-PLS模型的数量标记为Jsel;对Jsel次所选择的第2层特征进行处理,统计个第1层特征的被选择次数,如下所示,
其中,为第个第1层特征的被选择次数;
3)基于模型预测性能的第3层特征选择与建模
基于上述步骤得到的全部个第1层特征的被选择次数为设定比例系数确定用于第3层特征选择的阈值下限采用如下公式计算;
其中,floor(·)表示取整函数;的最大值和最小值采用如下公式计算,
第3层特征选择的阈值上限取为全部个第1层特征被选择次数的最大值,
将第3层特征选择的阈值记为其值在和之间;第3层特征的筛选机制为:
其中,表示第个第1层特征经J次GA-PLS算法被选择的次数;μp表示第3层特征选择的阈值筛选标准;选择μp=1的特征变量依次存入中;接着,以为输入构建基于PLS的DXN软测量模型,并计算RMSE;
在和之间逐个增加值,构建基于PLS算法的DXN软测量模型,选择RMSE最小的作为基于数据驱动选择过程变量的基于PLS的DXN排放浓度软测量模型;
检查上述数据驱动软测量模型的输入中是否包括烟囱排放的CO浓度、HCL浓度、O2浓度和NOx浓度,同时去除公用传输系统中的特征;若未包括,则将上述特征进行补选,进而获得第3层的选择特征构建基于PLS的DXN软测量模型。
2.根据权利要求1所述的方法,其特征在于:变量维数287维。
3.根据权利要求1所述的方法,其特征在于:取相关系数和互信息的特征选择权重因子fi corr、fi mi和fi corr_mi均为0.8,和均取为0.5。
4.根据权利要求1所述的方法,其特征在于:基于综合评价值选择的特征变量为132个,对上述过程所选择的132个基于单特征相关性的过程变量,采用GA--PLS算法确定最佳过程变量的组合,去除冗余特征;
GA--PLS所采用的运行参数为:种群数量20、最大遗传代数40、最大LV数量6、遗传变异率0.005。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910397710.5A CN110135057B (zh) | 2019-05-14 | 2019-05-14 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
PCT/CN2019/107216 WO2020228215A1 (zh) | 2019-05-14 | 2019-09-23 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
US17/038,723 US11976817B2 (en) | 2019-05-14 | 2020-10-26 | Method for detecting a dioxin emission concentration of a municipal solid waste incineration process based on multi-level feature selection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910397710.5A CN110135057B (zh) | 2019-05-14 | 2019-05-14 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110135057A true CN110135057A (zh) | 2019-08-16 |
CN110135057B CN110135057B (zh) | 2021-03-02 |
Family
ID=67573782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910397710.5A Active CN110135057B (zh) | 2019-05-14 | 2019-05-14 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11976817B2 (zh) |
CN (1) | CN110135057B (zh) |
WO (1) | WO2020228215A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020228215A1 (zh) * | 2019-05-14 | 2020-11-19 | 北京工业大学 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
CN112884203A (zh) * | 2021-01-22 | 2021-06-01 | 浙江大学 | 一种基于贝叶斯支持向量回归的二噁英排放在线预测方法 |
CN113094986A (zh) * | 2021-04-01 | 2021-07-09 | 瀚蓝绿电固废处理(佛山)有限公司 | 垃圾焚烧炉烟气中污染物排放量预测模型构建方法及应用 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113515839A (zh) * | 2021-04-13 | 2021-10-19 | 中国人民解放军陆军工程大学 | 弹药贮存环境分析方法、装置及终端 |
CN114110616B (zh) * | 2021-11-22 | 2024-03-08 | 广州环投从化环保能源有限公司 | 一种垃圾焚烧炉hcl浓度排放控制方法和控制系统 |
CN116680594A (zh) * | 2023-05-05 | 2023-09-01 | 齐鲁工业大学(山东省科学院) | 一种利用深度特征选择算法提高多组学数据的甲状腺癌的分类精度方法 |
CN116511222A (zh) * | 2023-05-26 | 2023-08-01 | 重庆三峰环境集团股份有限公司 | 飞灰活化再利用方法与系统 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005008572A1 (en) * | 2003-07-11 | 2005-01-27 | Computer Associates Think, Inc. | Method and apparatus for automated feature selection |
CN103366100A (zh) * | 2013-06-25 | 2013-10-23 | 西安电子科技大学 | 从全基因组中过滤与复杂疾病无关snp的方法 |
US20150278703A1 (en) * | 2014-03-31 | 2015-10-01 | Google Inc. | Mutual information with absolute dependency for feature selection in machine learning models |
CN105023067A (zh) * | 2015-08-04 | 2015-11-04 | 环境保护部南京环境科学研究所 | 基于层次分析法-模糊综合评价的化工项目环境风险评价体系 |
CN106485353A (zh) * | 2016-09-30 | 2017-03-08 | 中国科学院遥感与数字地球研究所 | 空气污染物浓度预报方法及系统 |
CN107356710A (zh) * | 2017-07-06 | 2017-11-17 | 环境保护部华南环境科学研究所 | 一种垃圾焚烧烟气中二噁英类浓度预测方法及系统 |
US9875440B1 (en) * | 2010-10-26 | 2018-01-23 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
CN107944173A (zh) * | 2017-12-05 | 2018-04-20 | 北京工业大学 | 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统 |
WO2018088716A1 (ko) * | 2016-11-11 | 2018-05-17 | 주식회사 엘지화학 | 다이옥신류 화합물 분석용 전처리 방법 및 이를 이용한 분석 방법 |
CN108062566A (zh) * | 2017-12-13 | 2018-05-22 | 北京工业大学 | 一种基于多核潜在特征提取的智能集成软测量方法 |
CN108090317A (zh) * | 2017-09-20 | 2018-05-29 | 北京工业大学 | 一种采用案例推理的二噁英浓度软测量方法 |
CN108549792A (zh) * | 2018-06-27 | 2018-09-18 | 北京工业大学 | 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法 |
CN109190660A (zh) * | 2018-07-24 | 2019-01-11 | 西安理工大学 | 基于条件互信息的特征选择与评价方法 |
CN109492319A (zh) * | 2018-11-23 | 2019-03-19 | 东北电力大学 | 一种火电厂锅炉烟气含氧量软测量方法 |
CN109492830A (zh) * | 2018-12-17 | 2019-03-19 | 杭州电子科技大学 | 一种基于时空深度学习的移动污染源排放浓度预测方法 |
CN109583115A (zh) * | 2018-12-09 | 2019-04-05 | 北京工业大学 | 一种融合集成磨机负荷参数软测量系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102608285B (zh) * | 2012-02-21 | 2014-08-06 | 南京工业大学 | 基于支持向量机的有机混合物燃爆特性预测方法 |
CN103884670B (zh) * | 2014-03-13 | 2016-01-20 | 西安交通大学 | 基于近红外光谱的烟气成分定量分析方法 |
CN107038334B (zh) * | 2017-02-27 | 2019-12-17 | 浙江大学 | 循环流化床生活垃圾焚烧锅炉co排放预测系统及方法 |
CN110135057B (zh) * | 2019-05-14 | 2021-03-02 | 北京工业大学 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
-
2019
- 2019-05-14 CN CN201910397710.5A patent/CN110135057B/zh active Active
- 2019-09-23 WO PCT/CN2019/107216 patent/WO2020228215A1/zh active Application Filing
-
2020
- 2020-10-26 US US17/038,723 patent/US11976817B2/en active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005008572A1 (en) * | 2003-07-11 | 2005-01-27 | Computer Associates Think, Inc. | Method and apparatus for automated feature selection |
US9875440B1 (en) * | 2010-10-26 | 2018-01-23 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
CN103366100A (zh) * | 2013-06-25 | 2013-10-23 | 西安电子科技大学 | 从全基因组中过滤与复杂疾病无关snp的方法 |
US20150278703A1 (en) * | 2014-03-31 | 2015-10-01 | Google Inc. | Mutual information with absolute dependency for feature selection in machine learning models |
CN105023067A (zh) * | 2015-08-04 | 2015-11-04 | 环境保护部南京环境科学研究所 | 基于层次分析法-模糊综合评价的化工项目环境风险评价体系 |
CN106485353A (zh) * | 2016-09-30 | 2017-03-08 | 中国科学院遥感与数字地球研究所 | 空气污染物浓度预报方法及系统 |
WO2018088716A1 (ko) * | 2016-11-11 | 2018-05-17 | 주식회사 엘지화학 | 다이옥신류 화합물 분석용 전처리 방법 및 이를 이용한 분석 방법 |
CN107356710A (zh) * | 2017-07-06 | 2017-11-17 | 环境保护部华南环境科学研究所 | 一种垃圾焚烧烟气中二噁英类浓度预测方法及系统 |
CN108090317A (zh) * | 2017-09-20 | 2018-05-29 | 北京工业大学 | 一种采用案例推理的二噁英浓度软测量方法 |
CN107944173A (zh) * | 2017-12-05 | 2018-04-20 | 北京工业大学 | 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统 |
CN108062566A (zh) * | 2017-12-13 | 2018-05-22 | 北京工业大学 | 一种基于多核潜在特征提取的智能集成软测量方法 |
CN108549792A (zh) * | 2018-06-27 | 2018-09-18 | 北京工业大学 | 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法 |
CN109190660A (zh) * | 2018-07-24 | 2019-01-11 | 西安理工大学 | 基于条件互信息的特征选择与评价方法 |
CN109492319A (zh) * | 2018-11-23 | 2019-03-19 | 东北电力大学 | 一种火电厂锅炉烟气含氧量软测量方法 |
CN109583115A (zh) * | 2018-12-09 | 2019-04-05 | 北京工业大学 | 一种融合集成磨机负荷参数软测量系统 |
CN109492830A (zh) * | 2018-12-17 | 2019-03-19 | 杭州电子科技大学 | 一种基于时空深度学习的移动污染源排放浓度预测方法 |
Non-Patent Citations (4)
Title |
---|
YUJING SUN ET AL.: "Correlation Feature Selection and Mutual Information Theory Based Quantitative Research on Meteorological Impact Factors of Module Temperature for Solar Photovoltaic Systems", 《ENERGIES》 * |
汤健等: "基于选择性集成核学习算法的固废焚烧过程二英排放浓度软测量", 《化工学报》 * |
汤健等: "基于遗传算法-偏最小二乘进行谱特征选择的磨机负荷软测量方法", 《第二十九届中国控制会议论文集》 * |
简葳玙: "软测量模型的变量选择方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020228215A1 (zh) * | 2019-05-14 | 2020-11-19 | 北京工业大学 | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 |
CN112884203A (zh) * | 2021-01-22 | 2021-06-01 | 浙江大学 | 一种基于贝叶斯支持向量回归的二噁英排放在线预测方法 |
CN113094986A (zh) * | 2021-04-01 | 2021-07-09 | 瀚蓝绿电固废处理(佛山)有限公司 | 垃圾焚烧炉烟气中污染物排放量预测模型构建方法及应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2020228215A1 (zh) | 2020-11-19 |
CN110135057B (zh) | 2021-03-02 |
US11976817B2 (en) | 2024-05-07 |
US20210033282A1 (en) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135057A (zh) | 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 | |
CN108549792B (zh) | 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法 | |
Xia et al. | Dioxin emission prediction based on improved deep forest regression for municipal solid waste incineration process | |
CN111461355B (zh) | 基于随机森林的二噁英排放浓度迁移学习预测方法 | |
Bunsan et al. | Modeling the dioxin emission of a municipal solid waste incinerator using neural networks | |
CN107944173B (zh) | 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统 | |
CN111260149B (zh) | 一种二噁英排放浓度预测方法 | |
CN107356710A (zh) | 一种垃圾焚烧烟气中二噁英类浓度预测方法及系统 | |
Almalawi et al. | An IoT based system for magnify air pollution monitoring and prognosis using hybrid artificial intelligence technique | |
CN109960873A (zh) | 一种城市固废焚烧过程二噁英排放浓度软测量方法 | |
Dai et al. | A simulation-based fuzzy possibilistic programming model for coal blending management with consideration of human health risk under uncertainty | |
CN114398836A (zh) | 基于宽度混合森林回归的mswi过程二噁英排放软测量方法 | |
Xia et al. | Dioxin emission modeling using feature selection and simplified DFR with residual error fitting for the grate-based MSWI process | |
Kiang | Fuel property estimation and combustion process characterization: Conventional fuels, biomass, biocarbon, waste fuels, refuse derived fuel, and other alternative fuels | |
CN111462835B (zh) | 一种基于深度森林回归算法的二噁英排放浓度软测量方法 | |
CN114266461A (zh) | 基于可视化分布gan的mswi过程二噁英排放风险预警方法 | |
Marengo et al. | Modeling of the polluting emissions from a cement production plant by partial least-squares, principal component regression, and artificial neural networks | |
Li et al. | Neural networks and genetic algorithms can support human supervisory control to reduce fossil fuel power plant emissions | |
Chen et al. | Online support vector based gas emission prediction system for generation power plant | |
Xia et al. | Soft measuring method of dioxin emission concentration for MSWI process based on RF and GBDT | |
CN109978011A (zh) | 一种城市固废焚烧过程二噁英排放浓度预测系统 | |
CN114881470A (zh) | 基于数据的垃圾焚烧发电污染物排放风险诊断预警方法 | |
JP3668405B2 (ja) | ごみ焼却炉の制御方法及び装置 | |
Tang et al. | Dioxin Emission Concentration Soft Measuring Method Based on Selective Ensemble Least Square Support Vector Machine Algorithm | |
Yuxuan et al. | Review and outlook on municipal solid waste smart incineration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |