CN110135057B - 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 - Google Patents

基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 Download PDF

Info

Publication number
CN110135057B
CN110135057B CN201910397710.5A CN201910397710A CN110135057B CN 110135057 B CN110135057 B CN 110135057B CN 201910397710 A CN201910397710 A CN 201910397710A CN 110135057 B CN110135057 B CN 110135057B
Authority
CN
China
Prior art keywords
features
layer
feature
selection
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910397710.5A
Other languages
English (en)
Other versions
CN110135057A (zh
Inventor
乔俊飞
郭子豪
汤健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910397710.5A priority Critical patent/CN110135057B/zh
Publication of CN110135057A publication Critical patent/CN110135057A/zh
Priority to PCT/CN2019/107216 priority patent/WO2020228215A1/zh
Priority to US17/038,723 priority patent/US11976817B2/en
Application granted granted Critical
Publication of CN110135057B publication Critical patent/CN110135057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0027General constructional details of gas analysers, e.g. portable test equipment concerning the detector
    • G01N33/0036General constructional details of gas analysers, e.g. portable test equipment concerning the detector specially adapted to detect a particular component
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F23COMBUSTION APPARATUS; COMBUSTION PROCESSES
    • F23GCREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
    • F23G5/00Incineration of waste; Incinerator constructions; Details, accessories or control therefor
    • F23G5/50Control or safety arrangements
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F23COMBUSTION APPARATUS; COMBUSTION PROCESSES
    • F23GCREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
    • F23G2207/00Control
    • F23G2207/10Arrangement of sensing devices
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F23COMBUSTION APPARATUS; COMBUSTION PROCESSES
    • F23GCREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
    • F23G2208/00Safety aspects
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F23COMBUSTION APPARATUS; COMBUSTION PROCESSES
    • F23GCREMATION FURNACES; CONSUMING WASTE PRODUCTS BY COMBUSTION
    • F23G2900/00Special features of, or arrangements for incinerators
    • F23G2900/55Controlling; Monitoring or measuring
    • F23G2900/55003Sensing for exhaust gas properties, e.g. O2 content
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E20/00Combustion technologies with mitigation potential
    • Y02E20/12Heat utilisation in combustion or incineration of waste

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Food Science & Technology (AREA)
  • Combustion & Propulsion (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Incineration Of Waste (AREA)
  • Feedback Control In General (AREA)

Abstract

基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法属于软测量领域。本文提出基于多层特征选择的MSWI过程DXN排放浓度软测量方法。首先,从单特征与DXN相关性视角,结合相关系数和互信息构建综合评价值指标,实现MSWI多个子系统过程变量的第1层特征选择;接着,从多特征冗余性和特征选择鲁棒性视角,多次运行基于GA‑PLS的特征选择算法,实现第2层特征选择;最后,结合上层选择特征的统计频次、模型预测性能及机理知识进行第3层特征选择,构建得到DXN排放浓度软测量模型。结合某焚烧厂的多年DXN检测数据验证了所提方法的有效性。

Description

基于多层特征选择的固废焚烧过程二噁英排放浓度软测量 方法
技术领域
本发明属于软测量领域。
背景技术
基于炉排炉的城市固废焚烧(MSWI)技术是目前应用最广泛的生活垃圾资源化处理手段[1,2]。截止2017年,我国大陆已有MSWI电厂303座,其中220座采用基于炉排炉的焚烧技术。目前引进的国外MSWI过程多处于手动控制运行状态,难以保持稳定运行与进行优化控制[3]。针对发展中国家,当前最为紧迫的问题是控制MSWI所造成的污染物排放[4,5],其中排放物二噁英(DXN)是目前世界上毒性最强的污染物[6],也是造成焚烧建厂存在“邻避效应”的主要原因。DXN是多氯代二苯并对二噁英(PCDDs)、多氯代二苯并呋喃(PCDFs)以及部分具有类二噁英性质的多氯联苯所组成的持久性有机污染物的统称,被称为“世纪之毒”[7],其在生物体内具有显著的积累和放大效应[8,9]
当前,MSWI焚烧企业的主要关注点是如何通过优化控制运行参数实现DXN排放的最小化[10]。为优化固废焚烧过程,实现DXN排放浓度的在线测量非常必要。现阶段主要检测方法包括离线直接检测法、指示物/关联物在线间接检测法和软测量方法,其中:第1种检测方法需要专门实验室和相应化验分析设备,滞后时间尺度为月/周;第2种检测方法分为在线采集烟气、检测指示物/关联物浓度和基于映射模型间接计算DXN排放浓度等3个步骤,需要昂贵复杂的在线化验分析设备,滞后时间尺度为天/小时;第3种检测方法不需要化验分析设备,滞后时间尺度为分钟/秒[11]。本文主要关注第3种方法的研究。
DXN排放浓度软测量的已有研究包括:依据机理和经验选择的输入特征,文献[12,13,14]采用数十年前欧美研究机构针对不同类型焚烧炉采集的小样本数据,基于线性回归、人工神经网络(ANN)、选择性集成(SEN)最小二乘-支持向量机(LS-SVM)等方法构建模型;文献[15]选用台湾某焚烧厂4年多的实际过程数据,综合相关性分析、主成分分析(PCA)和人工神经网络(ANN)等算法,从23个易检测过程变量中选择13个为输入构建DXN软测量模型,指出贡献率较大的输入特征为活性炭注入频率、烟囱排放HCL气体浓度和混合室温度;文献[16]以炉膛温度、锅炉出口烟温、烟气流量、SO2浓度、HCl浓度及颗粒物浓度为输入变量构建基于支持向量机(SVM)的DXN排放浓度与毒性当量预测模型。实际MSWI过程的变量有数百维,这些变量在不同程度上均与DXN的生成、吸收与排放相关[17]。上述过程均未结合MSWI过程的多工序特性和变量间的共线性进行特征选择。此外,DXN软测量的标记样本难以获得,建模中应重点考虑小样本高维数据的特征选择问题。
特征选择的本质就是去除原始数据中的“无关特征”与“冗余特征”,保留重要特征。从消除“无关特征”的视角,应考虑MWSI过程中的单个特征(自变量)和DXN排放浓度(因变量)间的相关程度。文献[18]对高维数据利用相关系数进行维数约简,缩短运算时间和建模复杂度。文献[19]提出基于相关系数的多目标半监督特征选择方法。但研究表明,基于相关系数的线性方法难以描述自变量与因变量间的复杂任意映射关系[20]。文献[21]指出互信息对特征间的相关性具有良好的表征能力。文献[22]提出基于个体最佳互信息的特征选择方法。文献[23]提出基于条件互信息的特征选择方法,能够有效地对上一步所选择的特征进行评价。由此可知,相关系数与互信息均可以表征自变量和因变量间的相关性[24,25];前者的着重点在线性关系,后者的着重点在非线性关系[26,27]。针对实际的复杂工业过程,自变量和因变量间的映射关系难以采用单一的线性或非线性进行统一表征。上述这些方法均未考虑如何进行特征的自适应选择。
在获得与DXN具有较好相关性单输入特征的基础上,从消除“冗余特征”的视角,主要考虑MSWI过程众多过程变量间的冗余性。文献[28]采用相关系数表示已选特征与当前特征之间的冗余性。文献[29]提出PCA解决变量间的共线性问题,但所提取的潜在变量会破坏原始特征自身物理含义。文献[30]提出改进岭回归方法的回归系数为有偏估计量从而处理多重共线性问题。文献[31]验证了偏最小二乘(PLS)对输入特征间的多重共线性问题有良好的解释与分解能力。文献[32]提出了结合遗传算法(GA)全局优化搜索能力和PLS多重共线性处理能力的特征选择方法,即遗传-偏最小二乘算法(GA-PLS)。汤等人的研究表明,GA-PLS对高维谱数据具有良好的选择性[33],但在面对小样本高维数据时,GA的随机性导致其每次特征选择的结果存在着差异性,有必要对多次选择的特征进行统计,以提高鲁棒性和可解释性。
本文进行特征选择的目标是提高软测量模型的预测性能和可解释性。此外,上述特征选择过程主要从数据驱动视角出发,样本数量有限时可能存在偏差。依据已有的研究成果和先验知识,我们需要扩充机理含义明确的重要特征,使得软测量模型更具可解释性并且符合焚烧过程DXN排放特性,进而为后续的优化控制研究提供支撑。
综上,本文提出基于多层特征选择的MSWI过程DXN排放浓度软测量方法。首先,从单特征与DXN相关性视角,结合相关系数和互信息构建综合评价值指标,实现MSWI多个子系统过程变量的第1层特征选择;接着,从多特征冗余性和特征选择鲁棒性视角,多次运行基于GA-PLS的特征选择算法,实现第2层特征选择;最后,结合上层选择特征的统计频次、模型预测性能及机理知识进行第3层特征选择,构建得到DXN排放浓度软测量模型。结合某焚烧厂的多年DXN检测数据验证了所提方法的有效性。
国内某厂的炉排炉焚烧工艺流程如图1所示:
由图1可知,MSW由专用的运输车收集后运至卸料大厅,倾倒至密封的存放池内;由人工操控的吊斗将MSW放入焚烧炉进料斗内,给料机将其推至炉排炉;在焚烧炉的炉排内依次经历干燥、点燃、燃烧和烧尽四个阶段,其中:燃尽后的残渣掉入水冷渣斗内,再由输渣机将其推入炉渣池内,收集后送至填埋场处理;焚烧产生的烟气由废热锅炉转换为高压蒸汽并推动汽轮机组发电,锅炉出口的待处理烟气进入脱酸反应器进行中和反应,并在反应器入口处添加石灰和活性炭以吸附其中的DXN和重金属,其中:飞灰进入飞灰储仓,烟气进入布袋除尘器;烟气在袋式除尘器中被除去烟气颗粒物、中和反应物和活性炭吸附物,处理后分为三个部分,其中:尾部飞灰进入灰仓后再运走进行无害化处理,部分烟灰混合物在混合器中加水后重新进入脱酸反应器,尾部烟气则由引风机经烟囱排入大气,排放的尾气中含有HCL、SO2、NOx、HF和DXN等质。
由上述过程产生的DXN形态包括焚烧灰、飞灰和排放气体3种,其中:焚烧灰量最大但DXN浓度较低、飞灰量稍小但DXN浓度较焚烧灰高,该两类需进行特殊处理;排放气体中的DXN浓度为最高,包括垃圾不完全燃烧和新规合成反应生成(de novo syhthesis)两类[34]。为保证有毒有机物的有效分解,焚烧烟气应达到至少850℃并保持至少2秒。在烟气处理阶段,石灰和活性炭被喷射进入反应器用以移除酸性气体和吸附DXN以及某些重金属,再经袋式过滤器过滤后通过引风机排入烟囱;此外,该阶段存在的DXN记忆效应会导致排放浓度增加。通常,上述炉内焚烧和烟气处理阶段中与DXN产生和吸收相关的过程变量以秒为周期由现场分布式控制系统进行存储。排放烟气中的易检测气体(CO、HCL、SO2、NOx和HF等)浓度通过在线检测仪表实时检测。焚烧企业或环保部门通常以月或季为周期采用离线直接化验法对排放烟气进行DXN浓度检测。
综上可知,DXN排放浓度软测量存在的难点包括:MSW的原始DXN含量未知、DXN生成和吸收阶段的机理复杂不清、烟气处理阶段DXN存在的记忆效应导致测量存在不确定性等。因此,非常有必要对MSWI过程的输入特征进行分区域的特征选择。
发明内容
结合焚烧工艺将MSWI过程分为6个子系统:燃烧处理工程、锅炉设备工程、尾气处理工程、蒸汽发电工程、烟囱排放工程、公用传输工程。
本文中,软测量模型的输入数据X∈RN×P包括N个样本(行)和P个变量(列),其源于MSWI流程的不同子系统。此处,将来自第ith个子系统的输入数据表示为
Figure GDA0002849422130000031
即存在如下关系,
Figure GDA0002849422130000032
Figure GDA0002849422130000033
其中,I表示子系统个数,Pi表示第ith个子系统包含的输入特征个数。
相应的,输出数据
Figure GDA0002849422130000034
包括N个样本(行),其来源于采用离线直接检测法得到DXN检测样本。
显然,模型的输入/输出数据在时间尺度上具有较大的差异性:过程变量以秒为单位在DCS系统采集与存储,DXN排放浓度以月/季为周期离线直接化验获得,故存在N<<P。
为便于后文描述和理解,将Xi改写为如下形式,
Figure GDA0002849422130000035
其中,
Figure GDA0002849422130000036
表示第ith个子系统的第pith个输入特征,
Figure GDA0002849422130000037
表示列向量。
本文提出基于多层特征选择的MSWI过程DXN排放浓度软测量策略,如图2所示。
在图2中,
Figure GDA0002849422130000038
Figure GDA0002849422130000039
表示针对第ith个子系统的输入特征采用相关系数和互信息度量所选择的候选特征集合,
Figure GDA00028494221300000310
表示对基于相关系数法和互信息法所选择的候选特征集合采用综合评价值度量所选择的对第ith个子系统的第1层特征,
Figure GDA00028494221300000311
表示串行组合全部子系统的第1层特征所得到的基于单特征相关性的第1层特征,
Figure GDA00028494221300000312
表示运行第jth次GA-PLS算法所选择的基于多特征冗余性的第2层特征,
Figure GDA00028494221300000313
表示第1层特征中第
Figure GDA00028494221300000323
个特征被选择的次数,
Figure GDA00028494221300000315
表示依据特征选择阈值θ3rd和先验知识从
Figure GDA00028494221300000316
中所选择的第3层特征,Mpara表示软测量模型的参数,
Figure GDA00028494221300000317
表示预测值。
算法实现
基于单特征相关性的第1层特征选择
基于相关系数的单特征相关性度量
首先,计算不同原始输入特征与DXN排放浓度间的原始相关系数。此处以第ith个子系统的第pth个输入特征
Figure GDA00028494221300000318
为例进行描述,如下,
Figure GDA00028494221300000319
其中,
Figure GDA00028494221300000320
分别表示第ith个子系统的第pth个输入特征及DXN排放浓度N个建模样本的平均值。将原始相关系数
Figure GDA00028494221300000321
进行如下预处理,
Figure GDA00028494221300000322
其中,|·|表示取绝对值。
重复上述过程,获得全部原始输入特征的相关系数并记为
Figure GDA0002849422130000041
设定第ith个子系统的权重因子fi corr,将基于相关系数选择输入特征的阈值θi corr采用如下公式计算,
Figure GDA0002849422130000042
其中,fi corr的最大(fi corr)max和最小值(fi corr)min采用如下公式计算,
Figure GDA0002849422130000043
其中,max(·)和min(·)分别表示取最大和最小值的函数。
以θi corr作为阈值,第ith个子系统的第pith输入特征的选择准则如下所示,
Figure GDA0002849422130000044
选择其中
Figure GDA0002849422130000045
的特征
Figure GDA0002849422130000046
作为基于相关系数选择的候选特征并将其标记为
Figure GDA0002849422130000047
对第ith个子系统的全部原始输入特征执行上述过程,并将所选择的候选特征标记为,
Figure GDA0002849422130000048
其中,
Figure GDA0002849422130000049
表示基于相关系数选择的第ith个子系统的过程变量个数。
对全部子系统重复上述过程,基于相关系数度量选择的特征标记为
Figure GDA00028494221300000410
基于互信息的单特征相关性度量
首先,计算不同原始输入特征与DXN排放浓度间的互信息值。以第ith个子系统的第pth个输入特征
Figure GDA00028494221300000411
为例,如下:
Figure GDA00028494221300000412
其中,
Figure GDA00028494221300000413
表示联合概率密度,
Figure GDA00028494221300000414
和prob(yn)表示边际概率密度。
重复上述过程,获得全部原始输入特征的互信息值并记为
Figure GDA00028494221300000415
设定第ith个子系统的权重因子fi mi,,将基于互信息选择输入特征的阈值θi mi采用如下公式计算,
Figure GDA00028494221300000416
其中,fi mi的最大(fi mi)max和最小值(fi mi)min采用如下公式计算,
Figure GDA00028494221300000417
以θi mi作为阈值,第ith个系统的第pith输入特征的选择准则如下所示,
Figure GDA00028494221300000418
选择其中
Figure GDA0002849422130000051
的特征
Figure GDA0002849422130000052
作为基于互信息选择的候选特征并将其表标记为
Figure GDA0002849422130000053
对第ith个子系统的全部输入特征执行上述过程,并将所选择的候选特征标记为:
Figure GDA0002849422130000054
其中,
Figure GDA0002849422130000055
表示基于互信息选择的第ith个子系统的全部特征的个数。
对全部子系统重复上述过程,基于互信息度量选择的特征可标记为
Figure GDA0002849422130000056
基于综合评价值的单特征相关性度量
以第ith个子系统为例,同时考虑具有相关系数和互信息贡献度的输入特征在
Figure GDA0002849422130000057
Figure GDA0002849422130000058
中得到候选特征集合,其策略为:
Figure GDA0002849422130000059
其中,∩表示取交集。
Figure GDA00028494221300000510
表示第ith个子系统的第
Figure GDA00028494221300000511
个候选特征,其对应的相关系数值与互信息值为
Figure GDA00028494221300000512
Figure GDA00028494221300000513
为消除不同输入特征的相关系数值和互信息值的大小导致的差异性,按如下公式进行标准化处理,
Figure GDA00028494221300000514
Figure GDA00028494221300000515
其中,
Figure GDA00028494221300000516
Figure GDA00028494221300000517
表示第ith个子系统的第
Figure GDA00028494221300000518
个标准化的相关系数值和互信息值。
本文新定义一种候选输入特征的综合评价值
Figure GDA00028494221300000519
其表示形式为,
Figure GDA00028494221300000520
其中,ki corr和ki mi表示比例系数(默认取值为0.5),其满足ki corr+ki mi=1。
重复上述过程,获得全部候选输入特征的综合评价值并记为
Figure GDA00028494221300000524
设定第ith个子系统的权重因子fi corr_mi,将基于综合评价值选择输入特征的阈值θi lstsel采用下式计算,
Figure GDA00028494221300000526
其中,fi corr_mi的最大(fi corr_mi)max和最小值(fi corr_mi)min采用如下公式计算,
Figure GDA00028494221300000527
以θi lstsel作为阈值,以第ith个子系统的第
Figure GDA00028494221300000529
个候选输入特征为例,按如下规则进行选择,
Figure GDA0002849422130000061
对全部的原始候选输入特征执行上述过程,选择其中
Figure GDA0002849422130000062
的变量作为基于综合评价值选择的输入特征,并标记为,
Figure GDA0002849422130000063
重复上述过程完成对全部子系统第1层特征的选择,并串行排列可得到基于单特征相关性的第一层特征
Figure GDA0002849422130000064
Figure GDA0002849422130000065
其中,
Figure GDA0002849422130000066
表示第1层特征选择集合中的第
Figure GDA0002849422130000067
th个特征,
Figure GDA0002849422130000068
表示全部第1层特征的数量。
基于多特征冗余性的第2层特征选择
上述第1层特征的选择过程仅考虑单输入特征与DXN排放浓度之间的相关性,未考虑多特征间存在的冗余性。此处采用基于GA-PLS的特征选择算法同时考虑多个特征间的冗余性进行第2层特征选择。考虑到DXN排放浓度建模的小样本特点和GA算法的随机性,此处采用如下所示的第2层特征选择策略。
由图3可知:上述策略的输入为第1层选择特征
Figure GDA0002849422130000069
运行第jth次GA-PLS的输出为第2层选择特征
Figure GDA00028494221300000610
最终输出为运行J次GA-PLS后每个第1层输入特征的被选择次数,选择预测误差小于均值的Jsel次第2层特征进行统计处理,其中第
Figure GDA00028494221300000618
个特征的选择次数为
Figure GDA00028494221300000612
相应的全部
Figure GDA00028494221300000613
个第1层特征为
Figure GDA00028494221300000614
J为GA-PLS算法的运行次数,一般取值为100次以上;Jsel为GA-PLS模型预测误差小于J次运行均值的数量。
上述第2层特征选择的步骤如下:
第1步:设定GA-PLS运行次数J,以及GA-PLS算法参数:初始种群数量、最大遗传代数、变异概率、交叉方式、PLS算法潜在变量(LV)数量,一般设定为6;设定j=1,启动第2层的特征选择过程,开始运行。
第2步:判断是否达到运行次数J,若满足,则转到第11步,否则,转到第3步;
第3步:采用二进制方式对特征进行编码,其中染色体的长度为输入特征个数,1表示特征被选中,0表示特征未被选中;
第4步:采用随机方式对种群初始化;
第5步:对种群进行适应度评价,采用留一法交叉验证法计算均方根验证误差RMSECV,值越小表明适应度越好;
第6步:判断是否达到最大遗传代数的终止条件,如不满足,转第7步,否则转第9步;
第7步:进行选择、交叉和变异遗传操作,其中:选择操作采用精英替代策略即采用适应度好的个体替换适应度较差的个体,交叉操作采用单点交叉,变异操作采用单点变异;
第8步:获得新种群,转到执行第5步;
第9步:获得第jth次运行GA-PLS算法的最佳个体,进一步解码得到所选择的第2层特征,并将其记为
Figure GDA00028494221300000615
第10步:令j=j+1,转到第2步;
第11步:计算全部J次运行得到的预测模型的均方根误差(RMSE)的平均值,将大于此平均值的GA-PLS模型的数量标记为Jsel。对Jsel次所选择的第2层特征进行处理,统计
Figure GDA00028494221300000616
个第1层特征的被选择次数,如下所示,
Figure GDA00028494221300000617
其中,
Figure GDA0002849422130000071
为第
Figure GDA00028494221300000728
个第1层特征的被选择次数。
基于模型预测性能的第3层特征选择与建模
基于上述步骤得到的全部
Figure GDA0002849422130000073
个第1层特征的被选择次数为
Figure GDA0002849422130000074
结合确定的比例系数
Figure GDA0002849422130000075
(其默认值为1),确定用于第3层特征选择的阈值下限
Figure GDA0002849422130000076
采用如下公式计算,
Figure GDA0002849422130000077
其中,floor(·)表示取整函数;
Figure GDA0002849422130000078
值取1时表示阈值下限为全部第1层特征选择次数的均值,其最大值
Figure GDA0002849422130000079
和最小值
Figure GDA00028494221300000710
采用如下公式计算,
Figure GDA00028494221300000711
第3层特征选择的阈值上限
Figure GDA00028494221300000712
取为全部
Figure GDA00028494221300000713
个第1层特征被选择次数的最大值,
Figure GDA00028494221300000714
将第3层特征选择的阈值记为
Figure GDA00028494221300000715
其值在
Figure GDA00028494221300000716
Figure GDA00028494221300000717
之间。第3层特征的筛选机制为:
Figure GDA00028494221300000718
其中,
Figure GDA00028494221300000719
表示第
Figure GDA00028494221300000720
个第1层特征经J次GA-PLS算法被选择的次数;μp表示第3层特征选择的阈值筛选标准。选择μp=1的特征变量依次存入
Figure GDA00028494221300000721
中;接着,以
Figure GDA00028494221300000722
为输入构建基于PLS的DXN软测量模型,并计算RMSE。
进一步,在
Figure GDA00028494221300000723
Figure GDA00028494221300000724
之间逐个增加
Figure GDA00028494221300000725
值,构建基于PLS算法的DXN软测量模型,选择RMSE最小的作为基于数据驱动选择过程变量的基于PLS的DXN排放浓度软测量模型。
进一步,进一步,检查上述数据驱动软测量模型的输入中是否包括烟囱排放的CO浓度、HCL浓度、O2浓度和NOx浓度,同时去除公用传输系统中的特征;若未包括,则将上述特征进行补选,进而获得第3层的选择特征
Figure GDA00028494221300000726
进一步,构建基于数据驱动与机理结合选择过程变量的基于PLS的DXN软测量模型。。
综上可知,本文所提多层特征选择的过程可表示如下,
Figure GDA00028494221300000727
附图说明
图1基于炉排炉固废焚烧工艺流程
图2软测量策略
图3基于多特征冗余性的第2层特征选择策略图
图4焚烧子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图5锅炉子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图6烟气处理子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图7蒸汽发电子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图8尾气排放子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
图9公用子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值
具体实施方式
建模数据描述
本文建模数据源于北京某基于炉排炉的MSWI焚烧企业,包括DXN排放浓度检测样本的数量为34个,变量维数为287维(包含了MSWI过程的全部过程变量)。可见,输入特征数量远远超过建模样本数量,进行维数约简非常有必要。本文中,将焚烧、锅炉、烟气处理、蒸汽发电、烟气排放和公用工程6个子系统标记为Incinerator、Boiler、Flue gas、Steam、Stack和Common。
建模结果
基于单特征相关性的特征选择结果
针对不同的子系统,取相关系数和互信息的特征选择权重因子fi corr、fi mi和fi corr _mi均为0.8,ki corr和ki mi均取为0.5,不同的子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值如图4-9所示。
由图4-9可知,不同子系统过程变量的相关系数,互信息值和综合指标评价值的间存在差异,其最小值、均值和最大值的统计结果如表1所示。
表1不同子系统过程变量的相关性度量结果统计
Figure GDA0002849422130000083
由表1可知:(1)子系统过程变量相关系数值、互信息值和综合指标评价值平均值的最大值均源于烟气排放子系统,分别为0.2816、0.7401和0.2500;烟气排放子系统测量的是与DXN同时排放至大气中的气体,如烟囱排放HCL浓度、烟囱排放O2浓度、烟囱排放NOx浓度、烟囱排放CO浓度等,这与DXN的产生机理和文献中关于DXN排放检测的综述是相符的[11];(2)子系统过程变量相关系数值、互信息值和综合指标评价值最大值的最大值分别源于焚烧子系统、烟气排放子系统和烟气排放子系统,分别为0.6760、0.8665和0.2827,是与DXN生成过程相关的系统;(3)子系统过程变量相关系数值、互信息值和综合指标评价值最小值的最小值均源于公用工程子系统,从机理上讲,该子系统与DXN产生的物质流不具备直接的联系,但从单特征相关性的度量结果可知,其包含的部分过程变量与DXN间的相关系数值和互信息值还是较大的;(4)上述统计表明了DXN排放工业数据具有一定程度的可靠性,从单特征相关性的视角,排在前3的是与DXN生成、处理和排放相关的系统;但其他子系统的部分过程变量从数据视角也与DXN排放浓度的相关性较大,故需要结合机理知识进行最终的特征选择。
进一步,基于综合指标评价值所选择的过程变量数量如表2所示。
表2基于综合指标评价值所选择的过程变量数量
Figure GDA0002849422130000091
结合图4-9和表2可知,基于相关系数和互信息选择的特征数量并不相同;基于综合评价值选择的特征变量为132个,数量最多的子系统为焚烧(39)和公用工程(42)。此外,分别从各个子系统进行过程变量的选择保证了每个子系统均能够为下步变量选择贡献特征,也便于后续对不同子系统进行独立分析。
基于多特征冗余性的特征选择结果
对上述过程所选择的132个基于单特征相关性的过程变量,采用GA-PLS算法确定最佳过程变量的组合,去除冗余特征。
GA-PLS所采用的运行参数为:种群数量20、最大遗传代数40、最大LV数量6、遗传变异率0.005、窗口宽度1、收敛百分比98%、变量初始化百分比30%。
基于上述参数运行100次,所得预测模型的RMSE统计结果如表3所示。
表3运行100次GA-PLS的RMSE统计结果
Figure GDA0002849422130000092
由表3可知,从预测性能的统计结果看,GA-PLS的运行结果具有较大的波动性,这与本论文所采用的建模样本数量小和GA算法自身具有随机性相关。对大于预测均值的GA-PLS算法所获得的预测模型进行统计,可得到用于特征选择频次统计的模型数量为49个。进一步,计算132个过程变量的被选择次数,如下表所示。
表4基于多特征选择的过程变量被选择次数统计表
Figure GDA0002849422130000093
Figure GDA0002849422130000101
由表4可知:(1)全部132个过程变量被选择的平均次数为13次,具有最大选择次数的过程变量源于公用工程子系统;(2)具有最大单特征相关性的烟气排放子系统的4个过程变量的被选择次数最大仅为6,可见进行多特征冗余性与单特征相关性的选择结果间存在差异性,同时,也说明GA-PLS算法所存在的随机性;(3)仅是基于数据驱动的特征变量选择还是存在缺陷的,需要机理知识的补充。
基于模型预测性能的特征选择结果
基于上述GA-PLS的运行结果,将特征选择阈值的范围设定为13-48。。
按照特征选择阈值与预测性能间的关系,将阈值确定为18,则所选择的过程变量数量为39个,在各个子系统中所选择的变量如表5所示。
表5基于模型预测性能选择的过程变量统计表
Figure GDA0002849422130000102
由表4可知,输入特征维数降为39,与DXN产生机理相关的特征为14个(焚烧7个,尾气处理6个,锅炉1个)。采用上述基于数据驱动选择的过程变量构建PLS模型。
依据LV数量与预测性能RMSE间的关系,当LV数量为2,其训练和测试RMSE分别为0.01375和0.01929。不同LV提取的潜在变量贡献率如表6所示。
依据DXN产生的机理可知,焚烧发电子系统和公用工程子系统与DXN排放浓度的相关性不大,烟气排放子系统与DXN相关。此处,结合机理增加烟气排放子系统的4个过程变量(烟囱排放HCL浓度 烟囱排放O2浓度 烟囱排放NOx浓度 烟囱排放CO浓度)作为输入特征。
采用上述基于数据驱动与机理结合选择的18个过程变量构建PLS模型。
依据LV数量与预测性能RMSE间的关系,当LV数量为2时,其训练和测试RMSE分别为0.01638和0.02048。不同LV提取的变量,贡献率如表6所示。
表6基于不同输入特征PLS模型的LV贡献率
Figure GDA0002849422130000111
由表6可知,加入基于机理知识确定的过程变量后,LV在输入数据中的贡献率提高了2%,在输出数据中的贡献中降低了2%,可见去除和加入的过程变量对预测性能的影响是有限的。考虑到DXN建模数据预处理中是将24小时的数据进行均值化获得,对应的DXN检测值是连续采样8-9小时在离线化验1周获得的,在处理过程中难免会引入不确定因素。同时,此处以引入较小的预测误差为代价,引入部分机理相关的过程变量是适合的。具体的更深入的机理分析需要结合DXN排放过程的数值仿真研究深入进行。
比较与讨论
由上文可知,所提方法能够均衡的考虑相关系数与互信息度量的贡献度。采用PLS算法建立基于上述不同输入特征的软测量模型,统计结果如表7所示。
表7基于不同输入特征的PLS模型统计结果
Figure GDA0002849422130000112
由上述结果可知:采用相同LV数量,基于不同输入特征的PLS建模方法在测试数据的预测性能相差不大,但在输入特征的维数约简上却差距明显。输入特征维数由高低分别为:原始特征287维、基于互信息235维、基于相关系数153维、基于综合评价值98维、基于本文数据驱动为39维、基于本文数据驱动与机理混合为18维;可见本文方法在特征数量上缩减了16倍。由此可见,本文所提方法对构建物理含义清晰、可解释的软测量模型是有效的。同时也表明,对工业过程数据的分析需要结合机理知识进行。
本文在进行特征选择时,涉及到多个特征选择系数,这些系数对特征选择结果和模型预测性能的影响还需要进一步的深入分析。此外,本文所采用的建模方法为简单的线性模型,所选择的特征为混合的线性与非线性特征,因此在更为合理的建模策略的选择上也还有待于研究。工业过程数据的可靠性如何度量也是值得深入考虑的问题。针对机理知识明晰的输入特征,需要考虑在遗传算法的初始化中利用先验知识,以保证选择具有较强机理相关性的过程变量,如烟囱排放CO浓度等。
本文针对城市固废焚烧的剧毒副产品DXN的生成与排放机理复杂不清、难以实时在线检测,用于DXN软测量的高维输入特征难以有效选择及建模样本有限等问题,提出了基于多层特征选择的MSWI过程DXN排放浓度软测量方法,主要贡献体现在:(1)定义综合评价值指标进行基于相关性的单特征选择与度量;(2)提出多次运行GA-PLS的面向多特征冗余性的特征选择方法;(3)基于模型预测性能,结合数据驱动和机理知识选择最终输入特征构建软测量模型。结合某焚烧厂的多年DXN检测数据验证了所提方法的有效性。
参考文献
[1]Arafat H A,Jijakli K,Ahsan A.Environmental performance and energyrecovery potential of five processes for municipal solid waste treatment[J].Journal of Cleaner Production,2015,105:233-240
[2]Zhou H,Meng A,Long Y Q,Li Q H,and Zhang Y G.A review of dioxin-related substances during municipal solid waste incineration[J].WasteManagement,36:106-118,2015.
[3]Mukherjee A,Debnath B,Ghosh S K.A Review on Technologies ofRemoval of Dioxins and Furans from Incinerator Flue Gas[J].ProcediaEnvironmental Sciences,2016,35:528-540.
[4]Yuanan H,Hefa C,Shu T.The growing importance of waste-to-energy(WTE)incineration in Chinas anthropogenic mercury emissions:Emissioninventories and reduction strategies[J].Renewable and Sustainable EnergyReviews,2018,97:119-137.
[5]Huang T,Zhou L,Liu L,Xia M.Ultrasound-enhanced electrokineticremediation for removal of Zn,Pb,Cu and Cd in municipal solid wasteincineration fly ashes[J].Waste Management,2018,75:226-235.
[6]Jones P H,Degerlache J,Marti E,Mischer G,Scherrer M C,Bontinck MJ,Niessen H J,The global exposure of man to dioxins-a perspective onindustrial-waste incineration[J].Chemosphere,26(1993)1491-1497.
[7]Bai J,Sun X,Zhang C,Gong C,Hu J,Zhang J.Mechanism and kineticsstudy on the ozonolysis reaction of 2,3,7,8-TCDD in the atmosphere[J].Journalof Environmental Sciences,2014,26(1):181-188.
[8]俞明锋,付建英,詹明秀.生活废弃物焚烧处置烟气中二噁英排放特性研究[J].环境科学学报,2018,38(05):1983-1988.(Yu Ming-Feng,Fu Jian-Yinig,Zhan Ming-Xiu.The research of PCDD/Fs emission characteristics in flue gas frommunicipal solid waste incinerations[J].Acta Scientiae Circumstantiae,2018,38(05):1983-1988.)
[9]Gouin T,Daly T H L,Wania F,Mackay D,Jones K C.Variability ofconcentrations of polybrominated diphenyl ethers and polychlorinatedbiphenyls in air:implications for monitoring,modeling and control[J].Atmospheric Environment,2005,39(1):151-166.
[10]Zhang H J,Ni Y W,Chen J P,Zhang Q.Influence of variation in theoperating conditions on PCDD/F distribution in a full-scale MSW incinerator[J].Chemosphere,2008,70(4):721-730.
[11]乔俊飞,郭子豪,汤健.面向城市固废焚烧过程的二噁英排放浓度检测方法综述[J].自动化学报(在审).(Qiao J F,Guo Z H,Tang J.Dioxin Emission ConcentrationMeasurement Approaches for Municipal Solid Wastes Incineration Process:ASurvey[J].Acta Automatica Sinica,in trial)
[12]Chang N B,Huang S H.Statistical modelling for the prediction andcontrol of PCDDs and PCDFs emissions from municipal solid waste incinerators[J].Waste Management&Research,1995,13,379-400.
[13]Chang N B,Chen W C.Prediction of PCDDs/PCDFs emissions frommunicipal incinerators by genetic programming and neural network modeling[J].Waste Management&Research,2000,18(4)41–351.
[14]汤健,乔俊飞.基于选择性集成核学习算法的固废焚烧过程二噁英排放浓度软测量[J],化工学报,2019,70(02):696-706.(Tang J,Qiao J F.Dioxin emissionconcentration soft measuring approach of municipal solid waste incinerationbased on selective ensemble kernel learning algorithm[J],Journal of ChemicalIndustry and Engineering(China),2019,70(02):696-706.)
[15]Bunsan S,Chen W Y,Chen H W,Chuang Y H,Grisdanurak N.Modeling thedioxin emission of a municipal solid waste incinerator using neural networks[J].Chemosphere,2013,92:258-264.
[16]肖晓东,卢加伟,海景,等.垃圾焚烧烟气中二噁英类浓度的支持向量回归预测[J].可再生能源,2017,35(8):1107-1114.(Xiao X D,Lu J W,Hai J.Prediction ofdioxin emissions in flue gas from waste incineration based on support vectorregression[J],Renewable Energy Resources,2017,35(8):1107-1114.)
[17]汤健,乔俊飞,郭子豪.基于潜在特征选择性集成建模的二噁英排放浓度软测量[J],自动化学报(在审).(Tang J,Qiao J F,Guo Z H.Soft Sensing of DioxinEmission Concentration Based on Potential Characteristic Selective IntegratedModeling[J].Acta Automatica Sinica,in trial)
[18]Hasnat A,Molla A U.Feature selection in cancer microarray datausing multi-objective genetic algorithm combined with correlation coefficient[A].2016International Conference on Emerging Technological Trends(ICETT)[C].2016:1-6.
[19]Coelho F,Braga AP,Verleysen M.Multi-Objective Semi-SupervisedFeature Selection and Model Selection Based on Pearson’s CorrelationCoefficient[A].Iberoamerican Congress on Pattern Recognition.Springer[C],Berlin,Heidelberg,2010:509-516.
[20]Battiti R.Using mutual information for selecting features insupervised neural net learning[J].IEEE Transactions on Neural Networks,1994,5(4):537-550.
[21]Vergara J R,Estévez P A.A review of feature selection methodsbased on mutual information[J].Neural computing and applications,2014,24(1):175-186.
[22]Jain A K,Duin R P W,Mao J.Statistical pattern recognition:Areview[J].IEEE Transactions on pattern analysis and machine intelligence,2000,22(1):4-37.
[23]Fleuret F.Fast binary feature selection with conditional mutualinformation[J].Journal of Machine Learning Research,2004,5:1531-1555.
[24]Coelho F,Braga AP,Verleysen M.Multi-Objective Semi-SupervisedFeature Selection and Model Selection Based on Pearsons CorrelationCoefficient[J].Lecture Notes in Computer Science,2010,6419:509-516.
[25]Estévez P A,Tesmer M,Perez C A,Zurada J M.Normalized mutualinformation feature selection[J].IEEE Transactions on Neural Networks,2009,20(2):189-201.
[26]Amiri F,Yousefi M M R,Lucas C,Shakery A,Yazdani N.Mutualinformation-based feature selection for intrusion detection systems[J].Journal of Network and Computer Applications,34(2011)1184–1199.
[27]Mohammadi S,Mirvaziri H,Ghazizadehahsaee M.Multivariatecorrelation coefficient and mutual information-based feature selection inintrusion detection[J].Information Security Journal A Global Perspective,2017,26(5):229-239.
[28]Peng H,Long F,Ding C.Feature selection based on mutualinformation criteria of max-dependency,max-relevance,and min-redundancy[J].IEEE Transactions on pattern analysis and machine intelligence,2005,27(8):1226-1238.
[29]汤健,田福庆,贾美英.基于频谱数据驱动的旋转机械设备负荷软测量[M].北京:国防工业出版社,2015.(Tang J,Tian F Q,Jia M Y.Soft Measurement of RotatingMachinery Equipment Load Based on Spectrum Data Drive[M].Beijing:NationalDefense Industry Press,2015.)
[30]Tihonov AN.Solution of incorrectly formulated problems and theregularization method[J].Soviet Math.,1963,4:1035-1038.
[31]Wold S,Ruhe A,Wold H,Dunn III W J.The collinearity problem inlinear regression.The partial least squares(PLS)approach to generalizedinverses[J].SIAM Journal on Scientific and Statistical Computing,1984,5(3):735-743.
[32]Leardi R,Boggia R,Terrile M.Genetic algorithms as a strategy forfeature selection[J].Journal of chemometrics,1992,6(5):267-281.
[33]汤健,柴天佑,赵立杰,岳恒,郑秀萍,融合时频信息的磨矿过程磨机负荷软测量[J],控制理论与应用.2012,29(5):564-570.(TANG J,CHAI T Y,ZHAO L J,YUE H,ZHENGX P.Soft sensing mill load in grinding process by time/frequency informationfusion[J].Control Theory and Applications,2012,29(5):564-570.)
[34]Bunsan S,Chen W Y,Chen H W,Chuang Y H,Grisdanurak N.Modeling thedioxin emission of a municipal solid waste incinerator using neural networks[J].Chemosphere,2013,92:258-264.

Claims (3)

1.基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法,其特征在于:
结合焚烧工艺将基于炉排炉的城市固废焚烧MSWI过程分为6个子系统:燃烧处理工程、锅炉设备工程、尾气处理工程、蒸汽发电工程、烟囱排放工程、公用传输工程;
软测量模型的输入数据X∈RN×P包括N个样本即为行和P个变量即为列,其源于MSWI流程的不同子系统;
此处,将来自第ith个子系统的输入数据表示为
Figure FDA00027302059900000114
即存在如下关系,
Figure FDA0002730205990000011
Figure FDA0002730205990000012
其中,I表示子系统个数,Pi表示第ith个子系统包含的输入特征个数;
相应的,输出数据
Figure FDA0002730205990000013
包括N个样本,其来源于采用离线直接检测法得到排放物二噁英DXN检测样本;
过程变量以秒为单位在DCS系统采集与存储,DXN排放浓度以月/季为周期离线直接化验获得,故存在N<<P;
将Xi改写为如下形式,
Figure FDA0002730205990000014
其中,
Figure FDA00027302059900000115
表示第ith个子系统的第pith个输入特征,
Figure FDA0002730205990000015
表示列向量;
提出基于多层特征选择的MSWI过程DXN排放浓度软测量策略:先介绍以下术语:
Figure FDA0002730205990000016
Figure FDA0002730205990000017
表示针对第ith个子系统的输入特征采用相关系数和互信息度量所选择的候选特征集合,
Figure FDA0002730205990000018
表示对基于相关系数法和互信息法所选择的候选特征集合采用综合评价值度量所选择的对第ith个子系统的第1层特征,
Figure FDA0002730205990000019
表示串行组合全部子系统的第1层特征所得到的基于单特征相关性的第1层特征,
Figure FDA00027302059900000110
表示运行第jth次GA-PLS算法所选择的基于多特征冗余性的第2层特征,
Figure FDA00027302059900000111
表示第1层特征中第
Figure FDA00027302059900000112
个特征被选择的次数,
Figure FDA00027302059900000113
表示依据特征选择阈值θ3rd和先验知识从
Figure FDA0002730205990000021
中所选择的第3层特征,Mpara表示软测量模型的参数,
Figure FDA0002730205990000022
表示预测值;
1.1)首先,计算不同原始输入特征与DXN排放浓度间的原始相关系数;此处以第ith个子系统的第pth个输入特征
Figure FDA0002730205990000023
为例进行描述,如下,
Figure FDA0002730205990000024
其中,
Figure FDA0002730205990000025
分别表示第ith个子系统的第pth个输入特征及DXN排放浓度N个建模样本的平均值;将原始相关系数
Figure FDA0002730205990000026
进行如下预处理,
Figure FDA0002730205990000027
其中,|·|表示取绝对值;
重复上述过程,获得全部原始输入特征的相关系数并记为
Figure FDA0002730205990000028
设定第ith个子系统权重因子fi corr,将基于相关系数选择输入特征的阈值
Figure FDA0002730205990000029
采用如下公式计算,
Figure FDA00027302059900000210
其中,最大(fi corr)max和最小值(fi corr)min采用如下公式计算,
Figure FDA00027302059900000211
其中,max(·)和min(·)分别表示取最大和最小值的函数;
Figure FDA00027302059900000212
作为阈值,第ith个子系统的第pith输入特征的选择准则如下所示,
Figure FDA00027302059900000213
选择其中
Figure FDA00027302059900000214
的特征
Figure FDA00027302059900000215
作为基于相关系数选择的候选特征并将其标记为
Figure FDA00027302059900000216
对第ith个子系统的全部原始输入特征执行上述过程,并将所选择的候选特征标记为,
Figure FDA0002730205990000031
其中,
Figure FDA0002730205990000032
表示基于相关系数选择的第ith个子系统的过程变量个数;
对全部子系统重复上述过程,基于相关系数度量选择的特征标记为
Figure FDA0002730205990000033
1.2)基于互信息的单特征相关性度量
首先,计算不同原始输入特征与DXN排放浓度间的互信息值;以第ith个子系统的第pth个输入特征
Figure FDA0002730205990000034
为例,如下:
Figure FDA0002730205990000035
其中,
Figure FDA0002730205990000036
表示联合概率密度,
Figure FDA0002730205990000037
和prob(yn)表示边际概率密度;
重复上述过程,获得全部原始输入特征的互信息值并记为
Figure FDA0002730205990000038
设定第ith个子系统的权重因子fi mi,将基于互信息选择输入特征的阈值
Figure FDA0002730205990000039
采用如下公式计算,
Figure FDA00027302059900000310
其中,fi mi的最大(fi mi)max和最小值(fi mi)min采用如下公式计算,
Figure FDA00027302059900000311
Figure FDA00027302059900000312
作为阈值,第ith个系统的第pith输入特征的选择准则如下所示,
Figure FDA00027302059900000313
选择其中
Figure FDA00027302059900000314
的特征
Figure FDA00027302059900000315
作为基于互信息选择的候选特征并将其表标记为
Figure FDA00027302059900000316
对第ith个子系统的全部输入特征执行上述过程,并将所选择的候选特征标记为:
Figure FDA0002730205990000041
其中,
Figure FDA0002730205990000042
表示基于互信息选择的第ith个子系统的全部特征的个数;
对全部子系统重复上述过程,基于互信息度量选择的特征可标记为
Figure FDA0002730205990000043
1.3)基于综合评价值的单特征相关性度量
以第ith个子系统为例,同时考虑具有相关系数和互信息贡献度的输入特征在
Figure FDA0002730205990000044
Figure FDA0002730205990000045
中得到候选特征集合,其策略为:
Figure FDA0002730205990000046
其中,∩表示取交集;
Figure FDA0002730205990000047
表示第ith个子系统的第
Figure FDA0002730205990000048
个候选特征,其对应的相关系数值与互信息值为
Figure FDA0002730205990000049
Figure FDA00027302059900000410
为消除不同输入特征的相关系数值和互信息值的大小导致的差异性,按如下公式进行标准化处理;
Figure FDA00027302059900000411
Figure FDA00027302059900000412
其中,
Figure FDA00027302059900000413
Figure FDA00027302059900000414
表示第ith个子系统的第
Figure FDA00027302059900000415
个标准化的相关系数值和互信息值;
新定义一种候选输入特征的综合评价值
Figure FDA00027302059900000416
其表示形式为,
Figure FDA00027302059900000417
其中,
Figure FDA00027302059900000418
Figure FDA00027302059900000419
表示比例系数,均取值为0.5,其满足
Figure FDA00027302059900000420
重复上述过程,获得全部候选输入特征的综合评价值并记为
Figure FDA00027302059900000421
设定第ith个子系统的权重因子fi corr_mi,将基于综合评价值选择输入特征的阈值
Figure FDA00027302059900000422
采用下式计算,
Figure FDA00027302059900000423
其中,fi corr_mi的最大(fi corr_mi)max和最小值(fi corr_mi)min采用如下公式计算,
Figure FDA0002730205990000051
Figure FDA0002730205990000052
作为阈值,以第ith个子系统的第
Figure FDA0002730205990000053
个候选输入特征为例,按如下规则进行选择,
Figure FDA0002730205990000054
对全部的原始候选输入特征执行上述过程,选择其中
Figure FDA0002730205990000055
的变量作为基于综合评价值选择的输入特征,并标记为,
Figure FDA0002730205990000056
重复上述过程完成对全部子系统第1层特征的选择,并串行排列得到基于单特征相关性的第一层特征
Figure FDA0002730205990000057
Figure FDA0002730205990000058
其中,
Figure FDA0002730205990000059
表示第1层特征选择集合中的第
Figure FDA00027302059900000510
个特征,
Figure FDA00027302059900000511
表示全部第1层特征的数量;
2)基于多特征冗余性的第2层特征选择
采用基于GA-PLS的特征选择算法同时考虑多个特征间的冗余性进行第2层特征选择;采用如下所示的第2层特征选择策略;
上述策略的输入为第1层选择特征
Figure FDA00027302059900000512
运行第jth次GA-PLS的输出为第2层选择特征
Figure FDA00027302059900000513
最终输出为运行J次GA-PLS后每个第1层输入特征的被选择次数,选择预测误差小于Jsel次均值的第2层特征进行统计处理,其中第
Figure FDA00027302059900000514
个特征的选择次数为
Figure FDA00027302059900000515
相应的全部
Figure FDA00027302059900000516
个第1层特征为
Figure FDA00027302059900000517
J为GA-PLS算法的运行次数,Jsel为GA-PLS模型预测误差小于J次运行均值的数量;
上述第2层特征选择的步骤如下:
第1步:设定GA-PLS运行次数J,以及GA-PLS算法参数:初始种群数量、最大遗传代数、变异概率、交叉方式、PLS算法潜在变量数量;设定j=1,启动第2层的特征选择过程,开始运行;
第2步:判断是否达到运行次数J,若满足,则转到第11步,否则,转到第3步;
第3步:采用二进制方式对特征进行编码,其中染色体的长度为输入特征个数,1表示特征被选中,0表示特征未被选中;
第4步:采用随机方式对种群初始化;
第5步:对种群进行适应度评价,采用留一法交叉验证法计算均方根验证误差RMSECV,值越小表明适应度越好;
第6步:判断是否达到最大遗传代数的终止条件,如不满足,转第7步,否则转第9步;
第7步:进行选择、交叉和变异遗传操作,其中:选择操作采用精英替代策略即采用适应度好的个体替换适应度较差的个体,交叉操作采用单点交叉,变异操作采用单点变异;
第8步:获得新种群,转到执行第5步;
第9步:获得第jth次运行GA-PLS算法的最佳个体,进一步解码得到所选择的第2层特征,并将其记为
Figure FDA0002730205990000061
第10步:令j=j+1,转到第2步;
第11步:计算全部J次运行得到的预测模型的均方根误差RMSE的平均值,将大于此平均值的GA-PLS模型的数量标记为Jsel;对Jsel次所选择的第2层特征进行处理,统计
Figure FDA0002730205990000062
个第1层特征的被选择次数,如下所示,
Figure FDA0002730205990000063
其中,
Figure FDA0002730205990000064
为第
Figure FDA0002730205990000065
个第1层特征的被选择次数;
3)基于模型预测性能的第3层特征选择与建模
基于上述步骤得到的全部
Figure FDA0002730205990000066
个第1层特征的被选择次数为
Figure FDA0002730205990000067
设定比例系数
Figure FDA0002730205990000068
确定用于第3层特征选择的阈值下限
Figure FDA0002730205990000069
采用如下公式计算;
Figure FDA0002730205990000071
其中,floor(·)表示取整函数;
Figure FDA0002730205990000072
的最大值
Figure FDA0002730205990000073
和最小值
Figure FDA0002730205990000074
采用如下公式计算,
Figure FDA0002730205990000075
第3层特征选择的阈值上限
Figure FDA0002730205990000076
取为全部
Figure FDA0002730205990000077
个第1层特征被选择次数的最大值,
Figure FDA0002730205990000078
将第3层特征选择的阈值记为
Figure FDA0002730205990000079
其值在
Figure FDA00027302059900000710
Figure FDA00027302059900000711
之间;第3层特征的筛选机制为:
Figure FDA00027302059900000712
其中,
Figure FDA00027302059900000713
表示第
Figure FDA00027302059900000714
个第1层特征经J次GA-PLS算法被选择的次数;μp表示第3层特征选择的阈值筛选标准;选择μp=1的特征变量依次存入
Figure FDA00027302059900000715
中;接着,以
Figure FDA00027302059900000716
为输入构建基于PLS的DXN软测量模型,并计算RMSE;
Figure FDA00027302059900000717
Figure FDA00027302059900000718
之间逐个增加
Figure FDA00027302059900000719
值,构建基于PLS算法的DXN软测量模型,选择RMSE最小的作为基于数据驱动选择过程变量的基于PLS的DXN排放浓度软测量模型;
检查上述数据驱动软测量模型的输入中是否包括烟囱排放的CO浓度、HCL浓度、O2浓度和NOx浓度,同时去除公用传输系统中的特征;若未包括,则将上述特征进行补选,进而获得第3层的选择特征
Figure FDA00027302059900000720
构建基于PLS的DXN软测量模型。
2.根据权利要求1所述的方法,其特征在于:变量维数287维。
3.根据权利要求1所述的方法,其特征在于:fi corr、fi mi和fi corr_mi均为0.8,
Figure FDA0002730205990000081
Figure FDA0002730205990000082
均取为0.5。
CN201910397710.5A 2019-05-14 2019-05-14 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法 Active CN110135057B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910397710.5A CN110135057B (zh) 2019-05-14 2019-05-14 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法
PCT/CN2019/107216 WO2020228215A1 (zh) 2019-05-14 2019-09-23 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法
US17/038,723 US11976817B2 (en) 2019-05-14 2020-10-26 Method for detecting a dioxin emission concentration of a municipal solid waste incineration process based on multi-level feature selection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910397710.5A CN110135057B (zh) 2019-05-14 2019-05-14 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法

Publications (2)

Publication Number Publication Date
CN110135057A CN110135057A (zh) 2019-08-16
CN110135057B true CN110135057B (zh) 2021-03-02

Family

ID=67573782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910397710.5A Active CN110135057B (zh) 2019-05-14 2019-05-14 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法

Country Status (3)

Country Link
US (1) US11976817B2 (zh)
CN (1) CN110135057B (zh)
WO (1) WO2020228215A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135057B (zh) * 2019-05-14 2021-03-02 北京工业大学 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法
CN112884203A (zh) * 2021-01-22 2021-06-01 浙江大学 一种基于贝叶斯支持向量回归的二噁英排放在线预测方法
CN113094986B (zh) * 2021-04-01 2022-01-18 瀚蓝绿电固废处理(佛山)有限公司 垃圾焚烧炉烟气中污染物排放量预测模型构建方法及应用
CN113515839A (zh) * 2021-04-13 2021-10-19 中国人民解放军陆军工程大学 弹药贮存环境分析方法、装置及终端
CN114110616B (zh) * 2021-11-22 2024-03-08 广州环投从化环保能源有限公司 一种垃圾焚烧炉hcl浓度排放控制方法和控制系统
CN116110506A (zh) * 2022-12-21 2023-05-12 北京工业大学 一种mswi过程二噁英排放浓度在线软测量方法
CN116680594B (zh) * 2023-05-05 2024-07-05 齐鲁工业大学(山东省科学院) 一种利用深度特征选择算法提高多组学数据的甲状腺癌的分类精度方法
CN116511222A (zh) * 2023-05-26 2023-08-01 重庆三峰环境集团股份有限公司 飞灰活化再利用方法与系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005008572A1 (en) * 2003-07-11 2005-01-27 Computer Associates Think, Inc. Method and apparatus for automated feature selection
CN103366100A (zh) * 2013-06-25 2013-10-23 西安电子科技大学 从全基因组中过滤与复杂疾病无关snp的方法
US9875440B1 (en) * 2010-10-26 2018-01-23 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
CN107944173A (zh) * 2017-12-05 2018-04-20 北京工业大学 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统
CN108062566A (zh) * 2017-12-13 2018-05-22 北京工业大学 一种基于多核潜在特征提取的智能集成软测量方法
CN108090317A (zh) * 2017-09-20 2018-05-29 北京工业大学 一种采用案例推理的二噁英浓度软测量方法
CN108549792A (zh) * 2018-06-27 2018-09-18 北京工业大学 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
CN109190660A (zh) * 2018-07-24 2019-01-11 西安理工大学 基于条件互信息的特征选择与评价方法
CN109492319A (zh) * 2018-11-23 2019-03-19 东北电力大学 一种火电厂锅炉烟气含氧量软测量方法
CN109583115A (zh) * 2018-12-09 2019-04-05 北京工业大学 一种融合集成磨机负荷参数软测量系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102608285B (zh) * 2012-02-21 2014-08-06 南京工业大学 基于支持向量机的有机混合物燃爆特性预测方法
CN103884670B (zh) * 2014-03-13 2016-01-20 西安交通大学 基于近红外光谱的烟气成分定量分析方法
US10832158B2 (en) * 2014-03-31 2020-11-10 Google Llc Mutual information with absolute dependency for feature selection in machine learning models
CN105023067A (zh) * 2015-08-04 2015-11-04 环境保护部南京环境科学研究所 基于层次分析法-模糊综合评价的化工项目环境风险评价体系
CN106485353B (zh) * 2016-09-30 2019-11-29 中国科学院遥感与数字地球研究所 空气污染物浓度预报方法及系统
KR102034841B1 (ko) * 2016-11-11 2019-10-21 주식회사 엘지화학 다이옥신류 화합물 분석용 전처리 방법 및 이를 이용한 분석 방법
CN107038334B (zh) * 2017-02-27 2019-12-17 浙江大学 循环流化床生活垃圾焚烧锅炉co排放预测系统及方法
CN107356710A (zh) * 2017-07-06 2017-11-17 环境保护部华南环境科学研究所 一种垃圾焚烧烟气中二噁英类浓度预测方法及系统
CN109492830B (zh) * 2018-12-17 2021-08-31 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN110135057B (zh) * 2019-05-14 2021-03-02 北京工业大学 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005008572A1 (en) * 2003-07-11 2005-01-27 Computer Associates Think, Inc. Method and apparatus for automated feature selection
US9875440B1 (en) * 2010-10-26 2018-01-23 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
CN103366100A (zh) * 2013-06-25 2013-10-23 西安电子科技大学 从全基因组中过滤与复杂疾病无关snp的方法
CN108090317A (zh) * 2017-09-20 2018-05-29 北京工业大学 一种采用案例推理的二噁英浓度软测量方法
CN107944173A (zh) * 2017-12-05 2018-04-20 北京工业大学 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统
CN108062566A (zh) * 2017-12-13 2018-05-22 北京工业大学 一种基于多核潜在特征提取的智能集成软测量方法
CN108549792A (zh) * 2018-06-27 2018-09-18 北京工业大学 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
CN109190660A (zh) * 2018-07-24 2019-01-11 西安理工大学 基于条件互信息的特征选择与评价方法
CN109492319A (zh) * 2018-11-23 2019-03-19 东北电力大学 一种火电厂锅炉烟气含氧量软测量方法
CN109583115A (zh) * 2018-12-09 2019-04-05 北京工业大学 一种融合集成磨机负荷参数软测量系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Correlation Feature Selection and Mutual Information Theory Based Quantitative Research on Meteorological Impact Factors of Module Temperature for Solar Photovoltaic Systems;Yujing Sun et al.;《energies》;20161222;第10卷(第1期);全文 *
基于选择性集成核学习算法的固废焚烧过程二英排放浓度软测量;汤健等;《化工学报》;20190228;第70卷(第2期);全文 *
基于遗传算法-偏最小二乘进行谱特征选择的磨机负荷软测量方法;汤健等;《第二十九届中国控制会议论文集》;20100731;全文 *
软测量模型的变量选择方法研究;简葳玙;《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》;20170815(第8期);第13-25页 *

Also Published As

Publication number Publication date
US11976817B2 (en) 2024-05-07
WO2020228215A1 (zh) 2020-11-19
CN110135057A (zh) 2019-08-16
US20210033282A1 (en) 2021-02-04

Similar Documents

Publication Publication Date Title
CN110135057B (zh) 基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法
CN108549792B (zh) 一种基于潜结构映射算法的固废焚烧过程二噁英排放浓度软测量方法
Xia et al. Dioxin emission prediction based on improved deep forest regression for municipal solid waste incineration process
CN109960873B (zh) 一种城市固废焚烧过程二噁英排放浓度软测量方法
CN107944173B (zh) 一种基于选择性集成最小二乘支撑向量机的二噁英软测量系统
Bunsan et al. Modeling the dioxin emission of a municipal solid waste incinerator using neural networks
CN112464544B (zh) 一种城市固废焚烧过程二噁英排放浓度预测模型构建方法
Hao et al. Combining neural network and genetic algorithms to optimize low NOx pulverized coal combustion
CN111260149B (zh) 一种二噁英排放浓度预测方法
CN111461355A (zh) 基于随机森林的二噁英排放浓度迁移学习预测方法
CN111144609A (zh) 一种锅炉废气排放预测模型建立方法、预测方法及装置
CN111462835B (zh) 一种基于深度森林回归算法的二噁英排放浓度软测量方法
Chen et al. Bagging based ensemble learning approaches for modeling the emission of PCDD/Fs from municipal solid waste incinerators
WO2023138140A1 (zh) 基于宽度混合森林回归的mswi过程二噁英排放软测量方法
Dal Pozzo et al. Economic and environmental benefits by improved process control strategies in HCl removal from waste-to-energy flue gas
Xia et al. Dioxin emission modeling using feature selection and simplified DFR with residual error fitting for the grate-based MSWI process
CN114155919A (zh) 一种基于机器学习的多源城市固废配伍优化方法
Huang et al. Causation mechanism analysis of excess emission of flue gas pollutants from municipal solid waste incineration power plants by employing the Fault Tree combined with Bayesian Network: A case study in Dongguan
Wen et al. Dioxin emission prediction from a full-scale municipal solid waste incinerator: deep learning model in time-series input
Xia et al. Soft measuring method of dioxin emission concentration for MSWI process based on RF and GBDT
Li et al. Neural networks and genetic algorithms can support human supervisory control to reduce fossil fuel power plant emissions
Jin et al. Machine learning-aided optimization of coal decoupling combustion for lowering NO and CO emissions simultaneously
Movahed et al. Modeling and optimization of NO emission for a steam power plant by data‐driven methods
CN109978011A (zh) 一种城市固废焚烧过程二噁英排放浓度预测系统
Lim et al. Smart solutions for clean air: An AI-guided approach to sustainable industrial pollution control in coal-fired power plant

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant