CN112285287B - 一种烟气在线监测数据预处理方法 - Google Patents

一种烟气在线监测数据预处理方法 Download PDF

Info

Publication number
CN112285287B
CN112285287B CN202011118064.3A CN202011118064A CN112285287B CN 112285287 B CN112285287 B CN 112285287B CN 202011118064 A CN202011118064 A CN 202011118064A CN 112285287 B CN112285287 B CN 112285287B
Authority
CN
China
Prior art keywords
combustion
data
factor
stage
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011118064.3A
Other languages
English (en)
Other versions
CN112285287A (zh
Inventor
蒋鸿伟
叶效强
余阳
暴军
胡晓辉
吴玉书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Ctsy Environmental Technology Co ltd
Original Assignee
Guangdong Ctsy Environmental Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Ctsy Environmental Technology Co ltd filed Critical Guangdong Ctsy Environmental Technology Co ltd
Priority to CN202011118064.3A priority Critical patent/CN112285287B/zh
Publication of CN112285287A publication Critical patent/CN112285287A/zh
Application granted granted Critical
Publication of CN112285287B publication Critical patent/CN112285287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method, e.g. intermittent, or the display, e.g. digital
    • G01N33/0067General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method, e.g. intermittent, or the display, e.g. digital by measuring the rate of variation of the concentration
    • G01N33/0068
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Abstract

一种水污染源在线监测数据异常的识别方法,包括如下步骤:步骤A:接入站点监测数据;步骤B:对站点监测数据中异常数据进行初级识别;步骤C:对站点监测数据中异常数据进行二级识别,剔除非正常监测时段的异常数据;步骤D:通过污染因子之间、污染因子与烟气参数之间的逻辑关系,对不符合逻辑关系的异常数据进行三级筛查;步骤E:判别监测站点的燃烧阶段、燃烧持续类型和燃烧波动类型;步骤F:判别全局疑似异常数据;步骤G:通过预测模型判别局部疑似异常数据;步骤H:对不符合逻辑关系的异常数据、全局疑似异常数据和局部疑似异常数据进行记录并处理。本发明解决异常点捕获效果欠佳问题,准确识别异常数据,大大提高运维人员的工作效率。

Description

一种烟气在线监测数据预处理方法
技术领域
本发明涉及烟气监测技术领域,尤其涉及一种烟气在线监测数据预处理方法。
背景技术
固定污染源烟气在线监测数据为环境管理部门、环境执法部门掌握企业污染的情况提供了重要决策依据,随着环境治理力度不断加大,环境监测数据的质量越来越重要。但是,在烟气在线监测过程中,受系统误差、仪器故障、维护保养、人为造假、污染源异常等多方面的影响,往往会出现一系列的异常数据,从而影响烟气监测数据的整体质量。
在现场运维过程中,异常数据的审核工作一般由人工完成。首先,筛选监测数据的异常表现形式,比如零值、负值、恒定值、缺失值、极值、急剧升高、急剧下降等,并记录这些异常数据的出现时间;然后,运维人员结合现场监测仪器的运行状态、维护保养情况、企业工况等,并使用零点校准、量程校准、校验、参比方法、CEMS准确度检测等质控方法,审核异常数据、及标记异常原因。这种人工审核和质控的方法通常能有效识别烟气监测中异常数据,但是也面临了一些问题:一是人工审核过程繁杂,需要耗费大量人力、物力;二是污染源监测站点多,监测设备质量参差不齐,且每个监测站点的实际运行情况不同,异常数据的筛选容易受个人经验的主观性影响,从而可能对异常数据的判别存在一定的偏差;三是对于仪器故障引起的数据异常波动,人工审核存在运维盲目、识别故障的周期长、识别故障的准确性欠佳、需要现场排查等缺点,导致运维不及时,影响污染源自动监测设备的运行质量和运行效率。
而在异常数据的检测算法方面,目前已出现了统计学方法、模型的预测方法、距离的检测方法、神经网络方法、以及支持向量机方法等多种方法。但是,由于烟气监测站点繁多,每个站点锅炉的治污工艺、燃烧波动特征、燃烧持续性特征、以及锅炉燃烧阶段等不一样;此外,当传输信号受到冲击干扰时,或者在PLC、上位机、数采仪及平台接收到异常通讯信息时,往往会导致监测数据超大,使得异常检测算法本身也面临一定的局限性。因此,针对烟气的在线监测异常数据,迫切需要一种结合烟气的排放特征,更全面、客观、可靠的系统性数据预处理方法。
发明内容
本发明的目的在于针对背景技术中的缺陷,提出一种烟气在线监测数据预处理方法,解决背景技术中问题。
为达此目的,本发明采用以下技术方案:
一种水污染源在线监测数据异常的识别方法,包括如下步骤:
步骤A:接入站点监测数据;
步骤B:对站点监测数据中异常数据进行初级识别;
步骤C:对站点监测数据中异常数据进行二级识别,剔除非正常监测时段的异常数据;
步骤D:通过污染因子之间、污染因子与烟气参数之间的逻辑关系,对不符合逻辑关系的异常数据进行三级筛查;
步骤E:判别监测站点的燃烧阶段、燃烧持续类型和燃烧波动类型;
步骤F:判别全局疑似异常数据;
步骤G:通过预测模型判别局部疑似异常数据;
步骤H:对不符合逻辑关系的异常数据、全局疑似异常数据和局部疑似异常数据进行记录并处理。
优选的,在步骤B中,初级识别包括检测站点监测数据的完整性,补全站点监测数据中报文数据缺失的时段、并将补全时段的监测值标记为NULL值;
剔除步骤B中识别的异常数据包括剔除缺失值、不变值、负值、超量程、低于分位数的极小值、超出分位数的极大值的数据,以及剔除显著异常值。
优选的,在步骤E中,判别监测站点的燃烧阶段、燃烧持续类型和燃烧波动类型的具体步骤如下:
步骤E1:氧气异常值处理,设定氧气监测范围区间,将不属于氧气监测范围区间内的值作为氧气异常值进行处理;
步骤E2:监测站点的燃烧阶段的判别,包括根据燃烧占比来判断监测站点是否处于燃烧阶段;
步骤E3:燃烧持续类型的判别,包括:
计算持续燃烧状态,将“启炉”阶段至“燃尽”阶段的时间段划分为持续燃烧状态,并将持续燃烧状态标记为“1”,非持续燃烧状态标记为“0”;
判断持续燃烧的类型,包括:
设定燃烧间断率判定值,检测燃烧间断率,若燃烧间断率大于燃烧间断率判定值,则为间断燃烧类型,否则为持续燃烧类型;
步骤E4:燃烧波动类型的判别,包括:
获取离群率和变异系数;
根据离群率和变异系数判定站点因子波动类型,站点因子波动类型包括平稳型、低波动型、中波动型和高波动型。
优选的,在步骤E2中,根据燃烧占比来判断监测站点是否处于燃烧阶段的具体步骤为:
若(t-1)小时内燃烧占比小于第一阈值,并且(t+1)小时内燃烧占比大于第二阈值,则t时刻燃烧阶段为“启炉”阶段;
若(t-1)小时内燃烧占比大于第二阈值,并且(t+1)小时内燃烧占比小于第一阈值,则t时刻燃烧阶段为“燃尽”阶段;
若t时刻氧含量小于第三阈值,并且t时刻燃烧阶段不属于“启炉”阶段或者t时刻燃烧阶段不属于“燃尽”阶段,则t时刻燃烧阶段为“燃烧”阶段;
若t时刻氧含量大于第三阈值,并且t时刻燃烧阶段不属于“启炉”阶段或者t时刻燃烧阶段不属于“燃尽”阶段,则t时刻燃烧阶段为“停炉”阶段。
优选的,在步骤E3中,
cdr=count(RT,CCS,(PF<u-2*σorO2>th))tp/rttp;
其中,cdr表示燃烧间断率;
RT表示近期时间范围,为上文的近期3个月内;
CCS表示持续燃烧状态标记为“1”;
PF表示污染因子;
O2表示氧含量;
th表示第三阈值;
tp表示时间点数;
rttp表示近期时间范围内的总时间点数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
count表示count函数。。
优选的,获取变异系数包括:
CV=σ/u×100%,其中CV表示变异系数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
获取离群率包括:
Count_odd_rate=count(RT,CCS,(PF>u+2*σor PF<u-2*σ)tp/rttp;
其中:
Count_odd_rate表示离群率;
RT表示近期时间范围,为上文的近期3个月内;
CCS表示持续燃烧状态标记为“1”;
PF表示污染因子;
tp表示时间点数;
rttp表示近期时间范围内的总时间点数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
count表示count函数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值,σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差。
优选的,判断站点因子波动类型的步骤包括:
若CV<15%并且Count_odd_rate<5%,则站点因子波动类型为平稳型;
若CV<50%并且5%≤Count_odd_rate<10%,或者15%≤CV<50%并且Count_odd_rate<10%,则站点因子波动类型为低波动型;
若50%≤CV<100%并且Count_odd_rate<20%,或者CV<100%并且10%≤Count_odd_rate<20%,则站点因子波动类型为中波动型;
若CV≥100%或者Count_odd_rate≥20%,则站点因子波动类型为高波动型;
其中,CV表示变异系数,Count_odd_rate表示离群率。
优选的,判别全局疑似异常数据包括:
若污染因子为零值,并且氧含量小于第三阈值以及污染因子燃烧持续类型为持续燃烧型,则该污染因子属于疑似异常数据;
若污染因子燃烧持续类型为持续燃烧型、污染因子波动类型为平稳型或者低波动型、污染因子的值小于(u+2*σ)或者大于(u-2*σ)、污染因子燃烧阶段为“启炉”阶段或者“燃尽”阶段、污染因子持续燃烧状态标记为“1”,则该污染因子属于疑似异常数据;
若污染因子不属于以下范围:
污染因子燃烧持续类型为持续燃烧型、污染因子波动类型为平稳型或者低波动型、污染因子的值大于(u+3*σ)或者大于(u-3*σ)、污染因子燃烧阶段为“启炉”阶段或者“燃尽”阶段、污染因子持续燃烧状态标记为“1”;
则该污染因子属于疑似异常数据。
优选的,通过预测模型判别局部疑似异常数据包括:
步骤G1:建立最优SVR回归模型;
步骤G2:通过SVR模型对未来数据进行预测,在95%的置信度下,一步预测的置信区间为:
Figure BDA0002731008490000061
其中:
Figure BDA0002731008490000062
为时刻预测值,σt为拟合数据与训练数据之间的残差的标准差;
步骤G3:根据实测值是否超出预测的置信区间,判断烟气监测数据是否异常。如果实测值超出置信区间
Figure BDA0002731008490000071
则判别为局部疑似异常值。
有益效果:
本发明结合烟气的排放特征,提供了一种自动审核与人工审核相结合的烟气在线监测数据预处理方法。解决当前人工审核效率低下、异常点捕获效果欠佳、缺乏客观性的问题,帮助运维人员更全面、准确、客观地识别异常数据,大大提高了运维人员的工作效率。
附图说明
图1是本发明的一个实施例的烟气在线监测数据预处理流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明的一种水污染源在线监测数据异常的识别方法,如图1所示,包括如下步骤:
步骤A:接入站点监测数据;
步骤B:对站点监测数据中异常数据进行初级识别;
步骤C:对站点监测数据中异常数据进行二级识别,剔除非正常监测时段的异常数据;
包括:结合企业工况、监测仪器运行状态、以及运维状态,对异常数据进行二级识别。将企业工况处于停运、停炉检修、停电等停炉状态,监测仪器处于故障期间、维修期间、超期限未校准时段、失控时段、有计划的维护保养、校准校验等非正常监测时段的数据予以剔除。
步骤D:通过污染因子之间、污染因子与烟气参数之间的逻辑关系,对不符合逻辑关系的异常数据进行三级筛查;
包括:通过污染因子之间、污染因子与烟气参数之间的逻辑关系,对不符合逻辑的异常数据进行三级筛查。例如:烟尘折算值偏高(超过均值+2倍标准差),但是烟尘实测值正常(在均值+2倍标准差范围内),并且氧气值偏高(超过均值+2倍标准差),这可能由于气态污染物通道堵塞、漏气、或故障,引起氧气值异常偏高,从而导致烟尘折算值偏高。再如,烟尘折算值、烟尘实测值均偏高(超过均值+2倍标准差),但是气态污染物SO2、NOX、氧气值均正常(在均值+2倍标准差范围内),这可能由于烟尘仪镜片被污染、烟尘仪故障、或清理排放口等原因导致烟尘异常偏高。
步骤E:判别监测站点的燃烧阶段、燃烧持续类型和燃烧波动类型;
步骤F:判别全局疑似异常数据;
步骤G:通过预测模型判别局部疑似异常数据;
步骤H:对不符合逻辑关系的异常数据、全局疑似异常数据和局部疑似异常数据进行记录并处理。
优选的,在步骤B中,初级识别包括检测站点监测数据的完整性,补全站点监测数据中报文数据缺失的时段、并将补全时段的监测值标记为NULL值;
剔除步骤B中识别的异常数据包括剔除缺失值、不变值、负值、超量程、低于分位数的极小值、超出分位数的极大值的数据,以及剔除显著异常值。
包括对数据完整性进行检查,补全报文缺失的时段、并将补全时段的监测值标记为NULL值;此外,剔除缺失值/NULL值、值不变、负值、超量程、低于0.3%分位数的极小值、以及超出99.7%分位数的极大值等,不符合现场监测情况、不符合逻辑的显著异常值
优选的,在步骤E中,判别监测站点的燃烧阶段、燃烧持续类型和燃烧波动类型的具体步骤如下:
步骤E1:氧气异常值处理,设定氧气监测范围区间,将不属于氧气监测范围区间内的值作为氧气异常值进行处理;
在实际生产中,将烟气的氧含量控制在6%以下有较大的难度,一般烟煤锅炉的氧含量控制在6%~8%作为经济运行指标,考虑到烟道等部位漏风的影响,烟道尾部的氧含量会进一步增加。在停炉期,氧含量会接近空气氧含量的21%左右(在仪器监测95%置信度内,空气含氧量标准值范围约在20%-22%之间)。因此,对于氧气监测值小于6%、或者大于22%的值,可当作氧气异常值处理。
步骤E2:监测站点的燃烧阶段的判别,包括根据燃烧占比来判断监测站点是否处于燃烧阶段;
监测站点的燃烧阶段的判别。一般情况下,停炉期可参考以下几个参数判断:一是烟气负荷只为锅炉满负荷的20%(限安装在引风机前);二是烟气流速为2m/s以下;三是氧气含量为19%以上;四是烟温在40度以下。在以上几个参数中,负荷易受监测位置的影响,烟气流速易受自然风速的影响,烟温易受天气温度的影响,而氧含量对于燃烧阶段的判断较为准确。在烟气实际监测中,即使在燃烧期,氧气含量偶尔也会出现大于19%的情况。因此,为了更准确识别燃烧阶段,本发明通过使用燃烧占比(氧含量<19%的占比)来判断燃烧阶段。利用30秒一条的实时数据判断t时刻燃烧阶段的逻辑:
优选的,在步骤E2中,根据燃烧占比来判断监测站点是否处于燃烧阶段的具体步骤为:
若(t-1)小时内燃烧占比小于第一阈值,并且(t+1)小时内燃烧占比大于第二阈值,则t时刻燃烧阶段为“启炉”阶段;
若(t-1)小时内燃烧占比大于第二阈值,并且(t+1)小时内燃烧占比小于第一阈值,则t时刻燃烧阶段为“燃尽”阶段;
若t时刻氧含量小于第三阈值,并且t时刻燃烧阶段不属于“启炉”阶段或者t时刻燃烧阶段不属于“燃尽”阶段,则t时刻燃烧阶段为“燃烧”阶段;
若t时刻氧含量大于第三阈值,并且t时刻燃烧阶段不属于“启炉”阶段或者t时刻燃烧阶段不属于“燃尽”阶段,则t时刻燃烧阶段为“停炉”阶段;
其中,第一阈值为10%,第二阈值为20%,第三阈值为19%,10%,20%是自定义阀值,从燃烧阶段的判别效果看,选定10%,20%的阀值,燃烧阶段的界定清晰、判别准确率较高。另外,t-1小时燃烧占比指的是最近一小时的燃烧占比,t+1小时燃烧占比指的是接下来一小时的燃烧占比。
步骤E3:燃烧持续类型的判别,包括:
计算持续燃烧状态,将“启炉”阶段至“燃尽”阶段的时间段划分为持续燃烧状态,并将持续燃烧状态标记为“1”,非持续燃烧状态标记为“0”;
判断持续燃烧的类型,包括:
设定燃烧间断率判定值,检测燃烧间断率,若燃烧间断率大于燃烧间断率判定值,则为间断燃烧类型,否则为持续燃烧类型;
步骤E4:燃烧波动类型的判别,由于烟气不同站点污染因子的浓度均值相差较大,因此,即使两个站点因子相同的标准差、但浓度均值相差较大,波动的相对大小也相差较大。为了更客观、全面刻画站点因子的波动大小,本发明通过统计实时数据最近3个月,处于持续燃烧状态的离群率、变异系数,判断站点因子波动类型。包括:
获取离群率和变异系数;
根据离群率和变异系数判定站点因子波动类型,站点因子波动类型包括平稳型、低波动型、中波动型和高波动型。
优选的,在步骤E3中:
cdr=count(RT,CCS,(PF<u-2*σor O2>th))tp/rttp;
其中,cdr表示燃烧间断率;
RT表示近期时间范围,为上文的近期3个月内;
CCS表示持续燃烧状态标记为“1”;
PF表示污染因子;
O2表示氧含量;
th表示第三阈值;
tp表示时间点数;
rttp表示近期时间范围内的总时间点数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
count表示count函数。
优选的,获取变异系数包括:
CV=σ/u×100%,其中CV表示变异系数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
获取离群率包括:
Count_odd_rate=count(RT,CCS,(PF>u+2*σor PF<u-2*σ)tp/rttp);
其中:
Count_odd_rate表示离群率;
RT表示近期时间范围,为上文的近期3个月内;
CCS表示持续燃烧状态标记为“1”;
PF表示污染因子;
tp表示时间点数;
rttp表示近期时间范围内的总时间点数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
count表示count函数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值,σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差。
优选的,判断站点因子波动类型。根据行业经验,在进行数据统计分析时,如果变异系数大于15%,则要考虑该数据波动性较大或可能不正常。通过分析比较站点因子,可将站点因子波动类型分为平稳型、低波动型、中波动型、高波动型;
判断站点因子波动类型的步骤包括:
若CV<15%并且Count_odd_rate<5%,则站点因子波动类型为平稳型;
若CV<50%并且5%≤Count_odd_rate<10%,或者15%≤CV<50%并且Count_odd_rate<10%,则站点因子波动类型为低波动型;
若50%≤CV<100%并且Count_odd_rate<20%,或者CV<100%并且10%≤Count_odd_rate<20%,则站点因子波动类型为中波动型;
若CV≥100%或者Count_odd_rate≥20%,则站点因子波动类型为高波动型;
其中,CV表示变异系数,Count_odd_rate表示离群率。
优选的,全局异常数据判别,对于持续燃烧、波动平稳的站点,因波动较小,这里使用2-Sigman异常值检测方法;对于间断燃烧、波动较大的站点,因波动较大,这里使用3-Sigman异常值检测方法。此外,烟气在启炉时,因氧气含量不稳定、脱硫脱硝系统启动滞后,往往会导致污染物折算浓度偏高的现象;烟气在燃尽时,因氧气含量上升、脱硫脱硝系统提前退出,同样会导致污染物折算浓度偏高的现象。因此,启炉、燃尽阶段浓度的偏高属于正常的情况,不应判为异常值。另外,此处的全局异常只针对处于燃烧状态的异常值,处于停炉期的异常状态,前文步骤已经识别。
判别全局疑似异常数据包括:
若污染因子为零值,并且氧含量小于第三阈值以及污染因子燃烧持续类型为持续燃烧型,则该污染因子属于疑似异常数据;
若污染因子燃烧持续类型为持续燃烧型、污染因子波动类型为平稳型或者低波动型、污染因子的值小于(u+2*σ)或者大于(u-2*σ)、污染因子燃烧阶段为“启炉”阶段或者“燃尽”阶段、污染因子持续燃烧状态标记为“1”,则该污染因子属于疑似异常数据;
若污染因子不属于以下范围:
污染因子燃烧持续类型为持续燃烧型、污染因子波动类型为平稳型或者低波动型、污染因子的值大于(u+3*σ)或者大于(u-3*σ)、污染因子燃烧阶段为“启炉”阶段或者“燃尽”阶段、污染因子持续燃烧状态标记为“1”;
则该污染因子属于疑似异常数据。
优选的,通过SVR预测模型判别局部疑似异常。通过SVR模型预测未来一步时,在95%的置信度下,预测置信区间为:一步预测值±1.96*拟合数据与训练数据间的残差的标准差。根据实测值是否超出预测的置信区间,可以判断烟气监测数据是否异常,实测值超过区间范围的数据属于疑似异常,进入后续的人工现场核实。
通过预测模型判别局部疑似异常数据包括:
步骤G1:建立最优SVR回归模型;
步骤G2:通过SVR模型对未来数据进行预测,在95%的置信度下,一步预测的置信区间为:
Figure BDA0002731008490000141
其中:
Figure BDA0002731008490000142
为时刻预测值,σt为拟合数据与训练数据之间的残差的标准差;
步骤G3:根据实测值是否超出预测的置信区间,判断烟气监测数据是否异常。如果实测值超出置信区间
Figure BDA0002731008490000143
则判别为局部疑似异常值。
步骤H:现场运维人员对不符合逻辑数据、全局疑似异常数据、局部疑似异常数据,根据现场实际监测情况进行核实标记。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (8)

1.一种烟气在线监测数据预处理方法,其特征在于:包括如下步骤:
步骤A:接入站点监测数据;
步骤B:对站点监测数据中异常数据进行初级识别;
步骤C:对站点监测数据中异常数据进行二级识别,剔除非正常监测时段的异常数据;
步骤D:通过污染因子之间、污染因子与烟气参数之间的逻辑关系,对不符合逻辑关系的异常数据进行三级筛查;
步骤E:判别监测站点的燃烧阶段、燃烧持续类型和燃烧波动类型;
具体步骤如下:
步骤E1:氧气异常值处理,设定氧气监测范围区间,将不属于氧气监测范围区间内的值作为氧气异常值进行处理;
步骤E2:监测站点的燃烧阶段的判别,包括根据燃烧占比来判断监测站点是否处于燃烧阶段;
步骤E3:燃烧持续类型的判别,包括:
计算持续燃烧状态,将“启炉”阶段至“燃尽”阶段的时间段划分为持续燃烧状态,并将持续燃烧状态标记为“1”,非持续燃烧状态标记为“0”;
判断持续燃烧的类型,包括:
设定燃烧间断率判定值,检测燃烧间断率,若燃烧间断率大于燃烧间断率判定值,则为间断燃烧类型,否则为持续燃烧类型;
步骤E4:燃烧波动类型的判别,包括:
获取离群率和变异系数;
根据离群率和变异系数判定站点因子波动类型,站点因子波动类型包括平稳型、低波动型、中波动型和高波动型;
步骤F:判别全局疑似异常数据;
步骤G:通过预测模型判别局部疑似异常数据;
步骤H:对不符合逻辑关系的异常数据、全局疑似异常数据和局部疑似异常数据进行记录并处理。
2.根据权利要求1所述一种烟气在线监测数据预处理方法,其特征在于:
在步骤B中,初级识别包括检测站点监测数据的完整性,补全站点监测数据中报文数据缺失的时段、并将补全时段的监测值标记为NULL值;
剔除步骤B中识别的异常数据包括剔除缺失值、不变值、负值、超量程、低于分位数的极小值、超出分位数的极大值的数据,以及剔除显著异常值。
3.根据权利要求1所述一种烟气在线监测数据预处理方法,其特征在于:
在步骤E2中,根据燃烧占比来判断监测站点是否处于燃烧阶段的具体步骤为:
若(t-1)小时内燃烧占比小于第一阈值,并且(t+1)小时内燃烧占比大于第二阈值,则t时刻燃烧阶段为“启炉”阶段;
若(t-1)小时内燃烧占比大于第二阈值,并且(t+1)小时内燃烧占比小于第一阈值,则t时刻燃烧阶段为“燃尽”阶段;
若t时刻氧含量小于第三阈值,并且t时刻燃烧阶段不属于“启炉”阶段或者t时刻燃烧阶段不属于“燃尽”阶段,则t时刻燃烧阶段为“燃烧”阶段;
若t时刻氧含量大于第三阈值,并且t时刻燃烧阶段不属于“启炉”阶段或者t时刻燃烧阶段不属于“燃尽”阶段,则t时刻燃烧阶段为“停炉”阶段。
4.根据权利要求3所述一种烟气在线监测数据预处理方法,其特征在于:
在步骤E3中,cdr=count(RT,CCS,(PF<u-2*σor O2>th))tp/rttp;
其中,cdr表示燃烧间断率;
RT表示近期时间范围,为上文的近期3个月内;
CCS表示持续燃烧状态标记为“1”;
PF表示污染因子;
O2表示氧含量;
th表示第三阈值;
tp表示时间点数;
rttp表示近期时间范围内的总时间点数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
count表示count函数。
5.根据权利要求4所述一种烟气在线监测数据预处理方法,其特征在于:
获取变异系数包括:
CV=σ/u×100%,其中CV表示变异系数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
获取离群率包括:
Count_odd_rate=count(RT,CCS,(PF>u+2*σor PF<u-2*σ) ) tp/rttp;
其中:
Count_odd_rate表示离群率;
RT表示近期时间范围,为上文的近期3个月内;
CCS表示持续燃烧状态标记为“1”;
PF表示污染因子;
tp表示时间点数;
rttp表示近期时间范围内的总时间点数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值;
σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差;
count表示count函数;
u指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的均值,σ指的是近期时间范围内氧含量小于第三阈值的污染因子浓度的标准差。
6.根据权利要求5所述一种烟气在线监测数据预处理方法,其特征在于:
判断站点因子波动类型的步骤包括:
若CV<15%并且Count_odd_rate<5%,则站点因子波动类型为平稳型;
若CV<50%并且5%≤Count_odd_rate<10%,或者15%≤CV<50%并且Count_odd_rate<10%,则站点因子波动类型为低波动型;
若50%≤CV<100%并且Count_odd_rate<20%,或者CV<100%并且10%≤Count_odd_rate<20%,则站点因子波动类型为中波动型;
若CV≥100%或者Count_odd_rate≥20%,则站点因子波动类型为高波动型;
其中,CV表示变异系数,Count_odd_rate表示离群率。
7.根据权利要求6所述一种烟气在线监测数据预处理方法,其特征在于:
判别全局疑似异常数据包括:
若污染因子为零值,并且氧含量小于第三阈值以及污染因子燃烧持续类型为持续燃烧型,则该污染因子属于疑似异常数据;
若污染因子燃烧持续类型为持续燃烧型、污染因子波动类型为平稳型或者低波动型、污染因子的值小于(u+2*σ)或者大于(u-2*σ)、污染因子燃烧阶段为“启炉”阶段或者“燃尽”阶段、污染因子持续燃烧状态标记为“1”,则该污染因子属于疑似异常数据;
若污染因子不属于以下范围:
污染因子燃烧持续类型为持续燃烧型、污染因子波动类型为平稳型或者低波动型、污染因子的值大于(u+3*σ)或者大于(u-3*σ)、污染因子燃烧阶段为“启炉”阶段或者“燃尽”阶段、污染因子持续燃烧状态标记为“1”;
则该污染因子属于疑似异常数据。
8.根据权利要求1所述一种烟气在线监测数据预处理方法,其特征在于:
通过预测模型判别局部疑似异常数据包括:
步骤G1:建立最优SVR回归模型;
步骤G2:通过SVR模型对未来数据进行预测,在95%的置信度下,一步预测的置信区间为:
Figure FDA0003652094580000051
其中:
Figure FDA0003652094580000052
为时刻预测值,σt为拟合数据与训练数据之间的残差的标准差;
步骤G3:根据实测值是否超出预测的置信区间,判断烟气监测数据是否异常;如果实测值超出置信区间
Figure FDA0003652094580000053
则判别为局部疑似异常值。
CN202011118064.3A 2020-10-19 2020-10-19 一种烟气在线监测数据预处理方法 Active CN112285287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011118064.3A CN112285287B (zh) 2020-10-19 2020-10-19 一种烟气在线监测数据预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011118064.3A CN112285287B (zh) 2020-10-19 2020-10-19 一种烟气在线监测数据预处理方法

Publications (2)

Publication Number Publication Date
CN112285287A CN112285287A (zh) 2021-01-29
CN112285287B true CN112285287B (zh) 2022-08-16

Family

ID=74497522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011118064.3A Active CN112285287B (zh) 2020-10-19 2020-10-19 一种烟气在线监测数据预处理方法

Country Status (1)

Country Link
CN (1) CN112285287B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113486704A (zh) * 2021-05-18 2021-10-08 贵州正航众联电力建设有限公司 一种配电房操作员身份验证系统
CN115561133B (zh) * 2022-09-20 2023-08-29 生态环境部环境工程评估中心 火电行业cems校准期间异常数据的自动识别方法和系统
CN116340795B (zh) * 2023-05-29 2023-07-28 山东一然环保科技有限公司 一种用于纯氧燃烧加热炉运行数据处理方法
CN116805065B (zh) * 2023-08-25 2023-11-14 山东荣信集团有限公司 一种煤粉加热炉燃烧器监测数据智能管理方法
CN116881646B (zh) * 2023-09-06 2023-11-21 山东奥晶生物科技有限公司 一种甜菊糖苷生产监测数据管理系统
CN116992391B (zh) * 2023-09-27 2023-12-15 青岛冠宝林活性炭有限公司 一种硬碳工艺环保监测数据采集处理方法
CN117556368B (zh) * 2024-01-12 2024-03-29 钛合联(深圳)科技有限公司 基于物联网的水利监测异常数据处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063609A (zh) * 2014-07-01 2014-09-24 北京金控自动化技术有限公司 一种利用神经网络辅助判定污染源监测数据有效性的方法
CN104360667A (zh) * 2014-11-28 2015-02-18 山东省环境保护信息中心 一种污染源在线监控平台及污染源监控数据防造假方法
CN106599271A (zh) * 2016-12-22 2017-04-26 江苏方天电力技术有限公司 一种燃煤机组排放监测时序数据异常值检测方法
CN107908891A (zh) * 2017-11-28 2018-04-13 河海大学 一种基于arima‑svr的水文时间序列异常值检测方法
CN108830765A (zh) * 2018-04-18 2018-11-16 中国地质大学(武汉) 一种水污染源监测数据的审核方法及系统
CN109557869A (zh) * 2018-11-27 2019-04-02 江苏方天电力技术有限公司 一种火电机组碳排放在线监测管理系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063609A (zh) * 2014-07-01 2014-09-24 北京金控自动化技术有限公司 一种利用神经网络辅助判定污染源监测数据有效性的方法
CN104360667A (zh) * 2014-11-28 2015-02-18 山东省环境保护信息中心 一种污染源在线监控平台及污染源监控数据防造假方法
CN106599271A (zh) * 2016-12-22 2017-04-26 江苏方天电力技术有限公司 一种燃煤机组排放监测时序数据异常值检测方法
CN107908891A (zh) * 2017-11-28 2018-04-13 河海大学 一种基于arima‑svr的水文时间序列异常值检测方法
CN108830765A (zh) * 2018-04-18 2018-11-16 中国地质大学(武汉) 一种水污染源监测数据的审核方法及系统
CN109557869A (zh) * 2018-11-27 2019-04-02 江苏方天电力技术有限公司 一种火电机组碳排放在线监测管理系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
废气污染源自动监测异常数据诊断与处理方法研究;郑涛 等;《资源节约与环保》;20131231(第07期);第38-39页 *

Also Published As

Publication number Publication date
CN112285287A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
CN112285287B (zh) 一种烟气在线监测数据预处理方法
CN112232571B (zh) 一种废气主要污染物浓度的预测方法
CN116975378B (zh) 一种基于大数据的设备环境监测方法及系统
CN111651933B (zh) 基于统计推断的工业锅炉故障预警方法及系统
CN109034533B (zh) 一种集团级实时监管平台污染物参数小时均值统计的方法
CN111550763A (zh) 锅炉受热面灰渣污染的监测方法
CN116757500A (zh) 一种工业互联网平台监测系统及方法
CN112465239B (zh) 基于改进pso-fcm算法的脱硫系统运行优化方法
CN112946190A (zh) 一种基于云计算的生态环境监测预警系统及监测预警方法
CN110500596A (zh) 一种危险废物焚烧自动控制方法
CN115098829A (zh) 一种基于多源计量数据的碳排放量在线分析方法
CN115738622A (zh) 一种脱硫设备的尾气排放检测系统
CN105808902B (zh) 用于湿法脱硫系统运行工况分析的定性方法
CN111445142B (zh) 一种燃料掺烧评价方法、系统及装置
CN108445845A (zh) 一种适用于大型电站的智能型锅炉燃烧稳定性判断系统及方法
CN115879726B (zh) 一种企业生产状况与排放量监测方法
CN113836794B (zh) 一种软硬结合的飞灰含碳量在线监测方法
CN110555188A (zh) 一种动车组车轮参数磨耗趋势的分析方法
CN114440205A (zh) 一种锅炉系统受热面安全诊断系统及方法
CN115561133B (zh) 火电行业cems校准期间异常数据的自动识别方法和系统
CN114495019A (zh) 一种管廊渗漏病害的实时监测和动态反馈方法
CN111174824B (zh) 一种酸雾排放的管控平台
CN114742300B (zh) 一种脱硝设备锅炉烟道阻力预警方法及系统
CN115753675A (zh) 一种区域级二氧化碳排放监测与管控系统及运行方法
CN117419359A (zh) 一种电厂锅炉燃烧的优化监控系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant