CN112016050B - 一种基于流形学习的cems系统异常数据监控方法 - Google Patents

一种基于流形学习的cems系统异常数据监控方法 Download PDF

Info

Publication number
CN112016050B
CN112016050B CN202010790222.3A CN202010790222A CN112016050B CN 112016050 B CN112016050 B CN 112016050B CN 202010790222 A CN202010790222 A CN 202010790222A CN 112016050 B CN112016050 B CN 112016050B
Authority
CN
China
Prior art keywords
data
concentration
original
distribution
emission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010790222.3A
Other languages
English (en)
Other versions
CN112016050A (zh
Inventor
金贵新
魏建华
魏君飞
武传伟
刘志敏
林聪�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwei Electronics Group Corp
Original Assignee
Hanwei Electronics Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwei Electronics Group Corp filed Critical Hanwei Electronics Group Corp
Priority to CN202010790222.3A priority Critical patent/CN112016050B/zh
Publication of CN112016050A publication Critical patent/CN112016050A/zh
Application granted granted Critical
Publication of CN112016050B publication Critical patent/CN112016050B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于流形学习的CEMS系统异常数据监控方法,包括:CEMS系统实时采集工厂污染物废气排放数据,将采集到的9路信息数据作为输入量,数据异常作为输出量,利用流形学习中的T‑sne高维可视化算法,对污染物废气排放高维数据压缩并可视化,找出异常数据,实现对工厂生产污染物排放监控。本发明解决了现在技术对工厂废气不能有效核查异常数据的问题,使用流形学习算法对数据进行高维可视化发现其中异常,从而提高了CEMS系统的快速性、准确性和稳定性。

Description

一种基于流形学习的CEMS系统异常数据监控方法
技术领域
本发明涉及工厂生产中连续烟气监测CMES系统环保领域,特别是指一种基于流形学习的CEMS系统异常数据监控方法。
背景技术
随着全球工业和物联网进程的快速发展,环境污染和生态破坏日益严重引起了世界各国的高度重视。连续烟气监测系统CEMS(Continuous Emission Monitoring System,CEMS)作为一种监控设备,可以连续、实时、在线监测污染物排放总量的目标。CMES作为国家污染排放监测网中的一个重要组成部分得到了越来越多的重视。它不仅是智慧工厂的重要的研究方向,还可以在智慧城市、智能生产等智能系统中起着重要的作用。
2016年,为了贯彻执行《中华人民共和国环境保护法》、《中华人民共和国大气污染防治法》和《河南省减少污染物排放条例》等法律、法规,实施大气固定污染源排放浓度和排放总量监测监控,规范河南省固定污染源颗粒物、烟气(SO2、NOX)排放连续监控水平,制定了污染物排放标准。在我省工厂环保监测中,烟气中的包含颗粒物、二氧化硫、氮氧化物、氧含量、烟气流速、烟气温度、以及其对应的原始折算浓度、修正浓度、修正折算浓度。连续烟气监测CEMS环保系统的日常数据主要为:烟温偏高、测量烟气流量低、样气带水及设备腐蚀处理建议、误判、漏判等。
以往关于工厂生产废气监测的研究,其主要是通过借助大数据、“应急专家数据库”、“环境应急监测设备”建立异常数据经验判断法,依靠经验初步剔除数据,并采用现场核定法,使用统计学二次判定。以往对于环保数据本身没有做出相应的探究,由于废气采样数据通道较多,数据较为复杂,找出其中异常数据也较为困难。基于工厂中连续烟气监测系统多路传感器采集到的工厂废气数据,在不改变原有数据和设备基础上完成对废气数据的分析,很难找到生产中存在的异常数据。市场上现有的CEMS连续烟气监测系统,设备简单、系统不够完善等问题,对于异常数据常采用经验判断法,现场情况核定等,传统的判别方法主要是依靠经验,发容易产生误判、漏判等问题。
基于采集到的环保数据,如何从中找出异常数据对于工厂生产具有指导意义。
发明内容
本发明的目的在于针对现有技术中存在的不足,提供一种基于流形学习的CEMS系统异常数据监控方法。
为达到上述目的,本发明提供了一种基于流形学习的异常数据监控方法,包括:
CEMS系统实时采集工厂污染物废气排放数据,将采集到的9路信息数据作为输入量,数据异常作为输出量,利用流形学习中的T-sne高维可视化算法,对污染物废气排放高维数据压缩并可视化,找出异常数据,实现对工厂生产污染物排放监控;
其中,
每一路采集到的信息数据进行修正折算处理后,包括:颗粒物的原始浓度、原始折算浓度、修正浓度和修正折算浓度;二氧化硫的原始浓度、原始折算浓度、修正浓度和修正折算浓度;氮氧化物的原始浓度、原始折算浓度、修正浓度和修正折算浓度;氧含量;烟气流速和烟气温度;
利用流形学习中的T-sne高维可视化算法,对污染物废气排放高维数据压缩并可视化的方法包括:
先对采集到的信息数据进行筛选和预处理,以删除和过滤数据中的缺失值和异常值,然后按月份对每一路信息数据进行特征提取为原始特征数据,再根据原始特征构造为27个新的特征数据,新构建的特征数据包括每个月份的均值、标准差、方差;
使用t-sne对新构建的特征数据进行高维数据可视化:
先计算概率pj|i,正比于数据点xi与xj之间的相似度,由高维欧几里得距离转换为表示相似性的条件概率,由公式(1)可以得到;
对于低纬度下的信息数据样本点yi,指定高斯分布的均方差为相似度为:
由于sne算法定义的条件概率pj|i≠pi|j和qj|i≠qi|j不对称,且信息数据样本点之间的距离或者相似度是唯一的,对应相等,为满足对称性问题在sne算法基础上重新定义相似性的条件概率,其中n为样本的总数:
低维空间中的条件概率分布为t分布:
由于t分布相比高斯分布中心部位偏低,尾部偏高偏长,得到新的损失函数:
其中,Pi为信息数据样本点xi下,所有样本点的条件概率分布;Qi为低维度下环保数据样本点yi,所有点的条件概率分布;
若pji和pij分布一致,则损失函数较小,高维空间相似点映射到低维空间的距离也更近,否则距离较远,即为异常的数据。
本发明相对现有技术具有突出的实质性特点和显著进步,具体的说,本发明解决了现在技术对工厂废气不能有效核查异常数据的问题,使用流形学习算法对数据进行高维可视化发现其中异常,从而提高了CEMS系统的快速性、准确性和稳定性。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细描述。
一种基于流形学习的CEMS系统异常数据监控方法,包括:
CEMS系统实时采集工厂污染物废气排放数据,将采集到的9路信息数据作为输入量,数据异常作为输出量,利用流形学习中的T-sne高维可视化算法,对污染物废气排放高维数据压缩并可视化,找出异常数据,实现对工厂生产污染物排放监控;
其中,
每一路采集到的信息数据进行修正折算处理后,包括:颗粒物的原始浓度、原始折算浓度、修正浓度和修正折算浓度;二氧化硫的原始浓度、原始折算浓度、修正浓度和修正折算浓度;氮氧化物的原始浓度、原始折算浓度、修正浓度和修正折算浓度;氧含量;烟气流速和烟气温度;
利用流形学习中的T-sne高维可视化算法,对污染物废气排放高维数据压缩并可视化的方法包括:
先对采集到的信息数据进行筛选和预处理,以删除和过滤数据中的缺失值和异常值,然后按月份对每一路信息数据进行特征提取为原始特征数据,再根据原始特征构造为27个新的特征数据,新构建的特征数据包括每个月份的均值、标准差、方差;
使用t-sne对新构建的特征数据进行高维数据可视化:
先计算概率pj|i,正比于数据点xi与xj之间的相似度,由高维欧几里得距离转换为表示相似性的条件概率,由公式(1)可以得到;
对于低纬度下的信息数据样本点yi,指定高斯分布的均方差为相似度为:
由于sne算法定义的条件概率pj|i≠pi|j和qj|i≠qi|j不对称,且信息数据样本点之间的距离或者相似度是唯一的,对应相等,为满足对称性问题在sne算法基础上重新定义相似性的条件概率,其中n为样本的总数:
低维空间中的条件概率分布为t分布:
由于t分布相比高斯分布中心部位偏低,尾部偏高偏长,得到新的损失函数:
其中,Pi为信息数据样本点xi下,所有样本点的条件概率分布;Qi为低维度下环保数据样本点yi,所有点的条件概率分布;
若pji和pij分布一致,则损失函数较小,高维空间相似点映射到低维空间的距离也更近,否则距离较远,即为异常的数据。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,所属领域的普通技术人员在不脱离本发明技术方案的精神下,对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (1)

1.一种基于流形学习的CEMS系统异常数据监控方法,其特征在于,包括:
CEMS系统实时采集工厂污染物废气排放数据,将采集到的9路信息数据作为输入量,数据异常作为输出量,利用流形学习中的T-sne高维可视化算法,对污染物废气排放高维数据压缩并可视化,找出异常数据,实现对工厂生产污染物排放监控;
其中,
每一路采集到的信息数据进行修正折算处理后,包括:颗粒物的原始浓度、原始折算浓度、修正浓度和修正折算浓度;二氧化硫的原始浓度、原始折算浓度、修正浓度和修正折算浓度;氮氧化物的原始浓度、原始折算浓度、修正浓度和修正折算浓度;氧含量;烟气流速和烟气温度;
利用流形学习中的T-sne高维可视化算法,对污染物废气排放高维数据压缩并可视化的方法包括:
先对采集到的信息数据进行筛选和预处理,以删除和过滤数据中的缺失值和异常值,然后按月份对每一路信息数据进行特征提取为原始特征数据,再根据原始特征构造为27个新的特征数据,新构建的特征数据包括每个月份的均值、标准差、方差;
使用t-sne对新构建的特征数据进行高维数据可视化:
先计算概率pj|i,正比于数据点xi与xj之间的相似度,由高维欧几里得距离转换为表示相似性的条件概率,由公式(1)可以得到;
对于低纬度下的信息数据样本点yi,指定高斯分布的均方差为相似度为:
由于sne算法定义的条件概率pj|i≠pi|j和qj|i≠qi|j不对称,且信息数据样本点之间的距离或者相似度是唯一的,对应相等,为满足对称性问题在sne算法基础上重新定义相似性的条件概率,其中n为样本的总数:
低维空间中的条件概率分布为t分布:
由于t分布相比高斯分布中心部位偏低,尾部偏高偏长,得到新的损失函数:
其中,Pi为信息数据样本点xi下,所有样本点的条件概率分布;Qi为低维度下环保数据样本点yi,所有点的条件概率分布;
若pji和pij分布一致,则损失函数较小,高维空间相似点映射到低维空间的距离也更近,否则距离较远,即为异常的数据。
CN202010790222.3A 2020-08-07 2020-08-07 一种基于流形学习的cems系统异常数据监控方法 Active CN112016050B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010790222.3A CN112016050B (zh) 2020-08-07 2020-08-07 一种基于流形学习的cems系统异常数据监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010790222.3A CN112016050B (zh) 2020-08-07 2020-08-07 一种基于流形学习的cems系统异常数据监控方法

Publications (2)

Publication Number Publication Date
CN112016050A CN112016050A (zh) 2020-12-01
CN112016050B true CN112016050B (zh) 2023-11-21

Family

ID=73498442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010790222.3A Active CN112016050B (zh) 2020-08-07 2020-08-07 一种基于流形学习的cems系统异常数据监控方法

Country Status (1)

Country Link
CN (1) CN112016050B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115561133B (zh) * 2022-09-20 2023-08-29 生态环境部环境工程评估中心 火电行业cems校准期间异常数据的自动识别方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109784498A (zh) * 2019-01-23 2019-05-21 中山大学 基于核空间的流形学习非线性逼近的算法
CN110532444A (zh) * 2019-07-22 2019-12-03 中国电力科学研究院有限公司 一种高维电力大数据可视化方法及系统
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、系统、计算机设备和存储介质
CN111314173A (zh) * 2020-01-20 2020-06-19 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7853432B2 (en) * 2007-10-02 2010-12-14 The Regents Of The University Of Michigan Method and apparatus for clustering and visualization of multicolor cytometry data
CN108535636A (zh) * 2018-05-16 2018-09-14 武汉大学 一种模拟电路基于参数随机分布邻近嵌入胜者为王的故障特征提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、系统、计算机设备和存储介质
CN109784498A (zh) * 2019-01-23 2019-05-21 中山大学 基于核空间的流形学习非线性逼近的算法
CN110532444A (zh) * 2019-07-22 2019-12-03 中国电力科学研究院有限公司 一种高维电力大数据可视化方法及系统
CN111314173A (zh) * 2020-01-20 2020-06-19 腾讯科技(深圳)有限公司 监控信息异常的定位方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于RISOMAP的非线性过程故障检测方法;张妮;田学民;蔡连芳;;化工学报(06);全文 *
基于流形学习的涡轮泵海量数据异常识别算法;夏鲁瑞;胡茑庆;秦国军;;航空动力学报(03);全文 *

Also Published As

Publication number Publication date
CN112016050A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN111930049A (zh) 一种基于物联网的林业森林防火安全智能监测管理系统
CN101157006B (zh) 燃煤机组烟气脱硫实时监控及信息管理系统
CN115358332A (zh) 面向多源数据的大气污染溯源方法
CN110716512A (zh) 一种基于燃煤电站运行数据的环保装备性能预测方法
CN112016050B (zh) 一种基于流形学习的cems系统异常数据监控方法
CN111289697B (zh) Cems运行状态监控与数据作假识别方法及系统
CN115146940A (zh) 工业园区大气污染物协同减排评估方法
CN115146537A (zh) 基于耗电量的大气污染物排放量估算模型构建方法及系统
KR102100739B1 (ko) 미세먼지 발생 예측방법
CN116186624A (zh) 一种基于人工智能的锅炉评估方法及系统
CN117092297A (zh) 一种工业园区大气污染物的溯源方法、系统、设备及介质
CN108803466A (zh) 一种工业锅炉能效在线检测系统及方法
CN116359285A (zh) 一种基于大数据的油气浓度智能检测系统及方法
CN110852493A (zh) 基于多种模型对比的大气pm2.5浓度预测方法
CN112037106B (zh) 一种基于特征互相关性和概率密度的数据异常分析方法
CN112634113B (zh) 一种基于动态滑窗的污染废气关联分析方法
CN116930423A (zh) 一种空气质量模型模拟效果的自动验证评估方法及系统
CN108872487B (zh) 大气污染源多污染物在线自动监测装置
CN105809304B (zh) 电厂和治污设施生产运行参数相关性分析的方法
CN113986892A (zh) 一种火电机组煤耗预测、数据清洗方法及系统
CN113869359A (zh) 基于模块化神经网络的城市固废焚烧过程氮氧化物预测方法
CN111210147A (zh) 基于时序特征提取的烧结过程运行性能评价方法及系统
CN111222540A (zh) 基于聚类的无监督学习的异常判断二噁英检测方法
CN116976733B (zh) 一种基于大数据的大气污染源在线监测数据评估系统
CN217305072U (zh) 一种污染源自动监控非现场执法数据分析研判系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant