CN104063609B - 一种利用神经网络辅助判定污染源监测数据有效性的方法 - Google Patents
一种利用神经网络辅助判定污染源监测数据有效性的方法 Download PDFInfo
- Publication number
- CN104063609B CN104063609B CN201410311076.6A CN201410311076A CN104063609B CN 104063609 B CN104063609 B CN 104063609B CN 201410311076 A CN201410311076 A CN 201410311076A CN 104063609 B CN104063609 B CN 104063609B
- Authority
- CN
- China
- Prior art keywords
- data
- similarity
- monitoring
- monitoring data
- pollution source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种利用神经网络辅助判定污染源监测数据有效性的方法,包括:数据模型建立步骤、相似度度量步骤和数据有效性检测步骤,其中,数据模型建立步骤用于基于单数据集,并采用神经网络技术,建立数据预测模型,对选定时刻的数据进行预测,获取预测值;相似度度量步骤用于将预测值与实际监测数值进行相似度度量,获取数据相似度,并基于预定义的相似度界限值确定监测数据的异常点范围;数据有效性检测步骤用于在异常点范围内,基于数据相似度进行监测数据的有效性检测,找出无效的监测数据。
Description
技术领域
本发明涉及检测技术,特别涉及一种利用神经网络辅助判定污染源监测数据有效性的方法。
背景技术
在我国经济可持续发展的同时,环境污染不断加剧,尤其表现在水环境和大气环境方面,相关企业的污染物排放值超过了环境的自净能力,环境质量发生不良变化,危害人类健康。在这样的大环境下,环境治理工作刻不容缓,国家对污染源企业的监管也加大了力度。
2013年国家环境保护部出台了81号文件,文件要求要加强对国控污染物重点监测企业排放的特征污染物的监测,并进行相关信息公开,公开内容如下:
基础信息:企业名称、法人代表、所属行业、地理位置、生产周期、联系方式、委托监测机构名称等;
自行监测方案;
自行监测结果:全部监测点位、监测时间、污染物种类及浓度、标准限值、达标情况、超标倍数、污染物排放方式及排放去向;
在信息公开的同时,为了加强对国控企业(国家重点监控企业)污染源自动监测数据的使用和管理,国家环保部门又出台了《国家重点监控企业污染源自动监测数据有效性审核办法》文件。国控企业污染源自动监测数据有效性审核是指由市(地)级环境保护部门(以下简称“市级责任环保部门”)负责,对国控企业污染源自动监测设备定期进行监督考核,确定其自动监测设备正常运行。国控企业污染源自动监测设备在正常运行状态下所提供的实时监测数据,即为通过有效性审核的污染源自动监测数据。国控企业污染源自动监测设备验收合格后,其正常运行提供的监测数据在一定时段内认定为有效数据。日常运行监督考核合格后至下次运行监督考核,该时段内自动监测设备正常运行提供的监测数据认定为有效数据。有效的国控企业污染源自动监测数据是国控企业计算主要污染物排放数量和确定达标排放的依据,是环境保护主管部门总量考核、监督执法、排污申报核定等工作的基础。
目前,在国控企业污染源自动监测设备正常运行状态下发布的数据,由于特殊情况,会存在人为程序干扰致使数据作假的现象,此时会干扰市级责任环保部门对国控污染源自动监测数据的有效性审核,针对此情况,本发明提出一种利用神经网络辅助判定污染源监测数据有效性的方法,旨在提高自动监测数据有效性审核工作的高效性和准确性。
国控污染源数据公开的一般过程是:首先根据企业环评标准,确定本企业公开哪些数据和判定这些数据是否达到所依据的标准,企业参考此标准来组织生产运营工作,将数据对外发布,同时上报国家环保部门。在数据发布的过程中,存在如下情况:
国控企业公布的监测数据可能受人工或程序设定干扰,在出现监测数据不达标的情况下,判定为达标并上报数据。
上述情况中的数据,本发明称之为异常点,对于国家环保部门来说,这些数据是无效的。污染源自控监测数据具有复杂性、多样性的显著特征,要在大量数据中挖掘出这些异常点,目前比较常规的方法主要是利用比对监测:
废水污染物浓度及流量比对
废气污染物浓度、氧量、流量和烟温比对要在一大堆监测数据基础上进行一一比对工作,不仅工作量大,而且效率不高。缺乏一种高效的数据有效性审核方法,给环境监管部门带来了很大的困扰。在这样的背景下,亟待提出一种污染源监测数据有效性检查的方法。
发明内容
本发明所要解决的技术问题在于提供一种污染源监测数据有效性检测方法,以克服现有技术中存在的数据量大,效率低的问题。
为达上述目的,本发明提供了一种利用神经网络辅助判定污染源监测数据有效性的方法,包括:
数据模型建立步骤:基于单数据集,并采用神经网络技术,建立数据预测模型,对选定时刻的数据进行预测,获取预测值;
相似度度量步骤:将所述预测值与实际监测数值进行相似度度量,获取数据相似度,并基于预定义的相似度界限值确定监测数据的异常点范围;
数据有效性检测步骤:在所述异常点范围内,基于所述数据相似度进行监测数据的有效性检测,找出无效的监测数据。
上述污染源监测数据有效性检查的方法,所述数据模型建立步骤还包括:
数据收集步骤:用于收集污染源监测数据,采用一定时间段内的多个采样点数据为输入,基于单一输入的所述单数据集进行所述数据预测模型的建立;
神经网络结构确定步骤:根据输入的所述多个采样点数据,相应采用所述神经网络模型多个神经元节点为输入,多个神经元节点为输出,所述神经网络的隐层节点采取由小到大的顺序进行试算,获取输入输出样本观测值集;
样本输出步骤:根据所述输入输出样本观察值集,通过对所述神经网络的权值和阈值进行学习和调整,对所述神经网络进行学习训练,并对所述输入输出样本进行相应处理。
上述污染源监测数据有效性检查的方法,所述相似性度量步骤还包括:
差异度计算步骤:采用相似度度量函数Similar,基于所述数据预测模型输出的预测数据与相应时间段的监测数据进行相似度度量,计算所述预测数据与所述监测数据差异度,并确定所述差异度大的数据为数据背离有效。
上述污染源监测数据有效性检查的方法,所述相似度度量函数Similar为:
所述d为数据向量维数,所述X为预测值向量,X=(x1,x2,x3,…xd),所述Y为实际监测数据向量,Y=(y1,y2,y3,…yd)。
与现有技术相比,本发明的有益效果在于:
1)本发明方法的实现可以在环境监管部门数据有效性审核工作中,快速缩小审核范围,协助审核工作的推进,并提高审核效率;
2)本发明方法中提出的Similar度量函数可以有效避免这些“噪声维度”的干扰问题。
附图说明
图1为本发明方法流程示意图;
图2为本发明具体实施例数据预测模型建立示意图。
其中,附图标记:
S1~S3、S11~S13、S21:本发明各实施例的施行步骤
具体实施方式
下面给出本发明的具体实施方式,结合图示对本发明做出了详细描述。
本发明提出了一种利用神经网络辅助判定污染源监测数据有效性的方法,核心思想是通过监测数据的变化趋势,进行选定时刻的数据预测,将预测值与实际监测值进行相似性度量,通过定义相似度界限值,进一步缩小异常点范围,提高异常点监测的工作效率。
图1为本发明方法流程示意图,如图1所示,本发明提供的一种利用神经网络辅助判定污染源监测数据有效性的方法,包括:
数据模型建立步骤S1:基于单数据集,并采用神经网络技术,建立数据预测模型,对选定时刻的数据进行预测,获取预测值;
相似度度量步骤S2:将预测值与实际监测数值进行相似度度量,获取数据相似度,并基于预定义的相似度界限值确定监测数据的异常点范围;
数据有效性检测步骤S3:在异常点范围内,基于数据相似度进行监测数据的有效性检测,找出无效的监测数据。
其中,数据模型建立步骤S1还包括:
数据收集步骤S11:用于收集污染源监测数据,采用一定时间段内的多个采样点数据为输入,基于单一输入的单数据集进行数据预测模型的建立;
神经网络结构确定步骤S12:根据输入的多个采样点数据,相应采用神经网络模型多个神经元节点为输入,多个神经元节点为输出,神经网络的隐层节点采取由小到大的顺序进行试算,获取输入输出样本观测值集;
样本输出步骤S13:根据输入输出样本观察值集,通过对神经网络的权值和阈值进行学习和调整,对神经网络进行学习训练,并对输入输出样本进行相应处理。
其中,相似度度量步骤S2还包括:
差异度计算步骤S21:采用相似度度量函数Similar,基于数据预测模型输出的预测数据与相应时间段的监测数据进行相似度度量,计算预测数据与监测数据差异度,并确定差异度大的数据为数据背离有效。
其中,相似度度量函数Similar为:
该d为数据向量维数,该X为预测值向量,X=(x1,x2,x3,…xd),该Y为实际监测数据向量,Y=(y1,y2,y3,…yd)。
以下结合图示,对本发明具体实施例进行详细说明:
国控企业自控监测的数据是有一定时间序列的,具有离散性,其时间序列对应的监测数据值可能存在一些规律性的变换,例如季节变化产生的在线监测数据的周期性变换、每天当中数据的周期性变化等等。根据周期性变化特点,本发明可以通过一种技术手段,形成监测数据的周期变化曲线,即数据的变化模型。基于此,本发明提出,对单数据集(某一监测数据在某一时间序列的值)进行建模分析并进行下一时刻数值的预测,通过实际值与预测值比较,用数据相似度来描述预测值与实际值之间的异常程度。例如对污水处理出水水质cod进行数据建模预测,套用预测模型获得的x1,x2时刻的预测值分别为30,35,此时x1,x2时刻的实际监测值为58,60,此时本发明记两个时间之间预测值的向量X,实际监测值的向量Y。为了缩小异常点监测范围,使异常点的监测更准确,本发明定义向量之间相似度在(0,0.3)范围内的为异常范围,在此范围内,再进一步进行数据有效性检测,可大大提高环保责任部门工作的高效性。本发明以此范围为例,但不限于该范围的选定。
本发明针对环保行业质量指标,进行有效性检查。污水处理方面,本发明对cod、氨氮进行有效性检测,大气方面,对二氧化硫进行有效性检测,对这些表征环境质量达标与否的关键数据进行有效性检查,具有重要的实际意义。
(1)建立数据模型
污染源监测数据具有一定的离散特性和周期性,为了能准确的分析数据变化趋势,本发明依据监测数据本身进行预测模型的建立,即单一输入的预测模型。污水处理中本发明取COD、氨氮为测量目标,大气环境本发明取二氧化硫为测量目标。
利用神经网络技术,建立数据预测模型。采用一定时间段内的n个采样点数据为输入,预测该时间段后续两个时刻的数据,因此确定网络模型输入为n个神经元节点、输出层为2个神经元节点,隐层节点采用由小到大的顺序进行试算。该模型的建立,采用MATLAB工具箱实现,如图2所示,图2为本发明具体实施例数据预测模型建立示意图;
在确定神经网络结构后,利用输入输出样本观测值集,对网络的权值和阈值进行学习和调整,经过神经网络拟合与预测模型的校验,使网络实现给定的输入输出映射关系,为提高收敛速度,对输入样本进行归一化处理,训练结束后再对输出数据进行还原处理。
(2)相似度度量
对监测数据进行建模后得到后续时刻的预测数据,将预测数据与相应时间段的监测数据进行相似性度量,计算两者差异程度,从而找出差异较大的数据,认为这些数据背离有效性。相似性度量采用Similar函数,具体描述如下:
设有d维数据向量X=(x1,x2,x3,…xd)及Y=(y1,y2,y3,…yd),定义新的相似度度量函数Similar如公式4-1所示:
该改进相似度度量函数引入了指数e,当xi和yi差异较大时,分子反而变小。将(4-1)函数用于向量X,Y之间相似度的函数,具有如下性质:
函数充分考虑了两个数据向量的所有维度,使差异过大的维度的贡献率降低。
函数最大值为1,代表X和Y在所有维度上的值都相等,此时X和Y在d维空间上是完全重合的,此时相似度最大。函数最小值为0,代表X和Y在每个维度上的差异均接近于无穷大,此时X和Y相似度最小。
Similar函数与传统的相似度度量函数相比,通过差异的度量区别了所有维度的贡献率,提高了差异小的维度的贡献率,使得那些相似性强的维度占有主导地位,而降低那些差异很大的维度的贡献率,使得这些维度几乎被略去。在两个数据向量的相似度度量中,该函数符合这样的逻辑:彼此相接近的维度越多,表明相似性越大,这与人们日常的认知相吻合。在污水监测数据中,对于高维时序数据经常会出现这样的情况:在大多数维度上,两个向量的差异都较小,数据走势也基本一致,只是在个别维度上,两个数据向量的差值很大。应用传统的基于距离的度量函数,会放大个别的“噪声维度”对整体度量效果的影响。因此,两个数据的相似信息很容易就会被淹没在这些少数主导“噪声维度”中。本方法中提出的Similar度量函数可以有效避免这些“噪声维度”的干扰。
(3)区间范围
符合上述异常范围的监测数据,从理论意义上来讲,是作假数据的可能性较大,但并不代表一定是作假数据。
综上所述,本发明方法针对环保行业质量指标,进行有效性检查。污水处理方面,我们对cod、氨氮进行有效性检测,大气方面,对二氧化硫进行有效性检测,对这些表征环境质量达标与否的关键数据进行有效性检查,具有重要的实际意义。
当然,本发明还可有其它多种实施例,不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (2)
1.一种利用神经网络辅助判定污染源监测数据有效性的方法,其特征在于,包括:
数据模型建立步骤:基于单数据集,并采用神经网络技术,建立数据预测模型,对后续时刻的数据进行预测,获取预测值;
相似度度量步骤:将所述预测值与实际监测数值进行相似度度量,获取数据相似度,并基于预定义的相似度界限值确定监测数据的异常点范围;
数据有效性检测步骤:在所述异常点范围内,基于所述数据相似度进行监测数据的有效性检测,找出无效的监测数据;
所述相似度度量步骤还包括:
差异度计算步骤:采用相似度度量函数Similar,基于所述数据预测模型输出的预测数据与相应时间段的监测数据进行相似度度量,计算所述预测数据与所述监测数据差异度,并确定所述差异度大的数据为数据背离有效,
所述相似度度量函数Similar为:
所述d为数据向量维数,所述X为预测值向量,X=(x1,x2,x3,…xd),所述Y为实际监测数据向量,Y=(y1,y2,y3,…yd)。
2.根据权利要求1所述污染源监测数据有效性检查的方法,其特征在于,所述数据模型建立步骤还包括:
数据收集步骤:用于收集污染源监测数据,采用一定时间段内的多个采样点数据为输入,基于单一输入的所述单数据集进行所述数据预测模型的建立;
神经网络结构确定步骤:根据输入的所述多个采样点数据,相应采用所述神经网络模型多个神经元节点为输入,多个神经元节点为输出,所述神经网络的隐层节点采取由小到大的顺序进行试算,获取输入输出样本观测值集;
样本输出步骤:根据所述输入输出样本观察值集,通过对所述神经网络的权值和阈值进行学习和调整,对所述神经网络进行学习训练,并对所述输入输出样本进行相应处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410311076.6A CN104063609B (zh) | 2014-07-01 | 2014-07-01 | 一种利用神经网络辅助判定污染源监测数据有效性的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410311076.6A CN104063609B (zh) | 2014-07-01 | 2014-07-01 | 一种利用神经网络辅助判定污染源监测数据有效性的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104063609A CN104063609A (zh) | 2014-09-24 |
CN104063609B true CN104063609B (zh) | 2017-02-15 |
Family
ID=51551319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410311076.6A Active CN104063609B (zh) | 2014-07-01 | 2014-07-01 | 一种利用神经网络辅助判定污染源监测数据有效性的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104063609B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104699056B (zh) * | 2015-02-13 | 2017-03-15 | 北京金控数据技术股份有限公司 | 一种对污水处理工艺单元运行性能进行监控的方法 |
CN108921440B (zh) * | 2018-07-11 | 2022-08-05 | 平安科技(深圳)有限公司 | 污染物异常监测方法、系统、计算机设备和存储介质 |
CN111385106B (zh) * | 2018-12-11 | 2022-03-01 | 华为技术有限公司 | 一种用于故障根因的识别方法、装置和设备 |
CN112285287B (zh) * | 2020-10-19 | 2022-08-16 | 广东长天思源环保科技股份有限公司 | 一种烟气在线监测数据预处理方法 |
CN112581031B (zh) * | 2020-12-30 | 2023-10-17 | 杭州朗阳科技有限公司 | 一种c语言实现递归神经网络(rnn)对电机异常进行实时监控的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0632268A1 (en) * | 1993-07-01 | 1995-01-04 | Johnson Service Company | Apparatus and method for determining the indoor air quality within an enclosed space |
CN102117383A (zh) * | 2011-02-28 | 2011-07-06 | 河海大学 | 一种河流污染实时诊断的方法 |
CN102707026A (zh) * | 2012-06-06 | 2012-10-03 | 天津大学 | 一种用于再生水厂原水水质的在线预警系统及其控制方法 |
CN103267832A (zh) * | 2013-05-13 | 2013-08-28 | 安徽工程大学 | 地表水在线水质监测系统 |
-
2014
- 2014-07-01 CN CN201410311076.6A patent/CN104063609B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0632268A1 (en) * | 1993-07-01 | 1995-01-04 | Johnson Service Company | Apparatus and method for determining the indoor air quality within an enclosed space |
CN102117383A (zh) * | 2011-02-28 | 2011-07-06 | 河海大学 | 一种河流污染实时诊断的方法 |
CN102707026A (zh) * | 2012-06-06 | 2012-10-03 | 天津大学 | 一种用于再生水厂原水水质的在线预警系统及其控制方法 |
CN103267832A (zh) * | 2013-05-13 | 2013-08-28 | 安徽工程大学 | 地表水在线水质监测系统 |
Non-Patent Citations (2)
Title |
---|
Using Improved Neural Network Model To Analyze RSP, NOx And NO2 Levels In Urban Air In Mong Kok, Hong Kong;W. Z. Lu 等;《Environmental Monitoring and Assessment》;20030930;第87卷(第3期);第235-254页 * |
基于BP神经网络的空气污染指数预测模型研究;白鹤鸣 等;《环境科学与技术》;20100331;第36卷(第3期);第186-189页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104063609A (zh) | 2014-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105510546B (zh) | 一种基于自组织递归rbf神经网络的生化需氧量bod智能检测方法 | |
CN104061445B (zh) | 一种基于神经网络的管道泄漏检测方法 | |
CN104063609B (zh) | 一种利用神经网络辅助判定污染源监测数据有效性的方法 | |
Man et al. | Forecasting COD load in municipal sewage based on ARMA and VAR algorithms | |
CN104376380B (zh) | 一种基于递归自组织神经网络的氨氮浓度预测方法 | |
CN101923083B (zh) | 基于支持向量机和神经网络的污水化学需氧量软测量方法 | |
US20180029900A1 (en) | A Method for Effluent Total Nitrogen-based on a Recurrent Self-organizing RBF Neural Network | |
CN104965971B (zh) | 一种基于模糊神经网络的氨氮浓度软测量方法 | |
CN111191191B (zh) | 一种精准预测混凝土坝变形效应的组合模型的构建方法 | |
Zhao et al. | Water resources risk assessment model based on the subjective and objective combination weighting methods | |
CN104408562B (zh) | 一种基于bp神经网络的光伏系统发电效率综合评估方法 | |
CN107025338A (zh) | 一种基于递归rbf神经网络的污泥膨胀故障辨识方法 | |
CN107480705A (zh) | 一种自来水管漏水检测方法 | |
CN104182794B (zh) | 一种基于神经网络的污水处理过程出水总磷tp软测量方法 | |
CN105574326A (zh) | 一种基于自组织模糊神经网络的出水氨氮浓度软测量方法 | |
CN103226741A (zh) | 城市供水管网爆管预测方法 | |
CN106199174A (zh) | 基于迁移学习的挤压机能耗异常预测方法 | |
CN104091061B (zh) | 一种利用正态分布辅助判定污染源监测数据有效性的方法 | |
Yu et al. | The nonlinear effect of new urbanization on water pollutant emissions: Empirical analysis based on the panel threshold model | |
CN102778548B (zh) | 一种污水处理过程污泥膨胀指数预测方法 | |
CN115392617A (zh) | 一种基于环境异质性的水库库尾河段水环境安全评估方法 | |
CN115713448A (zh) | 基于汇水单元的流域水污染常规因子快速溯源方法 | |
CN114858207A (zh) | 一种基于软测量的河道排污口网格化溯源排查方法 | |
CN111047476A (zh) | 基于rbf神经网络的大坝结构安全监控精确预测方法及系统 | |
Zhang et al. | An unsupervised leak detection method with aggregating prediction and reconstruction along projection pathway for natural gas gathering pipelines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100048 Beijing City, West Third Ring Road, No. 91, state building, building, room C03, room three Applicant after: BEIJING JINKONG DATA TECHNOLOGY CO., LTD. Address before: 100048 Beijing City, West Third Ring Road, No. 91, state building, building, room C03, room three Applicant before: Beijing Jinkong Automatic Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |