CN112101789A - 一种基于人工智能的水污染报警等级识别方法 - Google Patents

一种基于人工智能的水污染报警等级识别方法 Download PDF

Info

Publication number
CN112101789A
CN112101789A CN202010973023.6A CN202010973023A CN112101789A CN 112101789 A CN112101789 A CN 112101789A CN 202010973023 A CN202010973023 A CN 202010973023A CN 112101789 A CN112101789 A CN 112101789A
Authority
CN
China
Prior art keywords
model
data
optimal
water pollution
pollution alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010973023.6A
Other languages
English (en)
Inventor
程雨涵
梁漫春
钱益武
李梅
李楚
王清泉
曹毅
孔美玲
龚柳
肖鑫鑫
王康林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Zeone Safety Technology Co ltd
Beijing Chen'an Measurement And Control Technology Co ltd
Hefei Institute for Public Safety Research Tsinghua University
Original Assignee
Anhui Zeone Safety Technology Co ltd
Beijing Chen'an Measurement And Control Technology Co ltd
Hefei Institute for Public Safety Research Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Zeone Safety Technology Co ltd, Beijing Chen'an Measurement And Control Technology Co ltd, Hefei Institute for Public Safety Research Tsinghua University filed Critical Anhui Zeone Safety Technology Co ltd
Priority to CN202010973023.6A priority Critical patent/CN112101789A/zh
Publication of CN112101789A publication Critical patent/CN112101789A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Abstract

本发明提供了一种基于人工智能的水污染报警等级识别方法,包括以下步骤:步骤A:获取历史数据,对历史数据进行预处理;步骤B:人工标记历史数据的风险等级,得到风险标签数据,按比例划分为训练集和测试集;步骤C:搭建深度学习模型,将训练集数据输入深度学习模型,输出训练后的模型;步骤D:使用测试集进行测试,如果满足预设标准,则作为水污染报警等级识别模型;步骤E:对各入口节点的实时数据进行识别得到水污染报警等级。本发明的优点在于:综合考虑水体的水质和水量数据,基于人工智能深度学习技术,发现水体污染与多种参数的深度关系,对污染报警等级进行准确的判断识别。

Description

一种基于人工智能的水污染报警等级识别方法
技术领域
本发明涉及水污染分析技术领域,尤其涉及一种基于人工智能的水污染报警等级识别方法。
背景技术
对水环境进行污染情况监控时需要考虑入河排口、管网节点等位置的监控,涉及的监控因子较多,如果采用单因子指标报警,在同一时间点,存在多个监测指标的同时报警情况,产生多条报警信息,工作人员需要对多条单因子报警信息进行处理,人工判断节点排放的综合污染风险程度。依赖工作人员的工作经验,具有随机性,因人差异性,效率较低且对工作人员的专业技术有一定要求。
公开号为CN110196083A的发明专利申请公开了一种排水管网污染路径的监测识别方法,通过建立待监测区域的排水管网骨架模型,根据排水管网骨架模型,识别可能性污染传输路径和可能性污染传输路径的关键节点,按照关键节点在实际排水管网布点后,监测实际排水管网的水量和水质指标数据,在监测到水量和水质指标数据异常时,利用排水管网骨架模型从可能性污染传输路径中确定实际污染传输路径,对实际污染传输路径中的关键节点进行污染取证;通过对水质、水量的监控快速确定水质异常并确定问题节点;该方法虽然考虑了水质和水量的变化情况,但实际上的判断条件依然是单个因子是否超标,没有对多个因子进行综合评估,准确度较低。
发明内容
本发明所要解决的技术问题在于异常检测存在滞后性的情况,提供一种基于水质和水量综合判定,快速准确确认水污染报警等级的方法。
本发明是通过以下技术方案解决上述技术问题的:一种基于人工智能的水污染报警等级识别方法,包括以下步骤:
步骤A:获取水环境入口节点影响因子的历史数据,对历史数据进行异常值剔除和缺失值填充操作;
步骤B:基于时间序列标记各节点影响因子对应的风险等级,结合历史数据得到风险标签数据,将风险标签数据按比例划分为训练集和测试集;
步骤C:搭建深度学习模型,配置模型参数,将训练集数据输入深度学习模型,通过参数优化,当训练模型的准确度满足输出标准时,输出训练后的模型;
步骤D:使用测试集对训练后的深度学习模型进行测试,如果测试结果不满足预设标准,则返回步骤C,如果满足预设标准,则作为水污染报警等级识别模型;
步骤E:将各入口节点的实时数据输入水污染报警等级识别模型,得到水污染报警等级。
本发明综合考虑水体的水质和水量数据,基于人工智能深度学习技术,发现水体污染与多种参数的深度关系,对污染报警等级进行准确的判断识别;另外对每个入口节点分别配置适用的模型,提高准确度,能够在发现异常时直接确定问题节点,提高响应速度,不需要根据主通道的异常反向排查各节点的情况,处理速度更快。
优选的,所述影响因子包括水质数据和水量数据,所述水质数据包括物理指标、常规水质指标、金属含量、无机物含量、有机物含量、微生物含量、辐射量;所述水量数据包括水位、流量、流速。
优选的,步骤A中基于箱线图或三倍标准偏差法检测异常值,对极端异常值进行剔除;基于缺失值前后多个数据的平均值对缺失值进行填充。
优选的,步骤C中基于决策树搭建深度学习模型,训练方法包括以下步骤:
步骤i:调用决策树模型,选择基尼系数或信息增益作为模型的特征指标计算方法;
步骤ii:设置决策树各参数的序列值列表,包括最大深度、叶子节点最少样本数、最大叶子节点数,将风险标签数据的训练集输入决策树模型,依据序列值列表逐个更新每个参数,并保持其他参数不变,以准确率和召回率最优值对应的数值作为当前参数的最优值,依次确定每个参数的最优值,基于迭代后的最高准确率和召回率评价指标确定决策树的最佳参数组合;
步骤iii:基于最佳模型参数组合,使用测试集数据对决策树模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤ii。
优选的,搜准确率的计算公式为:
Figure BDA0002684789180000021
召回率计算公式为:
Figure BDA0002684789180000022
其中,TP表示真实结果为A,预测结果也是A的数量,FN表示真实结果为A,预测结果不是A的数量;TN表示真实结果不是A,预测结果也不是A的数量,FN表示真实结果不是A,预测结果是A的数量。
优选的,步骤C中基于随机森林搭建深度学习模型,训练方法包括以下步骤:
步骤I:调用随机森林模型,配置参数n_estimators、max_features、max_depth、max_features、min_samples_leaf、min_samples_split、max_depth的序列值列表;
步骤II:将风险标签数据的训练集输入随机森林模型,基于序列值列表依次更新参数n_estimators、max_features、max_depth、max_features、min_samples_leaf、min_samples_split、max_depth;基于最高准确率和召回率评价指标确定随机森林的最佳参数组合;
步骤III:基于最佳模型参数组合,使用测试集数据对随机森林模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤II。
优选的,步骤C中基于SVM搭建深度学习模型,训练方法包括以下步骤:
步骤a:调用SVM模型,初始化模型参数gamma和惩罚系数C的序列值列表;
步骤b:将风险标签数据的训练集输入SVM模型进行训练,基于序列值列表依次更新参数,以准确率最优时对应的参数作为该参数的最优值,按照该方法依次确定各参数的最优值,最终基于最高准确率确定SVM模型的最佳参数组合;
步骤c:基于最佳模型参数组合,使用测试集数据对SVM模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤b。
优选的,步骤C中基于神经网络搭建深度学习模型,训练方法包括以下步骤:
步骤1:搭建包括输入层、隐藏层1、隐藏层2、输出层的神经网络,初始化隐藏层1、隐藏层2和输出层的权重参数w1、w2、w3,偏重参数b1、b2、b3,激活函数学习率η、损失函数、优化器函数;
步骤2:将风险标签数据的训练集输入神经网络模型进行训练,计算每轮训练后的模型分类准确率和损失,对损失函数求梯度,根据梯度、初始设定学习率对权重参数w、偏重参数b进行迭代更新,模型损失小于0.1,且模型准确率大于90%时,结束训练;
步骤3:通过学习率序列列表循环带入模型,基于模型准确率、模型损失率收敛得到最佳学习率;
步骤4:基于最佳模型参数组合,使用测试集数据对神经网络模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤2。
优选的,所述神经网络的计算公式为:
h1=(w1·Xinput)+b1
h2=(w2·Xh1)+b2
Youtput=σ((w3·Xh2)+b3)
其中,h1为该神经网络的隐藏层1输出,h2为该神经网络的隐藏层2输出,Youtput为输出层的输出数据,即水污染报警等级;Xinput表示输入层数据;σ表示激活函数,本实施例采用relu激活函数,Xh1和Xh2分别表示隐藏层1和隐藏层2的输入数据。
优选的,神经网络的权重和偏重的更新方法为:
Figure BDA0002684789180000041
Figure BDA0002684789180000042
其中,wold、bold为更新前的权重和偏重,wnew、bnew为更新后的权重和偏重。
本发明提供的基于人工智能的水污染报警等级识别方法的优点在于:综合考虑水体的水质和水量数据,基于人工智能深度学习技术,发现水体污染与多种参数的深度关系,对污染报警等级进行准确的判断识别;另外对每个入口节点分别配置适用的模型,提高准确度,能够在发现异常时直接确定问题节点,提高响应速度,不需要根据主通道的异常反向排查各节点的情况,处理速度更快。
附图说明
图1为本发明的实施例提供的户基于人工智能的水污染报警等级识别方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
如图1所示,本实施例提供了一种基于人工智能的水污染报警等级识别方法,包括以下步骤:
步骤A:获取水环境入口节点影响因子的历史数据,对历史数据进行异常值剔除和缺失值填充操作;
所述影响因子包括水质数据和水量数据,所述水质数据包括物理指标、常规水质指标、金属含量、无机物含量、有机物含量、微生物含量、辐射量;具体的,物理指标包括水温、PH、透过率、悬浮物、浊度;常规水质指标包括溶解氧含量、高锰酸盐指数、化学需氧量、五日生化需氧量、氨氮含量、总磷含量、总氮含量;金属含量包括铜、铁、锌、汞、铬、铅;无机物含量包括氟化物、卤化物、磷酸盐类、硫化物;有机物含量包括氰化物、挥发酚、石油类、阴离子表面活性剂;微生物含量包括粪大肠杆菌群;辐射量包括总α、总β、3H、14C、90Sr活度浓度;所述水量数据包括水位、流量、流速等。
对数据进行处理前,还需要对数据进行清洗整理,可使用多表关联、时间处理等方法对数据进行整理,数据整理内容包含:监测数据表与站点基础信息表、监测指标基础表匹配,将多张数据表整理成一张表,另外将分钟级流量、液位、水温等数据进行均值、加和值等统计方法整合成与水质统一频率的数据展示形式;然后基于箱线图或三倍标准偏差法检测异常值,对极端异常值判定为设备异常,将极端异常值剔除;基于缺失值前后多个数据的平均值对缺失值进行填充,优选使用前后4—8位数据的平均值进行填充。
步骤B:基于时间序列标记各节点影响因子对应的风险等级,结合历史数据得到风险标签数据,将风险标签数据按比例划分为训练集和测试集;
本步骤中通过人工判断,综合考虑各方面的影响因子,对水体数据标记风险等级。
步骤C:搭建深度学习模型,配置模型参数,将训练集数据输入深度学习模型,通过参数优化,当训练模型的准确度满足输出标准时,输出训练后的模型;
步骤D:使用测试集对训练后的深度学习模型进行测试,如果测试结果不满足预设标准,则返回步骤C,如果满足预设标准,则作为水污染报警等级识别模型;
步骤E:将各入口节点的实时数据输入水污染报警等级识别模型,得到水污染报警等级。
本实施例综合考虑水体的水质和水量数据,基于人工智能深度学习技术,发现水体污染与多种参数的深度关系,对污染报警等级进行准确的判断识别;另外对每个入口节点分别配置适用的模型,提高准确度,能够在发现异常时直接确定问题节点,提高响应速度,不需要根据主通道的异常反向排查各节点的情况,处理速度更快。
其中深度学习模型可以使用决策树、随机森林、支持向量机(SVM)、BP神经网络、LSTM神经网络等模型进行构建,也可以同时训练多个模型,然后基于分类准确性选择最优的模型作为最终的水污染报警等级识别模型;本实施例以部分深度学习模型为例说明如何进行模型训练。
决策树
步骤i:调用决策树模型,选择基尼系数或信息增益作为模型的特征指标计算方法;
步骤ii:设置决策树各参数的序列值列表,包括最大深度、叶子节点最少样本数、最大叶子节点数,将风险标签数据的训练集输入决策树模型,依据序列值列表逐个更新每个参数,并保持其他参数不变,以准确率和召回率最优值对应的数值作为当前参数的最优值,依次确定每个参数的最优值,基于迭代后的最高准确率和召回率评价指标确定决策树的最佳参数组合;
所述准确率的计算公式为:
Figure BDA0002684789180000061
召回率计算公式为:
Figure BDA0002684789180000062
其中,TP表示真实结果为A,预测结果也是A的数量,FN表示真实结果为A,预测结果不是A的数量;TN表示真实结果不是A,预测结果也不是A的数量,FN表示真实结果不是A,预测结果是A的数量。
步骤iii:基于最佳模型参数组合,使用测试集数据对决策树模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤ii。
随机森林
步骤I:调用随机森林模型,配置参数n_estimators、max_features、max_depth、max_features、min_samples_leaf、min_samples_split、max_depth的序列值列表;
步骤II:将风险标签数据的训练集输入随机森林模型,基于序列值列表依次更新参数n_estimators、max_features、max_depth、max_features、min_samples_leaf、min_samples_split、max_depth;基于最高准确率和召回率评价指标确定随机森林的最佳参数组合;
例如预设max_depth的序列值列表为[3,4,5,...10,…20…],依次改变max_depth数据,保持其他参数不变,通过循环依次带入训练模型,输出不同max_depth下的模型准确率、召回率,以最优结果对应的数值作为最佳max_depth值,然后以该最优值带入模型对其他参数进行迭代优化,最终获得所有参数的最优值的组合。
所述准确率的计算公式为:
Figure BDA0002684789180000063
召回率计算公式为:
Figure BDA0002684789180000064
其中,TP表示真实结果为A,预测结果也是A的数量,FN表示真实结果为A,预测结果不是A的数量;TN表示真实结果不是A,预测结果也不是A的数量,FN表示真实结果不是A,预测结果是A的数量。
步骤III:基于最佳模型参数组合,使用测试集数据对随机森林模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤II。
SVM
步骤a:调用SVM模型,初始化模型参数gamma和惩罚系数C的序列值列表;
步骤b:将风险标签数据的训练集输入SVM模型进行训练,基于序列值列表依次更新参数,以准确率最优时对应的参数作为该参数的最优值,按照该方法依次确定各参数的最优值,最终基于最高准确率确定SVM模型的最佳参数组合;
所述准确率的计算公式为:
Figure BDA0002684789180000071
其中,TP表示真实结果为A,预测结果也是A的数量,FN表示真实结果为A,预测结果不是A的数量;TN表示真实结果不是A,预测结果也不是A的数量,FN表示真实结果不是A,预测结果是A的数量。
步骤c:基于最佳模型参数组合,使用测试集数据对SVM模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤b。
神经网络
步骤1:构建包括输入层、隐藏层1、隐藏层2、输出层的神经网络,初始化隐藏层1、隐藏层2和输出层的权重参数w1、w2、w3,偏重参数b1、b2、b3,激活函数、学习率η、损失函数、优化器函数;
所述水污染报警等级识别神经网络的计算公式为:
h1=(w1·Xinput)+b1
h2=(w2·Xh1)+b2
Youtput=σ((w3·Xh2)+b3)
其中,h1为该神经网络的隐藏层1输出,h2为该神经网络的隐藏层2输出,Youtput为输出层;Xinput表示输入层数据;σ表示激活函数,本实施例采用relu激活函数,Xh1和Xh2分别表示隐藏层1和隐藏层2的输入数据;
步骤2:将风险标签数据的训练集输入神经网络模型进行训练,计算每轮训练后的模型分类准确率和损失,对损失函数求梯度,根据梯度、初始设定学习率对权重参数w、偏重参数b进行更新,模型损失小于0.1,且模型准确率大于90%时,结束训练;
所述准确率的计算公式为:
Figure BDA0002684789180000072
其中,TP表示真实结果为A,预测结果也是A的数量,FN表示真实结果为A,预测结果不是A的数量;TN表示真实结果不是A,预测结果也不是A的数量,FN表示真实结果不是A,预测结果是A的数量;
随时函数E采用softmax_cross_entropy_with_logits多分类交叉熵函数计算预测值与标签值之间的误差;
步骤3:另外将学习率序列列表循环带入模型,基于模型准确率、模型损失收敛得到适用本模型最佳学习率;
步骤4:基于最佳模型参数组合,使用测试集数据对神经网络模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤2。
权重和偏重的更新方法分别为:
Figure BDA0002684789180000081
Figure BDA0002684789180000082
其中,wold、bold为更新前的权重和偏重,wnew、bnew为更新后的权重和偏重。

Claims (10)

1.一种基于人工智能的水污染报警等级识别方法,其特征在于:包括以下步骤:
步骤A:获取水环境入口节点影响因子的历史数据,对历史数据进行异常值剔除和缺失值填充操作;
步骤B:基于时间序列标记各节点影响因子对应的风险等级,结合历史数据得到风险标签数据,将风险标签数据按比例划分为训练集和测试集;
步骤C:搭建深度学习模型,配置模型参数,将训练集数据输入深度学习模型,通过参数优化,当训练模型的准确度满足输出标准时,输出训练后的模型;
步骤D:使用测试集对训练后的深度学习模型进行测试,如果测试结果不满足预设标准,则返回步骤C,如果满足预设标准,则作为水污染报警等级识别模型;
步骤E:将各入口节点的实时数据输入水污染报警等级识别模型,得到水污染报警等级。
2.根据权利要求1所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:所述影响因子包括水质数据和水量数据,所述水质数据包括物理指标、常规水质指标、金属含量、无机物含量、有机物含量、微生物含量、辐射量;所述水量数据包括水位、流量、流速。
3.根据权利要求1所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:步骤A中基于箱线图或三倍标准偏差法检测异常值,对极端异常值进行剔除;基于缺失值前后多个数据的平均值对缺失值进行填充。
4.根据权利要求1所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:步骤C中基于决策树搭建深度学习模型,训练方法包括以下步骤:
步骤i:调用决策树模型,选择基尼系数或信息增益作为模型的特征指标计算方法;
步骤ii:设置决策树各参数的序列值列表,包括最大深度、叶子节点最少样本数、最大叶子节点数,将风险标签数据的训练集输入决策树模型,依据序列值列表逐个更新每个参数,并保持其他参数不变,以准确率和召回率最优值对应的数值作为当前参数的最优值,依次确定每个参数的最优值,基于迭代后的最高准确率和召回率评价指标确定决策树的最佳参数组合;
步骤iii:基于最佳模型参数组合,使用测试集数据对决策树模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤ii。
5.根据权利要求4所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:搜准确率的计算公式为:
Figure FDA0002684789170000011
召回率计算公式为:
Figure FDA0002684789170000021
其中,TP表示真实结果为A,预测结果也是A的数量,FN表示真实结果为A,预测结果不是A的数量;TN表示真实结果不是A,预测结果也不是A的数量,FN表示真实结果不是A,预测结果是A的数量。
6.根据权利要求1所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:步骤C中基于随机森林搭建深度学习模型,训练方法包括以下步骤:
步骤I:调用随机森林模型,配置参数n_estimators、max_features、max_depth、max_features、min_samples_leaf、min_samples_split、max_depth的序列值列表;
步骤II:将风险标签数据的训练集输入随机森林模型,基于序列值列表依次更新参数n_estimators、max_features、max_depth、max_features、min_samples_leaf、min_samples_split、max_depth;基于最高准确率和召回率评价指标确定随机森林的最佳参数组合;
步骤III:基于最佳模型参数组合,使用测试集数据对随机森林模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤II。
7.根据权利要求1所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:步骤C中基于SVM搭建深度学习模型,训练方法包括以下步骤:
步骤a:调用SVM模型,初始化模型参数gamma和惩罚系数C的序列值列表;
步骤b:将风险标签数据的训练集输入SVM模型进行训练,基于序列值列表依次更新参数,以准确率最优时对应的参数作为该参数的最优值,按照该方法依次确定各参数的最优值,最终基于最高准确率确定SVM模型的最佳参数组合;
步骤c:基于最佳模型参数组合,使用测试集数据对SVM模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤b。
8.根据权利要求1所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:步骤C中基于神经网络搭建深度学习模型,训练方法包括以下步骤:
步骤1:搭建包括输入层、隐藏层1、隐藏层2、输出层的神经网络,初始化隐藏层1、隐藏层2和输出层的权重参数w1、w2、w3,偏重参数b1、b2、b3,激活函数学习率η、损失函数、优化器函数;
步骤2:将风险标签数据的训练集输入神经网络模型进行训练,计算每轮训练后的模型分类准确率和损失,对损失函数求梯度,根据梯度、初始设定学习率对权重参数w、偏重参数b进行迭代更新,模型损失小于0.1,且模型准确率大于90%时,结束训练;
步骤3:通过学习率序列列表循环带入模型,基于模型准确率、模型损失率收敛得到最佳学习率;
步骤4:基于最佳模型参数组合,使用测试集数据对神经网络模型进行测试,并将输出结果与步骤B中标定的风险等级进行比对;如果正确率≥90%,则将该最佳参数组合对应的决策树作为水污染报警等级识别模型输出,否则返回步骤2。
9.根据权利要求8所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:所述神经网络的计算公式为:
h1=(w1·Xinput)+b1
h2=(w2·Xh1)+b2
Youtput=σ((w3·Xh2)+b3)
其中,h1为该神经网络的隐藏层1输出,h2为该神经网络的隐藏层2输出,Youtput为输出层的输出数据,即水污染报警等级;Xinput表示输入层数据;σ表示激活函数,本实施例采用relu激活函数,Xh1和Xh2分别表示隐藏层1和隐藏层2的输入数据。
10.根据权利要求9所述的一种基于人工智能的水污染报警等级识别方法,其特征在于:神经网络的权重和偏重的更新方法为:
Figure FDA0002684789170000031
Figure FDA0002684789170000032
其中,wold、bold为更新前的权重和偏重,wnew、bnew为更新后的权重和偏重。
CN202010973023.6A 2020-09-16 2020-09-16 一种基于人工智能的水污染报警等级识别方法 Pending CN112101789A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010973023.6A CN112101789A (zh) 2020-09-16 2020-09-16 一种基于人工智能的水污染报警等级识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010973023.6A CN112101789A (zh) 2020-09-16 2020-09-16 一种基于人工智能的水污染报警等级识别方法

Publications (1)

Publication Number Publication Date
CN112101789A true CN112101789A (zh) 2020-12-18

Family

ID=73759192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010973023.6A Pending CN112101789A (zh) 2020-09-16 2020-09-16 一种基于人工智能的水污染报警等级识别方法

Country Status (1)

Country Link
CN (1) CN112101789A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408205A (zh) * 2021-06-22 2021-09-17 平安国际智慧城市科技股份有限公司 环境污染分级方法、装置、设备及存储介质
CN113469858A (zh) * 2021-07-23 2021-10-01 中国葛洲坝集团生态环境工程有限公司 一种用于流域治理的wer系统集成方法
CN114878772A (zh) * 2022-06-07 2022-08-09 中国水利水电科学研究院 一种应用于污水处理的检测预警监测系统
CN115545678A (zh) * 2022-11-29 2022-12-30 浙江贵仁信息科技股份有限公司 一种基于水环境画像与污染物溯源的水质监测方法
CN116522086A (zh) * 2023-04-25 2023-08-01 中国长江三峡集团有限公司 一种基于变分自编码器的数据恢复和水质检测方法、装置
CN117171661A (zh) * 2023-11-03 2023-12-05 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统
CN117171583A (zh) * 2023-09-04 2023-12-05 生态环境部南京环境科学研究所 一种基于人工智能神经网络的水质生物毒性预测方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101825622A (zh) * 2010-04-02 2010-09-08 浙江浙大中控信息技术有限公司 一种水质预测方法和装置
CN103942461A (zh) * 2014-05-14 2014-07-23 浙江师范大学 基于在线贯序极限学习机的水质参数预测方法
CN106198909A (zh) * 2016-06-30 2016-12-07 中南大学 一种基于深度学习的水产养殖水质预测方法
CN106874960A (zh) * 2017-03-03 2017-06-20 中国水产科学研究院黄海水产研究所 基于改进支持向量机的渔业环境污染等级评估方法
CN106991437A (zh) * 2017-03-20 2017-07-28 浙江工商大学 基于随机森林预测污水水质数据的方法及系统
CN107132266A (zh) * 2017-06-21 2017-09-05 佛山科学技术学院 一种基于随机森林的水质分类方法及系统
CN107688871A (zh) * 2017-08-18 2018-02-13 中国农业大学 一种水质预测方法和装置
CN108846512A (zh) * 2018-06-05 2018-11-20 南京邮电大学 基于择优分类的水质预测方法
CN109740804A (zh) * 2018-12-24 2019-05-10 成都四方伟业软件股份有限公司 水体质量预测方法、终端设备及计算机可读存储介质
CN110598726A (zh) * 2019-07-16 2019-12-20 广东工业大学 一种基于随机森林的输电杆塔鸟害风险预测方法
CN110751176A (zh) * 2019-09-16 2020-02-04 中国水利水电科学研究院 一种基于决策树算法的湖泊水质预测方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101825622A (zh) * 2010-04-02 2010-09-08 浙江浙大中控信息技术有限公司 一种水质预测方法和装置
CN103942461A (zh) * 2014-05-14 2014-07-23 浙江师范大学 基于在线贯序极限学习机的水质参数预测方法
CN106198909A (zh) * 2016-06-30 2016-12-07 中南大学 一种基于深度学习的水产养殖水质预测方法
CN106874960A (zh) * 2017-03-03 2017-06-20 中国水产科学研究院黄海水产研究所 基于改进支持向量机的渔业环境污染等级评估方法
CN106991437A (zh) * 2017-03-20 2017-07-28 浙江工商大学 基于随机森林预测污水水质数据的方法及系统
CN107132266A (zh) * 2017-06-21 2017-09-05 佛山科学技术学院 一种基于随机森林的水质分类方法及系统
CN107688871A (zh) * 2017-08-18 2018-02-13 中国农业大学 一种水质预测方法和装置
CN108846512A (zh) * 2018-06-05 2018-11-20 南京邮电大学 基于择优分类的水质预测方法
CN109740804A (zh) * 2018-12-24 2019-05-10 成都四方伟业软件股份有限公司 水体质量预测方法、终端设备及计算机可读存储介质
CN110598726A (zh) * 2019-07-16 2019-12-20 广东工业大学 一种基于随机森林的输电杆塔鸟害风险预测方法
CN110751176A (zh) * 2019-09-16 2020-02-04 中国水利水电科学研究院 一种基于决策树算法的湖泊水质预测方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408205A (zh) * 2021-06-22 2021-09-17 平安国际智慧城市科技股份有限公司 环境污染分级方法、装置、设备及存储介质
CN113408205B (zh) * 2021-06-22 2022-05-27 平安国际智慧城市科技股份有限公司 环境污染分级方法、装置、设备及存储介质
CN113469858A (zh) * 2021-07-23 2021-10-01 中国葛洲坝集团生态环境工程有限公司 一种用于流域治理的wer系统集成方法
CN114878772A (zh) * 2022-06-07 2022-08-09 中国水利水电科学研究院 一种应用于污水处理的检测预警监测系统
CN114878772B (zh) * 2022-06-07 2023-02-21 中国水利水电科学研究院 一种应用于污水处理的检测预警监测系统
CN115545678A (zh) * 2022-11-29 2022-12-30 浙江贵仁信息科技股份有限公司 一种基于水环境画像与污染物溯源的水质监测方法
CN116522086A (zh) * 2023-04-25 2023-08-01 中国长江三峡集团有限公司 一种基于变分自编码器的数据恢复和水质检测方法、装置
CN117171583A (zh) * 2023-09-04 2023-12-05 生态环境部南京环境科学研究所 一种基于人工智能神经网络的水质生物毒性预测方法
CN117171661A (zh) * 2023-11-03 2023-12-05 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统
CN117171661B (zh) * 2023-11-03 2024-01-26 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统

Similar Documents

Publication Publication Date Title
CN112101789A (zh) 一种基于人工智能的水污染报警等级识别方法
CN106572493B (zh) Lte网络中的异常值检测方法及系统
CN111222290B (zh) 一种基于多参数特征融合的大型设备剩余使用寿命预测方法
CN108805202B (zh) 一种用于电解槽故障预警的机器学习方法及其应用
CN112132333B (zh) 一种基于深度学习的短期水质水量预测方法及系统
CN111105332A (zh) 一种基于人工神经网络的高速公路智能预养护方法及系统
Zhang et al. Objective attributes weights determining based on shannon information entropy in hesitant fuzzy multiple attribute decision making
CN108470022B (zh) 一种基于运维管理的智能工单质检方法
CN115577018B (zh) 一种水质监测数据的智能处理方法及系统
CN111639497A (zh) 一种基于大数据机器学习的异常行为发现方法
CN111914492B (zh) 一种基于进化优化的半监督学习工业过程软测量建模方法
CN116579768B (zh) 一种发电厂在线仪表运维管理方法及系统
CN111126865B (zh) 一种基于科技大数据的技术成熟度判断方法和系统
CN110851422A (zh) 一种基于机器学习的数据异常监测模型构建方法
CN111191855B (zh) 一种基于管网多元水质时序数据的水质异常事件识别预警方法
CN116468536A (zh) 一种自动化风险控制规则生成的方法
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN108563201B (zh) 一种dmaic驱动的小批量零件加工工艺过程质量改进方法
CN114819178A (zh) 一种铁路施工进度指标预测和在线更新方法
CN113295635A (zh) 一种基于动态更新数据集的水质污染报警方法
CN112949680A (zh) 一种基于对应分析和多元线性回归的污染源识别方法
CN117170221A (zh) 一种污水处理的人工智能控制系统
CN112241808A (zh) 路面技术状况预测方法、装置、电子设备及存储介质
CN109635008B (zh) 一种基于机器学习的设备故障检测方法
CN111401444A (zh) 红酒原产地的预测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination