CN111291937A - 基于支持向量分类与gru神经网络联合的处理污水水质预测方法 - Google Patents

基于支持向量分类与gru神经网络联合的处理污水水质预测方法 Download PDF

Info

Publication number
CN111291937A
CN111291937A CN202010117184.5A CN202010117184A CN111291937A CN 111291937 A CN111291937 A CN 111291937A CN 202010117184 A CN202010117184 A CN 202010117184A CN 111291937 A CN111291937 A CN 111291937A
Authority
CN
China
Prior art keywords
data
model
sewage
quality
gru
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010117184.5A
Other languages
English (en)
Inventor
王晓峰
周建
邹乐
黄前静
邓锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University
Original Assignee
Hefei University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University filed Critical Hefei University
Priority to CN202010117184.5A priority Critical patent/CN111291937A/zh
Publication of CN111291937A publication Critical patent/CN111291937A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Activated Sludge Processes (AREA)
  • Feedback Control In General (AREA)

Abstract

基于支持向量分类与GRU神经网络联合的处理污水水质预测方法,属于污水处理技术领域。对采集到的污水历史数据进行缺失值处理、异常值剔除和数据标准化,采用PCA主元分析法对数据降维,选取的辅助变量将作为污水水质预测模型的输入变量;采用适合处理时序数据的GRU神经网络建立了污水出水关键预测模型,先引入支持向量机模型对污水水质数据进行分类,再让分类后的数据分别通过一个前述的GRU神经网络算法分别建模预测出水水质。在SVM模型训练时使用网格搜索法及交叉验证法对模型参数进行寻优,得到的联合预测模型的预测精度更准确,模型效果更好,网络性能能够满足实际应用需要,可以实现对污水处理系统出水水质的精准预测。

Description

基于支持向量分类与GRU神经网络联合的处理污水水质预测 方法
技术领域
本发明属于污水处理技术领域,具体是涉及一种基于支持向量分类与GRU神经网络联合的处理污水水质预测方法。
背景技术
当前我国的污染问题日益严重,污水处理越来越受到重视,作为保护水资源的有效措施,污水处理过程因为其强耦合、高度非线性的特性,污水出水水质的准确检测一直是个难题,对于一些出水关键水质参数的测量,现存的测量方法或测量仪器存在诸多局限性与不便,如检测周期长、仪器价格昂贵、操作繁琐等问题。
软测量技术因为其具有时效性好、高精度和低成本的优点,近年来被不少专家学者应用在污水处理水质监测方面,并取得不错的效果。人工神经网络是一种具有优良逼近能力的模型,在污水处理水质软测量建模中被广泛应用。本发明以出水COD与出水氨氮作为预测指标,采用门控循环单元(GRU)神经网络建立污水出水水质预测模型,以期将其应用到实际污水处理生产环境中。同时,建立支持向量机与GRU神经网络相结合的SVM-GRU水质预测模型。针对神经网络模型在训练过程中容易陷入局部最优,难以达到全局最优的问题,引入支持向量机分类模型,使神经网络在学习待测参数数值时的变化在控制一定的范围中,进而降低局部最优对全局范围的影响,达到提高预测效果的目的。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提出了一种基于支持向量分类与GRU神经网络联合的处理污水水质预测方法,引入支持向量分类模型先对污水数据进行分类,使神经网络在学习目标参数时的数值的变化在一定的范围内,从而缓解局部最优对全局范围的影响,达到提高GRU神经网络预测精度和稳定性的目的。
为解决本发明的技术问题,所采用的技术方案为:一种基于支持向量分类与GRU神经网络联合的处理污水水质预测方法,步骤如下:
①、污水处理关键水质参数预测模型主导变量以及辅助变量的选择
以出水COD和出水氨氮为主导变量,初步选定辅助变量,然后对采集到的污水历史数据进行缺失值处理、异常值剔除和数据标准化,同时消除数据量纲以及数量级不同带来的影响;进一步采用PCA主元分析法对数据降维,最终确定以出水COD与出水氨氮为主导变量时,所选取的辅助变量将作为污水水质预测模型的输入变量;
②、基于GRU神经网络的水质预测模型的建立以及对污水处理水质的预测
采用适合处理时序数据的GRU神经网络建立了污水出水关键预测模型,并对模型效果进行验证;在GRU模型的构建过程中,经过了数据预处理、数据集的构建、时间序列长度的选择、模型结构的确定、选择Adam优化算法后,设置了模型的初始学习率与迭代次数,对实验数据进行训练,并使用交叉验证法对模型预测效果进行了验证;
③、基于SVM与GRU神经网络联合的水质预测模型的建立以及对污水处理水质的预测
首先引入支持向量机模型对污水水质数据进行分类,再让分类后的数据分别通过一个步骤②所述的GRU神经网络算法分别建模预测出水水质。
本发明的有益效果表现在:
1)、针对待预测的出水COD和出水氨氮,选择合理的辅助变量。首先,初步选择若干与目标参数相关度较高的过程变量作为辅助变量;最后,利用PCA主元分析法,以降维的方式消除数据噪声冗余,简化原始数据的复杂度,得到最终确定的辅助变量参数。
2)、建立基于GRU神经网络的水质预测模型。以合肥市庐江县某污水处理厂的实际历史污水数据作为实验数据,以选取的与待测水质指标密切相关的污水指标作为辅助变量,建立以出水COD与出水氨氮为主导变量的GRU神经网络预测模型,并采用自适应学习率法对网络学习率进行寻优,最后将模型预测得到的结果与真实值对比,预测结果可靠且误差在可接受的范围内,证实了GRU神经网络训练的有效性。
3)、建立支持向量机与GRU神经网络相结合的SVM-GRU水质预测模型。针对神经网络模型在训练过程中容易陷入局部最优,难以达到全局最优的问题,引入支持向量机分类模型,使神经网络在学习待测参数数值时的变化在控制一定的范围中,进而降低局部最优对全局范围的影响,达到提高预测效果的目的。在SVM模型训练时使用网格搜索法及交叉验证法对模型参数进行寻优,最终得到的SVM-GRU联合预测模型预测精度更准确,模型效果更好,网络性能能够满足实际应用需要,可以实现对污水处理系统出水水质的精准预测。
附图说明
以下结合实施例和附图对本发明作出进一步的详述。
图1是实验数据出水COD的数据分布图。
图2是实验数据出水氨氮的数据分布图。
图3是时间序列长度测试图。
图4是GRU模型结构图。
图5是GRU模型预测出水COD数据与真实数据对比曲线图。
图6是GRU模型预测出水氨氮数据与真实数据对比曲线图。
图7是SVM-GRU水质预测联合模型结构图。
图8是SVM-GRU联合预测出水COD数据与真实数据对比曲线图。
图9是SVM-GRU联合预测出水氨氮数据与真实数据对比曲线图。
具体实施方式
本发明的一种基于支持向量分类与GRU神经网络联合的处理污水水质预测方法,具体由以下三部分构成,具体为:
第一部分、污水处理关键水质参数预测模型辅助变量的选取
1.1、污水水质预测模型主导变量的选择
通过对活性污泥工艺流程的基本了解,可知污水处理系统高度复杂的系统,其中包含大量的反应参数。对于工艺中水质参数的准确测量有利于对于污水的有效防治,也让出水水质可以符合国家规定的排放标准,不对环境造成二次污染。
对于较难的参数,仅仅只靠仪器仪表等较简单的硬件设备很难实现准确科学的测量,因此软测量技术在污水处理工艺上对于重要参数测定是很重要的。目前,软测量技术在国外实际的运用已经很多,特别是在过程工业领域下,但是在污水处理领域的运用还不是很广泛,还需要进一步深入研究。
若将软测量技术应用在污水处理过程中的参数预测的过程中,将实现对于比较难进行测量及测定的部分重要参数的实时监测,能极大程度的提高了污水处理厂的运行效率,也能降低运行成本,达到大幅度减少污水处理工艺技术上的投资。将软测量技术应用到实际工程的最基础和关键的步骤是如何根据测量的水质参数搭建一个准确且稳定的软测量模型。
在对污水处理后的水质进行评价时,一般选用出水的化学需氧量、生物需氧量、氨氮等指标。这些指标都不容易直接检测,且是重要水质参数,一般作为软测量模型的主导变量,即模型的输出变量。其中化学需氧量COD(Chemical Oxygen Demand)是反映水中可降解的有机物的含量的参数,是水质评价的关键指标之一,COD的准确检测对后续污水处理系统的优化控制具有重要意义;氨氮是判定水体的污染程度和营养元素浓度的重要指标,大量含氮的营养物质会导致水体中的微生物和藻类大量生长和繁殖,导致水中溶解氧含量大量下降,致使很多生物及鱼类缺氧死亡,是通常用来衡量地表水和污水的污染程度的参数。因此本发明选用出水COD和出水氨氮作为主导变量,用来验证本发明方法的可行性和有效性。
1.2、污水水质预测模型辅助变量的初选
软测量技术的原理就是选取在工业现场较易测量的参数作为神经网络的输入,通过非线性函数建立与较难测量的参数的关系,这样就可以利用这些较易实时测量的变量对较难测量的量进行预测。所以,选取与目标参数相关性强的辅助变量是建立污水水质预测模型的关键步骤。
辅助变量的选取一般要遵循以下几点:(1)建立模型时,要拥有很强的泛化能力;(2)在污水处理过程中对于辅助变量的选择一定是比较容易测量的。一般在污水处理过程中,有进水瞬时流量、pH、水温、MLSS、DO以及氨氮浓度等这些辅助变量。(3)辅助变量的选择还须和选取的目标参数有一定的相关性。在污水处理过程中,对于提取相关变量的数量也是一个关键问题,因为如果提取数量过多,会使数据维数变大,从而产生多余的数据,也会导致数据计算量过大,进而影响系统的效率,使其效率降低。如果提取数量过少,会使一些关键数据丢失,丢失了系统的准确性,以及很难进行预测,导致结果不准确。因此对于辅助变量的选取是建立污水水质预测模型的关键步骤。
Activated Sludge Model(ASM)系列模型曾在活性污泥处理工艺的过程仿真和模型研究中被广泛应用。通过ASM系列模型研究描述的活性污泥法工艺中出水COD与出水氨氮的过程机理,并结合上述辅助变量的选择条件,初步选定污水水质预测模型的辅助变量为:粗格栅栅前液位,提升泵液位,进水pH值,进水瞬时流量,进水累计流量,曝气池溶解氧浓度DO,水温T,曝气池混合悬浮固体浓度MLSS,曝气池氧化还原电位ORP,进水氨氮,进水COD等参数,进一步采用PCA主元分析法通过数据降维方法分析并选择与出水COD与出水氨氮预测相关程度大的变量。
1.3、水质预测模型辅助变量的确定
1.3.1、水质数据采集与预处理
在初步确定污水水质预测模型的辅助变量后,即对污水数据进行采集,本实施例所使用的实验数据来源于合肥市庐江县某污水处理厂2017年1月1日至1月18日的污水指标数据,数据按每分钟进行采集,共计25920组数据。选取的主导变量——出水COD和出水氨氮的数据分布图分别如图1和图2所示。
水质指标数据如下表1所示:
表1水质指标统计
水质指标
粗格栅栅前液位
提升泵液位
进水pH
氧化沟北DO
氧化沟北MLSS
氧化沟北ORP
氧化沟南DO
氧化沟南MLSS
氧化沟南ORP
进水瞬时流量
进水COD
进水氨氮
进水累计流量
数据采集是需要采集设备连续地正常运行,由于检测器异常、天气异常、停电或其他故障等随机因素都会对所要采集的数据产生影响,因此采集到的数据难免会存在异常值以及缺失值,所以在最终确定污水水质预测模型的辅助变量前要对数据进行预处理,包括缺失值处理,异常数据剔除以及数据归一化。
(1)缺失值处理
对于数据收集不完整的数据组,由于这些丢失的数据可能包含重要的架构信息,不能给预测模型提供足够的特征,从而导致预测模型不稳定或预测结果不可靠。因此,必须先对缺失值进行填充。
通过对数据周期和时序特征的分析,针对污水时间序列数据缺失的情况,采用加权均值法对其进行填充。
获取当前时刻之前的n个时刻的污水特性的平均值:
Figure BDA0002391851120000051
获取前m天当前时刻的污水特性的平均值:
Figure BDA0002391851120000052
对缺失值填充为:
fk(t)=αf1(t)+(1-α)f2(t) (2-3)
式(2-3)中,fk(t)表示第k天t时刻的污水特征数据,α是加权系数,通常取0.5-1之间的数。这种方法不仅考虑了数据的周期性,而且在处理缺失值数据时,还考虑到了数据在上一个历史时刻的时间安排所产生的影响。
(2)异常值剔除
为了减少数据噪声,一般会对异常数据进行剔除,本实施例采用3σ准则(即拉依达准则),剔除从污水处理厂采集到的冗余及错误的原始数据。主要是先处理随机误差,在预处理过程中,对随机误差进行处理,然后根据公式(2-4)得出标准偏差,然后通过概率得到一个变化的区间,把超出此区间的数据定为粗大误差,最后将其误差的数据进行删除。
设有n个样本数据为x1,x2,…,xn,其平均值为
Figure BDA0002391851120000061
偏差为
Figure BDA0002391851120000062
标准差计算公式如式2-4所示:
Figure BDA0002391851120000063
样本数据xi的偏差vi(1≤i≤n)能通过式(2-5)来表达,即:
|vi|>3σ (2-5)
如果满足上式,就把xi当作是包含较大误差的异常数据,并将其剔除。
(3)数据标准化
由于数据的多样性以及复杂性,不同类型之间也会进行相互影响,从而去影响系统的预测结果,因此,需要将从污水处理厂采集的数据进行标准化处理,如式2-6所示:
Figure BDA0002391851120000064
式中,x*xmin,xmax分别表示每一维输入数据xi归一化后的值、最大值和最小值。数据经过标准化处理之后,这样就把范围全部缩小在[0,1]区间内,可以去除数据数量大以及测量范围大的影响。在进行训练得到结果之后,最后还需将数据进行还原,即反归一化操作,公式如下:
x′=xmin+x*(xmax-xmin) (2-7)
x′即为预测模型的预测输出值。
1.3.2、辅助变量的降维选择
根据对活性污泥法污水处理过程模型与机理分析,以及污水指标历史数据的采集,经过上一部分缺失值填充、异常数据剔除和数据归一化之后,采集的13个过程变量之间仍然存在严重的相互关联和影响。
为了进一步简化模型的输入,提高建立预测模型的效率。本实施例采用主元分析法(PCA)来消除变量问的相关性,去除噪声和冗余,简化原始过程数据特性分析的复杂度。该方法的优点是计算简单,且没有参数限制,方便地应用于各种场合且应用极其广泛。
主元分析法PCA可以解决辅助变量的选择问题,其原理是通过输入一个矩阵,此矩阵可以直接使用之前输入的矩阵,构造一个包含之前所有信息的矩阵,对于新构造的矩阵的维数要比之前的低,计算步骤如下所示:
n维空间中有m个样本点,xi=[xi1,xi2,...,xin]T(i=1,2,...,n)构成数据矩阵X=[x1,x2,...,xm],数据矩阵的均值为:
Figure BDA0002391851120000071
同时要对X进行零均值化处理,得到矩阵A为:
A=[x1-μ,x2-μ,...,xm-μ] (2-9)
令X的协方差矩阵为C:
Figure BDA0002391851120000072
对C的特征值进行计算,并对结果进行一定的顺序排序,则为λ1,λ2,...,λn,与每个特征值相对应的特征向量矩阵为V=[v1,v2,...,vn],则有:
(VTA)(VTA)T=0 (2-11)
A的第i个主元方向投影得到向量pi为:
Figure BDA0002391851120000073
在前s(s<n)个方向上投影后的得到ρ:
Figure BDA0002391851120000074
若ρ接近于1,则表示实现了数据的降维。
通过上述步骤可实现对辅助变量的降维,进而简化计算并提高预测模型的计算效率。将初步选取的进水COD,进水氨氮,进水累计流量,粗格栅栅前液位,提升泵液位,进水pH,氧化沟北DO,氧化沟北MLSS,氧化沟北ORP,氧化沟南DO,氧化沟南MLSS,氧化沟南ORP,进水瞬时流量作为主元分析的输入变量。
①以出水氨氮作为主导变量时,辅助变量的确定
按照主成分分析算法的步骤对其进行降维处理,处理之后按照贡献率从大到小前七个主成分分别为:进水氨氮、进水累计流量、进水COD、进水瞬时流量、进水pH、氧化沟北DO浓度、氧化沟北ORP,贡献率依次为:0.1971,0.1635,0.1475,0.1282,0.0853,0.0709,0.0679,累计贡献率为0.8604。
当累计贡献率大于0.85时,可以选择该前七个主成分代表原变量的信息,数据由原来的13维降到7维。最终确定当以出水氨氮作为主导变量时,辅助变量分别为:进水氨氮、进水累计流量、进水COD、进水瞬时流量、进水pH、氧化沟北DO浓度、氧化沟北ORP。
②以出水COD作为主导变量时,辅助变量的确定
按照主成分分析算法的步骤对其进行降维处理,处理之后按照贡献率从大到小前七个主成分分别为:进水COD、进水氨氮、进水累计流量、进水瞬时流量、氧化沟北DO、进水pH、氧化沟北ORP,贡献率依次为:0.2132,0.1564,0.1533,0.1326,0.0901,0.0693,0.0588,累计贡献率为0.8737。
当累计贡献率大于0.85时,可以选择该前七个主成分代表原变量的信息,数据由原来的13维降到7维。最终确定当以出水COD作为主导变量时,辅助变量分别为:进水COD、进水氨氮、进水累计流量、进水瞬时流量、氧化沟北DO、进水pH、氧化沟北ORP。
由上可知,第一部分描述了污水处理关键水质参数预测模型辅助变量选择的方法。首先,以出水COD和出水氨氮为主导变量,初步选定了13个相关的辅助变量,然后对采集到的污水历史数据进行缺失值处理、异常值剔除和数据标准化,消除数据量纲以及数量级不同带来的影响;进一步采用主元分析法对数据降维,经过处理将变量由13维降为7维,减少了输入数据的维度,提高了模型的计算效率。最终确定以出水COD与出水氨氮为主导变量时,所选取的辅助变量将作为污水水质预测模型的输入变量。
第二部分基于GRU神经网络的水质预测模型的建立
本部分主要针对活性污泥工艺污水处理系统,为成功实现对污水出水关键水质的有效预测,选取GRU神经网络,并使用自适应学习率法对其进行改进,建立污水水质预测模型。首先以合肥市庐江县某污水处理厂的实际历史污水数据作为实验数据,以前文选取的七项与待测水质指标密切相关的污水指标作为辅助变量,建立以出水COD与出水氨氮为主导变量的预测模型,并对得到的预测结果进行分析。
2.1、基于GRU的污水水质时序预测模型的构建
2.1.1、数据集的构建
经过上述的数据前处理筛选出基于正常状态下的污水历史数据。数据经由传感器经过分钟级采集得到样本,对数据样本采用滑动窗口技术进行划分,构建特征集和标签集,再从样本数据中划分出训练数据和测试数据,针对待预测的出水COD和出水氨氮,构建包含所需辅助变量的多变量时间序列数据集。
训练时,由于本实施例选择了7组辅助变量,所以输入为(M,n,7)的三维向量,输出为一维向量。输入集的三个维度分别代表样本的个数,时间序列长度,样本的特征维度。
时间序列的长度在预测中是一个关键参数,也是GRU模型的中的重要参数。在本实施例中,时间序列长度表示要用多少过去的时间数据进行未来的数值的预测。该参数在一定程度上反映了历史信息对于预测结果的影响。该参数过小,会导致信息不足,预测准确度不高。该参数过大会导致信息冗余,计算量增加,模型收敛速度慢等问题。因此,本实施例针对不同的时间序列长度对模型进行了预测精度的测试。结果绘制成图3所示。
从图3中可以看出,随着时间序列长度的增加,均方根误差在一定范围内降到最低,预测精度达到最优,这说明了历史信息确实对未来数据的预测是有帮助的,也证明了GRU模型对于时序数据有很好的记忆效果。但是,随着时间序列长度的增加,模型的误差逐渐提高,预测精度反而下降了,这个现象表明随着时间序列长度的增加,导致了模型的参数增多,增加了模型训练的难度,提高了模型的复杂度。从另一角度来看,由于增加的时间序列长度必然会在数据划分时加大时间窗口的长度,导致训练的数据样本减少,一旦样本数减少,模型复杂度增加,就会使得模型发生过拟合现象,必然造成模型预测精度的下降。综合以上分析,选取时间序列长度为17。数据是经过间隔1分钟采样处理,因此模型实际上是利用了历史17分钟的数据信息对未来数值进行预测。
2.1.2、模型结构的确立
在搭建网络的过程中,重点环节是网络的层数和神经元节点的个数的确定。
2.1.2.1、GRU神经网络层数的确定
GRU层的作用是选择重要的信息进行记忆,同时遗忘不重要的信息。通过增加其网络层数可以提高模型的精度,但是也会增加模型的复杂度,导致模型训练时间长,拟合过度,模型泛化能力变弱,且模型预测精度也不会有明显提升。因此本实施例将其GRU层设置为一层。
dense层的目的,是将前面提取的特征,在dense层经过非线性变化,提取这些特征之间的关联,最后映射到输出空间上。原则上,一层dense层已足够。本实施例将dense层也设置为一层,并采用sigmoid函数作为其激活函数。
由此,本实施例的GRU模型结构由输入层、一个GRU层、一个dense层(全连接层)和输出层组成,结构简图如图4所示。
2.1.2.2、隐含层神经元数的确定
神经元数量的选取也影响着模型的精度,参数设置过小,模型的拟合能力较差;参数设置过大,模型的训练复杂度会变高,预测误差也会偏高。
为了确定GRU层的神经元数目,预设神经元数量为10、15、20、25、30、35、40对数据进行训练,并比较模型效果。本实施例选取的误差评价指标为均方根误差(RMSE)与均方根误差(MAE)。如公式3-15和3-15所示:
Figure BDA0002391851120000101
Figure BDA0002391851120000102
采用交叉验证法(cross-validation)对不同隐含神经元数量的GRU水质预测模型进行验证,本实施例使用10折交叉验证法,具体方法是将25920组污水历史数据随机划分为等量的10份,即每份数据含有2590组实验数据,在每次实验中,每次选用9份数据作为模型的输入数据集,即每次采用23328组数据对模型进行训练,剩下的1份数据即2592作为测试数据集对训练好的GRU模型进行测试,可以保证模型验证时的测试数据对训练好GRU模型是陌生的,以此验证模型的泛化能力。
重复此过程十次,每次采用不同的1份数据集作为实验的测试数据集,通过多次实验验证模型效果,根据数据的随机性,使模型的效果更稳定,对十次实验的结果MAE和RMSE求平均,不同神经元数量下GRU模型的预测效果如表2所示。
表2隐层不同神经元数量下GRU模型预测性能比较
Figure BDA0002391851120000103
Figure BDA0002391851120000111
由表2可知,当GRU层的神经元数量设为35时,模型性能最好,因此本实施例将GRU神经层的神经元数量设为35。
2.1.3、GRU网络的学习率优化算法
在神经网络的训练过程中,网络学习率是一个重要的参数,学习率的大小能够决定其他参数的更新程度。学习率的设置不能过大也不可过小,若学习率设置过大,会导致网络参数的梯度更新过快,但很难达到模型效果最优的参数值;如果学习率设置过小,则会使网络模型参数更新过慢,增大模型训练的时间复杂度,虽最终会达到最优值,但耗费大量时间,导致降低模型预测效率。所以网络学习率的设置是模型建立的重要步骤。
由于神经网络发展历史不长,现在对网络学习率的设置还没有规范的理论,但有研究学者设计实现了一种自适应的学习率调整方法,即在模型训练初期,将学习率设定为一个较大的值,便于使其快速逼近最优的取值范围,当训练次数逐渐增加后,网络学习率会逐渐变小,慢慢拟合到最优的模型参数。
Adam自适应学习率法就是一种这样的学习率自我调整方法,在本实施例建立的GRU神经网络预测水质的模型中,使用Adam法对网络学习率进行优化,Adam算法对学习率的优化方式为,使用梯度的一阶矩估计和二阶矩估计动态地优化每个参数的学习率。Adam算法经过多次的偏置优化后,网络学习率会落在一定范围内,使得参数的变化较平稳。
Adam优化法的优势包括:能处理非平稳与稀疏梯度数据;对于不同的参数,可以同时计算不同的自适应学习率;能够处理大规模高纬度的数据。已成为目前深度学习领域广泛应用的学习率优化算法。
2.2、实验结果与分析
本实施例采用GRU神经网络,建立污水关键水质预测模型,实验数据来源于合肥市庐江县某污水处理厂2017年1月1日至1月18日的污水指标数据,数据按每分钟进行采集,共计25920组数据。
在完成数据预处理、特征变量选取、数据集构建、时序长度确定、GRU模型结构的确定流程后,设定网络迭代次数为2000次,并设定Adam优化算法的学习率初始值为0.001,对GRU水质预测模型进行训练,并使用十折交叉验证法对模型的预测结果进行验证,模型效果评价指标采用RMSE与MAE。
当污水水质预测模型的主导变量为出水COD时,模型预测效果如图5所示,纵坐标为标准化后的数值,均方根误差RMSE为0.6043,平均绝对误差MAE为0.4155。
当污水水质预测模型的主导变量为出水氨氮时,模型预测效果如图6所示,均方根误差RMSE为0.6484,平均绝对误差MAE为0.4315。
表3GRU模型预测出水水质参数效果
出水指标 RMSE MAE 迭代次数
出水COD 0.6043 0.4155 2000
出水氨氮 0.6484 0.4315 2000
通过图5,图6,表3可以看出本实施例建立的GRU神经网络在数据的拟合与预测上有着不错的效果,能够较为可靠的预测出水COD与出水氨氮的值,经过比较预测值和实际值曲线变化相近,且误差在可接受范围内。本实施例建立基于GRU神经网络预测污水出水水质的模型是可行的。
由上可知,本实施例基于时间序列的污水数据,采用适合处理时序数据的GRU神经网络建立了污水出水关键预测模型,并对模型效果进行验证。在GRU模型的构建过程中,经过了数据预处理、数据集的构建、时间序列长度的选择、模型结构的确定、选择Adam优化算法后,设置了模型的初始学习率与迭代次数,对实验数据进行训练,并使用交叉验证法对模型预测效果进行了验证。
通过对实验结果的分析,本实施例建立的GRU模型在预测出水COD与出水氨氮的均方根误差RMSE分别达到0.6043和0.6484,平均绝对误差MAE分别达到0.4155和0.4315。模型在数据的拟合与预测上有着不错的效果,能够较为可靠的预测出水COD与出水氨氮的值,经过比较预测值和实际值曲线变化趋势相近,且误差在可接受范围内。
第三部分基于SVM与GRU网络联合的水质预测模型的研究
第二部分建立了基于GRU神经网络预测污水处理水质参数的模型,在预测结果上取得了一定的效果,但与精密的测量仪器相比仍未达到突出的优良效果。
理论上,单一的神经网络模型在训练过程中存在容易出现局部最优现象,难以达到在全局范围内实现最优的问题,为解决这个问题,本部分引入支持向量机模型先对污水数据进行分类,使神经网络在学习目标参数时的数值的变化在一定的范围内,从而缓解局部最优对全局范围的影响,以此达到提高GRU神经网络预测精度和稳定性的目的。
3.1、对联合模型预测污水出水水质的研究
研究发现,神经网络本身具有一定局限,其在网络学习过程中易产生局部现象,难以达到在全局范围内实现最优化。而在实际的污水处理生产中,受天气、环境或其他因素影响,可能会使污水水质数据发生突变,造成时间相近的污水的出水水质出现指标数值相差很大的矛盾数据。若使用单一的GRU神经网络对其这种水质进行建模预测,容易使模型在训练过程中陷入局部最小,影响模型最终的预测效果。
在本实施例中,首先引入支持向量机模型对污水水质数据进行分类,再在分类后的数据集上建立GRU神经网络。引入支持向量分类的目的是为了使GRU模型在学习污水水质数据时的目标参数的变化在一定范围内,从而缓解局部最优对全局范围的影响,以此达到提高GRU神经网络预测精度和稳定性的目的。
本实施例提出的SVM-GRU联合模型的模型结构如图7所示。
选取支持向量机模型对数据分类是有以下几个原因:
(1)支持向量机的理论基础是非线性映射,适合用于处理内部机制复杂的污水处理过程水质数据。
(2)SVM学习问题可以表示为凸优化问题,因此局部最优解一定是全局最优解。
(3)SVM的最优分类平面只由少数几个支持向量决定,计算复杂度低,能够有效避免“维数灾难”。
(4)拥有优秀的泛化能力。
选取支持向量机模型对数据分类的具体方法为:在污水数据进入GRU模型训练之前,选取支持向量机预估计目标水质参数的分类阈值,将污水水质数据分成两大类。根据数据分布,选取出水COD和出水氨氮的平均值作为模型的分类阈值对SVM模型进行训练后对待测试数据进行分类,在分类后的两个子类数据上分别建立GRU神经网络进行训练与预测,对最终预测结果进行评价并与单一的GRU神经网络模型效果对比。
3.2、基于的SVM与GRU的联合模型预测污水水质的研究
3.2.1、基于SVM的水质分类模型的建立
3.2.1.1、分类阈值的设定
由于水质数据预处理和数据集构建方法在第二部分已阐述过,这里不再赘述。在污水历史数据进入SVM分类模型训练之前,需要根据出水COD和出水氨氮的数据分布预设分类阈值,高于这个阈值的数据样本归为一类,低于这个阈值的样本数据归为另一类,这样做的目的是由于支持向量机分类算法属于有监督学习,通过训练数据的特征与标签建立模型,从而对没有标签的数据进行分类,达到对测试数据分类的目的。
本实施例使用平均数作为出水COD和出水氨氮的分类阈值,经过计算,出水COD的阈值为22.4mg/L,出水氨氮的阈值为5.7mg/L。
3.2.1.2、SVM核函数的选取
SVM核函数的选取十分重要,核函数有把原始数据从原始空间向高维特征空间映射的作用。不同核函数的选取可得到不同的非线性决策面,生成不同性能的SVM模型。现在普遍使用的核函数有以下几种:
(1)线性核函数:k(x,xi)=(x,xi);
(2)径向基核函数(RBF):
Figure BDA0002391851120000141
(3)多项式核函数:k(x,xi)=[(x·xi)+1]m,其中m为多项式参数;
(4)Sigmoid核函数:k(x,xi)=tanh[v(x·xi+c)],其中v>0,c<0。
选用径向基核函数作为核函数时,核值范围在(0,1)内,这会使得到的估计数据平滑,这样不仅能够简化运算,还可以得到具有优良泛化能力的支持向量机模型。因此在这里本实施例选择RBF函数作为SVM模型的核函数。
3.2.1.3、SVM模型的参数优化
在SVM模型训练过程中,对模型参数的选取至关重要。RBF核函数中的参数g,能够决定最优分类面与样本空间维数的复杂度。若果g的取值过大,k(x,xi)就接近于0,可能会导致模型过学习,而g的取值过小又会导致欠学习的问题。支持向量机的置信区间由核函数的误差惩罚因子C决定,从而调控误判样本数据的误差范围。如果参数C的取值过大或者过小,都最终会造成SVM模型的分类准确度降低。
所以,若想获得效果优良的SVM分类模型,核函数的惩罚因子C和参数g的选取尤为重要。在这里选用网格搜索法对SVM模型进行参数的寻优。网格搜索法可以同时对多个参数进行优化,同时寻找到使模型效果达到最优时的最佳参数组。
网格搜索法的具体流程是,在一定的正交坐标系中,以核参数g和惩罚因子C分别作为正交坐标系的两个坐标轴,使两个参数在一定的范围内根据给定步长变化,采取交叉验证方法,将数据集随机分成10组,每次取其中1组作为测试数据,其余9组作为训练数据。利用当时的参数C和g进行模型训练,得到10个模型的平均分类精度。连续调整搜索范围和搜索步长,选择交叉验证精度最佳的参数作为最优参数。
3.3、实验结果分析
使用上述方法建立基于SVM的污水水质分类模型,并分别在分类后的子样本数据集上建立GRU神经网络预测出水水质模型,GRU模型的建立方法如第二部分所述。
当待预测水质变量为出水COD时,预设历史数据的出水COD平均数12.8mg/L为支持向量分类模型的分类阈值,将出水COD浓度高于12.8mg/L的数据样本标记为类“0”,将出水COD浓度低于12.8mg/L的数据样本标记为类“1”。通过网格搜索方法将惩罚因子C和核函数参数g的范围初始化为[2-10,210]。通过10折交叉验证法每次以90%的实验数据作为训练数据,以当时的参数C和g训练支持向量机分类模型,以10%的实验数据作为测试数据,对训练好的SVM模型的分类准确率进行验证,选择令SVM分类模型达到最佳分类准确率时的参数对作为最终模型的参数。最终结果当C=100,g=12.915时,测试集的分类准确率达到94.12%。
测试数据在经过SVM分类模型被分为两类后,分别在两个子测试数据集上以第二部分所述的方法建立GRU神经网络,对污水出水COD指标进行预测,预测结果如图8所示。仍以均方根误差RMSE与平均绝对误差MAE作为模型的评价指标,结果显示SVM-GRU联合模型预测出水COD时,联合模型的RMSE为0.4359,MAE为0.3348。
当待预测水质变量为出水氨氮时,预设历史数据的出水氨氮平均数0.25mg/L为支持向量分类模型的分类阈值,将出水氨氮浓度高于0.25mg/L的数据样本标记为类“0”,将出水氨氮浓度低于0.25mg/L的数据样本标记为类“1”。通过网格搜索方法将惩罚因子C和核函数参数g的范围初始化为[2-10,210]。以同样的交叉验证法对参数C和g进行寻优,最终结果当C=100,g=4.641时,测试集的分类准确率达到96.47%。
测试数据在经过SVM分类模型被分为两类后,分别在两个子测试数据集上以建立GRU神经网络,对污水出水氨氮指标进行预测,预测结果如图9所示。结果显示SVM-GRU联合模型预测出水氨氮时,联合模型的RMSE为0.4671,MAE为0.3520。
将得到的SVM-GRU模型的预测效果与单一的GRU模型的水质预测效果相比较,建立表4。
表4联合模型预测误差与单一神经网络的比较
Figure BDA0002391851120000151
通过图8,图9以及表4可以看出,将联合模型的预测效果与单一神经网络的预测效果相对比,不论是预测出水COD还是出水氨氮,本实施例建立的SVM-GRU联合模型在均方根误差RMSE和平均绝对误差MAE的表现上均优于单一的GRU神经网络,预测结果更加准确,预测精度更高,说明本实施例建立的联合模型取得了优良的预测效果和泛化性能。
联合后的预测模型因为采用了SVM进行数据分类,这样可以让待预测的出水指标可以在一定范围内实现最优,进而可以排除一些局部最优的影响。将两种神经网络的优点进行结合,这样可以在全局范围内得到一个较高的精确度,当新的污水进入曝气生物滤池或者有其他原因造成水质突然变化的时候,仍然可以继续保证预测的结果有较高的精确度。同时,利用SVM对数据分类以后得到的样本会降低有矛盾的数据对预测模型的影响。
联合后的预测模型因为首先对进行数据了分类,进而使目标变量的预测在一定范围内达到最好,进而缓解了一部分局部最优的影响,通过对两种模型优点的结合,使联合模型的总体预测效果得到更高的精度。使模型在面对由于各种因素影响水质发生突变的矛盾数据时,仍能保持有效的预测精度,使模型在实际应用中更稳定。故本实施例建立的基于支持向量分类算法与GRU神经网络联合预测污水出水水质的模型具有更好的综合效能,能够应用于实际的污水水质处理生产过程中。
由上可知,针对神经网络在训练过程中容易出现的局部最优现象,影响GRU网络模型的预测精度及泛化能力的问题。本实施例引入支持向量机模型,提出了基于支持向量机与GRU模型联合的污水水质预测模型。首先对污水水质数据进行分类,再让分类后的数据分别通过一个GRU神经网络算法分别建模预测出水水质的值。将构建好的SVM-GRU联合模型进行仿真验证,经过实验对比,预测出水COD和出水氨氮时,本实施例建立的SVM-GRU联合模型的在模型误差和预测精度上均优于单一的神经网络模型。联合模型的预测效果更好更适合应用于实际的生产过程中。
以上内容仅仅是对本发明的构思所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的构思或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (8)

1.一种基于支持向量分类与GRU神经网络联合的处理污水水质预测方法,其特征在于:步骤如下:
①、污水处理关键水质参数预测模型主导变量以及辅助变量的选择
以出水COD和出水氨氮为主导变量,初步选定辅助变量,然后对采集到的污水历史数据进行缺失值处理、异常值剔除和数据标准化,同时消除数据量纲以及数量级不同带来的影响;进一步采用PCA主元分析法对数据降维,最终确定以出水COD与出水氨氮为主导变量时,所选取的辅助变量将作为污水水质预测模型的输入变量;
②、基于GRU神经网络的水质预测模型的建立以及对污水处理水质的预测
采用适合处理时序数据的GRU神经网络建立了污水出水关键预测模型,并对模型效果进行验证;在GRU模型的构建过程中,经过了数据预处理、数据集的构建、时间序列长度的选择、模型结构的确定、选择Adam优化算法后,设置了模型的初始学习率与迭代次数,对实验数据进行训练,并使用交叉验证法对模型预测效果进行了验证;
③、基于SVM与GRU神经网络联合的水质预测模型的建立以及对污水处理水质的预测
首先引入支持向量机模型对污水水质数据进行分类,再让分类后的数据分别通过一个步骤②所述的GRU神经网络算法分别建模预测出水水质。
2.如权利要求1所述的处理污水水质预测方法,其特征在于:步骤①中污水处理关键水质参数预测模型主导变量以及辅助变量的选择具体步骤为:
选用出水COD和出水氨氮作为主导变量,初步选定污水水质预测模型的辅助变量;
对数据进行预处理,包括缺失值处理,异常数据剔除以及数据归一化;
利用PCA主元分析法以降维的方式消除数据噪声冗余,简化原始数据的复杂度,得到最终确定的辅助变量参数。
3.如权利要求2所述的处理污水水质预测方法,其特征在于:缺失值处理步骤为:
通过对数据周期和时序特征的分析,针对污水时间序列数据缺失的情况,采用加权均值法对其进行填充;
获取当前时刻之前的n个时刻的污水特性的平均值:
Figure FDA0002391851110000011
获取前m天当前时刻的污水特性的平均值:
Figure FDA0002391851110000012
对缺失值填充为:
fk(t)=αf1(t)+(1-α)f2(t) (2-3)
式(2-3)中,fk(t)表示第k天t时刻的污水特征数据,α是加权系数,通常取0.5-1之间的数。
4.如权利要求3所述的处理污水水质预测方法,其特征在于:异常值剔除步骤为:
采用3σ准则剔除从污水处理厂采集到的冗余及错误的原始数据;
主要是先处理随机误差,在预处理过程中,对随机误差进行处理,然后根据公式(2-4)得出标准偏差,然后通过概率得到一个变化的区间,把超出此区间的数据定为粗大误差,最后将其误差的数据进行删除;
设有n个样本数据为x1,x2,…,xn,其平均值为
Figure FDA0002391851110000021
偏差为
Figure FDA0002391851110000022
标准差计算公式如式2-4所示:
Figure FDA0002391851110000023
样本数据xi的偏差vi(1≤i≤n)能通过式(2-5)来表达,即:
|vi|>3σ (2-5)
如果满足上式,就把xi当作是包含较大误差的异常数据,并将其剔除。
5.如权利要求4所述的处理污水水质预测方法,其特征在于:数据标准化步骤为:
将从污水处理厂采集的数据进行标准化处理,如式2-6所示:
Figure FDA0002391851110000024
式中,x*,xmin,xmax分别表示每一维输入数据xi归一化后的值、最大值和最小值;数据经过标准化处理之后,这样就把范围全部缩小在[0,1]区间内;在进行训练得到结果之后,将数据进行还原,即反归一化操作,公式如下:
x′=xmin+x*(xmax-xmin) (2-7)
x′即为预测模型的预测输出值。
6.如权利要求5所述的处理污水水质预测方法,其特征在于:采用主元分析法对数据降维处理步骤为:
主元分析法PCA解决辅助变量的选择问题,其原理是通过输入一个矩阵,此矩阵可以直接使用之前输入的矩阵,构造一个包含之前所有信息的矩阵,对于新构造的矩阵的维数要比之前的低,计算步骤如下所示:
n维空间中有m个样本点,xi=[xi1,xi2,...,xin]T(i=1,2,...,n)构成数据矩阵X=[x1,x2,...,xm],数据矩阵的均值为:
Figure FDA0002391851110000031
同时要对X进行零均值化处理,得到矩阵A为:
A=[x1-μ,x2-μ,...,xm-μ] (2-9)
令X的协方差矩阵为C:
Figure FDA0002391851110000032
对C的特征值进行计算,并对结果进行一定的顺序排序,则为λ1,λ2,...,λn,与每个特征值相对应的特征向量矩阵为V=[v1,v2,...,vn],则有:
(VTA)(VTA)T=0 (2-11)
A的第i个主元方向投影得到向量pi为:
Figure FDA0002391851110000033
在前s(s<n)个方向上投影后的得到ρ:
Figure FDA0002391851110000034
若ρ接近于1,则表示实现了数据的降维。
7.如权利要求1所述的处理污水水质预测方法,其特征在于:步骤②中基于GRU神经网络的水质预测模型的建立以及对污水处理水质的预测的具体步骤为:
基于GRU的污水水质时序预测模型的构建,确立GRU模型结构由输入层、一个GRU层、一个dense层(全连接层)和输出层组成,并使用Adam法对网络学习率进行优化;
在完成数据预处理、特征变量选取、数据集构建、时序长度确定、GRU模型结构的确定流程后,设定网络迭代次数为2000次,并设定Adam优化算法的学习率初始值为0.001,对GRU水质预测模型进行训练,并使用十折交叉验证法对模型的预测结果进行验证,模型效果评价指标采用RMSE与MAE;均方根误差(RMSE)与均方根误差(MAE)如公式3-15和3-15所示:
Figure FDA0002391851110000041
Figure FDA0002391851110000042
8.如权利要求1所述的处理污水水质预测方法,其特征在于:步骤③中基于SVM与GRU神经网络联合的水质预测模型的建立以及对污水处理水质的预测的具体步骤为:
在污水数据进入GRU模型训练之前,选取支持向量机预估计目标水质参数的分类阈值,将污水水质数据分成两大类;根据数据分布,选取出水COD和出水氨氮的平均值作为模型的分类阈值对SVM模型进行训练后对待测试数据进行分类,在分类后的两个子类数据上分别建立GRU神经网络进行训练与预测。
CN202010117184.5A 2020-02-25 2020-02-25 基于支持向量分类与gru神经网络联合的处理污水水质预测方法 Pending CN111291937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010117184.5A CN111291937A (zh) 2020-02-25 2020-02-25 基于支持向量分类与gru神经网络联合的处理污水水质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010117184.5A CN111291937A (zh) 2020-02-25 2020-02-25 基于支持向量分类与gru神经网络联合的处理污水水质预测方法

Publications (1)

Publication Number Publication Date
CN111291937A true CN111291937A (zh) 2020-06-16

Family

ID=71029504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117184.5A Pending CN111291937A (zh) 2020-02-25 2020-02-25 基于支持向量分类与gru神经网络联合的处理污水水质预测方法

Country Status (1)

Country Link
CN (1) CN111291937A (zh)

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858715A (zh) * 2020-07-24 2020-10-30 青岛洪锦智慧能源技术有限公司 一种基于数据挖掘的污水处理厂进水质量预测方法
CN112084230A (zh) * 2020-07-30 2020-12-15 同济大学 一种地表水水质预测方法
CN112101731A (zh) * 2020-08-18 2020-12-18 华南理工大学 一种基于混合核典型相关分析的污水厂在线故障监测方法
CN112116080A (zh) * 2020-09-24 2020-12-22 中国科学院沈阳计算技术研究所有限公司 一种融合了注意力机制的cnn-gru水质预测方法
CN112132193A (zh) * 2020-09-10 2020-12-25 中国科学院深圳先进技术研究院 一种用于遥感图像分类的神经网络优化方法、终端以及存储介质
CN112348290A (zh) * 2020-12-03 2021-02-09 西安交大长天软件股份有限公司 河流水质预测方法、装置、存储介质及设备
CN112348165A (zh) * 2020-09-25 2021-02-09 泰山学院 基于混合循环网络的水声通信信号分类识别方法及系统
CN112365093A (zh) * 2020-12-01 2021-02-12 国家海洋信息中心 一种基于gru深度学习的多特征因子赤潮预测模型
CN112381221A (zh) * 2020-10-28 2021-02-19 华南理工大学 一种基于半监督学习的污水监测的多输出软测量方法
CN112417765A (zh) * 2020-12-02 2021-02-26 华东理工大学 一种基于改进师生网络模型的污水处理过程故障检测方法
CN112735541A (zh) * 2021-01-15 2021-04-30 杭州中科先进技术研究院有限公司 一种基于简单循环单元神经网络的污水处理水质预测方法
CN112782975A (zh) * 2020-12-02 2021-05-11 海天水务集团股份公司 一种基于深度学习的污水处理曝气智能控制方法及系统
CN112862190A (zh) * 2021-02-09 2021-05-28 汕头大学 一种基于改进Seq2Seq框架的水质时间序列预测方法
CN112906936A (zh) * 2021-01-07 2021-06-04 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法
CN112905659A (zh) * 2021-02-05 2021-06-04 希盟泰克(重庆)实业发展有限公司 一种基于bim与人工智能的城市轨道交通数据分析方法
CN113033092A (zh) * 2021-03-24 2021-06-25 石化盈科信息技术有限责任公司 污水处理数据处理方法、装置、计算机设备和存储介质
CN113033917A (zh) * 2021-04-19 2021-06-25 重庆工商大学 一种基于外围数据的污水处理厂预测规划运行管理方法
CN113077110A (zh) * 2021-04-21 2021-07-06 国家海洋信息中心 一种基于gru的调和残差分段式潮位预测方法
CN113098707A (zh) * 2021-03-16 2021-07-09 重庆邮电大学 边缘网络中一种虚拟网络功能需求预测方法
CN113139743A (zh) * 2021-05-12 2021-07-20 平安国际智慧城市科技股份有限公司 污水排放指标分析方法、装置、电子设备及存储介质
CN113743540A (zh) * 2021-11-04 2021-12-03 华能(天津)煤气化发电有限公司 一种基于多模型融合Stacking算法的煤质熔点预测方法
CN113837364A (zh) * 2021-09-17 2021-12-24 华南师范大学 基于残差网络和注意力机制的污水处理软测量方法及系统
CN113912250A (zh) * 2021-11-23 2022-01-11 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) 一种乡村污水生物生态修复系统
CN113985207A (zh) * 2021-10-28 2022-01-28 国网北京市电力公司 一种电网运行设备故障监测方法、系统、装置及存储介质
US20220082545A1 (en) * 2020-09-15 2022-03-17 Beijing University Of Technology Total Nitrogen Intelligent Detection Method Based on Multi-objective Optimized Fuzzy Neural Network
CN114527716A (zh) * 2022-02-08 2022-05-24 青岛理工大学 一种基于注意力机制和行为克隆模型的污水处理预测控制方法
CN114548535A (zh) * 2022-02-14 2022-05-27 南京天洑软件有限公司 一种污水处理过程参数长窗预测方法
CN114819102A (zh) * 2022-05-19 2022-07-29 东南大学溧阳研究院 基于gru的空调设备故障诊断方法
CN115385445A (zh) * 2022-09-21 2022-11-25 南京晓庄学院 一种基于大数据的污水生化处理用软测量管理系统
CN115470702A (zh) * 2022-09-14 2022-12-13 中山大学 一种基于机器学习的污水处理水质预测方法及系统
CN116523388A (zh) * 2023-04-17 2023-08-01 无锡雪浪数制科技有限公司 一种基于工业互联网平台的数据驱动的质量建模方法
CN116720048A (zh) * 2022-07-18 2023-09-08 华能汕头海门发电有限责任公司 一种基于机器学习模型的电站辅机故障诊断方法和系统
CN117171661A (zh) * 2023-11-03 2023-12-05 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统
CN117174198A (zh) * 2023-11-02 2023-12-05 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统
CN117388457A (zh) * 2023-10-16 2024-01-12 中山大学 一种耦合水力停留时间提高污水厂出水预测精度的方法
CN117575017A (zh) * 2023-10-19 2024-02-20 南昌大学 一种污水处理过程的概率推理模型构建方法及其系统
CN117388457B (zh) * 2023-10-16 2024-05-31 中山大学 一种耦合水力停留时间提高污水厂出水预测精度的方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841979A (zh) * 2012-06-26 2012-12-26 广州市新之地环保产业有限公司 一种基于pca-ga-svr的污泥回流量预测方法
CN103488089A (zh) * 2013-09-22 2014-01-01 浙江大学 自适应的农药废液焚烧炉有害物排放达标控制系统及方法
CN107741738A (zh) * 2017-10-20 2018-02-27 重庆华绿环保科技发展有限责任公司 一种污水处理过程监控智能预警云系统及污水处理监测预警方法
CN109147875A (zh) * 2018-08-08 2019-01-04 合肥学院 基于模糊聚类的支持向量回归算法的污水溶解氧浓度预测方法
CN109740286A (zh) * 2019-01-21 2019-05-10 北京工业大学 一种混合优化bp神经网络的湖泊水质预测模型构建方法
CN110088619A (zh) * 2017-10-09 2019-08-02 Bl科技有限责任公司 用于废水处理厂或饮用水厂的过程和资产健康诊断、异常检测和控制的智能系统和方法
CN110132598A (zh) * 2019-05-13 2019-08-16 中国矿业大学 旋转设备滚动轴承故障噪声诊断算法
CN110334845A (zh) * 2019-04-30 2019-10-15 江南大学 一种基于gru溶解氧长时间预测方法
CN110490351A (zh) * 2019-03-27 2019-11-22 浙江工业大学 基于pca-ga-rbf的换热器污垢生长预测方法
CN110598902A (zh) * 2019-08-02 2019-12-20 浙江工业大学 一种基于支持向量机与knn相结合的水质预测方法
CN110737874A (zh) * 2019-09-02 2020-01-31 中国科学院地理科学与资源研究所 一种基于空间关系的流域水质监测异常值检测方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841979A (zh) * 2012-06-26 2012-12-26 广州市新之地环保产业有限公司 一种基于pca-ga-svr的污泥回流量预测方法
CN103488089A (zh) * 2013-09-22 2014-01-01 浙江大学 自适应的农药废液焚烧炉有害物排放达标控制系统及方法
CN110088619A (zh) * 2017-10-09 2019-08-02 Bl科技有限责任公司 用于废水处理厂或饮用水厂的过程和资产健康诊断、异常检测和控制的智能系统和方法
CN107741738A (zh) * 2017-10-20 2018-02-27 重庆华绿环保科技发展有限责任公司 一种污水处理过程监控智能预警云系统及污水处理监测预警方法
CN109147875A (zh) * 2018-08-08 2019-01-04 合肥学院 基于模糊聚类的支持向量回归算法的污水溶解氧浓度预测方法
CN109740286A (zh) * 2019-01-21 2019-05-10 北京工业大学 一种混合优化bp神经网络的湖泊水质预测模型构建方法
CN110490351A (zh) * 2019-03-27 2019-11-22 浙江工业大学 基于pca-ga-rbf的换热器污垢生长预测方法
CN110334845A (zh) * 2019-04-30 2019-10-15 江南大学 一种基于gru溶解氧长时间预测方法
CN110132598A (zh) * 2019-05-13 2019-08-16 中国矿业大学 旋转设备滚动轴承故障噪声诊断算法
CN110598902A (zh) * 2019-08-02 2019-12-20 浙江工业大学 一种基于支持向量机与knn相结合的水质预测方法
CN110737874A (zh) * 2019-09-02 2020-01-31 中国科学院地理科学与资源研究所 一种基于空间关系的流域水质监测异常值检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIAN ZHOU: "Prediction of Chemical Oxygen Demand in Sewage Based on Support Vector Machine and Neural Network", 《INTELLIGENT COMPUTING THEORIES AND APPLICATION》 *

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858715B (zh) * 2020-07-24 2023-04-07 青岛洪锦智慧能源技术有限公司 一种基于数据挖掘的污水处理厂进水质量预测方法
CN111858715A (zh) * 2020-07-24 2020-10-30 青岛洪锦智慧能源技术有限公司 一种基于数据挖掘的污水处理厂进水质量预测方法
CN112084230A (zh) * 2020-07-30 2020-12-15 同济大学 一种地表水水质预测方法
CN112101731A (zh) * 2020-08-18 2020-12-18 华南理工大学 一种基于混合核典型相关分析的污水厂在线故障监测方法
CN112101731B (zh) * 2020-08-18 2024-03-12 华南理工大学 一种基于混合核典型相关分析的污水厂在线故障监测方法
CN112132193A (zh) * 2020-09-10 2020-12-25 中国科学院深圳先进技术研究院 一种用于遥感图像分类的神经网络优化方法、终端以及存储介质
US20220082545A1 (en) * 2020-09-15 2022-03-17 Beijing University Of Technology Total Nitrogen Intelligent Detection Method Based on Multi-objective Optimized Fuzzy Neural Network
CN112116080A (zh) * 2020-09-24 2020-12-22 中国科学院沈阳计算技术研究所有限公司 一种融合了注意力机制的cnn-gru水质预测方法
CN112348165A (zh) * 2020-09-25 2021-02-09 泰山学院 基于混合循环网络的水声通信信号分类识别方法及系统
CN112381221A (zh) * 2020-10-28 2021-02-19 华南理工大学 一种基于半监督学习的污水监测的多输出软测量方法
CN112365093A (zh) * 2020-12-01 2021-02-12 国家海洋信息中心 一种基于gru深度学习的多特征因子赤潮预测模型
CN112417765A (zh) * 2020-12-02 2021-02-26 华东理工大学 一种基于改进师生网络模型的污水处理过程故障检测方法
CN112782975A (zh) * 2020-12-02 2021-05-11 海天水务集团股份公司 一种基于深度学习的污水处理曝气智能控制方法及系统
CN112417765B (zh) * 2020-12-02 2024-02-02 华东理工大学 一种基于改进师生网络模型的污水处理过程故障检测方法
CN112348290B (zh) * 2020-12-03 2024-06-04 西安交大长天软件股份有限公司 河流水质预测方法、装置、存储介质及设备
CN112348290A (zh) * 2020-12-03 2021-02-09 西安交大长天软件股份有限公司 河流水质预测方法、装置、存储介质及设备
CN112906936A (zh) * 2021-01-07 2021-06-04 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法
CN112735541A (zh) * 2021-01-15 2021-04-30 杭州中科先进技术研究院有限公司 一种基于简单循环单元神经网络的污水处理水质预测方法
CN112905659A (zh) * 2021-02-05 2021-06-04 希盟泰克(重庆)实业发展有限公司 一种基于bim与人工智能的城市轨道交通数据分析方法
CN112862190A (zh) * 2021-02-09 2021-05-28 汕头大学 一种基于改进Seq2Seq框架的水质时间序列预测方法
CN113098707B (zh) * 2021-03-16 2022-05-03 重庆邮电大学 边缘网络中一种虚拟网络功能需求预测方法
CN113098707A (zh) * 2021-03-16 2021-07-09 重庆邮电大学 边缘网络中一种虚拟网络功能需求预测方法
CN113033092A (zh) * 2021-03-24 2021-06-25 石化盈科信息技术有限责任公司 污水处理数据处理方法、装置、计算机设备和存储介质
CN113033917A (zh) * 2021-04-19 2021-06-25 重庆工商大学 一种基于外围数据的污水处理厂预测规划运行管理方法
CN113077110A (zh) * 2021-04-21 2021-07-06 国家海洋信息中心 一种基于gru的调和残差分段式潮位预测方法
CN113139743A (zh) * 2021-05-12 2021-07-20 平安国际智慧城市科技股份有限公司 污水排放指标分析方法、装置、电子设备及存储介质
CN113837364B (zh) * 2021-09-17 2023-07-11 华南师范大学 基于残差网络和注意力机制的污水处理软测量方法及系统
CN113837364A (zh) * 2021-09-17 2021-12-24 华南师范大学 基于残差网络和注意力机制的污水处理软测量方法及系统
CN113985207A (zh) * 2021-10-28 2022-01-28 国网北京市电力公司 一种电网运行设备故障监测方法、系统、装置及存储介质
CN113743540A (zh) * 2021-11-04 2021-12-03 华能(天津)煤气化发电有限公司 一种基于多模型融合Stacking算法的煤质熔点预测方法
CN113912250B (zh) * 2021-11-23 2022-05-27 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) 一种乡村污水生物生态修复系统
CN113912250A (zh) * 2021-11-23 2022-01-11 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) 一种乡村污水生物生态修复系统
CN114527716A (zh) * 2022-02-08 2022-05-24 青岛理工大学 一种基于注意力机制和行为克隆模型的污水处理预测控制方法
CN114527716B (zh) * 2022-02-08 2023-12-15 海斯特(青岛)泵业有限公司 一种基于注意力机制和行为克隆模型的污水处理预测控制方法
CN114548535A (zh) * 2022-02-14 2022-05-27 南京天洑软件有限公司 一种污水处理过程参数长窗预测方法
CN114548535B (zh) * 2022-02-14 2023-10-31 南京天洑软件有限公司 一种污水处理过程参数长窗预测方法
CN114819102A (zh) * 2022-05-19 2022-07-29 东南大学溧阳研究院 基于gru的空调设备故障诊断方法
CN116720048A (zh) * 2022-07-18 2023-09-08 华能汕头海门发电有限责任公司 一种基于机器学习模型的电站辅机故障诊断方法和系统
CN115470702A (zh) * 2022-09-14 2022-12-13 中山大学 一种基于机器学习的污水处理水质预测方法及系统
CN115470702B (zh) * 2022-09-14 2024-06-11 中山大学 一种基于机器学习的污水处理水质预测方法及系统
CN115385445A (zh) * 2022-09-21 2022-11-25 南京晓庄学院 一种基于大数据的污水生化处理用软测量管理系统
CN116523388B (zh) * 2023-04-17 2023-11-10 无锡雪浪数制科技有限公司 一种基于工业互联网平台的数据驱动的质量建模方法
CN116523388A (zh) * 2023-04-17 2023-08-01 无锡雪浪数制科技有限公司 一种基于工业互联网平台的数据驱动的质量建模方法
CN117388457A (zh) * 2023-10-16 2024-01-12 中山大学 一种耦合水力停留时间提高污水厂出水预测精度的方法
CN117388457B (zh) * 2023-10-16 2024-05-31 中山大学 一种耦合水力停留时间提高污水厂出水预测精度的方法
CN117575017A (zh) * 2023-10-19 2024-02-20 南昌大学 一种污水处理过程的概率推理模型构建方法及其系统
CN117174198A (zh) * 2023-11-02 2023-12-05 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统
CN117174198B (zh) * 2023-11-02 2024-01-26 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统
CN117171661A (zh) * 2023-11-03 2023-12-05 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统
CN117171661B (zh) * 2023-11-03 2024-01-26 山东鸿远新材料科技股份有限公司 一种化工厂污水处理监控方法及系统

Similar Documents

Publication Publication Date Title
CN111291937A (zh) 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
US11346831B2 (en) Intelligent detection method for biochemical oxygen demand based on a self-organizing recurrent RBF neural network
CN108898215B (zh) 一种基于二型模糊神经网络的污泥膨胀智能辨识方法
CN104376380B (zh) 一种基于递归自组织神经网络的氨氮浓度预测方法
CN108469507B (zh) 一种基于自组织rbf神经网络的出水bod软测量方法
CN112884056A (zh) 基于优化的lstm神经网络的污水水质预测方法
CN109828089B (zh) 一种基于dbn-bp的水质参数亚硝酸氮的在线预测方法
CN102854296A (zh) 一种基于集成神经网络的污水处理软测量方法
CN109492265B (zh) 基于动态非线性pls软测量方法的废水出水指标预测方法
CN110320335B (zh) 一种关于污水处理出水水质指标的多元鲁棒软测量方法
CN112132333A (zh) 一种基于深度学习的短期水质水量预测方法及系统
CN107247888B (zh) 基于储备池网络的污水处理出水总磷tp软测量方法
CN109657790A (zh) 一种基于pso的递归rbf神经网络出水bod预测方法
CN110981021B (zh) 一种基于模糊bp神经网络的废水高级氧化处理智能加药系统及方法
CN114037163A (zh) 一种基于动态权重pso优化bp神经网络的污水处理出水质量预警方法
CN104914227B (zh) 基于多高斯核自优化相关向量机的污水水质软测量方法
CN112417765A (zh) 一种基于改进师生网络模型的污水处理过程故障检测方法
CN112989704A (zh) 一种基于de算法的irfm-cmnn出水bod浓度预测方法
Hrnjica et al. Application of deep learning neural networks for nitrate prediction in the Klokot River, Bosnia and Herzegovina
CN114119277A (zh) 一种基于人工智能神经网络的絮凝投药决策的分析方法
CN107665288A (zh) 一种化学需氧量的水质软测量预测方法
CN111204867B (zh) 膜生物反应器-mbr膜污染智能决策方法
CN110542748B (zh) 一种基于知识的鲁棒型出水氨氮软测量方法
CN112819087A (zh) 一种基于模块化神经网络的出水bod传感器异常检测方法
CN116128039A (zh) 一种地表水体水质预测模型的构建方法和预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200616