CN112308169A - 一种基于改进在线序列极限学习机的出水水质预测方法 - Google Patents

一种基于改进在线序列极限学习机的出水水质预测方法 Download PDF

Info

Publication number
CN112308169A
CN112308169A CN202011247093.XA CN202011247093A CN112308169A CN 112308169 A CN112308169 A CN 112308169A CN 202011247093 A CN202011247093 A CN 202011247093A CN 112308169 A CN112308169 A CN 112308169A
Authority
CN
China
Prior art keywords
data
output
neural network
layer
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011247093.XA
Other languages
English (en)
Other versions
CN112308169B (zh
Inventor
杨秦敏
曹伟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011247093.XA priority Critical patent/CN112308169B/zh
Publication of CN112308169A publication Critical patent/CN112308169A/zh
Application granted granted Critical
Publication of CN112308169B publication Critical patent/CN112308169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Activated Sludge Processes (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于改进在线序列极限学习机的出水水质预测方法,该方法在机器学习方法极限学习机的基础上,考虑了不满秩矩阵求逆以及参数随机对神经网络带来的影响,将岭回归及ensemble方法引入并提出了改进在线序列极限学习机方法,将该方法应用在污水处理的水质预测上,具有训练速度快、可实时在线预测以及预测效果好等特点,有效解决了由于传感器硬件不足所带来的污水处理控制的延时问题,对污水处理工艺的提升具有重要的现实意义与经济价值。

Description

一种基于改进在线序列极限学习机的出水水质预测方法
技术领域
本发明涉及控制科学与工程、环境科学与工程领域,尤其涉及一种基于改进在线序列极限学习机的出水水质预测方法。
背景技术
水作为人类生活发展不可或缺的战略资源,是构成生命存在所必需的元素之一,世界范围内,水资源总体丰富,但人类可利用的水资源却十分匮乏,同时水资源的分布不均匀也使得部分地区的水资源短缺问题凸显。在自然因素之外,由人为因素导致的水污染、不合理利用等问题更进一步加剧了水资源的短缺。如何有效合理的利用现有的水资源,使得社会发展在快速发展的过程中,既有金山银山,又有绿水青山,成为近些年不断探讨并在实践的重大问题。
污水处理是一种合理利用、有效保护水资源的具体措施,通过对工业废水、城市废水及农业废水的净化并循环多次利用,不仅能够有效降低污水排放量,保护江河湖泊等淡水资源,而且也通过净化水的循环减少工厂城市对自然界水资源的需求。污水处理工业近些年来蓬勃发展,2014年我国城镇污水处理量已经达到了495.1亿吨,并在2015年的《水污染防治行动计划》中提出在2020年底前实现现有城镇污水处理设施因地制宜改造从而达到相应排放标准或再生利用要求。
但污水处理系统作为一个复杂的工业系统,具有非线性、强耦合、大迟滞,多扰动等问题,并且难以基于机理构建精确的数学模型。而在实际工业现场,由于系统存在有较大迟滞的现象存在,基于传感检测的结果对污水处理进行控制往往无法保证出水水质,同时一些传感检测值无法实时获取,需要采用实验方法离线获取,通过实现方法检测结果存在较大的时间滞后,无法为实时控制提供有效地参考值。所以基于检测传感结果进行控制的效果往往难以得到有效地提高。
发明内容
为了能够有效检测出水水质,构建基于输入输出数据的污水处理模型,本发明针对目前的需求提出一种基于改进在线序列极限学习机的出水水质预测方法,能够实现快速、有效且准确的在线预测出水水质,为及时调节控制策略提供指导。
本发明的目的是通过以下技术方案来实现的:一种基于改进在线序列极限学习机的出水水质预测方法,该方法包括以下步骤:
(1)数据获取及预处理
从污水处理过程中获取N0组检测样本数据
Figure BDA0002770375770000021
每组输入向量Xi表征n种污水水质组分,对应的期望输出Ti表征出水水质中的溶解氧浓度。
对N0组检测样本数据进行数据预处理,包括归一化和异常点剔除;
将不同量纲的数据归一化至[-1,1]之间,消除量纲对水质预测带来的影响,得到归一化后的样本数据Xn
对样本数据Xn进行异常点剔除,利用K-NN进行处理,将采样数据分段成p段,每段数据量相同,针对每段分别进行异常点剔除,具体步骤如下:
Step1:设定初始化距离;随机选择第q段数据,q=1,2,…,p,随机选择该数据段中四分之三的数据作为训练样本数据,其余数据作为未知样本数据;
Step2:计算未知样本数据至所有训练样本数据的欧几里得距离dist;
Step3:计算目前k个最临近样本数据中的最大距离max dist;
Step4:如果dist小于max dist,则将该未知样本作为k-最近邻样本;
Step5:重复Step 2、3、4,直到未知样本和所有训练样本的距离都计算完;
Step6:统计k-最近邻样本中正常数据样本出现的次数;
Step7:选择在正常样本中出现频率最大的一些点,出现次数较少甚至未出现的数据则作为异常点剔除;
Step8:完成第q段数据的异常点剔除后,令q=q+1,返回step1重新进行计算,直至q=p,结束异常点剔除,将异常点剔除后的正常污水处理数据标记为
Figure BDA0002770375770000022
其中N<N0
(2)对数据进行高低频分离处理
通过低通滤波器对数据
Figure BDA0002770375770000023
进行过滤,得到低频信息
Figure BDA0002770375770000024
xi=q·X’i+(1-q)·xi-1
oi=q·Ti'+(1-q)·oi-1
其中q为数字低通滤波器的时间常数,xi为X’i低通滤波后的值,oi为Ti'低通滤波后的值;
通过低频信息可以得到高频信息
Figure BDA0002770375770000031
x’=X’-x,o’=T’-o。
针对高频信息与低频信息分别进行下述步骤(3)-(5)处理。
(3)构建基于改进在线序列极限学习机的出水水质预测模型,其由输入层、隐含层、输出层和均值层四层结构组成;构建多个不同激励函数的在线序列极限学习机,并将最后的神经网络的输出求平均,作为预测模型最终输出。该模型共有k个神经网络,每个神经网络都具有不同的激励函数,因此共有k种激励函数,每个神经网络的输入层有n个节点,第k种激励函数有Lk个隐含层节点,输出层分别有m个节点,选择Purelin函数作为输出层的传递函数,同时均值层也有m个节点,即对输出层的节点分别加和求平均。
(4)对k个神经网络参数分别进行初始化,具体初始化步骤如下:
首先对输入层到隐含层的神经网络参数进行初始化,确定神经网络输入层节点个数n,神经网络隐含层节点的激励函数类型与个数Lk,输出层节点个数m。
其次对隐含层到输出层的权重进行初始化设计,针对低频信息,具体步骤如下所示:
Step1:根据
Figure BDA0002770375770000032
的数据长度N,得到隐含层节点输出Hj0
Figure BDA0002770375770000033
其中Gj为第j种神经网络的激励函数,al,bl(l=1,2,...,Lj)分别为输入层到隐含层的权重和偏移值,Lj表示神经网络的隐含层节点个数,x表征一共有N组神经网络输入数据,每组有n个特征值,即对应了神经网络输入层的节点个数,Hj0为第j种激励函数神经网络隐含层初次迭代时的输出,j=1,2,...,k;
Step2:将污水出水水质作为目标历史数据t:
Figure BDA0002770375770000034
其中ti(i=1,2,…,N)为第i组目标历史数据的输出;
Ste3:构建隐含层到输出层的网络,则有
Figure BDA0002770375770000035
将此式写为矩阵形式则
Figure BDA0002770375770000041
其中t是输出层输出,wlm为隐含层到输出层的权重向量,其矩阵为
Figure BDA0002770375770000042
Gj(al,bl,x)为隐含层输出,同时也为输出层输入,其矩阵形式为
Figure BDA0002770375770000043
Step4:采用广义逆计算方法与岭回归方法,得到隐含层到输出层的权重矩阵:
Figure BDA0002770375770000044
其中
Figure BDA0002770375770000045
λ是一个非常小的值,I是单位矩阵。当
Figure BDA0002770375770000046
非奇异时,极小值λ对矩阵产生不了影响,当
Figure BDA0002770375770000047
奇异时,极小值λ则确保了求逆有解。
(5)神经网络在线学习
在初始化结束后,根据神经网络进行不断地迭代学习,当污水处理系统产生第f组新数据,即进行到第f次迭代时,除了目标历史输出tf需要更新,隐含层到输出层的权重值也需要进行更新迭代,第f次迭代更新如下所示:
Figure BDA0002770375770000048
Figure BDA0002770375770000049
在神经网络的参数迭代学习完成后,则可以利用在线极限学习机对下一时刻的系统输出
Figure BDA00027703757700000410
进行预测:
Figure BDA00027703757700000411
依次迭代学习,则可以实现对于污水处理出水水质的实时预测。
(6)基于不同激励函数的神经网络输出并分别求均值,得到针对低频数据的预测结果
Figure BDA00027703757700000412
Figure BDA00027703757700000413
再对高频数据进行上述操作,得到预测结果
Figure BDA00027703757700000414
考虑到高频和低频信息分别利用上述模型预测则可以得到:
Figure BDA00027703757700000415
其中
Figure BDA00027703757700000416
为最后的预测输出,
Figure BDA00027703757700000417
Figure BDA00027703757700000418
分别为高频预测与低频预测结果。
进一步地,所述步骤(1)数中,从污水处理过程中获取的N0组检测样本数据
Figure BDA00027703757700000419
其中每组输入向量的具体形式为Xi=[SI,i,SS,i,XI,i,XS,i,XBH,i,XBA,i,XP,i,SNO,i,SO,i,SND,i,XND,i]T,分别表征污水中的可溶解惰性有机物、易生物降解底物、不可溶惰性有机物、缓慢生物降解底物、活跃异养生物、活跃自养生物、生物质衰变不可溶产物、硝酸盐与亚硝酸盐、铵根离子、可溶性可降解有机氮、不可溶不可降解有机氮这11种污水水质组分。
进一步地,所述步骤(1)中,归一化采用最大最小值归一化方法,将不同量纲的数据归一化至[-1,1]之间,公式如下:
Figure BDA0002770375770000051
其中X为污水处理中原样本数据,Xmin为样本数据的最小值,Xmax为样本数据的最大值,Xn为归一化后的样本数据。
进一步地,选择RBF,sin,sigmod这三种函数作为神经网络隐含层节点的激励函数类型,即k=3,针对RBF型隐含层节点的中心参数向量a和宽度向量b与针对加性类型(sin,sigmod)隐含层节点的连接权重向量a和偏置向量b在一定范围内随机产生。
本发明的有益效果是:
1.本发明方法与其他神经网络方法比较,避免由于参数的初始化不当所带来的故障及参数基于梯度下降法更新所带来的训练时间过长等问题。同时引入岭回归方法,避免由于奇异值问题导致的性能下降,以及采用多种神经网络同时预测求平均的方法,降低了由于参数随机化及激励函数适应性对性能所造成的影响,从而提升了预测效果,在实际应用中有更强的实用性。
2.本发明方法采用K-NN方法进行异常点剔除,避免异常值对模型预测产生影响,同时将高频信息以及低频信息分离,分别设计对应的极限学习机神经网络模型分别进行预测,分别获取对应特有信息,并最终提升预测模型的预测效果。
附图说明
图1为本发明神经网络结构示意图;
图2为本发明基于改进在线序列极限学习机的出水水质预测方法流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
本发明提出的一种基于改进在线序列极限学习机的出水水质预测方法,如图2所示,该方法包括以下步骤:
(1)数据获取及预处理:
从污水处理过程中获取N0组检测样本数据
Figure BDA0002770375770000061
其中每组输入向量Xi表征n种污水水质组分,本实施例中Xi=[SI,i,SS,i,XI,i,XS,i,XBH,i,XBA,i,XP,i,SNO,i,SO,i,SND,i,XND,i]T,分别表征污水中的可溶解惰性有机物、易生物降解底物、不可溶惰性有机物、缓慢生物降解底物、活跃异养生物、活跃自养生物、生物质衰变不可溶产物、硝酸盐与亚硝酸盐、铵根离子、可溶性可降解有机氮、不可溶不可降解有机氮等11种污水水质组分,对应的期望输出Ti=SO,i,表征出水水质中的溶解氧浓度这一种组分。
对N0组检测样本数据进行数据预处理,包括归一化、异常点剔除等步骤,从而获得污水处理系统的样本数据,具体如下:
归一化主要采用最大最小值归一化方法,用来消除量纲带来的影响,将不同量纲的数据归一化至[-1,1]之间,从而消除量纲对水质预测带来的影响。具体形式为:
Figure BDA0002770375770000062
其中X为污水处理中原样本数据,Xmin为样本数据的最小值,Xmax为样本数据的最大值,Xn为归一化后的样本数据,具体为Xn=[SIn,SSn,XIn,XSn,XBHn,XBAn,XPn,SNOn,SNHn,SNDn,XNDn]T
在归一化结束后进行异常点剔除,主要采用的方法是利用K-NN进行处理,由于考虑到检测数据会存在有大范围的波动,采用统一值进行处理会存在问题,考虑将采样数据分段成p段,每段数据量相同,针对每段分别进行异常点剔除。具体步骤如下所示:
Step1:设定初始化距离;随机选择第q段数据,q=1,2,…,p,随机选择该数据段中四分之三的数据作为训练样本数据,其余数据作为未知样本数据;
Step2:计算未知样本数据至所有训练样本数据的欧几里得距离dist:
dist=(|Xin-Xjn|2)1/2
Step3:计算目前k个最临近样本数据中的最大距离max dist;
Step4:如果dist小于max dist,则将该未知样本作为k-最近邻样本;
Step5:重复Step 2、3、4,直到未知样本和所有训练样本的距离都计算完;
Step6:统计k-最近邻样本中正常数据样本出现的次数;
Step7:选择在正常样本中出现频率最大的一些点,出现次数较少甚至未出现的数据则作为异常点剔除;
Step8:完成第q段数据的异常点剔除后,令q=q+1,返回step1重新进行计算,直至q=p,结束异常点剔除。
为了方便标记,将异常点剔除后的正常污水处理数据标记为
Figure BDA0002770375770000071
(其中N<N0)。
(2)对数据进行高低频分离处理
考虑到污水处理是一个多尺度的系统,将污水处理数据进行高低频分离,分别进行基于改进在线序列极限学习机的学习预测。为了进行高低频数据的分离,设计一个低通滤波器对数据
Figure BDA0002770375770000072
进行过滤,得到的低频信息
Figure BDA0002770375770000073
为:xi=q·X’i+(1-q)·xi-1,oi=q·Ti'+(1-q)·oi-1,其中q为数字低通滤波器的时间常数,xi为X’i低通滤波后的值,oi为Ti'低通滤波后的值;
在计算完成后,则可以得到高频信息
Figure BDA0002770375770000074
x’=X’-x,o’=T’-o。
针对高频信息与低频信息分别进行下述步骤(3)-(5)进行出水水质预测模型计算。
(3)构建基于改进在线序列极限学习机的出水水质预测模型,其由输入层、隐含层、输出层和均值层四层结构组成,参见图1。与在线序列极限学习机的最大区别在于增加均值层,因为传统的神经网络都采用一种激励函数在同一结构中,而一旦该种激励函数不适用于应用系统,以及不恰当的随机初始参数都会使得预测效果大打折扣,所以为了能够平衡不恰当激励函数对预测效果的影响,本发明引入总体均值思想,即构建多个不同激励函数的在线序列极限学习机,并将最后的神经网络的输出求平均,作为预测模型最终输出。其中一共有k个神经网络,每个神经网络都具有不同的激励函数,可以选择针对RBF隐含层节点的激励函数或者针对加性隐含层节点的激励函数等,所以一共有k种激励函数,每个神经网络的输入层有n个节点,第k种激励函数有Lk个隐含层节点,输出层分别有m个节点,选择Purelin函数作为输出层的传递函数,同时均值层也有m个节点,即对输出层的节点分别加和求平均。其中n,k,Lk以及m均为正整数。
由于隐含层存在多种不同的激励函数,对不同激励函数进行分类定义与介绍,分别为:
a)针对RBF隐含层节点的激励函数
G(al,bl,x)=g(bl||x-al||),bl∈R+
其中RBF隐含层节点可以采用高斯函数、双曲正切函数等,其中al与bl则分别为第l个隐含层节点的中心参数及宽度向量,R+则表示正实数集。
b)针对加性隐含层节点的激励函数
G(al,bl,x)=g(al·x+bl),bl∈R
其中加性隐含层节点可以采用sigmoid函数、阈值函数等作为激励函数,其中al是输入层到第l个隐含层节点的连接权重向量,al·x则是权重向量al与向量x的内积,而bl则是第l个隐含层节点的偏置。
(4)神经网络参数初始化,本发明中涉及到有k个神经网络结构,需要对k个神经网络分别进行初始化,其所采用的方法均保持一致,具体初始化步骤如下所示:
首先对输入层到隐含层的神经网络参数进行初始化,确定神经网络输入层节点个数n(本实施例中n=11),选择合适的神经网络隐含层节点的激励函数类型(本实施例中选择RBF,sin,sigmod这三种函数作为神经网络隐含层节点的激励函数类型,即k=3)与个数Lk(本实施例中均为200个隐含层节点),输出层节点个数m(本实施例中m=1)等。针对RBF型隐含层节点的中心参数向量al和宽度向量bl与针对加性类型(sin,sigmod)隐含层节点的连接权重向量al和偏置向量bl在一定范围内随机产生;
其次需要对隐含层到输出层的权重进行初始化设计,针对低频信息,具体步骤如下所示:
Step1:根据
Figure BDA0002770375770000081
的数据长度N,则可以得到隐含层节点输出Hj0
Figure BDA0002770375770000082
其中Gj为第j种神经网络的激励函数,al,bl(l=1,2,...,Li)分别为输入层到隐含层的权重和偏移值,Lj表示神经网络的隐含层节点个数,x表征一共有N组神经网络输入数据,每组有n个特征值,即对应了神经网络输入层的节点个数,Hj0为第j种激励函数神经网络隐含层初次迭代时的输出(j=1,2,...,k);
Step2:将污水出水水质作为目标历史数据t:
Figure BDA0002770375770000091
其中ti(i=1,2,…,N)为第i组目标历史数据的输出;
Ste3:构建隐含层到输出层的网络,输出层的传递函数选择Purelin函数,其具体形式为:
Figure BDA0002770375770000092
将此式写为矩阵形式则:
Figure BDA0002770375770000093
其中t是输出层输出,而wlm则为隐含层到输出层的权重向量,其矩阵则为
Figure BDA0002770375770000094
Gj(al,bl,x)为隐含层输出,同时也为输出层输入,其矩阵形式则为
Figure BDA0002770375770000095
Step4:在得到step1与step2的前提下,采用广义逆计算方法对step3进行处理得到隐含层到输出层的权重矩阵:
Figure BDA0002770375770000096
其中
Figure BDA0002770375770000097
Figure BDA0002770375770000098
为第j种激励函数神经网络的隐含层到输出层的初始权重矩阵,自此,则神经网络的所有参数都已完成初始化。
考虑到需要对
Figure BDA0002770375770000099
求逆,而往往会存在奇异值解,使得解不存在,为了避免该问题的出现,这里借鉴岭回归方法对于该问题的解决,引入一个极小量到求逆的过程中,使得解存在且唯一,具体改进如下所示:
Figure BDA00027703757700000910
其中
Figure BDA00027703757700000911
λ是一个非常小的值,而I则是单位矩阵。当
Figure BDA00027703757700000912
非奇异时,极小值λ对矩阵产生不了影响,反之,当
Figure BDA00027703757700000913
奇异时,则极小值λ则确保了求逆有解。
(5)神经网络在线学习
在初始化结束后,则根据神经网络进行不断地迭代学习,当污水处理系统产生第f组新数据,即进行到第f次迭代时,除了目标历史输出tf需要更新,隐含层到输出层的权重值也需要进行更新迭代,第f次迭代更新如下所示:
Figure BDA00027703757700000914
Figure BDA0002770375770000101
在神经网络的参数迭代学习完成后,则可以利用在线极限学习机对下一时刻的系统输出
Figure BDA0002770375770000102
进行预测
Figure BDA0002770375770000103
依次迭代学习,则可以实现对于污水处理出水水质的实时预测,避免由于污水处理系统延时所带来的困扰。
(6)计算最终的结果
基于不同激励函数的神经网络输出并分别求均值,得到针对低频数据的预测结果
Figure BDA0002770375770000104
Figure BDA0002770375770000105
再对高频数据进行上述操作,得到预测结果
Figure BDA0002770375770000106
考虑到高频和低频信息分别利用上述模型预测则可以得到:
Figure BDA0002770375770000107
其中
Figure BDA0002770375770000108
为最后的预测输出,
Figure BDA0002770375770000109
Figure BDA00027703757700001010
分别为高频预测与低频预测结果。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (4)

1.一种基于改进在线序列极限学习机的出水水质预测方法,其特征在于,包括以下步骤:
(1)数据获取及预处理
从污水处理过程中获取N0组检测样本数据
Figure FDA0002770375760000011
每组输入向量Xi表征n种污水水质组分,对应的期望输出Ti表征出水水质中的溶解氧浓度。
对N0组检测样本数据进行数据预处理,包括归一化和异常点剔除;
将不同量纲的数据归一化至[-1,1]之间,消除量纲对水质预测带来的影响,得到归一化后的样本数据Xn
对样本数据Xn进行异常点剔除,利用K-NN进行处理,将采样数据分段成p段,每段数据量相同,针对每段分别进行异常点剔除,具体步骤如下:
Step1:设定初始化距离;随机选择第q段数据,q=1,2,…,p,随机选择该数据段中四分之三的数据作为训练样本数据,其余数据作为未知样本数据;
Step2:计算未知样本数据至所有训练样本数据的欧几里得距离dist;
Step3:计算目前k个最临近样本数据中的最大距离max dist;
Step4:如果dist小于max dist,则将该未知样本作为k-最近邻样本;
Step5:重复Step2、3、4,直到未知样本和所有训练样本的距离都计算完;
Step6:统计k-最近邻样本中正常数据样本出现的次数;
Step7:选择在正常样本中出现频率最大的一些点,出现次数较少甚至未出现的数据则作为异常点剔除;
Step8:完成第q段数据的异常点剔除后,令q=q+1,返回step1重新进行计算,直至q=p,结束异常点剔除,将异常点剔除后的正常污水处理数据标记为
Figure FDA0002770375760000012
其中N<N0
(2)对数据进行高低频分离处理
通过低通滤波器对数据
Figure FDA0002770375760000013
进行过滤,得到低频信息
Figure FDA0002770375760000014
xi=q·X′i+(1-q)·xi-1
oi=q·Ti'+(1-q)·oi-1
其中q为数字低通滤波器的时间常数,xi为X′i低通滤波后的值,oi为Ti'低通滤波后的值;
通过低频信息可以得到高频信息
Figure FDA0002770375760000021
x′=X′-x,o′=T′-o。
针对高频信息与低频信息分别进行下述步骤(3)-(5)处理。
(3)构建基于改进在线序列极限学习机的出水水质预测模型,其由输入层、隐含层、输出层和均值层四层结构组成;构建多个不同激励函数的在线序列极限学习机,并将最后的神经网络的输出求平均,作为预测模型最终输出。该模型共有k个神经网络,每个神经网络都具有不同的激励函数,因此共有k种激励函数,每个神经网络的输入层有n个节点,第k种激励函数有Lk个隐含层节点,输出层分别有m个节点,选择Purelin函数作为输出层的传递函数,同时均值层也有m个节点,即对输出层的节点分别加和求平均。
(4)对k个神经网络参数分别进行初始化,具体初始化步骤如下:
首先对输入层到隐含层的神经网络参数进行初始化,确定神经网络输入层节点个数n,神经网络隐含层节点的激励函数类型与个数Lk,输出层节点个数m。
其次对隐含层到输出层的权重进行初始化设计,针对低频信息,具体步骤如下所示:
Step1:根据
Figure FDA0002770375760000022
的数据长度N,得到隐含层节点输出Hj0
Figure FDA0002770375760000023
其中Gj为第j种神经网络的激励函数,al,bl(l=1,2,...,Li)分别为输入层到隐含层的权重和偏移值,Lj表示神经网络的隐含层节点个数,x表征一共有N组神经网络输入数据,每组有n个特征值,即对应了神经网络输入层的节点个数,Hj0为第j种激励函数神经网络隐含层初次迭代时的输出,j=1,2,...,k;
Step2:将污水出水水质作为目标历史数据t:
Figure FDA0002770375760000024
其中ti(i=1,2,…,N)为第i组目标历史数据的输出;
Ste3:构建隐含层到输出层的网络,则有
Figure FDA0002770375760000025
将此式写为矩阵形式则
Figure FDA0002770375760000031
其中t是输出层输出,wlm为隐含层到输出层的权重向量,其矩阵为
Figure FDA0002770375760000032
Gj(al,bl,x)为隐含层输出,同时也为输出层输入,其矩阵形式为
Figure FDA0002770375760000033
Step4:采用广义逆计算方法与岭回归方法,得到隐含层到输出层的权重矩阵:
Figure FDA0002770375760000034
其中
Figure FDA0002770375760000035
λ是一个非常小的值,I是单位矩阵。当
Figure FDA0002770375760000036
非奇异时,极小值λ对矩阵产生不了影响,当
Figure FDA0002770375760000037
奇异时,极小值λ则确保了求逆有解。
(5)神经网络在线学习
在初始化结束后,根据神经网络进行不断地迭代学习,当污水处理系统产生第f组新数据,即进行到第f次迭代时,除了目标历史输出tf需要更新,隐含层到输出层的权重值也需要进行更新迭代,第f次迭代更新如下所示:
Figure FDA0002770375760000038
Figure FDA0002770375760000039
在神经网络的参数迭代学习完成后,则可以利用在线极限学习机对下一时刻的系统输出
Figure FDA00027703757600000310
进行预测:
Figure FDA00027703757600000311
依次迭代学习,则可以实现对于污水处理出水水质的实时预测。
(6)基于不同激励函数的神经网络输出并分别求均值,得到针对低频数据的预测结果
Figure FDA00027703757600000319
Figure FDA00027703757600000312
再对高频数据进行上述操作,得到预测结果
Figure FDA00027703757600000313
考虑到高频和低频信息分别利用上述模型预测则可以得到:
Figure FDA00027703757600000314
其中
Figure FDA00027703757600000315
为最后的预测输出,
Figure FDA00027703757600000316
Figure FDA00027703757600000317
分别为高频预测与低频预测结果。
2.根据权利要求1所述的一种基于改进在线序列极限学习机的出水水质预测方法,其特征在于,所述步骤(1)数中,从污水处理过程中获取的N0组检测样本数据
Figure FDA00027703757600000318
其中每组输入向量的具体形式为Xi=[SI,i,SS,i,XI,i,XS,i,XBH,i,XBA,i,XP,i,SNO,i,SO,i,SND,i,XND,i]T,分别表征污水中的可溶解惰性有机物、易生物降解底物、不可溶惰性有机物、缓慢生物降解底物、活跃异养生物、活跃自养生物、生物质衰变不可溶产物、硝酸盐与亚硝酸盐、铵根离子、可溶性可降解有机氮、不可溶不可降解有机氮这11种污水水质组分。
3.根据权利要求1所述的一种基于改进在线序列极限学习机的出水水质预测方法,其特征在于,所述步骤(1)中,归一化采用最大最小值归一化方法,将不同量纲的数据归一化至[-1,1]之间,公式如下:
Figure FDA0002770375760000041
其中X为污水处理中原样本数据,Xmin为样本数据的最小值,Xmax为样本数据的最大值,Xn为归一化后的样本数据。
4.根据权利要求1所述的一种基于改进在线序列极限学习机的出水水质预测方法,其特征在于,选择RBF,sin,sigmod这三种函数作为神经网络隐含层节点的激励函数类型,即k=3,针对RBF型隐含层节点的中心参数向量a和宽度向量b与针对加性类型(sin,sigmod)隐含层节点的连接权重向量a和偏置向量b在一定范围内随机产生。
CN202011247093.XA 2020-11-10 2020-11-10 一种基于改进在线序列极限学习机的出水水质预测方法 Active CN112308169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011247093.XA CN112308169B (zh) 2020-11-10 2020-11-10 一种基于改进在线序列极限学习机的出水水质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011247093.XA CN112308169B (zh) 2020-11-10 2020-11-10 一种基于改进在线序列极限学习机的出水水质预测方法

Publications (2)

Publication Number Publication Date
CN112308169A true CN112308169A (zh) 2021-02-02
CN112308169B CN112308169B (zh) 2022-05-03

Family

ID=74325386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011247093.XA Active CN112308169B (zh) 2020-11-10 2020-11-10 一种基于改进在线序列极限学习机的出水水质预测方法

Country Status (1)

Country Link
CN (1) CN112308169B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103728431A (zh) * 2014-01-09 2014-04-16 重庆科技学院 基于极限学习机的工业污水cod在线软测量方法
CN108091135A (zh) * 2017-12-12 2018-05-29 重庆师范大学 基于优化小波神经网络的停车泊位多步预测方法
CN108562709A (zh) * 2018-04-25 2018-09-21 重庆工商大学 一种基于卷积自编码器极限学习机的污水处理系统水质监测预警方法
CN109787236A (zh) * 2019-01-28 2019-05-21 云南电网有限责任公司 一种基于深度学习的电力系统频率态势预测方法
CN109816046A (zh) * 2019-02-19 2019-05-28 张家港江苏科技大学产业技术研究院 基于极限学习机的深度聚集式分类方法及系统
CN110222908A (zh) * 2019-06-19 2019-09-10 贵州电网有限责任公司 一种基于数据驱动的短期用电量预测方法
CN110555548A (zh) * 2019-08-05 2019-12-10 三峡大学 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法
CN110677297A (zh) * 2019-09-29 2020-01-10 北京工业大学 一种基于自回归滑动平均模型和极限学习机的组合网络流量预测方法
CN110807508A (zh) * 2019-10-31 2020-02-18 国网辽宁省电力有限公司经济技术研究院 计及复杂气象影响的母线峰值负荷预测方法
CN111461922A (zh) * 2020-04-02 2020-07-28 国网冀北电力有限公司唐山供电公司 一种基于极限学习机的变压器热点温度实时预测方法
CN111650834A (zh) * 2020-06-16 2020-09-11 湖南工业大学 基于极限学习机(elm)的污水处理过程预测控制方法
CN111832825A (zh) * 2020-07-14 2020-10-27 山东大学 融合长短期记忆网络和极限学习机的风电预测方法及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103728431A (zh) * 2014-01-09 2014-04-16 重庆科技学院 基于极限学习机的工业污水cod在线软测量方法
CN108091135A (zh) * 2017-12-12 2018-05-29 重庆师范大学 基于优化小波神经网络的停车泊位多步预测方法
CN108562709A (zh) * 2018-04-25 2018-09-21 重庆工商大学 一种基于卷积自编码器极限学习机的污水处理系统水质监测预警方法
CN109787236A (zh) * 2019-01-28 2019-05-21 云南电网有限责任公司 一种基于深度学习的电力系统频率态势预测方法
CN109816046A (zh) * 2019-02-19 2019-05-28 张家港江苏科技大学产业技术研究院 基于极限学习机的深度聚集式分类方法及系统
CN110222908A (zh) * 2019-06-19 2019-09-10 贵州电网有限责任公司 一种基于数据驱动的短期用电量预测方法
CN110555548A (zh) * 2019-08-05 2019-12-10 三峡大学 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法
CN110677297A (zh) * 2019-09-29 2020-01-10 北京工业大学 一种基于自回归滑动平均模型和极限学习机的组合网络流量预测方法
CN110807508A (zh) * 2019-10-31 2020-02-18 国网辽宁省电力有限公司经济技术研究院 计及复杂气象影响的母线峰值负荷预测方法
CN111461922A (zh) * 2020-04-02 2020-07-28 国网冀北电力有限公司唐山供电公司 一种基于极限学习机的变压器热点温度实时预测方法
CN111650834A (zh) * 2020-06-16 2020-09-11 湖南工业大学 基于极限学习机(elm)的污水处理过程预测控制方法
CN111832825A (zh) * 2020-07-14 2020-10-27 山东大学 融合长短期记忆网络和极限学习机的风电预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEIWEICAO 等: "Online sequential extreme learning machine based adaptive control for wastewater treatment plant", 《NEUROCOMPUTING》 *
WEIWEICAO 等: "Prediction Based on Online Extreme Learning Machine in WWTP Application", 《INTERNATIONAL CONFERENCE ON NEURAL INFORMATION PROCESSING》 *

Also Published As

Publication number Publication date
CN112308169B (zh) 2022-05-03

Similar Documents

Publication Publication Date Title
CN110675623B (zh) 基于混合深度学习的短时交通流量预测方法、系统、装置
CN108898215B (zh) 一种基于二型模糊神经网络的污泥膨胀智能辨识方法
CN105224872B (zh) 一种基于神经网络聚类的用户异常行为检测方法
CN100367300C (zh) 一种基于人工神经网络的特征选择方法
CN112183719A (zh) 一种基于多目标优化-模糊神经网络的出水总氮智能检测方法
CN107025338A (zh) 一种基于递归rbf神经网络的污泥膨胀故障辨识方法
CN109492265B (zh) 基于动态非线性pls软测量方法的废水出水指标预测方法
CN109472088A (zh) 一种页岩气调产井生产压力动态预测方法
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN116542382A (zh) 基于混合优化算法的污水处理溶解氧浓度预测方法
CN114022812B (zh) 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法
CN116689503A (zh) 一种基于记忆性功能网络的带钢全长厚度预测方法
CN113344288A (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN114417740B (zh) 一种深海养殖态势感知方法
CN113868938A (zh) 基于分位数回归的短期负荷概率密度预测方法、装置及系统
CN112765902A (zh) 基于TentFWA-GD的RBF神经网络软测量建模方法及其应用
CN115860211A (zh) 一种基于局部在线建模的铸坯质量预测方法
CN112819087B (zh) 一种基于模块化神经网络的出水bod传感器异常检测方法
CN112308169B (zh) 一种基于改进在线序列极限学习机的出水水质预测方法
CN113641733A (zh) 一种河道断面流量实时智能推求方法
Zhang et al. A network traffic prediction model based on quantum inspired PSO and neural network
CN101702172A (zh) 一种基于类-属性关系依赖度的数据离散化方法
CN112183820A (zh) 基于线性规划的有向网络链路预测方法
CN114871000A (zh) 一种浮选加药自适应调控方法
Dohnal et al. What are artificial neural networks and what they can do?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant