CN116796145A - 基于模块化随机配置网络的出水氨氮浓度软测量方法 - Google Patents
基于模块化随机配置网络的出水氨氮浓度软测量方法 Download PDFInfo
- Publication number
- CN116796145A CN116796145A CN202310564457.4A CN202310564457A CN116796145A CN 116796145 A CN116796145 A CN 116796145A CN 202310564457 A CN202310564457 A CN 202310564457A CN 116796145 A CN116796145 A CN 116796145A
- Authority
- CN
- China
- Prior art keywords
- network
- effluent
- output
- ammonia nitrogen
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 title claims abstract description 71
- 238000000691 measurement method Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 69
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 43
- 239000010865 sewage Substances 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 30
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 25
- 238000005259 measurement Methods 0.000 claims abstract description 24
- 238000010219 correlation analysis Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 11
- 230000010354 integration Effects 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 7
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 6
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 229910052760 oxygen Inorganic materials 0.000 claims description 6
- 239000001301 oxygen Substances 0.000 claims description 6
- 229910052698 phosphorus Inorganic materials 0.000 claims description 6
- 239000011574 phosphorus Substances 0.000 claims description 6
- 230000033116 oxidation-reduction process Effects 0.000 claims description 5
- 201000006681 severe congenital neutropenia Diseases 0.000 claims description 4
- 101000854060 Homo sapiens Oxygen-regulated protein 1 Proteins 0.000 claims description 3
- 101000720693 Homo sapiens Oxysterol-binding protein-related protein 1 Proteins 0.000 claims description 3
- 101150097577 OPR1 gene Proteins 0.000 claims description 3
- 101150037114 OPR2 gene Proteins 0.000 claims description 3
- 101100028078 Oryza sativa subsp. japonica OPR1 gene Proteins 0.000 claims description 3
- 102100025924 Oxysterol-binding protein-related protein 1 Human genes 0.000 claims description 3
- MMDJDBSEMBIJBB-UHFFFAOYSA-N [O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O.[NH6+3] Chemical compound [O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O.[NH6+3] MMDJDBSEMBIJBB-UHFFFAOYSA-N 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 125000000858 thiocyanato group Chemical group *SC#N 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 7
- 210000004556 brain Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000840 electrochemical analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 239000002351 wastewater Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于模块化随机配置网络的出水氨氮浓度软测量方法涉及污水处理过程智能建模领域。本发明基于类脑模块化网络以及随机配置网络在处理复杂建模任务时各自的优势,解决污水处理中出水氨氮浓度难以实时精准检测的问题。该方法首先利用灰色关联分析提取影响出水氨氮浓度的主要变量;然后,基于模糊聚类方法进行任务分解以缓解各建模任务的复杂性;之后,利用“分而治之”思想,对分解后的各子任务分别构建相应的随机配置网络子模型,并将各子模型输出的结果进行集成以提升对出水氨氮浓度的测量效果,进而实现对污水处理过程出水氨氮浓度的精准有效测量。基于实际污水处理厂收集的相关水质数据验证了所提方法在检测出水氨氮浓度方面的有效性和优越性。
Description
技术领域
本发明涉及工业人工智能领域并直接应用于污水处理过程智能建模领域。
背景技术
污水处理过程是水资源管理和防治的重要基础。通过对生活和工业过程产生的废水进行有效处理,可以一定程度上实现水资源的可重复利用。在污水处理过程中,出水水质的检测对污水处理过程的管理和调控至关重要;实现对污水处理过程的关键水质检测能够有效避免因污水处理不佳导致排放不达标等问题。其中,出水氨氮浓度是评估污水处理过程出水水质优劣的一个重要指标。当出水氨氮浓度过高时会严重危及周边的鱼、虾等水生生物,对周围生态环境造成不利影响。实现对出水氨氮浓度的实时有效检测不仅可以及时发现污水处理过程中存在的不足,同时也为相关污水处理的调控措施提供了一定的依据,进而确保出水氨氮浓度符合排放标准。因此,实现对出水氨氮浓度实时有效监测具有十分重要的意义。
当前,国内外污水处理厂常用于污水处理过程出水氨氮浓度的测量方法主要包括有电化学分析法、仪器分析方法以及分光光度法等。尽管使用这些方法在测量出水氨氮浓度时具有较高的测量精度高,但由于测量周期长、测量过程复杂、成本高、消耗大且极易受到人为因素影响等问题,难以保障对出水氨氮浓度的精准高效测量。近年来,随着工业信息化技术的不断发展、基于人工智能技术的智慧工厂建设成为了污水处理过程未来的重要发展方向。值得注意的是,以数据驱动建模的软测量技术为代表的智能建模方法由于其在进行水质测量过程中具有操作简单、易于执行、快速测量等优势,被广泛应用于污水处理过程的关键水质检测领域。其中,随机配置网络作为的随机化学习的经典模型,因其学习速度快、逼近性能强以及计算简单等优势被广泛应用于工业过程的数据驱动建模等领域。然而,由于实际污水处理过程受到一系列生化反应过程以及多种复杂不确定因素的影响具有多工况、复杂不确定等特点,单一网络模型由于自身存在的记忆遗忘以及普适建模特点,在处理这类多工况复杂建模任务时具有一定的局限性。此外,目前模块化神经网络大多采用传统的前馈神经网络作为基础模型,这类模型进行建模时存在网络参数和结构难以快速学习的问题,致使建模精度和效率难以保证。相比之下,随机配置网络具有学习速度快,逼近性能强等优势。然而,当前基于随机配置网络开发的出水氨氮浓度软测量模型的研究还很少。为进一步提高随机配置网络的逼近性能,以提高对出水氨氮浓度的建模性能,本发明基于类脑模块化思想以及随机配置网络各自的优势,设计了一种模块化随机配置网络。该网络通过分而治之的思想,将复杂的建模任务进行模块化处理,并采用改进的随机配置网络对子任务进行学习以提升网络整体的建模性能,进而实现对污水处理过程出水氨氮浓度的实时精准检测。
发明内容
本发明设计了一种具有分而治之以及自主学习特性的模块化随机配置网络出水氨氮浓度软测量模型。该方法受到人脑在分析处理信息时存在“分而治之”、分区协同的特性,以及大脑的模块化分区结构的启发,通过模拟人脑皮层结构和功能特性,对不同学习任务“分而治之”建立相应的网络随机配置网络模型,以实现对出水氨氮浓度的实时精准检测。具体来说,该模型首先基于灰色关联分析理论和专家知识,分析各水质参数变量与待测出水氨氮浓度的关联性,以获取与出水氨氮关联性强的辅助变量,降低模型的复杂度。然后,通过模糊均值聚类的方式对系统产生的数据进行任务分解;之后基于划分后的各子任务基于改进的随机配置网络建立相应的子模型。由于子模型中的随机配置网络能根据待处理的子任务中数据的分布特性自主构建相应的网络结构和参数,因此,该软测量方法能够在保障网络通用逼近能力的同时,具有自主学习和数据依赖特性,进而实现了对出水氨氮浓度的精准高效测量。为了实现上述目的,本发明采用以下技术方案:
步骤1:污水处理过程中相关水质数据采集与预处理;采集某污水处理厂在污水处理中的相关实际水质数据,包括:进水总磷TP1、厌氧末端氧化还原电位OPR1、好氧前端溶解氧浓度DO1、温度、好氧末端溶解氧浓度DO2、固体悬浮物浓度TSS、pH值、出水氧化还原电位OPR2、出水硝态氮浓度NO3-N、出水总磷TP2和出水氨氮浓度共11个水质参数;
步骤2:选取辅助变量;通过灰色关联分析来对上述污水处理过程中所采集到的相关水质参数与出水氨氮浓度间的关联性进行度量;
假设共有d=10个比较序列和1个参考序列,各序列所包含的样本数为N,使用X0={X0(1),X0(2),...,X0(N)}表示灰色关联分析中所选取的参考序列,比较序列为Xi={Xi(1),Xi(2),...,Xi(N)},i=1,2,3,…,d;为了更为准确地分析参考序列与各比较序列间的关联系数,这里对各比较序列Xi和参考序列X0中的数据进行如下归一化处理以缓解不同量纲对分析结果的影响。
通过对参考序列X0和比较序列Xi进行归一化后,得到一组新的参考序列x0和比较序列xi;其中,第i个比较序列与参考序列,在第n个时刻的灰色关联系数χi(n)可通过下式计算:
其中,x0(n)为参考序列在第n个时刻的样本值,xi(n)为比较序列在第n个时刻的样本值;表示所有比较序列与参考序列相差最小的值;/>表示所有比较序列与参考序列相差最大的值;记Δi(n)=|x0(n)-xi(n)|,则第i个比较序列与参考序列即出水氨氮浓度的灰色关联系数为:
其中η=0.5为分辨系数。因此,这里将不同时刻的关联系数取均值,来对各序列关联程度进行整体性比较,得到比较序列与参考序列间的关联程度,计算如下:
为了便于分析、比较各相关水质参数与出水氨氮浓度的关联度,这里将公式(5)得到的各相关参数与氨氮浓度的关联度进行统计。关联系数越大意味着该参数变量与出水氨氮浓度的相关程度就越高。通过公式(5)计算各水质参数与出水氨氮浓度的关联度,并将结果进行排序,得到与出水氨氮浓度的关联度较大的好氧前端DO1,出水pH,厌氧末端ORP1、进水TP、出水NO3-N以及温度T共6个变量作为辅助变量进行研究。
步骤3:设计基于模块化随机配置网络的出水氨氮浓度软测量模型;
该软测量模型的构建流程包括5个模块、分别为输入层、任务分解层、任务分配层、子网络模块以及输出整合层;下面详细介绍模型构建的主要流程和具体的功能实现:
步骤3.1:输入层用来传输数据;这里将数据通过输入层传输至任务分解模块,其中输入层的节点个数为6与输入辅助变量个数一致。
步骤3.2:任务分解层用来对输入数据进行处理,目的是将一个复杂的学习任务分解为若干个相对简单的子任务;该模块采用使用模糊均值聚类方法实现对获取的数据进行聚类;用Ck表示各类别的聚类中心,xn表示第n个输入样本,μnk表示样本xn对第k个聚类中心Ck的隶属度。则可通过最小化如下损失函数J,来实现对样本进行分簇:
其中,N为样本数。K为聚类簇数,α为常数,通常设置为α=2。||*||表示数据相似性的距离度量,这里采用最常见的欧氏距离;隶属度μnk表示的是第n个样本属于第k个类的程度,其通过下式计算:
其中Cj对表示第j个聚类中心,j=1,2,…,K;对应的聚类中心Ck可由下式计算:
由此,通过任务分解模块对样本进行分解后,得到了多个聚类簇和聚类中心;
步骤3.3:在任务分配层中首先将任务分解模块采用的模糊均值聚类方法得到各样本数据对于不同聚类簇的隶属度值视为该样本属于各聚类簇的初始权值系数;然后在任务分配层中设置一个分配阈值vp=0.4,其取值范围为区间[0,1],代表样本属于各簇的最低隶属度值;若某一样本的权值系数大于该阈值,则将该样本分配给相应的子任务;同时,任务分配层会统计该样本被分配至各任务的次数并记录相应的权值系数,便于输出层进行加权集成。
步骤3.4:子网络模块主要针对各子任务进行建模;在模块化神经网络中,子网络的建模性能对于整个网络模型的建模性能至关重要。随机配置网络在处理大规模复杂数据建模任务时具有学习速度快,逼近能力强的优势,且能够根据建模需求自主生成相应的网络结构,大幅较少了参数调优的工作负担。因此,采用随机配置网络作为模块化神经网络的子网络来对任务分解后得到的各子任务构建相应的子模型。
假设任务分配模块将获取到的样本{X,Y}分配至相应的各子任务t中,t=1,2,…K,K为子任务数与聚类簇数相同,得到的各任务对应的数据表示为{Xt,Yt};其中,表示为第t个子任务中网络的输入数据,相应的输出表示为Nt表示分配至任务t中的样本数。假设,对于第t个子任务已经构建好了具有L-1个隐节点的随机配置网络,给定目标函数/>则网络的输出可以表示为:
其中,Xt表示第t个子任务对应的输入数据,βj=[βj1,βj2,...,βjM]为该子网络对应的第j个隐含节点的输出权值;hj为第j个隐节点的输出向量,其表示为:
g(·)为隐含层神经元节点的激活函数,在随机配置网络中选取sigmoid函数作为隐含层神经元的激活函数,即:
其中,<·>表示欧式空间的内积,wj,bj分别为第j个隐节点的输入权值和阈值;当前网络的残差向量定义为:
对应的输出残差值为
M为输出节点的个数;若当前网络的输出残差没能满足预设误差容忍要求,即eP=0.001,则该网络会根据不等式约束条件(14)来选出新的隐含层神经元节点,得到第L个隐含层节点参数gL(wL和bL)。其中,网络选取隐含层节点参数的不等式约束条件为:
式中:0<ε<1和0<q<1为误差下降因子,设置ε=0.015,q=0.8;hL(Xt)=gL(wL,Xt,bL)表示第L个隐含节点的输出,其可通过公式(10-11)计算得出,eL-1,m为网络构建L-1个隐含层节点时第m个输出层节点的输出残差,m=1,2,…,M,则对于第t个子任务构建第L个隐节点后的网络隐含层节点的输出权值βt为:
则,第L个隐含层节点建立后网络的输出为:
此时网络的输出残差为:
然后,根据公式(13)计算此时网络的输出误差值并判断网络的输出误差是否满足预设误差要求,即/>若满足则SCNs构建完成;否则继续按照不等式约束条件(14)增加新的隐含层节点参数g(w,b)来构建网络减少网络的输出误差,此时子网络隐节点数为L=L+1,直至满足终止条件/>或L≥Lmax,Lmax=50。
步骤3.5:输出整合层的作用是对各子网络的输出进行集成处理,以得到最终网络的整体输出。在模块化随机配置网络中,输出整合策略的设置与任务分解的特点密切关联。因此,在该输出策略中选用加权平均法对各子网络的结果进行整合;假设对于第n个输入样本xn,被分配到各子任务的概率为若/>则将其设置为/>其中t=1,2,…K为子任务数,vp为各任务的分配阈值,其取值范围为区间[0,1],代表样本属于各簇的最低隶属度值,这里设置vp=0.4;之后对/>进行如下处理,得到该样本对应第t的任务的最终输出权值/>
因此,对于第n个输入样本,对应网络的最终输出yn为:
其中,表示样本xn在任务t上的输出,可通过公式(16)计算得到;未被选择的子网络则对网络整体的输出没有任何贡献;因此,第n个样对应的网络的最终输出可通过公式(19)计算得到,为该样本被分配至各相应子网络的加权和。
步骤3:根据步骤2,得到构建后的模块化随机配置网络,并基于该构建好的模型来对城市污水处理过程出水氨氮浓度进行测量,得到出水氨氮浓度的测量结果。
本发明不同与传统神经网络方法,具有如下特点:
本发明针对城市污水处理过程存在的多工况、不确定等复杂因素的影响,出水氨氮浓度难以实时、精准检测的问题。提出了一种基于模块化随机配置网络的软测量建模方法。该方法通过模拟人脑“分而治之”的思想来处理复杂、多工况的非线性建模任务,进而来实现对出水氨氮浓度的实时、准确检测。具体来说,该软测量方法首先通过灰色关联分析提取对出水氨氮浓度影响较大的变量以提高模型对出水氨氮浓度的测量性能;然后,通过对复杂任务的分解来降低单一模型的建模复杂度;进一步,基于改进的随机配置网络对子任务进行学习以提高模块化网络整体的学习效率和逼近精度。该软测量方法具有以下特点:
1)利用灰色关联分析对水质参数变量进行筛选,以降低模型的复杂度和计算量;
2)在任务分解层利用模糊均值聚类对系统产生的数据进行任务分解,使得每个子任务的数据具有高度的相似性和一致性分布以提高子模型的学习效率和泛化性能;
3)通过改进的随机配置算法作为子模型对各子任务进行建模以提高模块化随机配置网络整体的学习效率和建模性能。
4)由于使用改进的随机构建网络作为子模型,使得子模型能够根据待处理的子任务自主构建相应的网络结构和参数。因此,子网络在具有良好的自主学习和数据依赖性特征的同时保证了模型的通用逼近能力;
附图说明
图1为本发明M-SCNs软测量模型的基本策略图;
图2为模块化随机配置网络的基本结构图;
图3为本实例出水氨氮浓度测试结果图;
图4为本实例出水氨氮浓度测试误差图。
具体实施方式
采集某污水处理厂在污水处理中的相关实际水质数据,包括:进水总磷TP1、厌氧末端氧化还原电位OPR1、好氧前端溶解氧浓度DO1、温度、好氧末端溶解氧浓度DO2、固体悬浮物浓度TSS、pH值、出水氧化还原电位OPR2、出水硝态氮浓度NO3-N、出水氨氮浓度、出水总磷TP2,共498组实验数据进行研究,主要步骤如下:
步骤1:辅助变量选取
通过如下的灰色关联分析来对上述污水处理过程中所采集到的相关水质参数与出水氨氮浓度间的关联性进行度量,以获取与出水氨氮关联性强的辅助变量,进而提高模型的建模精度;
将获取到的除出水氨氮浓度外的其他水质参数作为比较序列,出水氨氮浓度作为参考序列,且各序列所包含的样本数为N。使用X0={X0(1),X0(2),...,X0(N)}表示灰色关联分析中所选取的参考序列,比较序列为Xi={Xi(1),Xi(2),...,Xi(N)},i=1,2,3,…,d;d为比较序列的个数。为了更为准确地分析参考序列与各比较序列间的关联系数,这里对各比较序列Xi和参考序列X0中的数据进行如下归一化处理以缓解不同量纲对分析结果的影响。
通过对参考序列X0和比较序列Xi进行归一化后,得到一组新的参考序列x0和比较序列xi;其中,第i个比较序列与参考序列,在第n个时刻的灰色关联系数χi(n)可通过下式计算:
其中,x0(n)为参考序列在第n个时刻的样本值,xi(n)为比较序列在第n个时刻的样本值;记Δi(n)=|x0(n)-xi(n)|,则第i个比较序列与参考序列即出水氨氮浓度的灰色关联系数为:
其中η=0.5为分辨系数。因此,这里将不同时刻的关联系数取均值,来对各序列关联程度进行整体性比较,得到比较序列与参考序列间的关联程度,计算如下:
为了便于分析、比较各相关水质参数与出水氨氮浓度的关联度,这里将公式(24)得到的各相关参数与氨氮浓度的关联度进行统计。关联系数越大意味着该参数变量与出水氨氮浓度的相关程度就越高。因此,对通过公式(24)计算得到的各水质参数与出水氨氮浓度的关联度进行统计,得到与出水氨氮浓度的关联度较大的好氧前端DO1,出水pH,厌氧末端ORP1、进水TP、出水NO3-N以及温度T共6个变量作为辅助变量进行研究。
步骤2:设计基于模块化随机配置网络的出水氨氮浓度软测量模型;
该软测量模型的构建流程包括5个模块、分别为输入层、任务分解层、任务分配层、子网络模块以及输出整合层;下面详细介绍模型构建的主要流程和具体的功能实现:
步骤2.1:输入模块用来传输数据;这里将进行特征提取后的水质数据X传输至任务分解模块,其中输入层的节点个数为6与输入辅助变量个数一致。该层共包含6个节点,其中每个节点代表一个对应的水质变量。
步骤2.2:基于k-means方法设置样本的聚类中心C和聚类个数K,并将其用于模糊隶属度函数的设置来对输入数据进行模糊化处理,这里,选择高斯函数作为模糊隶属度函数。在模糊隶属度层中每个节点代表一个对应的语言变量值。该层节点的输出为输入分量属于模糊集的隶属函数,则第n个输入样本的第i个输入变量对应的模糊隶属度为可通过高斯隶属度函数计算求得,这里高斯隶属度函数的中心为通过k-means得到的聚类中心C,k=1,2,…K,代表模糊规则,与聚类个数K相同。
在任务分解层中使用模糊均值聚类方法实现对获取的数据进行聚类。目的是将一个复杂的学习任务分解为若干个相对简单的子任务;用Ck表示各类别的聚类中心,xn表示第n个输入样本,μnk表示样本xn对第k个聚类中心Ck的隶属度。则可通过最小化如下损失函数J,来实现对样本进行分簇:
其中,N为样本数。K为聚类簇数,α为常数,通常设置为α=2。||*||表示数据相似性的距离度量,这里采用最常见的欧氏距离;隶属度μnk表示的是第n个样本属于第k个类的程度,其通过下式计算:
其中Cj对表示第j个聚类中心,j=1,2,…,K;对应的第k个聚类中心Ck可由下式计算:
由此,通过任务分解模块对样本进行分解后,得到了多个聚类簇和聚类中心;
步骤2.3:在任务分配层中将任务分解模块采用的模糊均值聚类方法得到各样本数据对于不同聚类簇的隶属度值视为该样本属于各聚类簇的初始权值系数;然后在任务分配层中设置一个分配阈值vp,其取值范围为[0,1],代表样本属于各簇的最低隶属度值,这里设置vp=0.4;同时,任务分配层会统计该样本被分配至各任务的次数并记录相应的权值系数,便于输出层进行加权集成。
步骤2.4:针对各子任务中的数据样本利用随机配置网络构建相应的子模型;
假设任务分配模块将获取到的样本{X,Y}分配至相应的各子任务t中,t=1,2,…K,K为子任务数与聚类簇数相同,得到的各任务对应的数据表示为{Xt,Yt};其中,表示为第t个子任务中网络的输入数据,相应的输出表示为Nt表示分配至任务t中的样本数。假设,对于第t个子任务已经构建好了具有L-1个隐节点的随机配置网络,给定目标函数/>则网络的输出可以表示为:
其中,Xt表示第t个子任务对应的输入数据,βj=[βj1,βj2,...,βjM]为该子网络对应的第j个隐含节点的输出权值;hj为第j个隐节点的输出向量,其表示为:
g(·)为隐含层神经元节点的激活函数,在随机配置网络中选取sigmoid函数作为隐含层神经元的激活函数,即:
其中,<·>表示欧式空间的内积,wj,bj分别为第j个隐节点的输入权值和阈值;当前网络的残差向量定义为:
对应的输出残差值为
M为输出节点的个数;若当前网络的输出残差没能满足预设误差容忍要求,即则该网络会根据不等式约束条件来选出新的隐含层神经元节点,得到第L个隐含层节点参数gL(wL和bL)。其中,网络选取隐含层节点参数的不等式约束条件为:
式中:0<ε<1和0<q<1为误差下降因子,这里设置ε=0.015,q=0.8;hL(Xt)=gL(wL,Xt,bL)表示第L个隐含节点的输出,其可通过公式(10-11)计算得出,eL-1,m为网络构建L-1个隐含层节点时第m个输出层节点的输出残差,m=1,2,…,M,则对于第t个子任务构建第L个隐节点后的网络隐含层节点的输出权值βt为:
则,第L个隐含层节点建立后网络的输出为:
此时网络的输出残差为:
然后,根据公式(32)计算此时网络的输出误差值并判断网络的输出误差是否满足预设误差要求,即/>若满足则SCNs构建完成;否则继续按照不等式约束条件(33)增加新的隐含层节点参数g(w,b)来构建网络减少网络的输出误差,此时子网络隐节点数为L=L+1,直至满足终止条件/>或L≥Lmax,Lmax=50。
步骤2.5:通过输出整合层对各子网络的输出进行集成处理,以得到最终网络的整体输出。
假设对于第n个输入样本xn,被分配到各子任务的概率为若则将其设置为/>其中t=1,2,…K为子任务数,vp为各任务的分配阈值,其取值范围为区间[0,1],代表样本属于各簇的最低隶属度值,这里设置vp=0.4;之后对/>进行如下处理,得到该样本对应第t的任务的最终输出权值/>
因此,对于第n个输入样本,对应网络的最终输出yn为:
其中,表示样本xn在任务t上的输出,可通过公式(35)计算得到;未被选择的子网络则对网络整体的输出没有任何贡献;因此,第n个样对应的网络的最终输出可通过公式(38)计算得到,为该样本被分配至各相应子网络的加权和。
步骤3:根据步骤2,得到构建后的模块化随机配置网络,并基于该构建好的模型来对城市污水处理过程出水氨氮浓度进行测量,得到出水氨氮浓度的的测量结果。
Claims (1)
1.基于模块化随机配置网络的出水氨氮浓度软测量方法,其特征在于,包括以下步骤:
步骤1:采集污水处理过程中相关水质数据;采集某污水处理厂在污水处理中的相关实际水质数据,包括:进水总磷TP1、厌氧末端氧化还原电位OPR1、好氧前端溶解氧浓度DO1、温度、好氧末端溶解氧浓度DO2、固体悬浮物浓度TSS、pH值、出水氧化还原电位OPR2、出水硝态氮浓度NO3-N、出水氨氮浓度、出水总磷TP2共11个水质参数;
步骤2:选取辅助变量;通过如下的灰色关联分析方法对上述污水处理过程所采集到的相关水质参数与出水氨氮浓度间的关联性进行度量,以获取与出水氨氮关联性强的辅助变量;
将获取到的除出水氨氮浓度外的其他水质参数作为比较序列,出水氨氮浓度作为参考序列,且各序列所包含的样本数为N;使用X0={X0(1),X0(2),...,X0(N)}表示灰色关联分析中所选取的参考序列,比较序列为Xi={Xi(1),Xi(2),...,Xi(N)},i=1,2,3,…,d;d为比较序列的个数;为了准确分析参考序列与各比较序列间的关联系数,这里对各比较序列Xi和参考序列X0中的数据进行如下归一化处理以缓解不同量纲对分析结果的影响;
通过对参考序列X0和比较序列Xi进行归一化后,得到一组新的参考序列x0和比较序列xi;其中,第i个比较序列与参考序列,在第n个时刻的灰色关联系数χi(n)通过下式计算:
其中,x0(n)为参考序列在第n个时刻的样本值,xi(n)为比较序列在第n个时刻的样本值,η=0.5为分辨系数;表示所有比较序列与参考序列相差最小的值;表示所有比较序列与参考序列相差最大的值;记Δi(n)=|x0(n)-xi(n)|,第i个比较序列与参考序列即出水氨氮浓度的灰色关联系数为:
因此,这里将不同时刻的关联系数取均值,来对各序列关联程度进行整体性比较,得到比较序列与参考序列间的关联程度,计算如下:
为了便于比较和分析各相关水质参数与出水氨氮浓度的关联度,这里将公式(5)得到的各相关参数与氨氮浓度的关联度进行统计;关联系数越大意味着该参数变量与出水氨氮浓度的相关程度就越高;因此,对通过公式(5)计算得到的各水质参数与出水氨氮浓度的关联度进行统计,得到与出水氨氮浓度的关联度较大的好氧前端DO1,出水pH,厌氧末端ORP1、进水TP、出水NO3-N以及温度T共6个变量作为辅助变量进行研究,并将特征提取后的输入数据用X表示,Y表示对应的出水氨氮浓度;
步骤3:设计基于模块化随机配置网络的出水氨氮浓度软测量模型;
该软测量模型的构建流程包括5个模块、分别为输入层、任务分解层、任务分配层、子网络模块以及输出整合层;下面详细介绍模型构建的流程和具体功能实现:
步骤3.1:输入层用来传输数据X;这里将数据通过输入层传输至任务分解模块,其中输入层的节点个数为6与输入辅助变量个数一致;
步骤3.2:任务分解层用来对输入数据进行处理,目的是将一个复杂的学习任务分解为若干个相对简单的子任务;该模块使用模糊均值聚类方法实现对获取的数据集进行聚类;用Ck表示各类别的聚类中心,xn表示第n个输入样本,μnk表示样本xn对第k个聚类中心Ck的隶属度;则可通过最小化如下损失函数J,来实现对样本进行分簇:
其中,N为样本数;K为聚类簇数,α为常数,设置为α=2;||*||表示数据相似性的距离度量,这里采用欧氏距离;隶属度μnk表示的是第n个样本属于第k个类的程度,其通过下式计算:
其中Cj对表示第j个聚类中心,j=1,2,…,K;对应的第k个聚类中心Ck可由下式计算:
由此,通过任务分解模块对样本进行分解后,得到了多个聚类簇和聚类中心;
步骤3.3:在任务分配层中首先将任务分解模块采用的模糊均值聚类方法得到各样本数据对于不同聚类簇的隶属度值视为该样本属于各聚类簇的初始权值系数;然后在任务分配层中设置一个分配阈值vp,其取值范围为[0,1],代表样本属于各簇的最低隶属度值,这里设置vp=0.4;若某一样本的权值系数大于该阈值,则将该样本分配给相应的子任务;同时,任务分配层会统计该样本被分配至各任务的次数并记录相应的权值系数,便于输出层进行加权集成;
步骤3.4:子网络模块针对各子任务进行建模;在模块化神经网络中,子网络的建模能力对于整个网络模型的建模性能至关重要;随机配置网络在处理大规模复杂建模任务时具有学习速度快,逼近能力强的优势,且能够根据建模需求自主生成相应的网络结构,大幅较少了参数调优的工作负担;因此,采用随机配置网络作为模块化神经网络的子网络来对任务分解后得到的各子任务构建相应的子模型;
假设任务分配模块将获取到的样本{X,Y}分配至相应的各子任务t中,t=1,2,…K,K为子任务数与聚类簇数相同,得到的各任务对应的数据表示为{Xt,Yt};其中,表示为第t个子任务中网络的输入数据,相应的输出表示为Nt表示分配至任务t中的样本数;假设,对于第t个子任务已经构建好了具有L-1个隐节点的随机配置网络,给定目标函数/>网络的输出为:
其中,Xt表示第t个子任务对应的输入数据,βj=[βj1,βj2,...,βjM]为子网络对应的第j个隐含节点的输出权值;M为输出节点个数;hj为第j个隐节点的输出向量,其表示为:
g(·)为隐含层神经元节点的激活函数,在随机配置网络中选取sigmoid函数作为隐含层神经元的激活函数,即:
其中,<·>表示欧式空间的内积,wj,bj分别为第j个隐节点的输入权值和阈值;当前网络的残差向量定义为:
对应的输出残差值为
M为输出节点的个数;若当前网络的输出残差没能满足预设误差容忍要求,即eP=0.001,则该网络会根据不等式约束条件(14)来选出新的隐含层神经元节点,得到第L个隐含层节点参数gL(wL和bL);其中,网络选取隐含层节点参数的不等式约束条件为:
式中:0<ε<1和0<q<1为误差下降因子,这里设置ε=0.015,q=0.8;hL(Xt)=gL(wL,Xt,bL)表示第L个隐含节点的输出,通过公式(10-11)计算得出,eL-1,m为网络构建L-1个隐含层节点时第m个输出层节点的输出残差,m=1,2,…,M,则对于第t个子任务构建第L个隐节点后的网络隐含层节点的输出权值βt为:
则,第L个隐含层节点建立后网络的输出为:
此时网络的输出残差为:
然后,根据公式(13)计算此时网络的输出误差值并判断网络的输出误差是否满足预设误差要求,即/>若满足则SCNs构建完成;否则继续按照不等式约束条件(14)增加新的隐含层节点参数g(w,b)来构建网络减少网络的输出误差,此时子网络隐节点数为L=L+1,直至满足终止条件/>eP=0.001或L≥Lmax,Lmax=50;
步骤3.5:输出整合层的作用是对各子网络的输出进行集成处理,以得到最终网络的整体输出;在模块化随机配置网络中,输出整合策略的设置与任务分解的特点密切关联;因此,在该输出策略中选用加权平均法对各子网络的结果进行整合;假设对于第n个输入样本xn,被分配到各子任务的概率为若/>则将其设置为/>其中t=1,2,…K为子任务数,vp为各任务的分配阈值,其取值范围为区间[0,1],代表样本属于各簇的最低隶属度值,这里设置vp=0.4;之后对/>进行如下处理,得到该样本对应第t的任务的最终输出权值/>
因此,对于第n个输入样本,对应网络的最终输出yn为:
其中,表示样本xn在任务t上的输出,可通过公式(16)计算得到;未被选择的子网络则对网络整体的输出没有任何贡献;因此,第n个样对应的网络的最终输出可通过公式(19)计算得到,为该样本被分配至各相应子网络的加权和;
步骤4:根据步骤3,得到构建后的模块化随机配置网络,并基于该构建好的模型来对城市污水处理过程出水氨氮浓度进行测量,得到出水氨氮浓度的测量结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310564457.4A CN116796145A (zh) | 2023-05-18 | 2023-05-18 | 基于模块化随机配置网络的出水氨氮浓度软测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310564457.4A CN116796145A (zh) | 2023-05-18 | 2023-05-18 | 基于模块化随机配置网络的出水氨氮浓度软测量方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116796145A true CN116796145A (zh) | 2023-09-22 |
Family
ID=88042897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310564457.4A Pending CN116796145A (zh) | 2023-05-18 | 2023-05-18 | 基于模块化随机配置网络的出水氨氮浓度软测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116796145A (zh) |
-
2023
- 2023-05-18 CN CN202310564457.4A patent/CN116796145A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Han et al. | A soft computing method to predict sludge volume index based on a recurrent self-organizing neural network | |
CN102854296B (zh) | 一种基于集成神经网络的污水处理软测量方法 | |
Huang et al. | A fast predicting neural fuzzy model for on-line estimation of nutrient dynamics in an anoxic/oxic process | |
CN109344971B (zh) | 一种基于自适应递归模糊神经网络的出水氨氮浓度预测方法 | |
Pham et al. | Modeling of Bunus regional sewage treatment plant using machine learning approaches | |
CN103793604A (zh) | 一种基于相关向量机的污水处理软测量方法 | |
CN115660165A (zh) | 一种基于双层pso的模块化神经网络出水氨氮浓度多步预测方法 | |
Sharghi et al. | Monitoring effluent quality of wastewater treatment plant by clustering based artificial neural network method | |
CN115456245A (zh) | 一种感潮河网区溶解氧预测方法 | |
CN112967763A (zh) | 基于模糊神经网络的出水总磷预测方法、电子设备及介质 | |
Kocijan et al. | Sequencing batch-reactor control using Gaussian-process models | |
CN109978024B (zh) | 一种基于互联模块化神经网络的出水bod预测方法 | |
CN113838542B (zh) | 化学需氧量智能预测方法和系统 | |
Grieu et al. | KSOM and MLP neural networks for on-line estimating the efficiency of an activated sludge process | |
Varkeshi et al. | Predicting the performance of Gorgan wastewater treatment plant using ANN-GA, CANFIS, and ANN models | |
CN112001436A (zh) | 一种基于改进的极限学习机的水质分类方法 | |
CN116796145A (zh) | 基于模块化随机配置网络的出水氨氮浓度软测量方法 | |
CN114781166A (zh) | 基于加权概率慢特征模型的污水处理过程软测量方法 | |
Zhang et al. | Neighborhood component analysis for modeling papermaking wastewater treatment processes | |
CN111815151A (zh) | 一种基于数据挖掘的污水处理厂甲烷产量预测方法 | |
Li et al. | Soft Sensor of Effluent Ammonia Nitrogen Concentration Based on Modular Stochastic Configuration Networks | |
Xu et al. | Prediction of the Wastewater's pH Based on Deep Learning Incorporating Sliding Windows. | |
Meng et al. | A Self-Organizing Modular Neural Network for Nonlinear System Modeling | |
Quan et al. | Prediction of effluent Ammonia Nitrogen using FNN-based CBR | |
Sainz et al. | Recurrent neuro-fuzzy modeling of a wastewater treatment plant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |