CN112631255A - 一种基于变分自编码器模型的污水处理过程故障监测方法 - Google Patents
一种基于变分自编码器模型的污水处理过程故障监测方法 Download PDFInfo
- Publication number
- CN112631255A CN112631255A CN202011585643.9A CN202011585643A CN112631255A CN 112631255 A CN112631255 A CN 112631255A CN 202011585643 A CN202011585643 A CN 202011585643A CN 112631255 A CN112631255 A CN 112631255A
- Authority
- CN
- China
- Prior art keywords
- data
- sewage treatment
- treatment process
- model
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0243—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/24—Pc safety
- G05B2219/24065—Real time diagnostics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W10/00—Technologies for wastewater treatment
- Y02W10/10—Biological treatment of water, waste water, or sewage
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Activated Sludge Processes (AREA)
Abstract
本发明公开了一种基于变分自编码器模型的污水处理过程故障监测方法,用于解决由于处理污水过程数据的非高斯性和非线性导致的监测结果不准确的问题。本发明包括“离线训练”和“在线监测”两个阶段。“离线训练”包括:首先对采集的正常数据进行归一化处理,然后利用变分自编码器建立离线训练模型。“在线监测”包括:对新采集到的数据利用正常数据的均值和方差进行归一化处理,并利用在离线状态训练好的模型实现在线监测。本发明利用变分自编码器提取包含非线性信息和服从高斯分布的特征,可以更好的实现对污水处理过程的准确监测。
Description
技术领域
本发明涉及基于数据驱动的故障监测技术领域,特别是涉及一种针对复杂处理过程的故障监测技术。本发明是基于数据驱动的方法在污水处理过程故障监测领域的具体应用。
背景技术
随着工业化、城市化进程的加快,在社会生产生活过程中产生了大量的污水,大量污水的直接排放导致水污染问题越来越严重,解决污水问题的一个主要途径是对污水进行净化处理。但污水处理过程是一个复杂的具有非线性和非高斯性的物理和生化反应过程,还极易受到季节、天气、流量等诸多因素的干扰和影响,因此,污水处理过程故障频发,导致出水水质不达标,增加处理耗能和运行费用。为了确保合格的出水水质同时降低因故障导致的二次处理能耗,必须加强对污水处理过程的过程监控。数据驱动的故障监测方法通过从历史数据集中提取特征信息进行故障监测,其监控的有效性取决于数据本身。因此,数据驱动的故障监测方法更适用于具有复杂机理模型的污水处理过程的故障监测。
目前,多元统计技术已经在过程监控领域得到了广泛应用,如主成分分析(Principal Component Analysis,PCA)和偏最小二乘(Partial Least Squares,PLS)和独立成分分析(Independent Component Analysis,ICA)等。但是,以上方法都是线性方法,不能有效处理数据的非线性。而且过程数据经常不满足高斯分布。虽然ICA算法提取数据中的非高斯信息,但是ICA提取的独立成分是不稳定的。深度学习技术因其强大的非线性特征提取能力而受到广泛关注,如自编码器(Autoencoder,AE),降噪自编码器(DenoisingAutoencoder,DAE)和稀疏自编码器(Sparse autoencoder,SAE)等。但是以上网络都不能很好的处理数据的非高斯性问题。数据的非线性和非高斯性直接影响到数据特征的提取。对数据的非线性和非高斯性进行处理,可以提取到数据的本质特征。
发明内容
为了解决由于处理污水过程数据的非高斯性和非线性导致的监测结果不准确的问题,本发明提供一种基于变分自编码器(Variational Autoencoder,VAE)模型的污水处理过程故障监测方法。Kingma和Welling等人提出的变分自编码器为非高斯数据的处理提供了新的思想。变分自编码器可以通过变分推理对潜在空间的潜在变量(数据特征)的数据分布进行限制,使潜在变量服从多元高斯分布。同时,变分自编码器的非线性激活函数还可以处理数据的非线性。本研究中采用变分自编码器对数据的非线性和非高斯性进行处理。首先,对采集的正常数据进行归一化处理,然后利用变分自编码器建立离线训练模型提取包含数据非线性信息和服从高斯分布的特征,然后对新采集到的数据利用正常数据的均值和方差进行归一化处理,并利用在离线状态训练好的模型进行在线监测来判断当前系统的运行状态。
本发明采用了如下的技术方案及实现步骤:
A.离线训练阶段:
1)利用以下公式对污水处理过程的正常数据进行归一化处理:
2)对污水处理过程建立变分自编码器模型VAE,用于重构污水处理过程的数据;使用归一化后的正常数据x对VAE模型进行训练,得到表征正常数据特征的潜在空间z以及正常数据的重构数据数据的重构误差统计量RE按照以下公式计算:
3)利用核密度估计(Kernel Density Estimation,KDE)计算离线模型的重构误差的控制限RElim:
首先,计算密度函数f(RE),计算方式如下:
其中,K(·)代表高斯核函数,l是带宽(l是由高斯核函数确定的),N是样本点总数,REi代表第i个样本的RE值,RE是一个一维矩阵,包含N个元素,REi即为其中的第i个元素;
然后,根据RE中包含的N个元素,先采用KDE求取其近似的密度函数估计,则置信水平为α时的控制限RElim可由下式求得(本实施例中α=0.01):
B.在线监测阶段:
4)采集当前时刻的样本数据xj,xj={x1j,…,xIj},其中I表示采集的变量总数,并利用离线建模过程步骤1)获得的均值和标准差进行归一化得到xjnew;
6)对每一个样本数据xi,如果其对应的重构误差统计量RE大于重构误差的控制限RElim,则说明此处有故障发生并发出警报,否则,返回步骤4继续进行监测,直到整个流程结束。
进一步的,本发明中VAE模型的输入维度为16,隐含层维度为8,隐变量z的维度为4,学习率设置为Adam,迭代次数为1000。隐含层是VAE模型的中间层,隐变量z是潜在变量(数据特征)。
有益效果
与现有技术相比,本发明利用变分自编码器模型对采集到的正常数据进行离线训练,然后利用训练获得的模型参数对在线数据进行监测。不同于传统多元统计分析方法,本发明提出的方法可以对污水数据的非线性和非高斯性进行处理,提取出包含非线性信息和服从高斯分布的特征,提出的特征更具有代表性,可以更好的实现对污水处理过程的监测。
附图说明
图1为污泥膨胀故障(μH=3.75)的监测图;
图2为污泥膨胀故障(μH=2)的监测图;
图3为毒性冲击故障(μH=3.75,BH=0.45)的监测图;
图4为本发明方法流程图。
具体实施方式
首先对VAE网络进行基本介绍:
VAE网络可以对潜在空间的概率分布进行限制。假设数据集包含的x是由未被观测到的连续随机变量z的一些随机过程产生的。这个过程包含两步:(1)z(i)是由一个前验概率分布pθ*(z)产生的,(2)x(i)是由一个条件分布pθ*(x|z)产生的。潜变量z(i)和参数θ*是未知的。前验概率pθ*(z)和似然pθ*(x|z)被认为来自参数pθ(z)和pθ(x|z)的分布的参数簇。
根据前验概率pθ(z)和似然pθ(x|z),边际似然积分被写作:
pθ(x)=∫pθ(z)pθ(x|z)dz
真实的后验密度被表示为:
从真实后验密度的计算公式可以看出,求解pθ(z|x)是不容易的。VAE引入一个识别模型qφ(z|x)来近似棘手的真实后验pθ(z|x)。未被观测到的连续随机变量z被作为原始数据的潜在表示或编码。识别模型qφ(z|x)被作为一个概率编码器,pθ(x|z)被作为一个概率解码器。
所有数据点的对数边际似然之和组成的对数边际似然可以表示为:
每个数据点x(i)的对数边际似然可以被写作:
log pθ(x(i))=DKL(qφ(z|x(i))||pθ(z|x(i)))+L(θ,φ;x(i))
其中,公式的第一项是数据点x(i)的真实后验pθ(z|x(i))和识别模型qφ(z|x(i))的Kullback-Leibler(KL)散度,第二项是数据点x(i)的变分下界。
由于KL散度是非负的,可以得到:
还可以被写为:
由以上的公式可知,KL散度越小,识别模型qφ(z|x(i))就能够更准确的估计真实后验pθ(z|x(i))。为了确保识别模型qφ(z|x(i))和真实后验pθ(z|x(i))更接近,VAE需要最大化变分下界L(θ,φ;x(i))。
采用Monto Carlo方法进行采样估计真实后验分布的方法是不可导的并且采样出来的潜在空间z具有较大的方差。VAE采用重参数技巧来处理这个问题。对于选定的后验分布qφ(z|x(i)),引入一个噪声变量ε的可微变换gφ(ε,x)来重新参数化随机变量再参数化后的表示如下:
设置隐变量z的先验服从多元高斯分布pθ(z)=N(z;0,I),同时后验qφ(z|x(i))也服从多元高斯分布qφ(z|x(i))=N(z;u(i),(σ(i))2I)。参数u和σ是由编码器计算得到的并随着网络的迭代不断更新。ε∈N(0,I)时,z=u(i)+σ(i)ε。
其中,z(i,l)=u(i)+σ(i)⊙ε(l),ε(l)~N(0,I),L是采样次数,j是z的维度。第一项通过使近似后验qφ(z|x(i))去逼近先验pθ(z)来调整编码器。第二项是一个期望的负重构误差,VAE通过这两项公式构成的损失函数来调整优化整个网络的参数。
以下具体描述本发明是如何进行故障监控的:
污水处理过程不仅包含了各种物理变化,还包含了复杂的化学变化和生化反应,这为污水处理过程的异常监测带来了极大地挑战。本发明采用国际水协会(IWA)研发的“仿真基准模型”(Benchmark SimulationModel 1,BSM1)对实际污水处理过程进行实时仿真。该模型由五个反应池(5999m3)和一个二沉池(6000m3)组成,此外还有三个曝气池。曝气池有10层,深4米,占地1500m2,反应过程有内回流和外回流。平均污水处理流量为20000m3/d,化学需氧量为300mg/l。实验对污泥膨胀故障和毒性冲击故障进行监测,污泥膨胀故障是对异养菌最大生长速率μH的改变,毒性冲击故障是同时改变异养菌最大生长速率μH和毒性冲击BH的值,μH正常工况下为4,BH正常工况下为0.3。仿真平台共采集1344个采样点数据,每个采样点包含16个变量。监测所用变量如表1所示,表2为故障设置情况。
表1监测所用变量
表2故障设置情况
故障编号 | 故障类型 | 故障变量 | 持续时间 |
1 | 污泥膨胀故障 | μH=3.75 | 673-864 |
2 | 污泥膨胀故障 | μH=2 | 673-864 |
3 | 毒性冲击故障 | μH=3.75,BH=0.45 | 673-864 |
将本发明方法应用到上述BSM1仿真平台的离线训练和在线监测的具体陈述如下:
A.离线训练阶段:
本发明中VAE模型的输入维度为16,隐含层维度为8,隐变量z的维度为4,学习率设置为Adam,迭代次数为1000。隐含层是VAE模型的中间层,隐变量z是潜在变量(数据特征)。
1)利用以下公式对污水处理过程的正常数据进行归一化处理:
2)对污水处理过程建立变分自编码器模型VAE,用于重构污水处理过程的数据;使用归一化后的正常数据x对VAE模型进行训练,得到表征正常数据特征的潜在空间z以及正常数据的重构数据数据的重构误差统计量RE按照以下公式计算:
3)利用核密度估计(Kernel Density Estimation,KDE)计算离线模型的重构误差的控制限RElim:
首先,计算密度函数f(RE),计算方式如下:
其中,K(·)代表高斯核函数,l是带宽(l是由高斯核函数确定的),N是样本点总数,REi代表第i个样本的RE值,RE是一个一维矩阵,包含N个元素,REi即为其中的第i个元素;
然后,根据RE中包含的N个元素,先采用KDE求取其近似的密度函数估计,则置信水平为α时的控制限RElim可由下式求得(本实施例中α=0.01):
B.在线监测阶段:
4)采集当前时刻的样本数据xj,xj={x1j,…,xIj},其中I表示采集的变量总数,并利用离线建模过程步骤1)获得的均值和标准差进行归一化得到xjnew;
6)对每一个样本数据xj,如果其对应的重构误差统计量RE大于重构误差的控制限RElim,则说明此处有故障发生并发出警报,否则,返回步骤4继续进行监测,直到整个流程结束。
上述步骤即为本发明方法在BSM1仿真平台故障监测领域的具体应用。为了验证本方法的有效性。我们使用一个批次的正常数据进行离线训练,并分别使用3个批次的故障数据进行在线监测。实验结果见图1到图3。如果图中纵坐标的值超过控制限,则认为在此时刻污水处理过程发生了故障;若图中纵坐标的值未超过控制限,则说明污水处理过程运行正常。表3是PCA、ICA和VAE方法的监测对比结果。T2和SPE是PCA的监测指标;I2和SPE是ICA的监测指标,RE是VAE的监测指标。FAR和MAR分别是故障监测的误报警率和漏报警率。表3的结果说明VAE模型的监测准确率更高。
表3三种方法的监测效果对比(%)
Claims (2)
1.一种基于变分自编码器模型的污水处理过程故障监测方法,其特征包括“离线训练”和“在线监测”两个阶段,具体步骤如下:
A.离线训练阶段:
1)利用以下公式对污水处理过程的正常数据进行归一化处理:
2)对污水处理过程建立变分自编码器模型VAE,用于重构污水处理过程的数据;使用归一化后的正常数据x对VAE模型进行训练,得到表征正常数据特征的潜在空间z以及正常数据的重构数据数据的重构误差统计量RE按照以下公式计算:
3)利用核密度估计(Kernel Density Estimation,KDE)计算离线模型的重构误差的控制限RElim:
首先,计算密度函数f(RE),计算方式如下:
其中,K(·)代表高斯核函数,l是带宽(l是由高斯核函数确定的),N是样本点总数,REi代表第i个样本的RE值,RE是一个一维矩阵,包含N个元素,REi即为其中的第i个元素;
然后,根据RE中包含的N个元素,先采用KDE求取其近似的密度函数估计,则置信水平为α时的控制限RElim可由下式求得(本实施例中α=0.01):
B.在线监测阶段:
4)采集当前时刻的样本数据xj,xj={x1j,…,xIj},其中I表示采集的变量总数,并利用离线建模过程步骤1)获得的均值和标准差进行归一化得到xjnew;
6)对每一个样本数据xj,如果其对应的重构误差统计量RE大于重构误差的控制限RElim,则说明此处有故障发生并发出警报,否则,返回步骤4继续进行监测,直到整个流程结束。
2.根据权利要求1所述的一种基于变分自编码器模型的污水处理过程故障监测方法,其特征在于:所述的VAE模型的输入维度为16,隐含层维度为8,隐变量z的维度为4。隐含层是VAE模型的中间层,隐变量z是潜在变量(数据特征)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011585643.9A CN112631255B (zh) | 2020-12-28 | 2020-12-28 | 一种基于变分自编码器模型的污水处理过程故障监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011585643.9A CN112631255B (zh) | 2020-12-28 | 2020-12-28 | 一种基于变分自编码器模型的污水处理过程故障监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112631255A true CN112631255A (zh) | 2021-04-09 |
CN112631255B CN112631255B (zh) | 2022-10-28 |
Family
ID=75286196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011585643.9A Active CN112631255B (zh) | 2020-12-28 | 2020-12-28 | 一种基于变分自编码器模型的污水处理过程故障监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112631255B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097763A1 (en) * | 2018-09-24 | 2020-03-26 | Sap Se | Computer systems for detecting training data usage in generative models |
CN111122811A (zh) * | 2019-12-14 | 2020-05-08 | 北京工业大学 | 一种oica和rnn融合模型的污水处理过程故障监测方法 |
CN111324110A (zh) * | 2020-03-20 | 2020-06-23 | 北京工业大学 | 一种基于多块收缩自动编码器的发酵过程故障监测方法 |
CN111598881A (zh) * | 2020-05-19 | 2020-08-28 | 西安电子科技大学 | 基于变分自编码器的图像异常检测方法 |
-
2020
- 2020-12-28 CN CN202011585643.9A patent/CN112631255B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097763A1 (en) * | 2018-09-24 | 2020-03-26 | Sap Se | Computer systems for detecting training data usage in generative models |
CN111122811A (zh) * | 2019-12-14 | 2020-05-08 | 北京工业大学 | 一种oica和rnn融合模型的污水处理过程故障监测方法 |
CN111324110A (zh) * | 2020-03-20 | 2020-06-23 | 北京工业大学 | 一种基于多块收缩自动编码器的发酵过程故障监测方法 |
CN111598881A (zh) * | 2020-05-19 | 2020-08-28 | 西安电子科技大学 | 基于变分自编码器的图像异常检测方法 |
Non-Patent Citations (3)
Title |
---|
G S CHADHA ET AL.: "Comparison of Semi-supervised Deep Neural Networks for Anomaly Detection in Industrial Processes", 《2019 INDIN》 * |
娄建楼 等: "基于改进堆栈降噪自编码器的锅炉设备在线监测数据清洗方法", 《计算机集成制造系统》 * |
张祥 等: "基于VAE-DBN的故障分类方法在化工过程中的应用", 《过程工程学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112631255B (zh) | 2022-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108469507B (zh) | 一种基于自组织rbf神经网络的出水bod软测量方法 | |
CN108900346B (zh) | 基于lstm网络的无线网络流量预测方法 | |
CN102854296B (zh) | 一种基于集成神经网络的污水处理软测量方法 | |
CN109344971B (zh) | 一种基于自适应递归模糊神经网络的出水氨氮浓度预测方法 | |
CN111160520A (zh) | 一种基于遗传算法优化的bp神经网络风速预测方法 | |
CN107292446B (zh) | 一种基于考虑分量关联性小波分解的混合风速预测方法 | |
CN104899653B (zh) | 基于专家系统及蓝藻生长机理时序模型的湖库蓝藻水华预测方法 | |
CN110942194A (zh) | 一种基于tcn的风电预测误差区间评估方法 | |
CN110542748B (zh) | 一种基于知识的鲁棒型出水氨氮软测量方法 | |
CN115271225B (zh) | 一种基于小波降噪和神经网络的风力-风功率建模方法 | |
CN115905821A (zh) | 基于多阶段动态模糊宽度学习的城市污水处理过程状态监测方法 | |
CN115758125A (zh) | 基于特征结构优化和深度学习的工业污水处理软测量方法 | |
CN116911419A (zh) | 一种基于趋势相关性特征学习的长时序预测方法 | |
CN107729988B (zh) | 基于动态深度置信网络的蓝藻水华预测方法 | |
CN110991616B (zh) | 一种基于删减型前馈小世界神经网络出水bod预测方法 | |
CN109408896B (zh) | 一种污水厌氧处理产气量多元智能实时监控方法 | |
CN110516792A (zh) | 基于小波分解和浅层神经网络的非平稳时间序列预测方法 | |
CN108509692B (zh) | 一种基于MiUKFNN算法的高含硫天然气脱硫工艺建模方法 | |
CN113609766B (zh) | 一种基于深度概率潜隐模型的软测量方法 | |
CN109669017A (zh) | 基于深度学习的炼厂蒸馏塔顶切水离子浓度预测方法 | |
CN113111576B (zh) | 一种基于混合编码粒子群-长短期记忆神经网络出水氨氮软测量方法 | |
CN112631255B (zh) | 一种基于变分自编码器模型的污水处理过程故障监测方法 | |
CN114781166B (zh) | 基于加权概率慢特征模型的污水处理过程软测量方法 | |
CN110929809B (zh) | 一种特征自增强的循环神经网络的污水关键水质指标软测量方法 | |
CN117094431A (zh) | 一种多尺度熵门控的DWTformer气象数据时序预测方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |