CN117575017A - 一种污水处理过程的概率推理模型构建方法及其系统 - Google Patents

一种污水处理过程的概率推理模型构建方法及其系统 Download PDF

Info

Publication number
CN117575017A
CN117575017A CN202311358800.6A CN202311358800A CN117575017A CN 117575017 A CN117575017 A CN 117575017A CN 202311358800 A CN202311358800 A CN 202311358800A CN 117575017 A CN117575017 A CN 117575017A
Authority
CN
China
Prior art keywords
data
time stamp
treatment process
timestamp
constructing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311358800.6A
Other languages
English (en)
Inventor
朱小刚
匡仁盛
郭智威
余恪平
丁峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang University New Generation Information Technology Industry Research Institute
Nanchang University
Original Assignee
Nanchang University New Generation Information Technology Industry Research Institute
Nanchang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang University New Generation Information Technology Industry Research Institute, Nanchang University filed Critical Nanchang University New Generation Information Technology Industry Research Institute
Priority to CN202311358800.6A priority Critical patent/CN117575017A/zh
Publication of CN117575017A publication Critical patent/CN117575017A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/042Backward inferencing
    • CCHEMISTRY; METALLURGY
    • C02TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02FTREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02F3/00Biological treatment of water, waste water, or sewage
    • C02F3/02Aerobic processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)

Abstract

本申请公开了一种污水处理过程的概率推理模型构建方法及其系统,其中,污水处理过程的概率推理模型构建方法,包括如下步骤:根据监测数据构造多个数据集,每个数据集均包括:多种污染物的实际的入口数据和实际的出口数据;利用数据集在混合云的私有云模块内创建概率推理模型;对概率推理模型进行优化,获得优化后的概率推理模型。本申请能够在缺乏IPP的情况下,反向推断出污水处理过程中丢失的IPP,能够令污水处理过程的概率推理模型在没有IPP数据的污水处理过程时依然生效,保证了预测结果的可靠性。

Description

一种污水处理过程的概率推理模型构建方法及其系统
技术领域
本申请涉及环境科学与资源利用技术领域,尤其涉及一种污水处理过程的概率推理模型构建方法及其系统。
背景技术
由于人口增长、城市化、工业化以及与废水处理技术相关的环境问题,对水的需求大大增加,清洁水的可用性已成为人类的十大问题之一。生活、工业、农业、采矿和商业废水来源需要有效去除固体或悬浮形式的有机或无机污染物。因此,废水处理过程(WWTP)对人类社会的可持续发展具有重要意义。在普通的污水处理过程中(比如:化学需氧量和氨氮污染物的处理)是通过添加一定量的来自工业曝气的溶解氧(DO)来实现的。准确控制曝气量以适应各种情况,实际上是污水处理过程的核心问题。因此,基于工业曝气的污水处理过程的生化反应过程来进行有效建模,已经成为一个实质性的迫切需求。但生化反应是一个复杂的过程,伴随着无形的物质交换和能量传递,给污水处理过程的建模带来了巨大的困难。
污水处理过程的数据驱动分析可用于故障检测、变量预测和自动控制。故障检测、变量预测和自动控制均需要不同的、越来越复杂的数据处理、分析和控制框架。因此,数据驱动方法将在每个过程控制中从故障检测、变量预测或高级控制的应用范围内进行分析。近年来,一些研究人员致力于污水处理厂的数据驱动建模,产生了相当数量的代表性方法,例如:
现有技术方案1:K.Sridevi、E.Sivaraman和P.Mullai提出的“在混合上流式厌氧污泥毯反应器中基于酒厂废水进行生物降解和发酵生物制氢的反向传播神经网络模型(Back propagation neural network modelling of biodegradation and fermentativebiohydrogen production using distillery wastewater in a hybrid upflowanaerobic sludge blanket reactor)”,见(https://doi.org/10.1016/j.biortech.2014.03.074),该方法在混合上流式厌氧污泥床(HUASB)反应器中,以酒厂废水为底物,研究了生物降解与生物制氢的关系。使用Levenberg-Marquardt(LM)算法开发并验证了一个网络拓扑结构为4-20-1的反向传播神经网络(BPNN)模型。该方法共研究了231个数据点,以考察HUASB反应器在适应和运行阶段的性能来预测酒厂废水的生物降解和生物制氢情况。但该方法应用的场景单一,局限于研究生物降解与生物制氢的关系,没有涉及到通用的污水处理过程,也没有考虑工业曝气的溶氧量的化学需氧量和氨氮的处理。
现有技术方案2:T.Yang、W.Qiu、Y.Ma、C.Mohammed和L.Zhang提出的“基于模糊模型对活性污泥过程中溶解氧的预测控制(Fuzzy model-based predictive control ofdissolved oxygen in activated sludge processes)”,见(https://doi.org/10.1016/j.neucom.2014.01.025),该方法设计了一个基于模糊模型的预测控制器来将污水处理厂的好氧反应器中的溶解氧浓度维持在设定值。所需的输入变量的模糊空间通过模糊c-means聚类算法进行划分,并使用最小二乘法确定相应的参数。该方法在瞬时和稳定性能方面都取得了令人满意的效益。但模型预测控制的大部分研究成果都集中在神经网络模型上,对模糊模型预测控制还没有进行充分的研究。虽然研究了污水生物处理过程中溶氧量的分层模糊预测控制,但所获得的模糊模型的参数缺乏明确的物理意义。
现有技术方案3:J.F.Qiao、Y.Hou、L.Zhang和H.G.Han提出的“污水处理过程中基于自适应模糊神经网络多目标操作控制(Adaptive fuzzy neural network control ofwastewater treatment process with multiobjective operation)”,见(https://doi.org/10.1016/j.neucom.2017.08.059),该方法提出了一个自适应模糊神经网络控制系统,用于污水处理过程(WWTP)的多目标操作,以达到标准的出水质量(EQ)以及低能耗(EC)。该控制系统包括一个采用自适应多目标差分进化(AMODE)算法的优化模块和一个采用自适应模糊神经网络(AFN)的控制模块。该系统产生了更好的出水质量和更低的平均运行消耗。但在污水处理过程中只学习前向特征映射,虽然基于丰富的中间过程参数(IPP)模型的结果非常可靠,但却不能处理没有IPP的污水处理过程场景。
发明内容
本申请的目的在于提供一种污水处理过程的概率推理模型构建方法及其系统,能够在缺乏IPP的情况下,反向推断出污水处理过程中丢失的IPP,能够今污水处理过程的概率推理模型在没有IPP数据的污水处理过程时依然生效,保证了预测结果的可靠性。
为达到上述目的,本申请提供了一种污水处理过程的概率推理模型构建方法,包括如下步骤:根据监测数据构造多个数据集,每个数据集均包括:多种污染物的实际的入口数据和实际的出口数据;利用数据集在混合云的私有云模块内创建概率推理模型;对概率推理模型进行优化,获得优化后的概率推理模型。
如上的,其中,概率推理模型预测的出口数据的表达式如下: 其中,/>为第i种污染物的预测的出口数据;/>是网络模型的激活函数;bt是第t时间戳的偏置值,bt∈R3×1,bt∈R3×1中的R3×1为bt的3×1的矩阵格式;ωt为从实际的入口数据/>获得的权重值,/>中的R3×1为/>的3×1的矩阵格式,/>表示第t时间戳的第i种污染物的实际的入口数据,ωt∈R3×3,R3×3为ωt的3×3的矩阵格式;/>表示第t时间戳的第i种污染物的中间处理数据;i为污染物种类的索引号。
如上的,其中,利用数据集在混合云的私有云模块内创建概率推理模型的子步骤如下:根据数据集将出口数据的生成过程构建为条件概率分布,获得条件处理函数;通过基于吉布斯抽样的贝叶斯方法进行后验概率推理,获得预测的出口数据的预测概率;利用卷积神经网络进行预测,预测出中间参数,获得中间参数的联合分布;根据条件处理函数、预测的出口数据的预测概率和中间参数的联合分布完成概率推理模型的构建。
如上的,其中,给定t时间戳,中间处理条件和中间过程参数,条件处理函数包括:第t时间戳的预测的出口数据被判定为真的处理函数和第t时间戳的预测的出口数据被判定为假的处理函数。
如上的,其中,第t时间戳的预测的出口数据被判定为真的处理函数的表达式如下:其中,/>为分类器网络D在t时刻预测/>为1时的处理函数;/>为预测的出口数据;Dt为t时刻分类器网络预测值;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据;ωt为从实际的入口数据获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值;/>是优化函数。
如上的,其中,预测的出口数据的预测概率的表达式如下:
其中,为分类器网络D预测/>的概率;/>是优化函数;Dt为t时刻分类器网络预测值;Dt|(t)为第t时刻的分类器网络D;ωt为从实际的入口数据获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值;ξ(Dt,1)为函数调用;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据。
如上的,其中,中间参数的联合分布的表达式如下:
其中,/>为中间参数的联合分布;Dt|(t)为Dt|(t)为第t时刻的分类器网络D;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据;μ1为第t时间戳时,化学需氧量的中间处理数据的平均值;μ2为第t时间戳时,氨氮的中间处理数据的平均值;μ3为第t时间戳时,总磷的中间处理数据的平均值;σ1为数据集中化学需氧量的分布的方差;σ2为数据集中氨氮的分布的方差;σ3为数据集中总磷的分布的方差;为第t时间戳的化学需氧量的中间处理数据,/>为第t时间戳的氨氮的中间处理数据,/>为第t时间戳的总磷的中间处理数据;/>为第t时间戳时,化学需氧量的独立分布;/>为第t时间戳时,氨氮的独立分布;/>为第t时间戳时,总磷的独立分布;/>为分类器网络D预测/>的概率。
如上的,其中,根据中间参数的联合分布获得生成过程函数,生成过程函数的目标是优化熵,优化熵的函数的表达式如下: 其中,OIP为优化熵的函数;/>为中间参数的联合分布;log为对数。
如上的,其中,采用随机梯度下降方法对概率推理模型进行优化,获得优化后的概率推理模型。
本申请还提供一种污水处理过程的概率推理模型构建系统,包括:混合云平台和多个数据监测端;其中,混合云平台至少包括:公有云模块和私有云模块;公有云模块:用于获取监测数据,并将监测数据发送至私有云模块;对监测数据进行存储;私有云模块:用于执行上述的污水处理过程的概率推理模型构建方法构建概率推理模型;数据监测端:用于获取监测数据,并将监测数据发送至公有云模块,其中,监测数据包括:多种污染物的实际的入口数据和/或实际的出口数据。
本申请实现的有益效果如下:
(1)能够在缺乏IPP的情况下,反向推断出污水处理过程中丢失的IPP,能够今污水处理过程的概率推理模型在没有IPP数据的污水处理过程时依然生效,保证了预测结果的可靠性。
(2)能够预测IPP的具体情况,能够提高污水处理过程的建模效率,具有现实意义,且能填补当前没有预测IPP方法的空白。
(3)本申请构建的概率推理模型能够模拟没有IPP的污水处理过程。
(4)本申请的污水处理过程的概率推理模型构建方法及其系统,提高了污水处理过程的建模效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为污水处理过程的概率推理模型构建系统一种实施例的结构示意图;
图2为污水处理过程的概率推理模型构建方法一种实施例的流程图;
图3为KRI数据集上的化学需氧量、氨氮和总磷的中间处理条件统计值;
图4为BOD数据集上的化学需氧量、氨氮和总磷的中间处理条件统计值;
图5为KRI数据集上的化学需氧量、氨氮和总磷的出口数据的特征统计值;
图6为BOD数据集上的化学需氧量、氨氮和总磷的出口数据的特征统计值;
图7为″随机和RNN″和″PIF和RNN"两种方法在KRI数据集上出口的MAE和RMSE统计值;
图8为″随机和RNN″和″PIF和RNN″两种方法在BOD数据集上出口的MAE和RMSE统计值;
图9为KRI数据集的出口数据在″随机和RNN″和″PIF和RNN"两种方法上的MAE和RMSE的四种距离值;
图10为BOD数据集的出口数据在″随机和RNN″和″PIF和RNN"两种方法上的MAE和RMSE的四种距离值。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本申请提供一种污水处理过程的概率推理模型构建系统,包括:混合云平台1和多个数据监测端2。
其中,混合云平台1至少包括:公有云模块11和私有云模块12。
公有云模块11:用于获取监测数据,并将监测数据发送至私有云模块12;对监测数据进行存储。
具体的,公有云模块11:用于传输数据和存储数据。其中,传输数据不仅限于对监测数据的传输,存储数据也不仅限于对监测数据的存储。
私有云模块12:用于执行下述的污水处理过程的概率推理模型构建方法构建概率推理模型。
具体的,作为一个实施例,数据监测端2向混合云平台1发送包括多种污染物的实际的入口数据和实际的出口数据的监测数据,混合云平台1根据监测数据构造多个用于创建概率推理模型的数据集。
作为另一个实施例,数据监测端2向混合云平台1发送包括多种污染物的实际的入口数据的监测数据,混合云平台1向构建的概率推理模型内输入监测数据中的多种污染物的实际的入口数据,即可获得多种污染物的预测的出口数据。
数据监测端2:用于获取监测数据,并将监测数据发送至公有云模块11,其中,监测数据包括:多种污染物的实际的入口数据和/或实际的出口数据。
进一步的,数据监测端2设置有监测模型和通信模型。
其中,监测模型:用于获取多种污染物的实际的入口数据和/或实际的出口数据。
通信模型:用于将获取的多种污染物的实际的入口数据和/或实际的出口数据作为监测数据发送至混合云平台。
进一步的,监测模型至少包括:进水槽、至少三个平行处理槽和出水槽,每个平行处理槽的一端与进水槽连通,另一端与出水槽连通;进水槽设置有用于监测多种污染物的实际的入口数据的进口监测设备,出水槽设置有用于监测多种污染物的实际的出口数据的出口监测设备,每个平行处理槽均设置有处理罐。
具体的,通过监测模型获取的数据集的构造没有经过人工干预,每次抽样的时间地点都由进口监测设备和出口监测设备控制,能够提高获得污水处理过程的数据集的精确度。多种污染物的实际的入口数据即为监测的污染物进入平行处理槽前的指标值。多种污染物的实际的出口数据即为监测的污染物离开平行处理槽后的指标值。
如图2所示,一种污水处理过程的概率推理模型构建方法,包括如下步骤:
S1:根据监测数据构造多个数据集,每个数据集均包括:多种污染物的实际的入口数据和实际的出口数据。
具体的,数据集可以为基于CAST(循环活性污泥技术)的KRI数据集和基于ODT(氧化沟技术)的BOD数据集,但不仅限于KRI数据集和BOD数据集。
进一步的,污染物的种类为三种,分别为:化学需氧量(COD)、氨氮(NH3-N)和总磷(TP)。污染物的种类不仅限于化学需氧量(COD)、氨氮(NH3-N)和总磷(TP)三种。
具体的,用表示第t时间戳的第i种污染物的实际的入口数据。i为污染物种类的索引号,i∈[1,M],M为污染物的种类总数,本申请优选为M=3。/>为第t时间戳的化学需氧量的入口数据,/>为第t时间戳的氨氮的入口数据,/>为第t时间戳的总磷的入口数据。/>通过监测获得。
表示第t时间戳的第i种污染物的实际的出口数据。i为污染物种类的索引号,i∈[1,M],M为污染物的种类总数,本申请优选为M=3。/>为第t时间戳的化学需氧量的出口数据,/>为第t时间戳的氨氮的出口数据,/>为第t时间戳的总磷的出口数据。/>通过监测获得。
表示第t时间戳的第i种污染物的中间处理数据。i为污染物种类的索引号,i∈[1,M],M为污染物的种类总数,本申请优选为M=3。/>为第t时间戳的化学需氧量的中间处理数据,/>为第t时间戳的氨氮的中间处理数据,/>为第t时间戳的总磷的中间处理数据。/>无法通过监测获得。
其中,t是时间戳的索引号,t∈[1,T],T为时间戳的索引号总数。时间戳用于反映污水处理过程的时间性。
S2:利用数据集在混合云的私有云模块内创建概率推理模型。
在第t时间戳的污水处理过程中,根据实际的入口数据中间过程参数IPP和中间处理数据/>控制实际的出口数据/>的生成。
中间处理数据符合高斯分布/>第t时间戳的预测的出口数据/>的表达式如下:
其中,
其中,为第i种污染物的预测的出口数据;μi表示第t时间戳时,中间处理数据的平均值,/>表示第t时间戳时,中间处理数据的方差;/>是网络模型的激活函数;bt是第t时间戳的偏置值,bt∈R3×1;bt∈R3×1中的R3×1为bt的3×1的矩阵格式;ωt为从实际的入口数据/>获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;ωt∈R3×3,R3×3为ωt的3×3的矩阵格式;x为网络模型的激活函数的自变量;max(0,x)为从0和x之间取最大值;表示第t时间戳的第i种污染物的实际的入口数据,/>表示第t时间戳的第i种污染物的中间处理数据;i为污染物种类的索引号。
具体的,R3×1和R3×3均是数学中维度的表示,R3×1为bt的3×1的矩阵格式,即:bt=[b1 t,b2 t,b3 t]。
进一步的,利用数据集在混合云的私有云模块内创建概率推理模型的子步骤如下:
S21:根据数据集将出口数据的生成过程构建为条件概率分布,获得条件处理函数。
进一步的,给定t时间戳,中间处理条件和中间过程参数,条件处理函数包括:第t时间戳的预测的出口数据被判定为真的处理函数和第t时间戳的预测的出口数据/>被判定为假的处理函数。
给定t时间戳,中间处理条件和中间过程参数IPP,第t时间戳的预测的出口数据被判定为真的处理函数的表达式如下:
其中,
其中,为分类器网络D在t时刻预测/>为1时的处理函数;/>为预测的出口数据;Dt为t时刻分类器网络预测值;/>是优化函数;D为表示分类器网络;表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据;ωt为从实际的入口数据/>获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值;x’为优化函数的自变量;exp(·)是以自然常数e为底的指数函数。
具体的,D是分类器网络的缩写,方便后续的网络优化。
给定t时间戳,中间处理条件和中间过程参数(IPP),第t时间戳的预测的出口数据被判定为假的处理函数的表达式如下:
其中,为分类器网络D在t时刻预测的出口数据/>为0时的处理函数;/>是优化函数;Dt为t时刻分类器网络预测值;/> 表示实际的入口数据;/>表示中间处理数据;ωt为从实际的入口数据/>获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值。
S22:通过基于吉布斯抽样的贝叶斯方法进行后验概率推理,获得预测的出口数据的预测概率。
进一步的,预测的出口数据的预测概率的表达式如下:
其中,为分类器网络D预测/>的概率;/>是优化函数;Dt为t时刻分类器网络预测值;Dt|(t)为第t时刻的分类器网络D;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据;ωt为从实际的入口数据/>获得的权重值,/>中的R3 ×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值;ξ(Dt,1)为函数调用。
具体的,通过分类器网络D预测的概率/>能够在缺乏IPP的情况下,反向推断出污水处理过程中丢失的IPP,能够今污水处理过程的概率推理模型在没有IPP数据的污水处理过程时依然生效,保证了预测结果的可靠性。
其中,定义的函数ξ(x″,y)是Kronecker delta函数:
其中,x″为第t时刻的分类器网络D预测的值;y为1。
进一步的,第t时间戳的经验误差EMt
其中,为第t时间戳的实际的出口数据,/>表示第t时间戳的实际的出口数据/>与第t时间戳的预测的出口数据/>之间的Kullback-Leibler散度。
具体的,Kullback-Leibler散度(信息散度)为一种概率分布方法。
进一步的,将经验误差EMt作为判断条件来判定是1还是0,第t时间戳的预测的出口数据/>的判断基线/>的表达式如下:
其中,∈表示经验误差的阈值;EMt为第t时间戳的的经验误差;当EMt<∈时,就是1,当EMt>∈时,/>就是0。
具体的,∈的具体值根据实际情况进行设置。
S23:利用卷积神经网络进行预测,预测出中间参数,获得中间参数的联合分布。
进一步的,中间参数的联合分布的表达式如下:
其中,为中间参数的联合分布;Dt|(t)为Dt|(t)为第t时刻的分类器网络D;/>表示实际的入口数据;μ1为第t时间戳时,化学需氧量的中间处理数据的平均值;μ2为第t时间戳时,氨氮的中间处理数据的平均值;μ3为第t时间戳时,总磷的中间处理数据的平均值;σ1为数据集中化学需氧量的分布的方差;σ2为数据集中氨氮的分布的方差;σ3为数据集中总磷的分布的方差;/>为第t时间戳的化学需氧量的中间处理数据,/>为第t时间戳的氨氮的中间处理数据,/>为第t时间戳的总磷的中间处理数据;/>为第t时间戳时,化学需氧量的独立分布;/>为第t时间戳时,氨氮的独立分布;/>为第t时间戳时,总磷的独立分布;为分类器网络D预测/>的概率。
进一步的,根据中间参数的联合分布获得生成过程函数,生成过程函数的目标是优化熵,优化熵的函数的表达式如下:
其中,OIP为优化熵的函数;为中间参数的联合分布;log为对数。
根据高斯分布的定义可以近似为:
因此,本申请的生成过程函数的优化熵可以近似为:
其中,OIP为优化熵的函数;ωt为从实际的入口数据获得的权重值;bt是第t时间戳的偏置值;/>表示中间处理数据;Dt为t时刻分类器网络预测值;ξ(Dt,1)为函数调用;/>为是优化函数;μi(i=1,2,3)为第t时间戳时,中间处理数据的平均值,即:μ1为第t时间戳时,化学需氧量的中间处理数据的平均值;μ2为第t时间戳时,氨氮的中间处理数据的平均值;μ3为第t时间戳时,总磷的中间处理数据的平均值;σi(i=1,2,3)为数据集中的分布的方差,即:σ1为数据集中化学需氧量的分布的方差;σ2为数据集中氨氮的分布的方差;σ3为数据集中总磷的分布的方差;α为正比于;/>为分类器网络D预测/>的概率。
具体的,通过优化熵的函数OIP预测IPP的具体情况,能够提高污水处理过程的建模效率。
S24:根据条件处理函数、预测的出口数据的预测概率和中间参数的联合分布完成概率推理模型的构建。
S3:对概率推理模型进行优化,获得优化后的概率推理模型。
进一步的,采用随机梯度下降(SGD)方法对概率推理模型进行优化,获得优化后的概率推理模型。
具体的,通过随机梯度下降(SGD)方法对概率推理模型进行j轮迭代,从而完成优化,迭代的表达式如下:
其中,为以化学需氧量推断中间处理过程参数的优化迭代过程的表达式。
其中,为以氨氮推断中间处理过程参数的优化迭代过程的表达式。
其中,为以总磷推断中间处理过程参数的优化迭代过程的表达式。
具体的,和/>均是卷积神经网络的处理过程的原理,其中的OIP即为优化目的。
经过迭代,第t+1时间戳的中间处理数据的表达式如下:
其中,为第t+1时间戳的中间处理数据;/>为推断中间处理过程参数的优化迭代过程的表达式;/>表示第t时间戳的中间处理数据;γ是学习率。
具体的,作为一个实施例,通过实际实验数据来说明本发明污水处理过程的概率推理模型构建方法及其系统的有效性。混合云平台接收两个工厂收集的监测数据,并将两个工厂的监测数据分别构建为KRI数据集和BOD数据集。其中,KRI数据集包含2016-2019年四年的业务记录,BOD数据集包含2017-2019年三年的业务记录。如图3和4所示,在每个数据集上,三种污染物的中间处理条件的统计特征的指标值的范围被分为五个部分。如图5和图6所示,三种污染物的出口数据(出口结果)的特征统计特征,即:柱状图。图3-6清楚地显示了三个指标在数值范围内的分布状况。KRI数据集和BOD数据集上的指标值都相对集中在一个连续的区间内,并且总体上满足正态分布。
设计两组实验来间接评估本申请的概率推理模型(PIF)的总性能。首先把SGD(梯度下降法)的学习率默认设置为0.01。训练数据的比例大小被设定为70%,第t时间戳的经验误差EMt中的距离测量默认选择为欧氏距离。两者在实验过程中会多次变化。∈设置为0.6。
通过第一组实验说明PIF如何促进建模效率。
首先一组按照高斯分布随机生成缺失的IPP,另一组按照PIF模型生成。然后利用递归神经网络(RNN)模型对这两个后处理版本的废水处理过程(WWTP)进行建模,并预测其结果。其中,更精确地恢复IPP数值将有助于提高预测的准确性。第一组实验的初始设定参数μ1μ2,/>μ3,/>分别设置为7.0,4.5,5.6,5.1,6.5,4.2。
通过″随机和RNN″和″PIF和RNN″两个指标对两种方法获得的精度结果进行了比较。图7和8展示了KRI数据集和BOD数据集的结果,X轴表示训练数据的比例从40%到80%不等,Y轴表示评价指标的值。这两个指标都是负数,意味着较低的数值表示较好的性能。
在所有场景中,本申请提出的污水处理过程的概率推理模型(下文均简称为PIF)和RNN的趋势曲线都明显低于Random(随机)和RNN的相应曲线。同时,PIF和RNN的趋势曲线比Random和RNN更稳定,几乎没有出现剧烈的波动。
PIF在超参数的基础上通过迭代采样完成中间过程参数(IPP),能获得更好的恢复精度。其次,PIF的过程包含多轮迭代计算,能够产生比随机更可靠的IPP。
再进行一组实验,研究″随机和RNN″和″PIF和RNN″两种方式对IPP的估计精度。
在另一个已知IPP的数据集上进行第二组实验,目的是评估IPP的恢复精度。现将所有的IPP手动隐藏,并通过″随机和RNN″和″PIF和RNN″两种方法进行恢复。将″随机和RNN″和″PIF和RNN″两种方法的估计结果与真实的IPP进行比较,分别评估″随机和RNN″和″PIF和RNN″两种方法的恢复性能。第二组实验的初始设定参数μ1μ2,/>μ3,/>分别设置为7.5,4.8,9.2,4.0,8.5,4.2。
第二组实验是在另一个已完成的数据集上进行的,该数据集的IPP是已知的。作为一个实施例,该数据集可以为基于厌氧-缺氧-有氧(A2/O)工艺的污水处理厂收集的数据集,但不仅限于基于厌氧-缺氧-有氧(A2/O)工艺的污水处理厂收集的数据集。通过″随机和RNN″和″PIF和RNN"两种方法估计IPP,并与IPP的实际值进行比较,通过MAE和RMSE来衡量估计的精确度,公式如下:
其中,MAE为均方误差;为第k个样本真实标签;/>为为第k个样本的预测标签;k∈[1,n],n为样本数量;RMSE为均方根误差。
在第二组实验中,训练数据的比例被设定为60%和70%。另外,改变距离测量,包括:欧氏距离(Euclidean Distance)、曼哈顿距离(Manhattan Distance)、切比雪夫距离(Chebyshev distance)和相关距离(Correlation distance),并将容忍阈值分别设置为0.6、0.8、0.4和0.001。图9和10展示了不同距离测量的MAE和RMSE结果。在图9和10中,X轴列出了四个不同的距离测量值,Y轴表示评价指标的值。引入PIF后,中间参数的估计精度得到了显著的改善。随机的度量值不会随着距离测量的变化而波动。
第二组实验直观地反映了PIF对IPP估计精度的显著提升。由于PIF包含了复杂的迭代和优化过程,因此今PIF具有很好的估计缺失IPP的能力。与按照一定的分布随机生成IPP相比,PIF的算法过程更加合理。通过实验可以证明本申请构建的概率推理模型的效率。
本申请实现的有益效果如下:
(1)能够在缺乏IPP的情况下,反向推断出污水处理过程中丢失的IPP,能够今污水处理过程的概率推理模型在没有IPP数据的污水处理过程时依然生效,保证了预测结果的可靠性。
(2)能够预测IPP的具体情况,能够提高污水处理过程的建模效率,具有现实意义,且能填补当前没有预测IPP方法的空白。
(3)本申请构建的概率推理模型能够模拟没有IPP的污水处理过程。
(4)本申请的污水处理过程的概率推理模型构建方法及其系统,提高了污水处理过程的建模效率。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,本申请的保护范围意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请保护范围及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种污水处理过程的概率推理模型构建方法,其特征在于,包括如下步骤:
根据监测数据构造多个数据集,每个数据集均包括:多种污染物的实际的入口数据和实际的出口数据;
利用数据集在混合云的私有云模块内创建概率推理模型;
对概率推理模型进行优化,获得优化后的概率推理模型。
2.根据权利要求1所述的污水处理过程的概率推理模型构建方法,其特征在于,概率推理模型预测的出口数据的表达式如下:
其中,为第i种污染物的预测的出口数据;/>是网络模型的激活函数;bt是第t时间戳的偏置值,bt∈R3×1,bt∈R3×1中的R3×1为bt的3×1的矩阵格式;ωt为从实际的入口数据获得的权重值,/>中的R3×1为/>的3×1的矩阵格式,/>表示第t时间戳的第i种污染物的实际的入口数据,ωt∈R3×3,R3×3为ωt的3×3的矩阵格式;/>表示第t时间戳的第i种污染物的中间处理数据;i为污染物种类的索引号。
3.根据权利要求2所述的污水处理过程的概率推理模型构建方法,其特征在于,利用数据集在混合云的私有云模块内创建概率推理模型的子步骤如下:
根据数据集将出口数据的生成过程构建为条件概率分布,获得条件处理函数;
通过基于吉布斯抽样的贝叶斯方法进行后验概率推理,获得预测的出口数据的预测概率;
利用卷积神经网络进行预测,预测出中间参数,获得中间参数的联合分布;
根据条件处理函数、预测的出口数据的预测概率和中间参数的联合分布完成概率推理模型的构建。
4.根据权利要求3所述的污水处理过程的概率推理模型构建方法,其特征在于,给定t时间戳,中间处理条件和中间过程参数,条件处理函数包括:第t时间戳的预测的出口数据被判定为真的处理函数和第t时间戳的预测的出口数据被判定为假的处理函数。
5.根据权利要求4所述的污水处理过程的概率推理模型构建方法,其特征在于,第t时间戳的预测的出口数据被判定为真的处理函数的表达式如下:
其中,为分类器网络D在t时刻预测/>为1时的处理函数;/>为预测的出口数据;Dt为t时刻分类器网络预测值;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据;ωt为从实际的入口数据/>获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值;/>是优化函数。
6.根据权利要求5所述的污水处理过程的概率推理模型构建方法,其特征在于,预测的出口数据的预测概率的表达式如下:
其中,为分类器网络D预测/>的概率;/>是优化函数;Dt为t时刻分类器网络预测值;Dt|(t)为第t时刻的分类器网络D;ωt为从实际的入口数据/>获得的权重值,/>中的R3×1为/>的3×1的矩阵格式;bt是第t时间戳的偏置值;ξ(Dt,1)为函数调用;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据。
7.根据权利要求6所述的污水处理过程的概率推理模型构建方法,其特征在于,中间参数的联合分布的表达式如下:
其中,为中间参数的联合分布;Dt|(t)为Dt|(t)为第t时刻的分类器网络D;/>表示第t时间戳的第i种污染物的实际的入口数据,i∈[1,M],M为污染物的种类总数,M=3;/>表示第t时间戳的第i种污染物的中间处理数据;μ1为第t时间戳时,化学需氧量的中间处理数据的平均值;μ2为第t时间戳时,氨氮的中间处理数据的平均值;μ3为第t时间戳时,总磷的中间处理数据的平均值;σ1为数据集中化学需氧量的分布的方差;σ2为数据集中氨氮的分布的方差;σ3为数据集中总磷的分布的方差;/>为第t时间戳的化学需氧量的中间处理数据,/>为第t时间戳的氨氮的中间处理数据,/>为第t时间戳的总磷的中间处理数据;/>为第t时间戳时,化学需氧量的独立分布;为第t时间戳时,氨氮的独立分布;/>为第t时间戳时,总磷的独立分布;/>为分类器网络D预测/>的概率。
8.根据权利要求7所述的污水处理过程的概率推理模型构建方法,其特征在于,根据中间参数的联合分布获得生成过程函数,生成过程函数的目标是优化熵,优化熵的函数的表达式如下:
其中,OIP为优化熵的函数;为中间参数的联合分布;log为对数。
9.根据权利要求8所述的污水处理过程的概率推理模型构建方法,其特征在于,采用随机梯度下降方法对概率推理模型进行优化,获得优化后的概率推理模型。
10.一种污水处理过程的概率推理模型构建系统,其特征在于,包括:混合云平台和多个数据监测端;
其中,混合云平台至少包括:公有云模块和私有云模块;
公有云模块:用于获取监测数据,并将监测数据发送至私有云模块;对监测数据进行存储;
私有云模块:用于执行权利要求1-9中任一项所述的污水处理过程的概率推理模型构建方法构建概率推理模型;
数据监测端:用于获取监测数据,并将监测数据发送至公有云模块,其中,监测数据包括:多种污染物的实际的入口数据和/或实际的出口数据。
CN202311358800.6A 2023-10-19 2023-10-19 一种污水处理过程的概率推理模型构建方法及其系统 Pending CN117575017A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311358800.6A CN117575017A (zh) 2023-10-19 2023-10-19 一种污水处理过程的概率推理模型构建方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311358800.6A CN117575017A (zh) 2023-10-19 2023-10-19 一种污水处理过程的概率推理模型构建方法及其系统

Publications (1)

Publication Number Publication Date
CN117575017A true CN117575017A (zh) 2024-02-20

Family

ID=89892490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311358800.6A Pending CN117575017A (zh) 2023-10-19 2023-10-19 一种污水处理过程的概率推理模型构建方法及其系统

Country Status (1)

Country Link
CN (1) CN117575017A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201721435D0 (en) * 2017-12-20 2018-01-31 Intellitect Water Ltd A water network monitor, monitoring system and method
CN111291937A (zh) * 2020-02-25 2020-06-16 合肥学院 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
KR102440371B1 (ko) * 2021-11-26 2022-09-05 니브스코리아 주식회사 빅데이터 및 인공지능 기반의 하수처리시설의 방류수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체
CN116484747A (zh) * 2023-05-16 2023-07-25 江门公用能源环保有限公司 一种基于自适应优化算法与深度学习的污水智能监控方法
CN116542382A (zh) * 2023-05-10 2023-08-04 长春理工大学 基于混合优化算法的污水处理溶解氧浓度预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201721435D0 (en) * 2017-12-20 2018-01-31 Intellitect Water Ltd A water network monitor, monitoring system and method
CN111291937A (zh) * 2020-02-25 2020-06-16 合肥学院 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
KR102440371B1 (ko) * 2021-11-26 2022-09-05 니브스코리아 주식회사 빅데이터 및 인공지능 기반의 하수처리시설의 방류수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체
CN116542382A (zh) * 2023-05-10 2023-08-04 长春理工大学 基于混合优化算法的污水处理溶解氧浓度预测方法
CN116484747A (zh) * 2023-05-16 2023-07-25 江门公用能源环保有限公司 一种基于自适应优化算法与深度学习的污水智能监控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒙西;乔俊飞;韩红桂;: "基于类脑模块化神经网络的污水处理过程关键出水参数软测量", 自动化学报, no. 05, 7 October 2018 (2018-10-07) *

Similar Documents

Publication Publication Date Title
Wang et al. A machine learning framework to improve effluent quality control in wastewater treatment plants
Yaqub et al. Modeling of a full-scale sewage treatment plant to predict the nutrient removal efficiency using a long short-term memory (LSTM) neural network
Cheng et al. Forecasting of wastewater treatment plant key features using deep learning-based models: A case study
Asadi et al. Biogas production estimation using data-driven approaches for cold region municipal wastewater anaerobic digestion
CN111126870B (zh) 利用集成主成分分析的污水处理过程异常工况检测方法
Jana et al. Optimization of effluents using artificial neural network and support vector regression in detergent industrial wastewater treatment
CN102854296A (zh) 一种基于集成神经网络的污水处理软测量方法
CN108536106B (zh) 一种基于卡尔曼滤波-极限学习机的曝气系统溶解氧在线调控方法
CN112417765B (zh) 一种基于改进师生网络模型的污水处理过程故障检测方法
Lin et al. UNISON decision framework for hybrid optimization of wastewater treatment and recycle for Industry 3.5 and cleaner semiconductor manufacturing
Wang et al. A full-view management method based on artificial neural networks for energy and material-savings in wastewater treatment plants
Kocijan et al. Sequencing batch-reactor control using Gaussian-process models
CN117105461A (zh) 基于机器学习的大数据污水预测处理方法
CN115147645A (zh) 基于多特征信息融合的膜组件膜污染检测方法
CN115294383A (zh) 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统
Qambar et al. Development of local and global wastewater biochemical oxygen demand real-time prediction models using supervised machine learning algorithms
CN114565154A (zh) 一种渗滤液生化段碳源投加量的预测方法及优化算法
CN105372995A (zh) 污水处理系统测控方法
CN117575017A (zh) 一种污水处理过程的概率推理模型构建方法及其系统
Cao et al. Deep learning based soft sensor for microbial wastewater treatment efficiency prediction
CN116048024A (zh) 一种分布式典型相关分析过程监测方法及装置
CN115356930A (zh) 一种污水处理过程中的多目标优化控制系统及方法
CN112599205B (zh) 事件驱动的污水处理过程出水总磷软测量模型设计方法
CN113851184A (zh) 一种基于人工智能的粪大肠杆菌群数的预测方法及装置
Zhang et al. Prediction and Detection of Sewage Treatment Process Using N-BEATS Autoencoder Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination