CN112417765A - 一种基于改进师生网络模型的污水处理过程故障检测方法 - Google Patents

一种基于改进师生网络模型的污水处理过程故障检测方法 Download PDF

Info

Publication number
CN112417765A
CN112417765A CN202011399762.5A CN202011399762A CN112417765A CN 112417765 A CN112417765 A CN 112417765A CN 202011399762 A CN202011399762 A CN 202011399762A CN 112417765 A CN112417765 A CN 112417765A
Authority
CN
China
Prior art keywords
teacher
network
student network
sewage treatment
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011399762.5A
Other languages
English (en)
Other versions
CN112417765B (zh
Inventor
钟伟民
杜文莉
钱锋
彭鑫
李智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202011399762.5A priority Critical patent/CN112417765B/zh
Publication of CN112417765A publication Critical patent/CN112417765A/zh
Application granted granted Critical
Publication of CN112417765B publication Critical patent/CN112417765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Geometry (AREA)
  • Activated Sludge Processes (AREA)

Abstract

本发明涉及污水处理领域,更具体的说,涉及一种基于改进师生网络模型的污水处理过程故障检测方法。本发明包括离线训练过程,S1、采集历史数据作为训练数据集;S2、进行预处理;S3、提取对应师生网络表征信息;S4、表征信息差异加入教师网络的训练过程;S5、对师生网络进行迭代训练;S6、在过程相关子空间和质量相关子空间中计算对应残差和阈值;在线训练过程,S7、获取过程变量的实时数据,进行预处理;S8、将预处理后的数据输入学生网络,在过程相关子空间和质量相关子空间中计算对应残差;S9、分别比较残差与阈值,判断污水处理过程是否发生故障。本发明可以减小教师网络和学生网络的差异,提高模型预测准确性、高效、快速、泛化能力强。

Description

一种基于改进师生网络模型的污水处理过程故障检测方法
技术领域
本发明涉及污水处理领域,更具体的说,涉及一种基于改进师生网络模型的污水处理过程故障检测方法。
背景技术
随着我国城市化的不断发展,城镇人口越来越多,水资源的使用量逐渐增加,与之而来的还有城市污水的排放量不断增加。
为了满足可持续发展的要求,提高城市污水的再生利用率,城市污水处理显得越来越重要。
城市污水中的污染物大致可以分为:固体污染物、有机污染物、营养性污染物、酸碱性污染物、有毒污染物、油类污染物、生物污染物和热污染物。
污水的水质则是用各种指标标准污水的物理、化学或生物性质。常见的指标有酸碱度(PH值)、化学需氧量(COD)、生物需氧量(BOD)、氨氮(NH3 -N)、总磷(P)等。
污水处理按程度可以划分为四个等级:预处理、一级处理、二级处理和三级处理。
预处理包括沉降、过滤、预曝气等对处理后水质不高的初级处理过程。
一级处理过程是通过格栅、沉砂池、初沉池、气浮池、调节池等去除污水中呈悬浮状态的固体污染物。这一部分主要涉及物理处理。
二级处理则是通过特定的工艺,如活性污泥法、CASS工艺、A2/O工艺、A/O工艺、SBR、氧化沟、水解酸化池等,去除污水中呈胶体和溶解状态的有机污染物质及氮、磷、等营养盐,使污水达到可排放标准。这一过程主要是生物处理。
三级处理主要是通过生物脱氮除磷、混凝沉淀法、砂滤法、紫外线臭氧消毒法、离子交换法、电渗分析法等,以此进一步处理难降解的有机物、氮和磷等能导致水体富营养化的可溶性无机物。这一过程主要是化学过程。
目前,城市污水处理所采用的活性污泥方法主要是借助微生物群体吸附和分解能力,对污水中可降解的有机物成分进行氧化,再使用复杂的生物和化学反应以及物理处理,使有机物质被降解并与污水进行分离以净化污水。
对于城市污水处理过程而言,一旦某个过程发生故障就会导致整个污水处理的故障,会给污水厂和社会带来巨大的经济损失和重大环境污染。
因此,对污水处理过程中的异常工况进行在线的故障监测和故障诊断,进而采取必要的措施减少或抑制异常工况的发生就变得非常重要。
城市污水在组分、含量、结构的多样性和复杂性使得污水处理过程具有时变性、时滞性、扰动性以及非线性等特征,这样使得传统的故障检测方法的监控效果较差。
传统的故障检测可以分为基于模型的方法、基于知识的方法、基于数据的方法。由于实际过程中会产生大量的数据,基于数据的方法可以快速地建立复杂的模型,因而。数据驱动的故障检测方法越来越受到大众的关注。
为了更好的处理非线性问题,神经网络被用于提取数据特征获得了较好的效果。但随着数据越来越复杂,神经网络更倾向于生成复杂的模型来获得更高的精度。复杂的模型需要耗费更长的时间和内存,对于一些在线预测任务往往不太适用。
发明内容
本发明的目的是提供一种基于改进师生网络模型的污水处理过程故障检测方法,解决现有技术的污水处理过程故障检测方法检测准确度低、监控效果较差的问题。
为了实现上述目的,本发明提供了一种基于改进师生网络模型的污水处理过程故障检测方法,包括离线训练过程和在线训练过程:
所述离线训练过程,进一步包括以下步骤,
S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的历史数据,作为训练数据集;
S2、将训练数据集中的数据进行预处理;
S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息;
S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程;
S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成;
S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值;
所述在线训练过程,进一步包括以下步骤,
S7、获取污水处理过程的过程变量的实时数据,并进行预处理;
S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差;
S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。
在一实施例中,所述步骤S1中污水处理过程采用的工艺,包括:
异养生物的需氧生长;
异养生物的缺氧生长;
自养生物的需氧生长;
异养生物的衰减;
自养生物的衰减;
可溶性有机氮的氨化;
被吸附的缓慢降解有机碳的水解;
被吸附的缓慢降解有机氮的水解。
在一实施例中,所述步骤S1中的过程变量和质量变量,反映污水处理过程的运行状况,包括但不限于:
溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、pH值、固态悬浮物浓度、水的压力和水温。
在一实施例中,所述步骤S2或步骤S7中,数据进行预处理的方法,包括以下步骤:
去除数据缺失的样本;
去除与其他样本偏差过大的样本;
对数据零均值化,以消除不同量纲的影响。
在一实施例中,所述步骤S3中的师生网络模型,通过以下步骤获得:
将过程变量X作为学生网络的输入;
将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入;
设定教师网络和学生网络网络结构为人工神经网络;
设定教师网络的层数为3层,隐含层的神经元个数为10个;
设定学生网络的层数为3层,隐含层神经元个数为6个;
进行训练所得到的隐含层为对应的表征信息。
在一实施例中,所述步骤S4中的表征信息模块,用于衡量教师网络和学生网络之间的差异,对应的公式表达式为:
Figure BDA0002812170450000041
其中,zt和zs分别表示教师网络和学生网络已取得表征信息;
phase表示该网络是处于训练阶段或测试阶段;
df表示对教师网络和学生网络表征信息的差异参数。
在一实施例中,所述步骤S4中,教师网络和学生网络表征信息的差异符合高斯分布,差异参数df~N(0,δ2I),
其中,
Figure BDA0002812170450000042
所述步骤S5中的预设停止条件为,δ<0.01或Niter>10000,
其中,Niter为迭代次数。
在一实施例中,所述步骤S6或步骤S8中,计算残差的方法,进一步包括以下步骤:
根据输入数据对训练完成的教师网络和学生网络的输出进行划分;
将教师网络的输出作为质量相关子空间;
将学生网络的输出作为过程相关子空间;
构建相应的残差,对应的公式表达式为:
Figure BDA0002812170450000051
Figure BDA0002812170450000052
其中,DX,i、DY,i分别表示过程相关子空间和质量相关子空间中所构建的残差,
Figure BDA0002812170450000053
分别表示过程变量和质量变量的输出数据,xi、yi分别表示过程变量和质量变量的输入数据。
在一实施例中,所述步骤S6中,计算阈值的方法,进一步包括以下步骤:
计算残差统计量的分布函数
Figure BDA0002812170450000054
对应的公式表达式为:
Figure BDA0002812170450000055
其中,xi表示输入数据集x中的第i个元素,d表示输入数据集x的维数,h表示带宽,
Figure BDA0002812170450000056
表示输出数据集
Figure BDA0002812170450000057
中的第i个元素;
将满足
Figure BDA0002812170450000058
的参数q所对应的
Figure BDA0002812170450000059
作为统计量的阈值;
其中,KDE值根据实验或人为设定。
在一实施例中,所述步骤S9,进一步包括以下步骤:
分别在过程相关子空间和质量相关子空间画出过程变量和质量变量的统计图;
将步骤S6中所得的阈值作为控制线,与步骤S8中所得的残差作比较,残差超出控制线则认为发生故障。
本发明提出的一种基于改进师生网络模型的污水处理过程故障检测方法,可以根据污水过程的训练数据,建立轻便学生网络识别故障点,减小教师网络和学生网络的差异,增强模型的泛化能力,提高模型预测的准确性,具有高效、快速、准确、泛化能力强等特点。
本发明提出的基于改进师生网络模型的污水处理过程故障检测方法,具体具有以下有益效果:
1)方法简单、高效、准确性高,利用神经网络建模可以有效地提取数据中的非线性特征,并利用师生网络降低网络复杂性,减少训练时间;
2)与传统的师生网络方法相比,本发明更注重减少师生网络之间的差异,学生网络对教师网络的学习效果更好,显著提高了检测的准确性和高效性;
3)实验过程中不需要先验知识,不需要暂停工业过程,可以根据实际需要和数据的变化更改模型,以实现对工况的实时跟踪,得到更好地预测精度,降低了模型维护的成本。
附图说明
本发明上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变的更加明显,在附图中相同的附图标记始终表示相同的特征,其中:
图1揭示了根据本发明一实施例的基于改进师生网络模型的污水处理过程故障检测方法流程图;
图2揭示了长期型1号基准仿真模型简化流程图;
图3揭示了根据本发明一实施例的改进师生网络模型的不确定建模的框架图;
图4揭示了根据本发明一实施例的改进师生网络模型的不确定建模的迭代训练流程图;
图5揭示了根据本发明一实施例的质量空间检测结果对比图;
图6揭示了根据本发明一实施例的过程空间检测结果对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释发明,并不用于限定发明。
本发明提出的基于改进师生网络模型的污水处理过程故障检测方法,以污水处理过程正常工况下的数据作为训练数据集,通过不确定建模对传统师生网络进行改进,将教师网络和学生网络之间的差异作为噪声,经过采样建模后反馈给教师网络的训练,复杂的教师网络监督轻便的学生网络,从而得到性能更好的学生网络。
在离线过程中,利用学生网络提取数据特征,构建残差统计量和阈值。
在线故障检测过程中,针对实时数据利用学生网络提取特征,并根据提取的特征计算统计量,根据统计量是否超出控制线来判断是否发生故障。
图1揭示了根据本发明一实施例的基于改进师生网络模型的污水处理过程故障检测方法流程图,如图1所示的基于改进师生网络模型的污水处理过程故障检测方法,包括离线训练过程和在线训练过程:
所述离线训练过程,进一步包括以下步骤,
S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的历史数据,作为训练数据集;
S2、将训练数据集中的数据进行预处理;
S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息;
S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程;
S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成;
S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值;
所述在线训练过程,进一步包括以下步骤,
S7、获取污水处理过程的过程变量的实时数据,并进行预处理;
S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差;
S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。
下面详细说明每一步骤。
首先是离线训练过程。
离线过程使用历史数据训练并分别在两个空间中构建残差,然后利用核密度估计确定残差的阈值。
S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的数据,作为训练数据集。
确定污水处理的工艺流程,选择过程变量和质量变量,构建训练数据集。确认污水处理的具体工艺是为了后面选取过程变量和质量变量时能更好的实现监控。
本实施例中的污水处理流程符合如图2所示的仿真模型,图2揭示了长期型1号基准仿真模型简化流程图,该过程由一个生物反应器210和一个二沉池220组成。
生物反应器210由5个池子组成,其中前2个池是无氧的,称为缺氧池211,后3个池是有氧的,称为好氧池212。
在这个过程中,有机物被微生物的生命活动消耗,氮通过好氧池硝化过程和缺氧池反硝化过程被消耗。
二沉池220高10层、4米高,其中没有化学反应发生。
生化反应器210内的污水从第五单元流出,一部分从第六层流入二沉池220,另一部分通过管道回流到生化反应器210入口进行内循环。
二沉池220中将符合污水排放标准的水从顶层的排出,而底部的污水分成两个部分,一部分是返回第一个缺氧的生化池,另一部分抽出剩余污泥。
污水处理过程应大致满足长期型1号基准仿真模型中的动态过程,采用的工艺主要包括:(1)异养生物的需氧生长;(2)异养生物的缺氧生长;(3)自养生物的需氧生长;(4)异养生物的衰减;(5)自养生物的衰减;(6)可溶性有机氮的氨化;(7)被吸附的缓慢降解有机碳的水解;(8)被吸附的缓慢降解有机氮的水解。
选取的过程变量和质量变量,要能反映污水处理过程的运行状况,包括但不限于:化学需氧量(Chemical Oxygen Demand,COD)、生物需氧量(Biological oxygen demand,BOD)、进水量、污泥回流量、出水量、溶解氧浓度、出水氨氮含量、化学需氧量、pH值、固态悬浮物浓度、水的压力和水温。
一般要求数据不少于200组,同时应该包含尽可能多的运行条件,比如干燥天气,潮湿天气,下雨天气等。
S2、将训练数据集中的数据进行预处理。
对数据的预处理的方法,包括以下步骤:
去除数据缺失的样本;
去除与其他样本偏差过大的样本,剔除异常数据;
对数据零均值化,以消除不同量纲的影响。
对数据零均值化方法,进一步包括:
假设有M组样本数据{Xm},每组样本数据是N维,由此组成M×N维的矩阵{Xm×n}。
对数据零均值化公式为:
Figure BDA0002812170450000091
其中,xij表示样本数据,M表示样本数量,N表示样本数据维度。
S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息。
师生网络利用复杂的教师网络指导生成简单、能迅速响应的学生网络,这种学生网络在进行在线预测的任务时能够在增加准确性的同时减小所用时间。所以考虑用师生网络来进行建模。
传统的师生网络的训练,采用预训练的教师网络的方法,忽略了学生网络与教师网络之间的差异造成的性能下降问题。此外,传统的师生网络模型的泛化能力较弱,对于未出现过的数据预测性能较弱。
图3揭示了根据本发明一实施例的改进师生网络模型的不确定建模的框架图,如图3所示的改进师生网络模型的网络结构,通过以下步骤获得:
根据已知的师生网络结构,将过程变量X作为学生网络的输入;
将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入;
设定教师网络和学生网络网络结构,可以选择为人工神经网络;
设定教师网络的层数为3层,隐含层的神经元个数为10个;
设定学生网络的层数为3层,隐含层神经元个数为6个。
然后进行训练,所得到的隐含层认为是对应表征信息。
S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程。
利用表征信息模块(REB)和不确定建模方法对教师网络和学生网络的差异进行建模,在教师网络的训练中把建模后的差异作为噪声进行训练,以此减小教师网络和学生网络的差异。
表征信息模块,用于衡量教师网络和学生网络之间的差异,对应的公式表达式为:
Figure BDA0002812170450000101
其中,zt和zs分别表示教师网络和学生网络已取得表征信息;
phase表示该网络是处于训练阶段或测试阶段,使用历史数据时是训练阶段,使用实时数据时是测试阶段;
df表示对教师网络和学生网络表征信息的差异参数,反映了两个网络之间的差异。对教师网络和学生网络表征信息的差异进行建模,这种差异是符合高斯分布的,利用高斯采样对其建模。
差异参数df表示为:
df~N(0,δ2I);
其中,δ2的值可以被计算为
Figure BDA0002812170450000102
S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成。
对教师网络和学生网络同时进行迭代训练,设置预设停止条件为:
δ<0.01或Niter>10000,
其中,Niter为迭代次数。
图4揭示了根据本发明一实施例的改进师生网络模型的不确定建模的迭代训练流程图,如图4所示的迭代训练的过程,在第N次的教师网络的训练中加入第N-1次的扰动,该扰动是由第N-1次教师网络和学生网络隐含层的特征的差异产生,通过对这个差异大小进行评估,并作为噪声的方差,然后,利用高斯采样对噪声进行采样。
学生网络的训练受到教师网络的监督。
S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值。
污水处理过程不仅要关注过程是否发生故障,还要关注污水处理后的水质是否达标,这就涉及到过程相关变量和质量相关变量,需要监控过程相关子空间和质量相关子空间。
主要包括对过程空间和质量空间的构建和残差的计算。
计算残差的方法,进一步包括以下步骤:
根据输入数据,对步骤S5中训练完成的教师网络和学生网络的输出进行划分;
将教师网络的输出作为质量相关子空间;
将学生网络的输出作为过程相关子空间;
构建相应的残差,对应的公式表达式为:;
Figure BDA0002812170450000111
Figure BDA0002812170450000112
其中,DX,i,DY,i分别表示过程相关子空间和质量相关子空间中所构建的残差;
Figure BDA0002812170450000113
分别表示过程变量和质量变量的输出数据;
xi、yi分别表示过程变量和质量变量的输入数据。
计算阈值的方法,进一步包括以下步骤:
计算残差统计量的分布函数
Figure BDA0002812170450000114
对应的公式表达式为:
Figure BDA0002812170450000121
其中,xi表示输入数据集x中的第i个元素,d表示输入数据集x的维数,h表示带宽,
Figure BDA0002812170450000122
表示输出数据集
Figure BDA0002812170450000123
中的第i个元素;
将满足
Figure BDA0002812170450000124
的参数q所对应的
Figure BDA0002812170450000125
作为统计量的阈值Jth,X和Jth,Y
其中,KDE值根据实验或经验人为确定。
较佳的,KDE值设定为99%,累积分布函数不低于99%的点可作为残差统计量的阈值。
下面介绍在线训练过程。
在线过程使用实时数据,并利用离线过程训练好的网络进行特征提取,计算对应的残差,然后画出统计图,若残差超出离线过程设定的阈值,则此时可能发生了故障。
为了同时监控过程相关子空间和质量相关子空间,将过程相关变量作为学生网络的输入,将过程相关变量和质量相关变量的联合变量作为教师网络的输入,根据提取的特征划分质量相关子空间和过程相关子空间。
S7、获取污水处理过程的过程变量的实时数据,并进行预处理。
采集实时的过程变量数据,进行预处理,实时数据的过程变量应与训练数据集中过程变量类别、个数和单位保持一致。
预处理方法与步骤S2的预处理方法一致。
S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差。
进行实时的训练,将处理后的数据输入到学生网络。
虽然只采集了过程变量,但学生网络能够利用过程变量预测出过程变量,因此,可以从学生网络的表征信息中获取过程相关子空间和质量相关子空间的数据。
计算对应空间的残差,通过将表征信息进行解码恢复得到质量相关子空间和过程相关子空间的数据,然后按照步骤S6中的计算残差的方法计算。
S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。
获得检测结果,分别在过程相关子空间和质量相关子空间画出统计量的统计图;
将步骤S6中所得的阈值作为控制线,与步骤S8中计算得到的残差作比较,残差超出控制线则被认为可能发生了故障。
更进一步的,可以调整模型,获得更好的检测效果
步骤S3的网络结构和步骤S4所建立的模型可以根据实际工业过程的数据和精度需要进行更改,步骤S6中根据核密度估计所得的阈值也可以根据精度调整。
本发明提出的一种基于改进师生网络模型的污水处理过程故障检测方法,在进行故障识别时:
首先采用本发明步骤S2中所述的预处理方法对数据进行预处理,然后采用步骤S3所述确定网络结构和步骤S4的网络训练方法进行教师网络和学生网络的训练,并利用步骤S6中所述的方法构建过程相关子空间和质量相关子空间,并计算对应的残差统计量和阈值。
在获取实时过程变量数据后,将其作为学生网络的输入,通过训练得出对应的表征信息,从而实现对过程空间和质量空间的预测,然后按照步骤S6的方法计算残差统计量,画出统计图,识别故障点。
以下以如图1所示的污水处理过程中,长期型1号基准仿真模型即活性污泥1号模型的故障识别的实例来说明本发明具体步骤。
步骤S1、选取表1中所示的14个变量作为过程变量,表2所示的1个变量作为质量变量。
采集污水处理过程正常工况下的数据,采集两周的数据,共1344组,作为训练数据集。
步骤S2、利用
Figure BDA0002812170450000131
对训练数据进行预处理;
其中,xij表示样本中的数据,M表示样本数量,N表示每个样本数据维度。
步骤S3、将过程变量X作为学生网络的输入,将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入。
设定教师网络和学生网络网络结构,选择人工神经网络,并且设定教师网络的层数为3层,隐含层的神经元个数为10个。
学生网络的层数为3层,隐含层神经元个数为6个。
然后进行训练,所得到的隐含层认为是对应表征信息。
步骤S4、对教师网络和学生网络之间的差异进行建模。
利用表征信息模块(REB)和不确定建模方法对教师网络和学生网络的差异进行建模
步骤S5、对教师网络和学生网络同时进行迭代训练,设置预设停止条件为δ2<1.5。迭代训练的过程如图4所示。
步骤S6、构建子空间,计算残差统计量和阈值
根据所述的统计量的构建方法构建残差统计量,并根据核密度估计,设定带宽h=0.1,置信度KDE=99%确定阈值。
步骤S7、采集实时的过程变量数据,进行预处理
在污水处理过程中,采集1344组实时数据。
每组数据由表1中所示的14个变量的数据组成。
根据实际运行状况得知从第672组数据开始,会出现表3所示的故障。共有2批数据。
步骤S8、进行实时的训练,将处理后的数据输入到学生网络。
这里虽然只采集了过程变量,但学生网络能够利用过程变量预测出过程变量。因此,可以从学生网络的表征信息中获取过程相关子空间和质量相关子空间的数据。
计算对应空间的残差,通过将表征信息进行解码恢复得到质量相关子空间和过程相关子空间的数据,然后按照步骤S6中的计算残差的方法计算。
步骤S9、获得检测结果,分别在过程相关子空间和质量相关子空间画出统计量的统计图,将步骤S6中所得的阈值作为控制线,与步骤S8中计算得到的残差作比较,超出控制线则被认为可能发生了故障。
使用与实施例1同样的训练数据和检测数据,通过本领域的常规方法TSSAE(Teacher-Student Stacked Autoencoder),SAE(Stacked Autoencoder),PCA(PrincipalComponent Analysis),PLS(Partial Least Squares)进行识别异常检测实验,本发明所提出的方法标识为TSUAE(Teacher-Student Uncertainty Autoencoder),最终的检测结果如表4、表5、图5和图6所示。
表4得到了所有方法的检测率,表5得到了所有方法的漏报率和漏报率,所述检测率和漏报率的计算方式如下:
Figure BDA0002812170450000151
Figure BDA0002812170450000152
其中,TP代表检测出是正常的、且实际上是正常的结果数,FN代表检测出是故障的、而实际上是正常的结果数,FP代表检测出是正常的、而实际上是故障的结果数,TN代表检测出是故障的、且实际上是故障的结果数。
就故障的检测结果来说,本发明所提出的方法TSUAE在故障1中过程相关子空间的检测率最高,这是一个明显的过程相关故障。
在故障2中,所有的方法都能检测出过程相关的故障,但本发明的方法能在质量相关子空间中显示这个故障会对污水处理的质量产生影响,需要引起重视。
就漏报率而言,本发明采用的确定控制线的方法都是KDE估计,因而,所有的漏报率都是很低的。
综上所述,本发明提出的方法,不仅能检测明显的过程相关故障(故障1),而且能检测质量相关的故障,并且在与本领域的其他方法对比,本发明提出的方法有更好的检测率,这表明本方法可以及时的发现故障,保障生产的过程。
表1:过程变量的组成
Figure BDA0002812170450000153
Figure BDA0002812170450000161
表2:质量变量的组成
变量 含义 单位
BOD5 污水中BOD的浓度 gBOD.m<sup>-3</sup>
表3:故障的设置
故障序号 含义 类型
1 S<sub>NO_2</sub>的传感器产生0.5的位移 过程故障
2 第四个反应池的氧传递系数减少一半 质量故障
表4故障检测的检测率
Figure BDA0002812170450000162
表5故障检测的误报率
Figure BDA0002812170450000171
本发明提出的基于改进师生网络模型的污水处理过程故障检测方法,具体具有以下有益效果:
1)方法简单、高效、准确性高,利用神经网络建模可以有效地提取数据中的非线性特征,并利用师生网络降低网络复杂性,减少训练时间;
2)与传统的师生网络方法相比,本发明更注重减少师生网络之间的差异,学生网络对教师网络的学习效果更好,显著提高了检测的准确性和高效性;
3)实验过程中不需要先验知识,不需要暂停工业过程,可以根据实际需要和数据的变化更改模型,以实现对工况的实时跟踪,得到更好地预测精度,降低了模型维护的成本。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
上述实施例是提供给熟悉本领域内的人员来实现或使用本发明的,熟悉本领域的人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。

Claims (10)

1.一种基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,包括离线训练过程和在线训练过程:
所述离线训练过程,进一步包括以下步骤,
S1、确定污水处理过程采用的工艺,选取污水处理过程中的过程变量和质量变量,采集正常工况下的历史数据,作为训练数据集;
S2、将训练数据集中的数据进行预处理;
S3、将预处理过后的数据输入师生网络模型,提取对应教师网络和学生网络的表征信息;
S4、将教师网络和学生网络的表征信息输入表征信息模块,对表征信息的差异作为噪声进行建模,加入教师网络的训练过程;
S5、对教师网络和学生网络进行迭代训练,直至达到预设停止条件,迭代停止训练完成;
S6、获取训练完成的教师网络和学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差,并根据核密度估计的方法确定阈值;
所述在线训练过程,进一步包括以下步骤,
S7、获取污水处理过程的过程变量的实时数据,并进行预处理;
S8、将预处理后的数据输入训练完成的学生网络,得到对应学生网络的表征信息,在过程相关子空间和质量相关子空间中分别根据表征信息估计相关变量并计算对应的残差;
S9、分别比较离线训练过程和在线训练过程计算得到的过程相关子空间和质量相关子空间的残差与阈值,判断污水处理过程是否发生故障。
2.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S1中污水处理过程采用的工艺,包括:
异养生物的需氧生长;
异养生物的缺氧生长;
自养生物的需氧生长;
异养生物的衰减;
自养生物的衰减;
可溶性有机氮的氨化;
被吸附的缓慢降解有机碳的水解;
被吸附的缓慢降解有机氮的水解。
3.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S1中的过程变量和质量变量,反映污水处理过程的运行状况,包括但不限于:
溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、pH值、固态悬浮物浓度、水的压力和水温。
4.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S2或步骤S7中,数据进行预处理的方法,包括以下步骤:
去除数据缺失的样本;
去除与其他样本偏差过大的样本;
对数据零均值化,以消除不同量纲的影响。
5.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S3中的师生网络模型,通过以下步骤获得:
将过程变量X作为学生网络的输入;
将过程变量X和质量变量Y组成联合变量[X,Y]作为教师网络的输入;
设定教师网络和学生网络网络结构为人工神经网络;
设定教师网络的层数为3层,隐含层的神经元个数为10个;
设定学生网络的层数为3层,隐含层神经元个数为6个;
进行训练所得到的隐含层为对应的表征信息。
6.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S4中的表征信息模块,用于衡量教师网络和学生网络之间的差异,对应的公式表达式为:
Figure FDA0002812170440000031
其中,zt和zs分别表示教师网络和学生网络已取得表征信息;
phase表示该网络是处于训练阶段或测试阶段;
df表示对教师网络和学生网络表征信息的差异参数。
7.根据权利要求6所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于:
所述步骤S4中,教师网络和学生网络表征信息的差异符合高斯分布,差异参数df~N(0,δ2I),
其中,
Figure FDA0002812170440000032
所述步骤S5中的预设停止条件为,δ<0.01或Niter>10000,
其中,Niter为迭代次数。
8.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S6或步骤S8中,计算残差的方法,进一步包括以下步骤:
根据输入数据对训练完成的教师网络和学生网络的输出进行划分;
将教师网络的输出作为质量相关子空间;
将学生网络的输出作为过程相关子空间;
构建相应的残差,对应的公式表达式为:
Figure FDA0002812170440000033
Figure FDA0002812170440000034
其中,DX,i、DY,i分别表示过程相关子空间和质量相关子空间中所构建的残差,
Figure FDA0002812170440000041
分别表示过程变量和质量变量的输出数据,xi、yi分别表示过程变量和质量变量的输入数据。
9.根据权利要求8所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S6中,计算阈值的方法,进一步包括以下步骤:
计算残差统计量的分布函数
Figure FDA0002812170440000042
对应的公式表达式为:
Figure FDA0002812170440000043
其中,xi表示输入数据集x中的第i个元素,d表示输入数据集x的维数,h表示带宽,
Figure FDA0002812170440000044
表示输出数据集
Figure FDA0002812170440000045
中的第i个元素;
将满足
Figure FDA0002812170440000046
的参数q所对应的
Figure FDA0002812170440000047
作为统计量的阈值;
其中,KDE值根据实验或人为设定。
10.根据权利要求1所述的基于改进师生网络模型的污水处理过程故障检测方法,其特征在于,所述步骤S9,进一步包括以下步骤:
分别在过程相关子空间和质量相关子空间画出过程变量和质量变量的统计图;
将步骤S6中所得的阈值作为控制线,与步骤S8中所得的残差作比较,残差超出控制线则认为发生故障。
CN202011399762.5A 2020-12-02 2020-12-02 一种基于改进师生网络模型的污水处理过程故障检测方法 Active CN112417765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011399762.5A CN112417765B (zh) 2020-12-02 2020-12-02 一种基于改进师生网络模型的污水处理过程故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011399762.5A CN112417765B (zh) 2020-12-02 2020-12-02 一种基于改进师生网络模型的污水处理过程故障检测方法

Publications (2)

Publication Number Publication Date
CN112417765A true CN112417765A (zh) 2021-02-26
CN112417765B CN112417765B (zh) 2024-02-02

Family

ID=74829228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011399762.5A Active CN112417765B (zh) 2020-12-02 2020-12-02 一种基于改进师生网络模型的污水处理过程故障检测方法

Country Status (1)

Country Link
CN (1) CN112417765B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420815A (zh) * 2021-06-24 2021-09-21 江苏师范大学 半监督rsdae的非线性pls间歇过程监测方法
CN114429189A (zh) * 2022-01-27 2022-05-03 成都理工大学 一种高泛用性滑坡位移速率预警方法
WO2022187409A1 (en) * 2021-03-03 2022-09-09 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatus for hybrid training of neural networks for video coding
WO2023009747A1 (en) * 2021-07-29 2023-02-02 Beijing Dajia Internet Information Technology Co., Ltd. Network based image filtering for video coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180276531A1 (en) * 2017-03-27 2018-09-27 Beijing University Of Technology Fault Identifying Method for Sludge Bulking Based on a Recurrent RBF Neural Network
CN111160776A (zh) * 2019-12-30 2020-05-15 华东理工大学 利用分块主成分分析的污水处理过程异常工况检测方法
CN111291937A (zh) * 2020-02-25 2020-06-16 合肥学院 基于支持向量分类与gru神经网络联合的处理污水水质预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180276531A1 (en) * 2017-03-27 2018-09-27 Beijing University Of Technology Fault Identifying Method for Sludge Bulking Based on a Recurrent RBF Neural Network
CN111160776A (zh) * 2019-12-30 2020-05-15 华东理工大学 利用分块主成分分析的污水处理过程异常工况检测方法
CN111291937A (zh) * 2020-02-25 2020-06-16 合肥学院 基于支持向量分类与gru神经网络联合的处理污水水质预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
彭继慎;董晶;: "基于RBF神经网络的控制系统传感器故障诊断方法", 现代电子技术, no. 12 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022187409A1 (en) * 2021-03-03 2022-09-09 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatus for hybrid training of neural networks for video coding
CN113420815A (zh) * 2021-06-24 2021-09-21 江苏师范大学 半监督rsdae的非线性pls间歇过程监测方法
CN113420815B (zh) * 2021-06-24 2024-04-30 江苏师范大学 半监督rsdae的非线性pls间歇过程监测方法
WO2023009747A1 (en) * 2021-07-29 2023-02-02 Beijing Dajia Internet Information Technology Co., Ltd. Network based image filtering for video coding
CN114429189A (zh) * 2022-01-27 2022-05-03 成都理工大学 一种高泛用性滑坡位移速率预警方法
CN114429189B (zh) * 2022-01-27 2023-06-27 成都理工大学 一种高泛用性滑坡位移速率预警方法

Also Published As

Publication number Publication date
CN112417765B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
CN112417765B (zh) 一种基于改进师生网络模型的污水处理过程故障检测方法
Haimi et al. Data-derived soft-sensors for biological wastewater treatment plants: An overview
CN111291937A (zh) 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
Han et al. Hierarchical neural network modeling approach to predict sludge volume index of wastewater treatment process
CN111160776A (zh) 利用分块主成分分析的污水处理过程异常工况检测方法
CN102854296A (zh) 一种基于集成神经网络的污水处理软测量方法
Hamada et al. Application of artificial neural networks for the prediction of Gaza wastewater treatment plant performance-Gaza strip
CN110232256B (zh) 一种基于kpls和rwfcm的污水处理过程监测方法
Jana et al. Optimization of effluents using artificial neural network and support vector regression in detergent industrial wastewater treatment
CN108088974B (zh) 一种厌氧同时反硝化产甲烷过程出水硝氮的软测量方法
CN107402586A (zh) 基于深度神经网络的溶解氧浓度控制方法及系统
CN111126870A (zh) 利用集成主成分分析的污水处理过程异常工况检测方法
CN108536106B (zh) 一种基于卡尔曼滤波-极限学习机的曝气系统溶解氧在线调控方法
Ba-Alawi et al. Missing data imputation and sensor self-validation towards a sustainable operation of wastewater treatment plants via deep variational residual autoencoders
Han et al. Data-driven decision-making for wastewater treatment process
CN109473182A (zh) 一种基于深度信念网络的mbr膜透水率智能检测方法
Zhu et al. A data-derived soft-sensor method for monitoring effluent total phosphorus
Yao et al. Predicting membrane fouling in a high solid AnMBR treating OFMSW leachate through a genetic algorithm and the optimization of a BP neural network model
Wu et al. Data-driven intelligent warning method for membrane fouling
Ba-Alawi et al. Explainable multisensor fusion-based automatic reconciliation and imputation of faulty and missing data in membrane bioreactor plants for fouling alleviation and energy saving
CN103605882B (zh) 一种丝状菌污泥膨胀指数svi特征模型的构建方法
AU2018418038B2 (en) System and method for predicting a parameter associated with a wastewater treatment process
Dologlu et al. Data driven identification of industrial reverse osmosis membrane process
CN114861543A (zh) 一种数据驱动的石化污水可生化性智能评价方法
Ren et al. Multivariable identification of membrane fouling based on compacted cascade neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant