CN115294383A - 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统 - Google Patents

一种基于umap-gadf-cnn的污水处理故障诊断方法及系统 Download PDF

Info

Publication number
CN115294383A
CN115294383A CN202210709454.0A CN202210709454A CN115294383A CN 115294383 A CN115294383 A CN 115294383A CN 202210709454 A CN202210709454 A CN 202210709454A CN 115294383 A CN115294383 A CN 115294383A
Authority
CN
China
Prior art keywords
sewage treatment
low
umap
cnn
gadf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210709454.0A
Other languages
English (en)
Inventor
赵立杰
张根
黄明忠
王国刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Chemical Technology
Original Assignee
Shenyang University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Chemical Technology filed Critical Shenyang University of Chemical Technology
Priority to CN202210709454.0A priority Critical patent/CN115294383A/zh
Publication of CN115294383A publication Critical patent/CN115294383A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于UMAP‑GADF‑CNN的污水处理故障诊断方法及系统,其中方法包括以下步骤:采集污水处理过程监测数据和故障类别标签;使用统一流形逼近与投影(Uniform Manifold Approximation and Projection,UMAP)对污水处理数据进行降维;采用格拉姆角差场(Gramian Angular Difference Field,GADF)将降维后的污水处理数据转换为二维图像;将二维图像数据输入到卷积神经网络(Convolutional Neural Network,CNN)模型中进行训练;最后将故障图像测试样本输入到训练好的故障诊断模型,进行污水处理故障诊断。实验证明,本发明提高了污水处理故障类别的分类准确率,从而有效提升了污水处理过程中故障诊断的整体性能。

Description

一种基于UMAP-GADF-CNN的污水处理故障诊断方法及系统
技术领域
本发明涉及污水处理故障诊断领域,尤其涉及一种基于UMAP-GADF-CNN的污水处理故障诊断方法及系统。
背景技术
污水处理是一个复杂的,动态的生化过程,受到强烈外部干扰和复杂生化反应的影响,污水处理厂故障时常发生。当污水处理厂出现故障时,会影响其运行效率并且水质无法达到相应的水质标准。污水处理过程工况复杂多变,易受到外界天气条件影响,污水处理过程的复杂性导致故障识别准确率不高。实时监控污水处理厂运行性能是保证设备安全运行的基础,因此,开发一种准确高效的故障诊断模型是污水处理厂稳定运行的有效手段。
近年来,基于深度学习的工业过程故障诊断的各种尝试引起了人们的广泛关注,基于深度学习的污水处理故障诊断方法也取得了良好的效果。污水处理数据是具有复杂时间相关性的时间序列,并且具有明显的非线性和非稳态的特征。现有方法未能充分利用污水处理数据信息,难以准确高效的识别出不同污水故障种类。有鉴于此特提出本发明,能够有效的提升对污水故障种类的识别准确率。
发明内容
本发明的目的是为了解决现有方法对污水故障识别效果不佳的问题,提出了一种基于UMAP-GADF-CNN的污水处理故障诊断方法及系统,使用UMAP降维算法将污水处理数据降维成低维时间序列,采用GADF将低维时间序列转换为二维图像,然后将二维图像数据输入到卷积神经网络CNN模型中进行训练,保存训练好的CNN模型,最后将故障图像测试样本输入到训练好的故障诊断模型,进行污水处理故障诊断。实验证明,本发明提高了污水处理故障类别的分类准确率,从而有效提升了污水处理过程中故障诊断的整体性能。
为解决上述技术问题,本发明提出了一种基于UMAP-GADF-CNN的污水处理故障诊断方法,该方法包括以下步骤:
S1,采集污水处理过程监测数据和故障类别标签;
S2,使用统一流形逼近与投影UMAP对污水处理数据进行降维;
S3,采用格拉姆角差场GADF将降维后的污水处理数据转换为二维图像;
S4,将二维图像数据输入到卷积神经网络CNN模型中进行训练;
S5,最后将故障图像测试样本输入到训练好的故障诊断模型,进行污水处理故障诊断。
进一步可选地,步骤S2包括如下步骤:
S21,使用UMAP算法对污水处理数据进行非线性降维,将高维时间序列
Figure 18975DEST_PATH_IMAGE001
降维成低维时间序列
Figure 310410DEST_PATH_IMAGE002
Figure 688302DEST_PATH_IMAGE003
Figure 226731DEST_PATH_IMAGE004
,其中
Figure 690073DEST_PATH_IMAGE005
表示时间序列的样本数量,
Figure 972150DEST_PATH_IMAGE006
表示高维时间序列的维数,
Figure 470128DEST_PATH_IMAGE007
表示低维时间序列的维数。
进一步可选地,步骤S3包括如下步骤:
S31,将低维时间序列归一化到[-1,1],通过如下公式实现:
Figure 913878DEST_PATH_IMAGE008
其中,
Figure 130096DEST_PATH_IMAGE009
表示第i时刻低维时间序列归一化后的值,
Figure 944425DEST_PATH_IMAGE010
表示第i时刻低维时间序列的数值,
Figure 296909DEST_PATH_IMAGE011
表示经过UMAP降维后的低维时间序列,
Figure 911561DEST_PATH_IMAGE012
表示低维时间序列中的最大值,
Figure 224862DEST_PATH_IMAGE013
表示低维时间序列中的最小值。
S32,将归一化后的低维时间序列映射到极坐标系,即将低维时间序列的数值转换为余弦值
Figure 848741DEST_PATH_IMAGE014
,将时间戳转换为半径
Figure 55732DEST_PATH_IMAGE015
,通过如下公式实现:
Figure 106864DEST_PATH_IMAGE016
其中,
Figure 32095DEST_PATH_IMAGE017
表示第i时刻的极坐标角度,
Figure 194086DEST_PATH_IMAGE018
表示第i时刻低维时间序列归一化后的值,
Figure 521162DEST_PATH_IMAGE019
表示归一化后的低维时间序列,
Figure 743196DEST_PATH_IMAGE020
表示第i时刻的极坐标半径,
Figure 890144DEST_PATH_IMAGE021
表示时间戳,
Figure 855826DEST_PATH_IMAGE022
表示正则化极坐标系统生成空间的常数因子;
S33,将低维时间序列映射到极坐标系后,通过考虑每个点之间的三角和/差来利用角度透视,以此来识别不同时间间隔内的时间相关性,格拉姆角差场GADF的定义如下所示:
Figure 37408DEST_PATH_IMAGE023
其中,
Figure 430344DEST_PATH_IMAGE024
表示归一化后的低维时间序列,
Figure 330166DEST_PATH_IMAGE025
表示
Figure 833960DEST_PATH_IMAGE024
的转置向量,
Figure 870049DEST_PATH_IMAGE026
表示单位向量[1,1,…,1],
Figure 433886DEST_PATH_IMAGE027
Figure 555425DEST_PATH_IMAGE028
分别表示第1时刻和第n时刻极坐标的角度。
进一步可选地,步骤S4包括如下步骤:
S41,将经过GADF转换后的二维图像分为训练集和测试集,然后将训练集输入到卷积神经网络CNN模型中进行训练,保存训练好的CNN模型。
进一步可选地,步骤S5包括如下步骤:
S51,将测试集输入到训练好的CNN模型中,得到污水故障分类结果,进行污水处理故障诊断。
一种基于UMAP-GADF-CNN的污水故障诊断系统,所述系统包括有计算机设备,计算机设备包括存储器、处理器及储存在所述存储器上并可在所述处理器上运行的计算器程序,所述处理器执行所述计算机程序时,实现基于UMAP-GADF-CNN的污水处理故障诊断。
所述的一种基于UMAP-GADF-CNN的污水故障诊断系统,,所述系统计算机设备的读存储介质,存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行基于UMAP-GADF-CNN的污水处理故障诊断。
采用上述技术方案后,本发明与现有技术相比具有以下有益效果:
1、本发明采用UMAP降维算法将污水处理数据降维成低维时间序列,能最大程度保留原始特征的同时大幅度的降低特征维数,并且运算速度较快,内存占用小。
2、本发明使用GADF将低维时间序列转换为二维图像,能在消除冗余特征的同时,将隐藏在复杂时间序列中的重要信息呈现出来,以便于直接提取深层特征。
3、本发明采用CNN模型中的轻量级网络MobileNetV3-Large提取图像特征并进行故障种类的识别,能够在保持神经网络性能的前提下,显著减少网络的参数和计算量,加快模型的运行时间。
下面结合附图对本发明的具体实施方式作进一步详细的描述。
附图说明
附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:
图1:为本发明基于UMAP-GADF-CNN的污水处理故障诊断方法的流程示意图。
图2:为本发明中GADF转换过程示意图。
图3:为GADF转换后的二维故障图像示例图。
图4:为MobileNetV3-Large模型的bneck模块结构图。
图5:为UMAP-GADF-CNN模型在测试集上的混淆矩阵。
需要说明的是,这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
在本发明的描述中,需要说明的是,污水处理过程监测变量和标签因污水处理厂工艺不同而不同,本实施方式下采集的数据以BSM1模拟平台数据集为例,但不限于此,因此不能理解为对本发明的限制。
污水处理过程工况复杂多变,易受到外界天气条件影响,为了解决污水处理过程的复杂性导致故障识别准确率不高的问题,本发明提供了一种基于UMAP-GADF-CNN的污水处理故障诊断方法及系统。
图1示出了本发明一种实施例的基于UMAP-GADF-CNN的污水处理故障诊断方法的流程示意图。如图1所示,该污水处理故障诊断模型构建方法包括:
S1,采集污水处理过程监测数据和故障类别标签。其中,S1包括如下步骤:
S11,本发明采用BSM1模拟平台中产生的污水处理数据作为实验仿真的数据。BSM1采用典型的前置反硝化工艺,包括由两个厌氧池和三个好氧池组成的五室活性污泥生化反应池和一个二沉池。在生化反应池内主要利用微生物的硝化和反硝化过程对污水进行生物脱氮,而在二沉池内则主要利用物理沉降进行泥水分离。
S12,本发明设置了污水处理厂的两个常见故障,即污泥膨胀故障和毒性冲击故障。污泥膨胀是一种具有严重影响的常见故障,由于废水水质复杂,生化系统溶解氧不足,可能会发生污泥膨胀。当污泥发生膨胀时,污泥的沉降和压缩性能恶化,悬浮物增多,污泥流失严重,生化系统可能发生故障,直接威胁污水处理系统的正常运行。本发明在BSM1中调整模型的异养菌最大比增长速率系数
Figure 862910DEST_PATH_IMAGE030
来产生四种不同严重程度的污泥膨胀故障。毒性冲击故障是由于有毒废水排放量大,导致活性污泥微生物活性降低,废水处理效果下降,因而达不到排放标准,甚至导致环境污染与生物处理系统故障。本发明在BSM1中调整模型的异养菌最大比增长速率系数
Figure 19085DEST_PATH_IMAGE030
和异养菌衰减系数
Figure 753823DEST_PATH_IMAGE032
来产生四种不同严重程度的毒性冲击故障。本发明基于BSM1中的
Figure 362659DEST_PATH_IMAGE034
Figure 208255DEST_PATH_IMAGE036
参数建立了两类故障,每类各有4种不同程度的故障,因此共8种故障。实验中使用的8种故障的详细描述如表1所示。
表1 设置的8种故障类型
Figure 218936DEST_PATH_IMAGE037
S13,污水处理数据共有12096个样本,每个样本有9维属性。12096个样本共分为9类,每类都是1344个样本。BSM1的采样周期一共为14天,每15分钟采集一次数据,故每种故障共有1344个样本。选用了干燥天气条件下的污水数据,选取第五个生化反应池中的监控变量,除去变化细微和变化剧烈的监控变量,一共选取了9种监控变量,能够准确的体现污水的水质变化。本发明中使用的9种监控变量如表2所示。
表2 选取的9种监控变量
Figure 124575DEST_PATH_IMAGE038
S14,污水处理数据中共有九类,第一类是正常状态类,第二类、第三类、第四类和第五类是4种不同程度的污泥膨胀故障类,第六类、第七类、第八类和第九类是4种不同程度的毒性冲击故障类,对每一个样本都打上类别标签。
S2,使用统一流形逼近与投影UMAP对污水处理数据进行降维。其中,S2包括如下步骤:
S21,在UMAP降维过程中,将输入的高维时间序列设为
Figure 220707DEST_PATH_IMAGE039
Figure 887573DEST_PATH_IMAGE040
,输出的低维时间序列设为
Figure 18340DEST_PATH_IMAGE041
Figure 94880DEST_PATH_IMAGE042
Figure 412729DEST_PATH_IMAGE043
,其中
Figure 865707DEST_PATH_IMAGE044
表示时间序列的样本数量,
Figure 850980DEST_PATH_IMAGE045
表示高维时间序列的维数,
Figure 98422DEST_PATH_IMAGE046
表示低维时间序列的维数,给定一个超参数
Figure 903567DEST_PATH_IMAGE047
,计算出每个样本点
Figure 894657DEST_PATH_IMAGE049
Figure 734437DEST_PATH_IMAGE046
维下的
Figure 152780DEST_PATH_IMAGE047
个近邻点集合
Figure 710800DEST_PATH_IMAGE051
对于每个样本点
Figure 240002DEST_PATH_IMAGE049
Figure 199867DEST_PATH_IMAGE053
Figure 789112DEST_PATH_IMAGE055
定义如下所示:
Figure 568849DEST_PATH_IMAGE056
其中,
Figure 901741DEST_PATH_IMAGE053
表示样本点
Figure 716114DEST_PATH_IMAGE049
距其最近邻之间的距离,
Figure 476259DEST_PATH_IMAGE055
是一个平滑的标准化因子,可以使黎曼度量局部退化到样本点
Figure 743292DEST_PATH_IMAGE049
Figure 879876DEST_PATH_IMAGE057
表示样本点
Figure 548754DEST_PATH_IMAGE049
和其近邻点
Figure 479801DEST_PATH_IMAGE058
之间的距离。
S22,对于高维空间中的两个样本点
Figure 234131DEST_PATH_IMAGE049
Figure 174405DEST_PATH_IMAGE060
,可以使用
Figure 697790DEST_PATH_IMAGE062
表示样本点
Figure 799738DEST_PATH_IMAGE064
是样本点
Figure 41364DEST_PATH_IMAGE049
最近邻的概率,
Figure 519750DEST_PATH_IMAGE062
定义如下所示:
Figure 897641DEST_PATH_IMAGE066
其中,
Figure 436070DEST_PATH_IMAGE068
表示样本点
Figure 899412DEST_PATH_IMAGE049
和样本点
Figure 175630DEST_PATH_IMAGE060
之间的距离。
S23,
Figure 408028DEST_PATH_IMAGE062
表示样本点
Figure 117358DEST_PATH_IMAGE060
是样本点
Figure 67997DEST_PATH_IMAGE049
最近邻的概率,但这不是一个对称函数,因此应该将此函数对称化,则对称化后的联合概率分布如下所示:
Figure 888185DEST_PATH_IMAGE070
其中,
Figure 240669DEST_PATH_IMAGE062
表示样本点
Figure 120900DEST_PATH_IMAGE049
是样本点
Figure 496518DEST_PATH_IMAGE060
最近邻的概率。
S24,在高维分布中建立模糊拓扑结构后,需要在低维分布中构建概率分布。假设高维空间中的样本点
Figure 182714DEST_PATH_IMAGE049
Figure 327388DEST_PATH_IMAGE060
映射到低维空间中的映射点分别为
Figure 440837DEST_PATH_IMAGE071
Figure 303751DEST_PATH_IMAGE072
,则低维空间中的概率分布
Figure 528059DEST_PATH_IMAGE074
如下所示:
Figure 792818DEST_PATH_IMAGE076
其中,
Figure 811590DEST_PATH_IMAGE077
Figure 161800DEST_PATH_IMAGE078
为超参数,UMAP默认设置为
Figure 189799DEST_PATH_IMAGE077
=1.929,
Figure 309064DEST_PATH_IMAGE078
=0.7915。
S25,UMAP将有关的数据点在投影空间中的距离尽可能的减小,而将无关的数据点在投影空间中的距离尽可能的增大,最后使用梯度下降法最小化交叉熵函数,公式如下所示:
Figure 764316DEST_PATH_IMAGE080
S3,采用格拉姆角差场GADF将降维后的污水处理数据转换为二维图像。GADF转换过程如图2所示。GADF转换后的二维故障图像如图3所示。其中,S3包括如下步骤:
S31,将低维时间序列归一化到[-1,1],通过如下公式实现:
Figure 336243DEST_PATH_IMAGE081
其中,
Figure 902354DEST_PATH_IMAGE082
表示第i时刻低维时间序列归一化后的值,
Figure 141705DEST_PATH_IMAGE083
表示第i时刻低维时间序列的数值,
Figure 767859DEST_PATH_IMAGE084
表示经过UMAP降维后的低维时间序列,
Figure 827082DEST_PATH_IMAGE085
表示低维时间序列中的最大值,
Figure 196883DEST_PATH_IMAGE086
表示低维时间序列中的最小值。
S32,将归一化后的低维时间序列映射到极坐标系,即将低维时间序列的数值转换为余弦值
Figure 290741DEST_PATH_IMAGE087
,将时间戳转换为半径
Figure 87796DEST_PATH_IMAGE088
,通过如下公式实现:
Figure 634315DEST_PATH_IMAGE089
其中,
Figure 542228DEST_PATH_IMAGE090
表示第i时刻的极坐标角度,
Figure 490592DEST_PATH_IMAGE082
表示第i时刻低维时间序列归一化后的值,
Figure 458548DEST_PATH_IMAGE091
表示归一化后的低维时间序列,
Figure 486504DEST_PATH_IMAGE092
表示第i时刻的极坐标半径,
Figure 135791DEST_PATH_IMAGE093
表示时间戳,
Figure 938662DEST_PATH_IMAGE094
表示正则化极坐标系统生成空间的常数因子。
S33,将低维时间序列映射到极坐标系后,通过考虑每个点之间的三角和/差来利用角度透视,以此来识别不同时间间隔内的时间相关性,格拉姆角差场GADF的定义如下所示:
Figure 77519DEST_PATH_IMAGE096
Figure 598630DEST_PATH_IMAGE098
其中,
Figure 113925DEST_PATH_IMAGE091
表示归一化后的低维时间序列,
Figure 771303DEST_PATH_IMAGE099
表示
Figure 81061DEST_PATH_IMAGE091
的转置向量,
Figure 89469DEST_PATH_IMAGE100
表示单位向量[1,1,…,1],
Figure DEST_PATH_IMAGE101
Figure 80559DEST_PATH_IMAGE102
分别表示第
Figure DEST_PATH_IMAGE103
时刻和第
Figure 858022DEST_PATH_IMAGE104
时刻极坐标的角度。
S4,将经过GADF转换后的二维图像数据分为训练集和测试集,比例为8:2,然后将训练集输入到卷积神经网络CNN模型中进行训练,保存训练好的CNN模型。其中,S4包括如下步骤:
S41,选用CNN模型中的轻量级网络MobileNetV3-Large模型进行训练。MobileNetV3模型是2019年提出的轻量级CNN模型,共有两个版本,分别为MobileNetV3-Large和MobileNetV3-Small,分别适用于不同的场景。该模型结合了MobileNetV1的深度可分离卷积和MobileNetV2的具有线性瓶颈的倒参差结构,同时引入了Squeeze-and-Excitation(SE)轻量级注意力机制模块,能够有效的平衡计算速度和准确率两者之间的关系。与其他卷积神经网络模型相比,MobileNetV3模型的参数量更少,计算速度更快。MobileNetV3-Large模型中的bneck模块结构如图4所示,MobileNetV3-Large模型的总体结构如表3所示。
表3 MobileNetV3-Large模型结构
Figure 338682DEST_PATH_IMAGE106
Figure 834385DEST_PATH_IMAGE108
其中,Input表示输入大小,Operator中的NBN表示不使用BN层,最后的conv2d 1×1等同于全连接层的作用,Exp size表示bottleneck中的第一层1×1卷积升维到的数量,out表示bottleneck输出的通道数,SE表示是否使用SE模块,NL表示使用哪种激活函数,HS表示
Figure 425903DEST_PATH_IMAGE110
,RE表示ReLU,s表示步长。
S42,MobileNetV3-Large模型结合了MnasNet和NetAdapt这两种自动机器学习(AutoML)技术。首先利用MnasNet进行全局网络结构的搜索,然后使用强化学习从一组离散的选择中选择最优配置,其次利用NetAdapt搜索每一层的过滤器数量并对体系结构进行微调,它能够以较小的降幅对未充分利用的激活通道进行调整。MobileNetV3-Large模型采用
Figure 57873DEST_PATH_IMAGE110
激活函数替代了
Figure 975013DEST_PATH_IMAGE112
激活函数,减少了计算量从而加快计算速度。
Figure 692434DEST_PATH_IMAGE110
激活函数公式如下所示:
Figure 87643DEST_PATH_IMAGE114
S5,最后将二维图像数据中的测试集输入到训练好的故障诊断模型,得到识别结果并进行污水处理故障诊断。基于UMAP-GADF-CNN的污水处理故障诊断方法在污水处理数据测试集上的混淆矩阵如图5所示。其中,S5包括如下步骤:
S51,在测试中,我们使用准确率(Accuracy),精确率(Precision)和召回率(Recall)作为评价标准,定义如下所示。其中TP将正样本预测为1,FN将正样本预测为0,FP将负样本预测为1,TN将负样本预测为0。
Figure DEST_PATH_IMAGE115
S52,为了验证本发明所提出的基于UMAP-GADF-CNN的污水处理故障诊断方法的有效性,选择FCN、MLP和UMAP-GASF-CNN模型进行性能比较。其中,FCN和MLP模型的输入为低维时间序列,UMAP-GASF-CNN和UMAP-GADF-CNN模型的输入为二维图像。性能对比结果如表4所示。
表4 污水故障分类模型性能对比
Figure 839698DEST_PATH_IMAGE116
S53,由表3可以看出,UMAP-GASF-CNN和UMAP-GADF-CNN模型在污水处理故障分类领域中,性能明显优于FCN和MLP这两种常见的深度学习分类模型。与FCN模型相比,UMAP-GADF-CNN模型的准确率、精确率和召回率高出了14.4%、14.5%和13.8%,在准确率方面提升了14.5%;与MLP模型相比,UMAP-GADF-CNN模型的准确率、精确率和召回率高出了7.6%、7.4%和7.1%,在准确率方面提升了7.6%。进一步对比发现,UMAP-GADF-CNN模型的故障识别准确率比UMAP-GASF-CNN模型略高0.2%,因此最终我们选择UMAP-GADF-CNN模型来完成污水处理故障诊断任务。由图5的混淆矩阵中可以看出,UMAP-GADF-CNN模型对正常类型、故障1和故障2类型的识别率达到了100%,对其他故障类型的识别率也接近100%,因此可以看出本发明提出的基于UMAP-GADF-CNN的污水处理故障诊断方法提高了污水处理故障类别的分类准确率,能够有效提升了污水处理过程中故障诊断的整体性能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所述仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专利的技术人员在不脱离本发明技术方案范围内,当可利用上述提示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明方案的范围内。

Claims (7)

1.一种基于UMAP-GADF-CNN的污水故障诊断方法,其特征在于,包括以下步骤:
S1,采集污水处理过程监测数据和故障类别标签;
S2,使用统一流形逼近与投影UMAP对污水处理数据进行降维;
S3,采用格拉姆角差场GADF将降维后的污水处理数据转换为二维图像;
S4,将二维图像数据输入到卷积神经网络CNN模型中进行训练;
S5,最后将故障图像测试样本输入到训练好的故障诊断模型,进行污水处理故障诊断。
2.如权利要求1所述的污水故障诊断方法,其特征在于,所述步骤S2是使用UMAP算法对污水处理数据进行非线性降维,将高维时间序列
Figure DEST_PATH_IMAGE002
降维成低维时间序列
Figure DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
,其中
Figure DEST_PATH_IMAGE010
表示时间序列的样本数量,
Figure DEST_PATH_IMAGE012
表示高维时间序列的维数,
Figure DEST_PATH_IMAGE014
表示低维时间序列的维数。
3.如权利要求1所述的污水故障诊断方法,其特征在于,所述步骤S3包括如下步骤:
S31,将低维时间序列归一化到[-1,1],通过如下公式实现:
Figure DEST_PATH_IMAGE016
其中,
Figure DEST_PATH_IMAGE018
表示第i时刻低维时间序列归一化后的值,
Figure DEST_PATH_IMAGE020
表示第i时刻低维时间序列的数值,
Figure DEST_PATH_IMAGE022
表示经过UMAP降维后的低维时间序列,
Figure DEST_PATH_IMAGE024
表示低维时间序列中的最大值,
Figure DEST_PATH_IMAGE026
表示低维时间序列中的最小值;
S32,将归一化后的低维时间序列映射到极坐标系,即将低维时间序列的数值转换为余弦值
Figure DEST_PATH_IMAGE028
,将时间戳转换为半径
Figure DEST_PATH_IMAGE030
,通过如下公式实现:
Figure DEST_PATH_IMAGE032
其中,
Figure DEST_PATH_IMAGE034
表示第i时刻的极坐标角度,
Figure DEST_PATH_IMAGE036
表示第i时刻低维时间序列归一化后的值,
Figure DEST_PATH_IMAGE038
表示归一化后的低维时间序列,
Figure DEST_PATH_IMAGE040
表示第i时刻的极坐标半径,
Figure DEST_PATH_IMAGE042
表示时间戳,
Figure DEST_PATH_IMAGE044
表示正则化极坐标系统生成空间的常数因子;
S33,将低维时间序列映射到极坐标系后,通过考虑每个点之间的三角和/差来利用角度透视,以此来识别不同时间间隔内的时间相关性,格拉姆角差场GADF的定义如下所示:
Figure DEST_PATH_IMAGE046
其中,
Figure DEST_PATH_IMAGE048
表示归一化后的低维时间序列,
Figure DEST_PATH_IMAGE050
表示
Figure 205959DEST_PATH_IMAGE048
的转置向量,
Figure DEST_PATH_IMAGE052
表示单位向量[1,1,…,1],
Figure DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE056
分别表示第1时刻和第n时刻极坐标的角度。
4.如权利要求1所述的污水故障诊断方法,其特征在于,所述步骤S4是将经过GADF转换后的二维图像分为训练集和测试集,然后将训练集输入到卷积神经网络CNN模型中进行训练,保存训练好的CNN模型。
5.如权利要求1所述的污水故障诊断方法,其特征在于,所述步骤S5是将测试集输入到训练好的CNN模型中,得到污水故障分类结果,进行污水处理故障诊断。
6.一种基于UMAP-GADF-CNN的污水故障诊断系统,所述系统包括有计算机设备,计算机设备包括存储器、处理器及储存在所述存储器上并可在所述处理器上运行的计算器程序,其特征在于,所述处理器执行所述计算机程序时,实现基于UMAP-GADF-CNN的污水处理故障诊断。
7.如权利要求6所述的一种基于UMAP-GADF-CNN的污水故障诊断系统,其特征在于,所述系统计算机设备的读存储介质,存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行基于UMAP-GADF-CNN的污水处理故障诊断。
CN202210709454.0A 2022-06-22 2022-06-22 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统 Withdrawn CN115294383A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210709454.0A CN115294383A (zh) 2022-06-22 2022-06-22 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210709454.0A CN115294383A (zh) 2022-06-22 2022-06-22 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统

Publications (1)

Publication Number Publication Date
CN115294383A true CN115294383A (zh) 2022-11-04

Family

ID=83819702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210709454.0A Withdrawn CN115294383A (zh) 2022-06-22 2022-06-22 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN115294383A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117371873A (zh) * 2023-12-01 2024-01-09 四川省生态环境科学研究院 一种基于大数据的环境保护工程用污水评估方法
CN117707062A (zh) * 2023-12-01 2024-03-15 北京科技大学 一种带钢热轧过程的故障检测方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117371873A (zh) * 2023-12-01 2024-01-09 四川省生态环境科学研究院 一种基于大数据的环境保护工程用污水评估方法
CN117707062A (zh) * 2023-12-01 2024-03-15 北京科技大学 一种带钢热轧过程的故障检测方法和装置
CN117371873B (zh) * 2023-12-01 2024-03-26 四川省生态环境科学研究院 一种基于大数据的环境保护工程用污水评估方法

Similar Documents

Publication Publication Date Title
CN115294383A (zh) 一种基于umap-gadf-cnn的污水处理故障诊断方法及系统
Farhi et al. Prediction of wastewater treatment quality using LSTM neural network
CN102854296B (zh) 一种基于集成神经网络的污水处理软测量方法
Qiu et al. Date-driven soft-sensor design for biological wastewater treatment using deep neural networks and genetic algorithms
CN110320335B (zh) 一种关于污水处理出水水质指标的多元鲁棒软测量方法
CN112101402B (zh) 一种基于知识模糊学习的膜污染预警方法
CN115356930B (zh) 一种污水处理过程中的多目标优化控制系统及方法
CN112417765B (zh) 一种基于改进师生网络模型的污水处理过程故障检测方法
AU2021106540A4 (en) Prediction method and system for river algal blooms
CN111762958A (zh) 基于asm2d模型的污水处理厂深井曝气工艺优化方法及装置
CN115147645A (zh) 基于多特征信息融合的膜组件膜污染检测方法
Li et al. An innovative combined model based on multi-objective optimization approach for forecasting short-term wind speed: A case study in China
US20170299565A1 (en) Computing system for detecting total phosphorus in effluent using data driven A2/O process
CN117235595A (zh) 一种基于LSTM-Attention的污水处理加药量预测方法及系统
CN104914227A (zh) 基于多高斯核自优化相关向量机的污水水质软测量方法
CN111204867B (zh) 膜生物反应器-mbr膜污染智能决策方法
CN106769748B (zh) 膜生物反应器-mbr出水透水率的智能检测系统
CN112001436A (zh) 一种基于改进的极限学习机的水质分类方法
CN109273058A (zh) 一种用于厌氧过程挥发性脂肪酸超标预警的复合算法
Xu et al. Prediction of the Wastewater's pH Based on Deep Learning Incorporating Sliding Windows.
Liu et al. Soft-sensors based on Gaussian process regression for wastewater treatment plants
CN117575017B (zh) 一种污水处理过程的概率推理模型构建方法及其系统
Zhou et al. Fault diagnosis for wasterwater treatment plant based on an improved support vector data description method
Lu Application of a Wavelet Packet and SOM Neural Network in Wastewater Treatment Fault
Yin et al. Prediction model of dissolved oxygen in marine pasture based on hybrid gray wolf algorithm optimized support vector regression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20221104