CN111126870A - 利用集成主成分分析的污水处理过程异常工况检测方法 - Google Patents

利用集成主成分分析的污水处理过程异常工况检测方法 Download PDF

Info

Publication number
CN111126870A
CN111126870A CN201911392964.4A CN201911392964A CN111126870A CN 111126870 A CN111126870 A CN 111126870A CN 201911392964 A CN201911392964 A CN 201911392964A CN 111126870 A CN111126870 A CN 111126870A
Authority
CN
China
Prior art keywords
data
model
principal component
models
sewage treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911392964.4A
Other languages
English (en)
Other versions
CN111126870B (zh
Inventor
钱锋
钟伟民
杜文莉
周钊
彭鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN201911392964.4A priority Critical patent/CN111126870B/zh
Publication of CN111126870A publication Critical patent/CN111126870A/zh
Application granted granted Critical
Publication of CN111126870B publication Critical patent/CN111126870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W10/00Technologies for wastewater treatment
    • Y02W10/10Biological treatment of water, waste water, or sewage

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及一种利用集成主成分分析的污水处理过程异常工况识别方法。该方法将正常工况下的数据作为训练数据集,计算训练数据集的特征值和特征向量,随机选取主元,并利用主成分分析法建立主元模型,重复多次建立多个主元模型,计算各个主元模型的T2统计量及其阈值,采用分裂式层次聚类方法从上述主元模型中选择出合适的模型,获取污水处理实时数据,并建立与训练数据集相同的合适的模型,根据实时数据的检测统计量是否超出阈值判断是否发生了故障。该方法可以根据污水处理过程的训练数据集建立合适的模型,识别故障点,具有可扩展性强,高效、快速、准确等特点。

Description

利用集成主成分分析的污水处理过程异常工况检测方法
技术领域
本发明属于污水处理领域,具体涉及一种利用集成主成分分析的污水处理过程的异常工况检测方法。
背景技术
随着中国人口数量进一步增长,工业化程度的不断加深,对淡水资源的需求量也在不断增长,但同时淡水资源的污染问题却日益严峻,污水资源的回收处置成为亟待解决的重大问题,城市污水处理已成为水资源回收利用的重要途径。污水处理对于建设高效、清洁、低碳,循环利用的绿色制造系统具有重要意义,可以有效提高先进的节能环保技术。
城市污水包含大颗粒固态悬浮物、多种病原体、含氮化合物、含磷化合物、碳水化合物等,是一个非常复杂的混合液。图1示出了一种污水处理工艺的流程图。污水处理过程是一个典型的多变量、多耦合、长流程、非线性的复杂过程,同时存在很多干扰因素和不确定因素。目前,城市污水处理所采用的方法主要是借助微生物群体吸附和分解能力,对污水中可降解的有机物成分进行氧化,再使用复杂的生物和化学反应以及物理处理,使有机物质被降解并与污水进行分离以净化污水。活性污泥法及其改善模型是运用最为广泛的污水处理模型,但由于受到工作环境、用水量、天气、毒水、进水水质和水量波动的影响,活性污泥会受到一定程度的损害,进而引起污水处理过程的故障,最终影响整个污水处理系统的出水水质不达标。图2示出了活性污泥简化流程图。一旦污水处理系统的某个过程发生故障就会导致整个污水处理的故障,会给污水厂和社会带来巨大的经济损失和重大环境污染。因此对污水处理过程中的异常工况进行在线的故障监测,进而采取必要的措施减少或抑制异常工况的发生就变得非常重要。
在目前过程监控领域中,一般将故障检测方法划分为以下三个类别:基于解析模型的方法、基于知识的方法以及基于数据的方法。由于污水处理过程涉及到的生物化学反应十分复杂,耦合关系很多,基于解析模型的方法实施起来变得非常困难。加上每个污水处理厂的实际工艺流程有所不同,污水处理厂的使用年限不够长导致其先验知识比较少,所以基于知识的方法受到了阻碍。综上,是用最为广泛和最有效果的是基于数据的方法,只需要获得正常工况下的过程监控数据就能利用数学模型建立起输入输出以及各个变量之间的关系,从而进行故障识别。
在基于数据的方法中,主成分分析法使用较为广泛,传统的主成分分析方法(Principle Component Analysis,PCA)是在构造PCA模型时将变量矩阵的变换特征值从大到小排列,并选择对应于较大特征值的主元,形成变换特征空间的子空间以提取特征信息,并且用较大特征值对应的特征向量表示原始数据的整体趋势,但较小特征值对应的特征向量反映原始数据中的细节变化,有时这些细节对于分析数据也是重要的。传统主成分分析法所得的模型只包含了特征值较大的主元,但特征值较小的主元中也可能存在故障信息,因此传统主成分分析法具有过多或不足主元数量所导致的监控效果不理想的问题。
发明内容
鉴于以上问题,本发明提出了一种利用主成分分析的污水处理过程的异常工况检测方法。该方法先获取正常工况下的污水处理过程数据,利用正常工况下的数据随机建立主元模型,然后通过集成学习的方法得到合适的模型,并确定合适的模型中T2统计量的阈值;然后采集实时数据,对实时污水处理过程进行检测,按照根据正常工况下的数据确定的合适的模型建立实时数据的主元模型,计算实时数据在所有合适的模型构成的数据空间的检测统计量的大小,当该检测统计量超出阈值时,则认为可能发生了异常工况。该方法可以有效地对实际过程的故障进行识别和诊断,对于确保污水处理过程的有效进行具有极其重要的意义。
具体而言,本发明提供一种基于集成主成分分析的污水处理过程异常工况检测方法,所述方法包括以下步骤:
步骤一:选择污水处理过程的监控变量,获取正常工况下各变量的数据,并记录为训练数据集;
步骤二:对训练数据进行预处理;
步骤三:求取训练数据的特征值,确定特征值对应的特征向量;
步骤四:从步骤三获得的特征向量中随机选取一定数量的特征向量作为主元,建立主成分分析的主元模型;重复多次,建立多个主成分分析的主元模型;
步骤五:对步骤四得到的每个主元模型计算T2统计量,利用核密度估计确定各个主元模型的T2统计量的阈值;
步骤六:进行模型聚类,从步骤四得到的主元模型中获得一个或多个合适的模型;
步骤七:获取污水处理过程某一时刻的实时数据,作为检测数据;
步骤八:对检测数据进行预处理;
步骤九:按照步骤六中获得合适的模型建立检测数据的主成分分析的主元模型,计算检测数据在各个合适的模型中的T2统计量;
步骤十:计算检测数据在某个合适的模型中的T2统计量的故障概率,并利用贝叶斯估计计算实时数据在所有合适的模型构成的数据空间的检测统计量,识别出异常工况。
在一个或多个实施方案中,步骤一中,污水处理生物过程应大致满足活性污泥1号模型中的动态过程,主要包括:(1)异养生物的需氧生长,(2)异养生物的缺氧生长,(3)自养生物的需氧生长,(4)异养生物的衰减,(5)自养生物的衰减,(6)可溶性有机氮的氨化,(7)被吸附的缓慢降解有机碳的水解,和(8)被吸附的缓慢降解有机氮的水解。
在一个或多个实施方案中,步骤一中,选取的监控变量要能反映污水处理过程的运行状况。
在一个或多个实施方案中,步骤一中,选取的监控变量选自溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、PH值、固态悬浮物浓度、水的压力和水温。
在一个或多个实施方案中,步骤一中,整个污水处理过程符合长期型1号基准仿真模型,包括两个缺氧池、三个好氧池和一个二沉池,缺氧池和好氧池满足活性污泥1号模型。
在一个或多个实施方案中,步骤二或步骤八中,对数据进行预处理包括:去除数据缺失的样本,对数据零均值化;其中,对数据零均值化包括:假设有M组样本数据{Xm},每个数据样本是N维,由此组成矩阵Xm×n,利用下式对数据标准化:
Figure BDA0002345501390000041
其中,i=1,2…M,j=1,2…N。
在一个或多个实施方案中,步骤三中,获得训练数据的特征值及其对应的特征向量的方法如下:
假设训练数据包含M组数据{Xm},每个数据是N维,由此组成矩阵Xm×n,矩阵Xm×n经零均值化处理后得到矩阵X;
步骤1:求出零均值化后的矩阵X的协方差矩阵ST
步骤2:求出ST的特征值λi及相应的单位化正交特征向量pi
在一个或多个实施方案中,步骤四中,随机选取的特征向量的个数k为特征向量总数的30%-50%;从步骤三得到的单位化正交特征向量中随机选择k个向量后,主成分分析的主元模型
Figure BDA0002345501390000042
的建立公式为:
Figure BDA0002345501390000043
其中,[t1,t2,…,tk]=[Xp1,Xp2,…Xpk],[p1,p2,…,pk]为从步骤三得到的单位化正交特征向量中随机选取的k个向量,X为训练数据经预处理后得到的矩阵。
在一个或多个实施方案中,步骤五中,T2统计量的计算公式为:
T2=XT-1PTX,
其中,T2为T2统计量,X为本文所述的建立主元模型中计算得到的主元模型
Figure BDA0002345501390000051
P为本文所述的建立主元模型中的[p1,p2,…,pk],Λ=diag(λ1,λ2,…,λk),λ12,…λk为与本文所述的建立主元模型中的[p1,p2,…,pk]相对应的各个特征值;
确定T2统计量的阈值的过程如下:
根据如下公式计算T2统计量的分布函数
Figure BDA0002345501390000052
Figure BDA0002345501390000053
其中,
Figure BDA0002345501390000054
表示T2统计量的第i行第i列个元素,k表示T2统计量的维数k,h表示带宽;满足
Figure BDA0002345501390000055
的q(q=1,2…k)所对应的
Figure BDA0002345501390000056
作为该主元模型的T2统计量的阈值
Figure BDA0002345501390000057
KDE阈值根据实验和经验确定。
在一个或多个实施方案中,步骤六中,采用分裂式层次聚类算法获得合适的模型,其步骤如下:
步骤1:根据步骤四所确定的主元及其个数k,构建一个由0和1组成的向量θi∈R1 ×n,其中,元素“1”表示相应位置的特征向量被选为主元,元素“0”表示相应位置的特征向量未被选为主元,总共有k个元素被设置为1,而其他元素被设置为0;
步骤2:实现分裂层次算法:所有对象都聚集在一起,然后再细分为更小的集群;首先识别出簇C中距离最远的两个模型A和B,然后将模型A和B分为两个簇C1和C2;前一个集群C中剩余的模型分别按照模型到A和B的欧式距离合并到集群C1和C2中;对新创建的集群A和B重复上述操作;一步一步地操作,直到满足用户确定的集群中实现最大相似性的最终条件;
步骤3:随机选取一个模型来表示集群,以防止相邻集群的保留模型的相似度过高;
步骤4:采用聚类算法:结合两个尚未属于同一聚类的包含最高相似性的聚类为彼此;继续分组,直到形成具有最小相似性的集群的组为止;在决定一个集群是否可以合并到其他候选集群时,候选集群的规模越大,候选集群合并它的可能性就越大;
步骤5:重复进行步骤1-4;直到满足要求的簇之间的相似性达到最小时,获得最优的模型。
在一个或多个实施方案中,步骤七中,实时数据的监控变量应与训练数据集中监控变量的类别和个数保持一致。
在一个或多个实施方案中,步骤十中,检测数据xtest在某个合适的模型中的T2统计量的故障概率
Figure BDA0002345501390000061
计算为:
Figure BDA0002345501390000062
其中,
Figure BDA0002345501390000063
N和F分别为正常和异常情况;
Figure BDA0002345501390000064
Figure BDA0002345501390000065
分别为正常和异常过程的先验概率;
Figure BDA0002345501390000066
Figure BDA0002345501390000067
的计算公式如下:
Figure BDA0002345501390000068
Figure BDA0002345501390000069
其中,
Figure BDA00023455013900000610
是训练数据在相应的合适的模型中的T2统计量的阈值,Tb 2是检测数据在该合适的模型中计算出的T2统计量。
在一个或多个实施方案中,步骤十中,根据训练数据在各个合适的模型中的T2统计量的阈值、检测数据在各个合适的模型中的T2统计量及其故障概率,实时数据在所有合适的模型构成的数据空间的检测统计量
Figure BDA00023455013900000611
用加权形式表示为:
Figure BDA00023455013900000612
其中,B为合适的模型的个数,
Figure BDA00023455013900000613
Figure BDA00023455013900000614
如本文任一实施方案所述;根据
Figure BDA00023455013900000616
是否超过异常过程的先验概率
Figure BDA00023455013900000615
判断采集该实时数据时是否发生了异常工况。
附图说明
图1为污水处理工艺流程图;
图2为活性污泥简化流程图;
图3为本发明的利用集成主成分分析的污水处理过程的异常工况检测方法步骤图;
图4为长期型1号基准仿真模型(Long-Term Benchmark Simulation Model No.1,BSM1)示意图;
图5为实施例1利用集成主成分分析法对污水处理过程进行检测得到的
Figure BDA0002345501390000071
统计量图;
图6为利用常规的主成分分析法(PCA方法)对实施例1中的污水处理过程进行检测得到的T2统计量图;
图7为利用慢特征分析法(SFA方法)对实施例1中的污水处理过程进行检测得到的T2统计量图。
具体实施方式
为使本领域技术人员可了解本发明的特点及效果,以下谨就说明书及权利要求书中提及的术语及用语进行一般性的说明及定义。除非另有指明,否则文中使用的所有技术及科学上的字词,均为本领域技术人员对于本发明所了解的通常意义,当有冲突情形时,应以本说明书的定义为准。
本文中,为使描述简洁,未对各个实施方案或实施例中的各个技术特征的所有可能的组合都进行描述。因此,只要这些技术特征的组合不存在矛盾,各个实施方案或实施例中的各个技术特征可以进行任意的组合,所有可能的组合都应当认为是本说明书记载的范围。
本发明发现,采用本发明提出的集成主成分分析法(Ensemble PrincipleComponent Analysis,EPCA),同时从包含大特征值和小特征值的主元中获得过程运行信息,从而能够有效的改善过多或不足主元数量所导致的监控效果不理想的问题。本发明的集成主成分分析法结合了集成学习的方法。集成学习是机器学习中的一种研究方法,其基本思想是将多个基础的学习者结合起来。
本发明包括一种利用集成主成分分析的污水处理过程异常工况检测方法(简称EPCA方法)。图3示出了本发明方法的步骤图。本发明中,污水处理过程的异常工况通常是指本领域公认的异常工况,包括但不限于进水增多的故障,污泥膨胀故障,传感器故障等。在某些实施方案中,污水处理过程的异常工况也可以包括针对待检测的污水处理过程而特别认定的异常工况。
本发明的EPCA方法包括以下步骤:
步骤一:选择污水处理过程的监控变量,获取正常工况下各变量的数据,并记录为训练数据集;
步骤二:对训练数据进行预处理;
步骤三:求取训练数据的特征值,确定特征值对应的特征向量;
步骤四:从步骤三获得的特征向量中随机选取一定数量的特征向量作为主元,建立主成分分析的主元模型;重复多次,建立多个主成分分析的主元模型;
步骤五:对步骤四得到的每个主元模型计算T2统计量,利用核密度估计确定各个主元模型的T2统计量的阈值;
步骤六:进行模型聚类,从步骤四得到的主元模型中获得一个或多个合适的模型;
步骤七:获取污水处理过程某一时刻的实时数据,作为检测数据;
步骤八:对检测数据进行预处理;
步骤九:按照步骤六中获得合适的模型建立检测数据的主成分分析的主元模型,计算检测数据在各个合适的模型中的T2统计量;
步骤十:计算检测数据在某个合适的模型中的T2统计量的故障概率,并利用贝叶斯估计计算实时数据在所有合适的模型构成的数据空间的检测统计量,识别出异常工况。
下文将对这些步骤进行详细描述。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成优选的技术方案。
一、选择监控变量,建立训练数据集
步骤一中,污水处理过程优选大致满足活性污泥1号模型(Activated SludgeModel 1,ASM1)中的动态过程。活性污泥1号模型为本领域所熟知,其动态过程主要包括:(1)异养生物的需氧生长,(2)异养生物的缺氧生长,(3)自养生物的需氧生长,(4)异养生物的衰减,(5)自养生物的衰减,(6)可溶性有机氮的氨化,(7)被吸附的缓慢降解有机碳的水解,(8)被吸附的缓慢降解有机氮的水解。本领域技术人员可以理解的是,污水处理过程满足活性污泥1号模型是指污水处理过程包括上述8个动态过程。在某些实施方案中,污水处理过程符合图1所示的流程。
在某些实施方案中,污水处理过程符合长期型1号基准仿真模型(Long-TermBenchmark Simulation Model No.1,BSM1)。图4示出了长期型1号基准仿真模型示意图。长期型1号基准仿真模型为本领域所熟知,包括两个缺氧池、三个好氧池和一个二沉池。
可以理解的是,步骤一中,选取的监控变量要能反映污水处理过程的运行状况。本发明中,监控变量是指需要采集的参数的种类。可选取的监控变量包括但不限于溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量(Chemical Oxygen Demand,COD)、生物需氧量(Biochemical Oxygen Demand,BOD)、pH值、固态悬浮物浓度、水的压力、水温、进水的易降解底物浓度、污水中NH4 -N和NH3 -N的浓度、污水中固体总量、进水流量、一个或多个反应池的慢速可生物降解有机物含量、一个或多个反应池的活性异养菌生物固体量、一个或多个反应池的溶解氧含量、一个或多个反应池的NO3 -N和NO2 -N浓度、一个或多个反应池的NH4 -N和NH3 -N浓度、二沉池悬浮污泥浓度、二沉池一层或多层的溶解氧含量、二沉池一层或多层的NO3 -N和NO2 -N浓度、二沉池一层或多层的NH4 -N和NH3 -N浓度、二沉池一层或多层中易降解底物浓度、污水中总氮浓度、污水中COD总量、污水中BOD的浓度、出水处传感器NO3 -N和NO2 -N浓度等。
在某些实施方案中,污水处理过程符合长期型1号基准仿真模型,选取的监控变量包括进水的易降解底物浓度、污水中NH4 -N和NH3 -N的浓度、污水中固体总量、进水流量、第1个反应池的慢速可生物降解有机物含量、第1个反应池活性异养菌生物固体量、第2个反应池溶解氧含量、第2个反应池NO3 -N和NO2 -N浓度、第2个反应池的NH4 -N和NH3 -N浓度、第5个反应池的慢速可生物降解有机物含量、第5个反应池活性异养菌生物固体量、第5个反应池溶解氧含量、第5个反应池NO3 -N和NO2 -N浓度、第5个反应池的NH4 -N和NH3 -N浓度、二沉池悬浮污泥浓度、二沉池第3层溶解氧含量、二沉池第3层NO3 -N和NO2 -N浓度、二沉池第3层NH4 -N和NH3 -N浓度、二沉池第4层溶解氧含量、二沉池第5层中易降解底物浓度、二沉池第5层溶解氧含量、二沉池第5层NO3 -N和NO2 -N浓度、二沉池第5层NH4 -N和NH3 -N浓度、二沉池第6层溶解氧含量、二沉池第6层NO3 -N和NO2 -N浓度、二沉池第6层NO4 -N和NO3 -N浓度、二沉池第10层溶解氧含量、二沉池第10层NO3 -N和NO2 -N浓度、二沉池第10层NO4 -N和NO3 -N浓度、污水中总氮浓度、污水中COD总量、污水中BOD的浓度和出水处传感器NO3 -N和NO2 -N浓度。
采集正常工况下的数据时,一般要求数据不少于200组,优选包含尽可能多的运行条件,比如干燥天气、潮湿天气、下雨天气等。本领域技术人员可以理解的是,本发明中,一组数据通常是指在某个时间点对所选取的监控变量进行采集得到的数据。
本发明将采集到的正常工况下的数据作为训练数据,训练数据组成训练数据集。本领域技术人员可以理解的是,对数据进行矩阵运算时,通常将采集到的一组数据作为矩阵的一个行向量,将属于同一种监控变量的数据作为矩阵的一个列向量。本发明中,除非有特殊说明,变量指的是矩阵的列向量(对应于监控变量),列向量的数量即为数据的维数。
二、对训练数据进行预处理
步骤二中,对数据的预处理通常包括:去除数据缺失的样本;对数据零均值化,以消除不同量纲的影响。
对数据零均值化的方法可以是本领域已知的。在某些实施方案中,对数据零均值化包括:假设有M组样本数据{Xm},每个数据样本是N维,由此组成Xm×n维的矩阵,对数据零均值化公式为:
Figure BDA0002345501390000101
其中,i=1,2…M,j=1,2…N。
三、求取训练数据的特征值和对应的特征向量
步骤三中,获得训练数据的特征值及其对应的特征向量的方法是本领域已知的;在某些实施方案中,本发明利用奇异值分解(SVD分解)计算标准化后数据矩阵的特征值及其对应的特征向量,具体过程如下:
假设训练数据包含M组数据{Xm},每个数据是N维,由此组成矩阵Xm×n,矩阵Xm×n经零均值化处理后得到矩阵X;
步骤1:求出零均值化后的矩阵X的协方差矩阵ST
协方差矩阵ST的计算方法是本领域已知的,例如可以通过下式计算:
ST=XTX,
其中,X为前述零均值化后的矩阵X;
步骤2:求出ST的特征值λi及相应的单位化正交特征向量ai
ST的特征值λi及相应的单位化正交向量ai的计算方法是本领域已知的,例如可以通过下式计算:
|λE-ST|=0,
其中,E为单位矩阵,由此可求得ST的特征值λ12,…,λn
对每一个λi,通过下式求出齐次线性方程组式的一个基础解系ξ1,ξ2,…,ξn
|λE-ST|X=0;
通过下式对基础解系ξ1,ξ2,…,ξn进行正交化和单位化,得到单位化正交向量ai
a1=ξ1
Figure BDA0002345501390000111
……
Figure BDA0002345501390000112
步骤三中计算特征值和单位化正交特征向量的方法也适用于步骤九。
四、随机选取一定数量的特征向量作为主元,建立主成分分析的主元模型
本领域技术人员可以理解的是,本文中,主元是指用于建立主成分分析模型的向量。
步骤四中,随机选取的特征向量的个数k为特征向量总数的30%-50%。
本发明中,构建主元模型(又称主成分分析模型)的方法可以是本领域已知的方法。
在某些实施方案中,从步骤三得到的单位化正交特征向量中随机选择k个向量后,主成分分析的主元模型
Figure BDA0002345501390000121
的建立公式为:
Figure BDA0002345501390000122
其中,[t1,t2,…,tk]=[Xp1,Xp2,…Xpk],[p1,p2,…,pk]为从步骤三得到的单位化正交特征向量中随机选取的k个向量,X为训练数据经预处理后得到的矩阵。
步骤四中,多次随机选取一定数量的特征向量,从而建立多个不同的主元模型;多个主元模型的主元的数量可以相同。
步骤四中的建立主元模型的方法也适用于步骤九中在检测子块中建立主元模型。
五、计算T2统计量,确定T2统计量的阈值
步骤五中,利用Hotelling T2统计量(简称T2统计量)来表征样本向量在主元空间里的变化。主元模型
Figure BDA0002345501390000123
的T2统计量的计算方式是本领域已知的,其计算公式为:
T2=XT-1PTX,
其中,T2为T2统计量,X为主元模型
Figure BDA0002345501390000124
P为本文所述的主元模型的建立公式中的[p1,p2,…,pk],Λ=diag(λ1,λ2,…,λk),λ12,…λk为与[p1,p2,…,pk]中的p1,p2,…pk一一对应的各个特征值。
利用T2=XT-1PTX计算得出的T2统计量T2是如
Figure BDA0002345501390000131
形式的对角矩阵。
步骤五中计算T2统计量的方法也适用于步骤九中计算检测数据的T2统计量。
考虑到数据分布无先验知识,残差可能不是高斯分布的,所以有了核密度估计(Kernel Density Estimation,KDE)。KDE是概率论中估计未知的函数的密度的方法,可以确定残差统计量的阈值。本发明利用主元模型的T2统计量,根据核密度估计,确定各个主元模型的T2统计量的阈值。本发明将训练数据在某个主元模型的T2统计量的阈值作为检测数据在相应的主元模型的T2统计量的阈值。
步骤五中,利用核密度估计方法确定T2统计量的阈值。在某些实施方案中,本发明采用高斯核密度估计方法确定T2统计量的阈值,具体过程如下:
根据如下公式计算T2统计量的分布函数
Figure BDA0002345501390000132
Figure BDA0002345501390000133
其中,
Figure BDA0002345501390000134
表示T2统计量的第i行第i列个元素,k表示T2统计量的维数k,h表示带宽。
Figure BDA0002345501390000135
函数的纵坐标
Figure BDA0002345501390000136
是一个0~1之间的值,表示概率;横坐标x是1到k之间的整数,k是T2统计量的维数k。
计算
Figure BDA0002345501390000137
q取1到k的正整数,k为T2统计量的维数k;当q(q=1,2…k)满足
Figure BDA0002345501390000138
时,将此时q所对应的
Figure BDA0002345501390000139
(即T2统计量的第q行第q列个元素)作为该主元模型的T2统计量的阈值
Figure BDA00023455013900001310
带宽为经验值。在某些实施方案中,带宽h为0.1。
通常,KDE的阈值可根据大量的实验以及经验确定。在某些实施方案中,KDE的阈值为99%。
六、进行模型聚类,从主元模型中获得合适的模型
步骤六中,对由步骤四建立得到的多个主元模型进行模型聚类,进而得到一个或多个合适的模型。本文所述的合适的模型是指对由步骤四建立得到的多个主元模型进行模型聚类而得到的模型。
步骤六中,可采用分裂式层次聚类算法获得合适的模型;在某些实施方案中,其步骤如下:
步骤1:根据步骤四所确定的主元及其个数k,构建一个由0和1组成的向量θi∈R1 ×n,其中,元素“1”表示相应位置的特征向量被选为主元,元素“0”表示相应位置的特征向量未被选为主元,总共有k个元素被设置为1,而其他元素被设置为0;
步骤2:实现分裂层次算法:所有对象都聚集在一起,然后再细分为更小的集群;首先识别出簇C中距离最远的两个模型A和B,然后将模型A和B分为两个簇C1和C2;前一个集群C中剩余的模型分别按照模型到A和B的欧式距离合并到集群C1和C2中;对新创建的集群A和B重复上述操作;一步一步地操作,直到满足用户确定的集群中实现最大相似性的最终条件;
步骤3:随机选取一个模型来表示集群,以防止相邻集群的保留模型的相似度过高;
步骤4:采用聚类算法:结合两个尚未属于同一聚类的包含最高相似性的聚类为彼此;继续分组,直到形成具有最小相似性的集群的组为止;在决定一个集群是否可以合并到其他候选集群时,候选集群的规模越大,候选集群合并它的可能性就越大;
步骤5:重复进行步骤1-4;直到满足要求的簇之间的相似性达到最小时,获得最优的模型。
步骤4中,最高相似性由聚类中表示向量之间的最小欧氏距离表示。
步骤5中,根据经验设定一个值,当计算的簇的欧式距离小于设定的值时就结束;此时的每一个簇都是一个合适的模型,可以不止一个。
七、获取实时数据,作为检测数据
可以理解的是,步骤七中,实时数据的监控变量应与训练数据的监控变量的类别和个数保持一致。
八、对检测数据进行预处理
步骤七中,对检测数据进行预处理的方法可以与步骤二中对训练数据进行预处理的方法相同。
九、建立检测数据的合适的模型,计算监测数据在各个合适的模型的T2统计量
步骤七中,按照步骤六中基于训练数据获得的合适的模型建立检测数据的主元模型(即建立检测数据的合适的模型),即本领域技术人员可以理解的是,如果步骤六获得了n个合适的模型,则也建立n个检测数据的主元模型,且如果训练数据中的某些特征向量被选取到同一个合适的模型中,则与训练数据中的这些特征向量来源于同种监控变量的实时数据中的特征向量被相应地选取到同一个主元模型中,由此得到与训练数据的合适的模型一一对应的检测数据的合适的模型。
十、计算检测数据在某个合适的模型中的T2统计量的故障概率,利用贝叶斯估计计算实时数据在所有合适的模型构成的数据空间的检测统计量
本发明利用检测数据在某个合适的模型的T2统计量和训练数据在相应的合适的模型的T2统计量的阈值,根据贝叶斯推论,确定检测数据在某个合适的模型的T2统计量的故障概率。
贝叶斯推理通常被用来将结果与概率相结合,贝叶斯条件公式为:
Figure BDA0002345501390000151
其中,P(A|B)是在事件B发生的情况下,事件A发生的可能性。
步骤十中,检测数据xtest在某个合适的模型中的T2统计量的故障概率
Figure BDA0002345501390000152
可以计算为:
Figure BDA0002345501390000153
其中,
Figure BDA0002345501390000161
N和F分别表示正常和异常情况;
Figure BDA0002345501390000162
Figure BDA0002345501390000163
分别为正常和异常过程的先验概率;
Figure BDA0002345501390000164
Figure BDA0002345501390000165
的计算公式如下:
Figure BDA0002345501390000166
Figure BDA0002345501390000167
其中,
Figure BDA0002345501390000168
是训练数据在相应的合适的模型中的T2统计量的阈值,Tb 2是检测数据在该合适的模型中计算出的T2统计量。
本领域技术人员可以理解的是,正常和异常过程的先验概率可根据实际工况的历史经验确定。可采用本领域常规的方法确定正常和异常过程的先验概率,例如可以统计一段时间内(如一年内)污水处理过程处于异常工况(发生故障)的时间,将处于异常工况的时间除以总时间(如一年),即为异常过程的先验概率;统计一段时间内(如一年内)污水处理过程处于正常工况(正常运行)的时间,将处于正常工况的时间除以总时间(如一年),即为正常过程的先验概率。
在某些实施方案中,
Figure BDA0002345501390000169
取99%,
Figure BDA00023455013900001610
取1%。
本发明根据各个合适的模型的T2统计量的阈值、检测数据在各个合适的模型的T2统计量及其故障概率,计算实时数据在由所有合适的模型所构成的数据空间的检测统计量(简称检测统计量,即
Figure BDA00023455013900001611
统计量);如果实时数据的检测统计量大于检测统计量的控制限,则认为采集该实时数据时污水处理过程可能发生了异常工况。
步骤十中,根据训练数据在各个合适的模型中的T2统计量的阈值、检测数据在各个合适的模型中的T2统计量及其故障概率,实时数据在整个数据空间的检测统计量
Figure BDA00023455013900001612
可以用加权形式表示为:
Figure BDA00023455013900001613
其中,B为合适的模型的个数,
Figure BDA0002345501390000171
为第b个合适的模型的T2统计量的故障概率,
Figure BDA0002345501390000172
其中,
Figure BDA0002345501390000173
是训练数据在第b个的合适的模型中的T2统计量的阈值,Tb 2是检测数据在第b个合适的模型中计算出的T2统计量;根据
Figure BDA0002345501390000174
是否大于异常过程的先验概率
Figure BDA0002345501390000175
判断该点是否发生了异常工况;如果
Figure BDA0002345501390000176
大于
Figure BDA0002345501390000177
则认为可能发生了异常工况;反之,则认为未发生异常工况。
十一、调整模型,获得更好的检测效果
在某些实施方案中,本发明还包括步骤十一:根据异常工况检测结果、污水处理过程的实际运行状况和/或异常工况检测的精度需要,对本发明的步骤一到十中的参数进行调整,以获得更好的检测效果。可以调整的参数包括监控变量的类别和个数、训练数据的组数、随机选取的特征向量的数目、随机选取特征向量的次数(即建立的主元模型的个数)、带宽、KDE阈值、正常和异常过程的先验概率等。
例如,步骤四中所建立的主元模型可以根据实际工业过程的数据和精度需要进行更改,例如改变随机选取的特征向量的数目、随机选取特征向量的次数等,以获得更好的检测效果。
本发明具有以下有益效果:
本发明方法简单,充分利用了数据驱动的优点,识别速度快并且准确率高,并且能通过故障诊断判断出可能发生故障的变量,能提供更多的信息,更快速的进行故障排除,尽快恢复工业过程的正常运行。同时本方法可以依据不同污水处理厂的实际需要,调整主元模型的精确度,以建立更好的模型,获得更好的检测效果。
下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,本领域技术人员根据本发明的内容作出的任何非本质的改进和调整,仍属于本发明的保护范围。实施例中未明确说明的算法和方法,为本领域公知的算法或方法,或为本文所述的算法或方法。实施例中未明确说明的代数具有本领域公知的或本文所述的含义。
实施例1
以下以污水处理过程的异常工况检测的实例来说明本发明的利用集成主成分分析的污水处理过程异常工况检测方法,具体步骤包括:
步骤一:选取表1中所示的33个变量作为监控变量,采集污水处理过程正常工作条件下的数据,共采集1344组数据,作为训练数据集;
步骤二:利用
Figure BDA0002345501390000181
对1344组训练数据进行预处理;
步骤三:利用SVD分解计算标准化后数据矩阵的特征值及其对应的特征向量;
步骤四:根据k取30%~50%特征值的经验,取k=10,并设定随机生成200个随机主元模型;
步骤五:在步骤四得到的每一个主元模型中计算T2统计量,利用本文所述的核密度估计确定各个T2统计量的阈值,带宽h设定为0.1,核密度估计的置信限(KDE阈值)设定为0.99;
步骤六:利用层次聚类对主元模型进行聚类,聚成60个合适的模型:
(1):根据所确定的主元个数k,构建一个由0和1组成的向量θi∈R1×n,其中,元素“1”表示选择了相应的主元,元素“0”表示没有选择,总共有k个元素被设置为1,而其他元素被设置为0;
(2):实现分裂层次算法:所有对象都聚集在一起,然后再细分为更小的集群。首先识别出簇C中距离最远的两个模型A和B,然后将模型A和B分为两个簇C1和C2;前一个集群C中剩余的模型分别按照模型到A和B的距离合并到集群C1和C2中;对新创建的集群A和B重复上述操作。一步一步地操作,直到满足用户确定的集群中实现最大相似性的最终条件;
(3):随机选取一个模型来表示集群,以防止相邻集群的保留模型的相似度过高;
(4):采用聚类算法:结合两个尚未属于同一聚类的包含最高相似性(由聚类中表示向量之间的最小欧氏距离表示)的聚类为彼此;继续分组,直到形成具有最小相似性的集群的组为止;在决定一个集群是否可以合并到其他候选集群时,候选集群的规模越大,候选集群合并它的可能性就越大;
(5):重复进行步骤(1)-(4);直到满足要求的簇之间的相似性达到最小时,获得最优的模型;
用欧式距离表示模型的相似度,计算公式为:
Figure BDA0002345501390000191
其中,θA,iB,i分别表示模型A和模型B的主元向量θ;
步骤七:采集污水处理过程的实时监控数据,共1344组,作为检测数据;已知从第672组数据开始,出现进水量突然增多的故障;
步骤八:对检测数据集进行预处理;
步骤九:按照步骤六中获得合适的模型建立检测数据的主成分分析的主元模型,计算检测数据在各个合适的模型中的T2统计量;步骤十:计算检测数据在某个合适的模型中的T2统计量的故障概率
Figure BDA0002345501390000192
并利用贝叶斯估计计算实时数据在所有合适的模型构成的数据空间的检测统计量
Figure BDA0002345501390000193
通过比较
Figure BDA0002345501390000194
是否超出
Figure BDA0002345501390000195
判断是否发生了故障:
Figure BDA0002345501390000196
其中,
Figure BDA0002345501390000197
N和F分别为正常和异常情况;
Figure BDA0002345501390000198
Figure BDA0002345501390000199
分别为正常和异常过程的先验概率取
Figure BDA00023455013900001910
Figure BDA00023455013900001911
的计算公式如下:
Figure BDA00023455013900001912
Figure BDA00023455013900001913
其中
Figure BDA00023455013900001914
是训练数据在相应的合适的模型中的T2统计量的阈值,Tb 2是检测数据在该合适的模型中计算出的T2统计量;
Figure BDA0002345501390000201
其中,B为合适的模型的个数,
Figure BDA0002345501390000202
Figure BDA0002345501390000203
如前所述;根据
Figure BDA0002345501390000204
是否大于异常过程的先验概率
Figure BDA0002345501390000205
(本实施例为1%)判断采集该实时数据时是否发生了异常工况,如果
Figure BDA0002345501390000206
大于
Figure BDA0002345501390000207
则认为采集该实时数据时污水处理过程发生了异常工况。
实施例1对污水处理过程异常工况进行检测的实验结果如图5和表2所示。
使用与实施例1同样的训练数据和检测数据通过本领域常规的主成分分析法(Principal Component Analysis,PCA)和慢特征分析(Slow Feature Analysis,SFA)进行异常工况检测实验,其实验结果如图6、图7和表2所示。
表1:变量选取
Figure BDA0002345501390000208
Figure BDA0002345501390000211
图5为实施例1利用本发明的EPCA方法进行异常工况检测得到的
Figure BDA0002345501390000212
统计量图。就故障的检测结果来说,从图5中可以发现,
Figure BDA0002345501390000213
统计量值都从第672个采样点附近开始出现了大幅度的增长,并且远远超过了规定的控制限(实施例1为
Figure BDA0002345501390000214
),表明EPCA可以及时发现故障,确保生产过程的安全。
图6给出了利用常规的主成分分析法进行异常工况检测的结果。图7给出了利用慢特征分析法进行异常工况检测的结果。PCA和SFA是业内使用广泛的故障诊断方法。通过比较图5-7可以发现本发明的EPCA法的检测效果是最好的。
表2给出了实施例1的分块PCA方法、常规的PCA方法和SFA方法得到的实验结果的检测率、误报率和漏报率,检测率、误报率和漏报率的计算方式如下:
Figure BDA0002345501390000221
Figure BDA0002345501390000222
Figure BDA0002345501390000223
其中,TP代表检测出是正常的、且实际上是正常的结果数,FN代表检测出是故障的、而实际上是正常的结果数,FP代表检测出是正常的、而实际上是故障的结果数,TN代表检测出是故障的、且实际上是故障的结果数。
表2:EPCA、PCA和SFA检测效果比较
方法 检测率 误报率 漏报率
EPCA 100% 0.2976% 0
PCA 16.320% 0.4464% 49.0327%
SFA 59.5952% 0.2232% 92.2198%
由表2可知,实施例1的EPCA的误报率为0.2976%,漏报率0%;与PCA和SFA相比,EPCA的漏报率最低,具有最好的检测效果。

Claims (10)

1.一种基于集成主成分分析的污水处理过程的异常工况检测的方法,其特征在于,所述方法包括以下步骤:
步骤一:选择污水处理过程的监控变量,获取正常工况下各变量的数据,并记录为训练数据集;
步骤二:对训练数据进行预处理;
步骤三:求取训练数据的特征值,确定特征值对应的特征向量;
步骤四:从步骤三获得的特征向量中随机选取一定数量的特征向量作为主元,建立主成分分析的主元模型;重复多次,建立多个主成分分析的主元模型;
步骤五:对步骤四得到的每个主元模型计算T2统计量,利用核密度估计确定各个主元模型的T2统计量的阈值;
步骤六:进行模型聚类,从步骤四得到的主元模型中获得一个或多个合适的模型;
步骤七:获取污水处理过程某一时刻的实时数据,作为检测数据;
步骤八:对检测数据进行预处理;
步骤九:按照步骤六中获得合适的模型建立检测数据的主成分分析的主元模型,计算检测数据在各个合适的模型中的T2统计量;
步骤十:计算检测数据在某个合适的模型中的T2统计量的故障概率,并利用贝叶斯估计计算实时数据在所有合适的模型构成的数据空间的检测统计量,识别出异常工况。
2.如权利要求1所述的方法,其特征在于,
步骤一中,污水处理生物过程应大致满足活性污泥1号模型中的动态过程,主要包括:(1)异养生物的需氧生长,(2)异养生物的缺氧生长,(3)自养生物的需氧生长,(4)异养生物的衰减,(5)自养生物的衰减,(6)可溶性有机氮的氨化,(7)被吸附的缓慢降解有机碳的水解,和(8)被吸附的缓慢降解有机氮的水解;和/或
步骤一中,选取的监控变量要能反映污水处理过程的运行状况;和/或
步骤一中,选取的监控变量选自溶解氧浓度、进水量、污泥回流量、出水量、出水氨氮含量、化学需氧量、生物需氧量、PH值、固态悬浮物浓度、水的压力和水温;和/或
步骤一中,整个污水处理过程符合长期型1号基准仿真模型,包括两个缺氧池、三个好氧池和一个二沉池,缺氧池和好氧池满足活性污泥1号模型。
3.如权利要求1所述的方法,其特征在于,
步骤二或步骤八中,对数据进行预处理包括:去除数据缺失的样本,对数据零均值化;其中,对数据零均值化包括:假设有M组样本数据{Xm},每个数据样本是N维,由此组成矩阵Xm×n,利用下式对数据标准化:
Figure FDA0002345501380000021
其中,i=1,2…M,j=1,2…N。
4.如权利要求1所述的方法,其特征在于,
步骤三中,获得训练数据的特征值及其对应的特征向量的方法如下:
假设训练数据包含M组数据{Xm},每个数据是N维,由此组成矩阵Xm×n,矩阵Xm×n经零均值化处理后得到矩阵X;
步骤1:求出零均值化后的矩阵X的协方差矩阵ST
步骤2:求出ST的特征值λi及相应的单位化正交特征向量pi
5.如权利要求1所述的方法,其特征在于,
步骤四中,随机选取的特征向量的个数k为特征向量总数的30%-50%;从步骤三得到的单位化正交特征向量中随机选择k个向量后,主成分分析的主元模型
Figure FDA0002345501380000022
的建立公式为:
Figure FDA0002345501380000023
其中,[t1,t2,…,tk]=[Xp1,Xp2,…Xpk],[p1,p2,…,pk]为从步骤三得到的单位化正交特征向量中随机选取的k个向量,X为训练数据经预处理后得到的矩阵。
6.如权利要求5所述的方法,其特征在于,
步骤五中,T2统计量的计算公式为:
T2=XT-1PTX,
其中,T2为T2统计量,X为权利要求5中计算得到的主元模型
Figure FDA0002345501380000038
P为权利要求5中的[p1,p2,…,pk],Λ=diag(λ1,λ2,…,λk),λ12,…λk为与权利要求5中的[p1,p2,…,pk]相对应的各个特征值;
确定T2统计量的阈值的过程如下:
根据如下公式计算T2统计量的分布函数
Figure FDA0002345501380000031
Figure FDA0002345501380000032
其中,
Figure FDA0002345501380000033
表示T2统计量的第i行第i列个元素,k表示T2统计量的维数k,h表示带宽;满足
Figure FDA0002345501380000034
的阈值
Figure FDA0002345501380000035
的q(q=1,2…k)所对应的
Figure FDA0002345501380000036
作为该主元模型的T2统计量的阈值
Figure FDA0002345501380000037
KDE阈值根据实验和经验确定。
7.如权利要求1所述的方法,其特征在于,
步骤六中,采用分裂式层次聚类算法获得合适的模型,其步骤如下:
步骤1:根据步骤四所确定的主元及其个数k,构建一个由0和1组成的向量θi∈R1×n,其中,元素“1”表示相应位置的特征向量被选为主元,元素“0”表示相应位置的特征向量未被选为主元,总共有k个元素被设置为1,而其他元素被设置为0;
步骤2:实现分裂层次算法:所有对象都聚集在一起,然后再细分为更小的集群;首先识别出簇C中距离最远的两个模型A和B,然后将模型A和B分为两个簇C1和C2;前一个集群C中剩余的模型分别按照模型到A和B的欧式距离合并到集群C1和C2中;对新创建的集群A和B重复上述操作;一步一步地操作,直到满足用户确定的集群中实现最大相似性的最终条件;
步骤3:随机选取一个模型来表示集群,以防止相邻集群的保留模型的相似度过高;
步骤4:采用聚类算法:结合两个尚未属于同一聚类的包含最高相似性的聚类为彼此;继续分组,直到形成具有最小相似性的集群的组为止;在决定一个集群是否可以合并到其他候选集群时,候选集群的规模越大,候选集群合并它的可能性就越大;
步骤5:重复进行步骤1-4,直到满足要求的簇之间的相似性达到最小时,获得最优的模型。
8.如权利要求1所述的方法,其特征在于,步骤七中,实时数据的监控变量应与训练数据集中监控变量的类别和个数保持一致。
9.如权利要求1中所述的方法,其特征在于,
步骤十中,检测数据xtest在某个合适的模型中的T2统计量的故障概率
Figure FDA0002345501380000041
计算为:
Figure FDA0002345501380000042
其中,
Figure FDA0002345501380000043
N和F分别为正常和异常情况;
Figure FDA0002345501380000044
Figure FDA00023455013800000410
分别为正常和异常过程的先验概率;
Figure FDA0002345501380000045
Figure FDA0002345501380000046
的计算公式如下:
Figure FDA0002345501380000047
Figure FDA0002345501380000048
其中,
Figure FDA0002345501380000049
是训练数据在相应的合适的模型中的T2统计量的阈值,Tb 2是检测数据在该合适的模型中计算出的T2统计量。
10.如权利要求9中任一项所述的方法,其特征在于,
步骤十中,根据训练数据在各个合适的模型中的T2统计量的阈值、检测数据在各个合适的模型中的T2统计量及其故障概率,实时数据在整个数据空间的检测统计量
Figure FDA0002345501380000051
用加权形式表示为:
Figure FDA0002345501380000052
其中,B为合适的模型的个数,
Figure FDA0002345501380000053
Figure FDA0002345501380000054
如权利要求9所述;根据
Figure FDA0002345501380000055
是否超过异常过程的先验概率
Figure FDA0002345501380000056
判断采集该实时数据时是否发生了异常工况。
CN201911392964.4A 2019-12-30 2019-12-30 利用集成主成分分析的污水处理过程异常工况检测方法 Active CN111126870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911392964.4A CN111126870B (zh) 2019-12-30 2019-12-30 利用集成主成分分析的污水处理过程异常工况检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911392964.4A CN111126870B (zh) 2019-12-30 2019-12-30 利用集成主成分分析的污水处理过程异常工况检测方法

Publications (2)

Publication Number Publication Date
CN111126870A true CN111126870A (zh) 2020-05-08
CN111126870B CN111126870B (zh) 2023-10-27

Family

ID=70504795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911392964.4A Active CN111126870B (zh) 2019-12-30 2019-12-30 利用集成主成分分析的污水处理过程异常工况检测方法

Country Status (1)

Country Link
CN (1) CN111126870B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101731A (zh) * 2020-08-18 2020-12-18 华南理工大学 一种基于混合核典型相关分析的污水厂在线故障监测方法
CN112591887A (zh) * 2020-11-03 2021-04-02 北京工业大学 一种基于核主成分分析和贝叶斯网络的污泥膨胀诊断方法
CN112629710A (zh) * 2020-12-30 2021-04-09 苏州绿科智能机器人研究院有限公司 一种发动机温度传感器的智能自诊断方法
CN112763678A (zh) * 2020-12-30 2021-05-07 佛山科学技术学院 一种基于pca的污水处理过程监控方法及系统
CN114636788A (zh) * 2022-02-28 2022-06-17 华南理工大学 基于改进贡献图和格兰杰因果分析的污泥膨胀诊断方法
CN114781166A (zh) * 2022-04-27 2022-07-22 浙江科技学院 基于加权概率慢特征模型的污水处理过程软测量方法
CN115307670A (zh) * 2022-10-12 2022-11-08 蘑菇物联技术(深圳)有限公司 用于定位中央空调系统异常传感器的方法、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070124113A1 (en) * 2005-11-28 2007-05-31 Honeywell International, Inc. Fault detection system and method using multiway principal component analysis
CN103776480A (zh) * 2014-01-29 2014-05-07 清华大学 基于多次移动平均的微小故障检测方法和装置
CN108062565A (zh) * 2017-12-12 2018-05-22 重庆科技学院 基于化工te过程的双主元-动态核主元分析故障诊断方法
CN109407652A (zh) * 2018-12-10 2019-03-01 中国石油大学(华东) 基于主辅pca模型的多变量工业过程故障检测方法
CN110244692A (zh) * 2019-06-20 2019-09-17 中国石油大学(华东) 化工过程微小故障检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070124113A1 (en) * 2005-11-28 2007-05-31 Honeywell International, Inc. Fault detection system and method using multiway principal component analysis
CN103776480A (zh) * 2014-01-29 2014-05-07 清华大学 基于多次移动平均的微小故障检测方法和装置
CN108062565A (zh) * 2017-12-12 2018-05-22 重庆科技学院 基于化工te过程的双主元-动态核主元分析故障诊断方法
CN109407652A (zh) * 2018-12-10 2019-03-01 中国石油大学(华东) 基于主辅pca模型的多变量工业过程故障检测方法
CN110244692A (zh) * 2019-06-20 2019-09-17 中国石油大学(华东) 化工过程微小故障检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YOUNG-JUN YOO: "Fault Detection Method Using Multi-mode Principal Component Analysis Based on Gaussian Mixture Model for Sewage Source Heat Pump System" *
刘天龙: "基于主成分分析的造纸污水处理过程故障诊断系统研究" *
徐用懋; 赵仕健: "多元统计过程监控与安全生产" *
汪阳;黄天戍;杜广宇;: "一种基于聚类和主成分分析的异常检测方法" *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101731A (zh) * 2020-08-18 2020-12-18 华南理工大学 一种基于混合核典型相关分析的污水厂在线故障监测方法
CN112101731B (zh) * 2020-08-18 2024-03-12 华南理工大学 一种基于混合核典型相关分析的污水厂在线故障监测方法
CN112591887A (zh) * 2020-11-03 2021-04-02 北京工业大学 一种基于核主成分分析和贝叶斯网络的污泥膨胀诊断方法
CN112629710A (zh) * 2020-12-30 2021-04-09 苏州绿科智能机器人研究院有限公司 一种发动机温度传感器的智能自诊断方法
CN112763678A (zh) * 2020-12-30 2021-05-07 佛山科学技术学院 一种基于pca的污水处理过程监控方法及系统
CN114636788A (zh) * 2022-02-28 2022-06-17 华南理工大学 基于改进贡献图和格兰杰因果分析的污泥膨胀诊断方法
CN114636788B (zh) * 2022-02-28 2022-12-16 华南理工大学 基于改进贡献图和格兰杰因果分析的污泥膨胀诊断方法
CN114781166A (zh) * 2022-04-27 2022-07-22 浙江科技学院 基于加权概率慢特征模型的污水处理过程软测量方法
CN114781166B (zh) * 2022-04-27 2024-04-23 浙江科技学院 基于加权概率慢特征模型的污水处理过程软测量方法
CN115307670A (zh) * 2022-10-12 2022-11-08 蘑菇物联技术(深圳)有限公司 用于定位中央空调系统异常传感器的方法、设备和介质
CN115307670B (zh) * 2022-10-12 2023-01-13 蘑菇物联技术(深圳)有限公司 用于定位中央空调系统异常传感器的方法、设备和介质

Also Published As

Publication number Publication date
CN111126870B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN111126870A (zh) 利用集成主成分分析的污水处理过程异常工况检测方法
CN111160776A (zh) 利用分块主成分分析的污水处理过程异常工况检测方法
CN107025338B (zh) 一种基于递归rbf神经网络的污泥膨胀故障辨识方法
CN110232256B (zh) 一种基于kpls和rwfcm的污水处理过程监测方法
CN112417765B (zh) 一种基于改进师生网络模型的污水处理过程故障检测方法
CN106295800A (zh) 一种基于递归自组织rbf神经网络的出水总氮tn智能检测方法
CN110232062B (zh) 一种基于kpls和fcm的污水处理过程监测方法
CN102854296A (zh) 一种基于集成神经网络的污水处理软测量方法
CN108919755B (zh) 一种基于多块非线性交叉关系模型的分布式故障检测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
Garcia-Alvarez Fault detection using principal component analysis (PCA) in a wastewater treatment plant (WWTP)
Li et al. Complex dynamic process monitoring method based on slow feature analysis model of multi-subspace partitioning
Khurshid et al. Machine learning approaches for data-driven process monitoring of biological wastewater treatment plant: A review of research works on benchmark simulation model no. 1 (bsm1)
CN113848307A (zh) 一种针对污泥膨胀的特征提取主成分分析在线监测方法
Parvathy et al. Hybrid machine learning based false data injection attack detection and mitigation model for waste water treatment plant
CN114781166B (zh) 基于加权概率慢特征模型的污水处理过程软测量方法
CN112001436A (zh) 一种基于改进的极限学习机的水质分类方法
Wang et al. Monitoring of wastewater treatment process based on slow feature analysis variational autoencoder
CN115983534A (zh) 污水处理过程的状态评价方法以及评价系统
CN116048024A (zh) 一种分布式典型相关分析过程监测方法及装置
Zhao et al. Enhanced classification based on probabilistic extreme learning machine in wastewater treatment process
Ling et al. A soft sensor based on influent mode discrimination neural network for a wastewater treatment process
CN116068974A (zh) 一种块内块间协同建模的分布式过程监测方法及装置
Heikkinen et al. SOM-based modelling for an activated sludge treatment process
Hu et al. Fault Diagnosis Using Deep Learning for Wastewater Treatment Processes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant