CN113848307B

CN113848307B - 一种针对污泥膨胀的特征提取主成分分析在线监测方法

Info

Publication number: CN113848307B
Application number: CN202111094212.7A
Authority: CN
Inventors: 刘乙奇; 黄志鹏; 程洪超
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2024-06-07
Anticipated expiration: 2041-11-19
Also published as: CN113848307A

Abstract

本发明公开了一种针对污泥膨胀的特征提取主成分分析在线监测方法，该方法首先利用离线数据建立主元模型，然后对采集到的现场数据进行预处理，再依次计算出每个实时观测样本的传统统计量，由此构成时间序列，最后对其特征提取得到新的统计量。如果新统计量的值未超出控制限则说明工况正常；相反，如果新统计量的值超过控制限则可判定该观测时刻发生了污泥膨胀。本发明充分考虑到早期污泥膨胀故障信号微弱的特点，通过特征提取来精细化故障特征，解决了基于主元分析的在线监测无法及时、准确地检测出污泥膨胀的问题，同时，新统计量的值可以作为判断污泥膨胀严重程度的一个参考标准。

Description

一种针对污泥膨胀的特征提取主成分分析在线监测方法

技术领域

本发明涉及污水处理厂污泥膨胀在线监测的技术领域，特别涉及一种针对污泥膨胀的特征提取主成分分析在线监测方法。

背景技术

现阶段，我国工业化速度日益加快，使得污水的排放量显著增加。为了应对日益增加的工业废水，建设自动化程度高的污水处理厂已经成为社会发展的需要之一。在这样的背景下，活性污泥法作为一种成本低廉、处理效果较好的污水处理法被广泛地应用于污水处理厂中。然而，丝状菌过度增殖所引起的污泥膨胀常常会造成二沉池中的活性污泥难以沉降，进而导致出水水质恶化。实际的污水厂情况非常复杂，污泥膨胀会在多种因素的共同作用下突然发生，甚至不同情况下发生的污泥膨胀的优势菌种都可能不尽相同，因此，污泥膨胀的早期预警仍是一个难题(郝二成袁星阜崴.污泥膨胀原因及控制措施研究郝二成[J].环境工程,2017,35(7).)。

污泥膨胀属于典型的微小漂移故障。在污泥膨胀的早期阶段，整个污水处理系统的运行过程相对比较稳定，所以故障信号相对微弱(程洪超，黄道平，刘乙奇，吴菁.基于鲁棒自适应典型相关分析的污水厂污泥膨胀检测方法:202010832523.8[P].[2020.8.18].)。因此，由传统的主成分分析构造的统计量所提取的故障信号不明显，常常导致早期污泥膨胀检测效果不够稳定，甚至难以被检测，最终导致故障的漏报问题。

发明内容

针对以上问题，本发明提出了一种针对污泥膨胀的特征提取主成分分析在线监测方法，利用特征提取方法将绝对均值或方根幅值与统计量相结合，得到了能够准确检测早期污泥膨胀并获得稳定检测效果的新统计量。同时，新统计量的还能作为判断污泥膨胀严重程度的一个参考标准。这为污水处理厂高效、准确地检测污泥膨胀提供了可能，克服了传统主成分分析在监测早期污泥膨胀时的不足，同时，工作人员可以根据新统计量的值来判断污泥膨胀的严重程度。

本发明至少通过如下技术方案之一实现。

一种针对污泥膨胀的特征提取主成分分析在线监测方法，包括以下步骤：

(1)、确定观测变量并设定采样间隔，采集正常工况时的观测数据作为训练集，并对训练集进行预处理，得到预处理后的训练集，对预处理后的训练集进行特征值分解；

(3)、选取置信度，计算T²或者SPE控制限，对污泥膨胀的在线监测；

(4)、采集实时观测数据作为测试集，对测试集预处理后，按照采集的时间顺序依次计算出测试集中每个样本的平方预测误差统计量或T²统计量并构成时间序列，并进行特征提取，得到新的统计量；

(5)、判断是否发生污泥膨胀：如果新统计量的值未超出控制限则说明工况正常；相反，如果新统计量的值超过控制限则判定该观测时刻发生污泥膨胀；

(6)、若检测出污泥膨胀，则故障报警，否则，当新的观测样本到达时，更新测试集，并重复步骤(4)～(5)；

(7)、若在某一时刻检测到发生污泥膨胀，则将该时刻的观测样本的统计量的值与由主元模型得到的控制限做差，得到的差越大，则说明污泥膨胀越严重。

优选地，所述预处理包括：

采用标准差标准化法，即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理：

其中，X∈R^m×n是原始的观测数据矩阵，R^m×n表示m行n列的实矩阵，X的每一行代表一个观测样本，每一列代表一个观测变量，μ_X和σ_X表示X中各观测变量的样本均值和样本标准差，X'表示预处理后的训练集。

优选地，所述预处理包括：采用极差标准化法，即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理：

其中，X∈R^m×n是原始的观测数据矩阵，R^m×n表示m行n列的实矩阵，X的每一行代表一个观测样本，每一列代表一个观测变量，X'表示预处理后的训练集，X(i,j)、X'(i,j)分别表示X和X'的第i行第j列位置上的元素，X(j)_max、X(j)_min分别表示X的第j列中的最大值和最小值。

优选地，训练集X'的特征值分解为：

其中∑_X'为预处理后的训练集X'的协方差矩阵，m为X'中包含的样本个数，X'^T代表X'的转置矩阵；是∑_X'的特征矩阵，n是观测变量的个数，λ₁,λ₂,...,λ_n是∑_X'的特征值且λ₁≥λ₂,...,≥λ_n；V是∑_X'的特征矩阵，V的各列是λ₁,λ₂,...,λ_n所依次对应的特征向量，V^T代表V的转置矩阵。

优选地，所述的T²控制限为：

其中α是T²控制限的置信度，代表置信度为α时的T²控制限，k为主元个数且k≤n，n表示观测变量的个数，m表示预处理后的训练集中包含的样本个数，F_k,m-k,α是带有k和m-k个自由度、置信水平为α的F分布临界值；

优选地，所述的SPE控制限为：

其中β是SPE控制限的置信度，SPE_β代表置信度为β时的SPE控制限，参数n表示观测变量的个数，λ_j表示预处理后的训练集X'的协方差矩阵∑_X'的第k+1～第n个特征值，/>表示λ_j的i次方，参数/>c_β为标准正态分布在置信度水平β下的阈值；

优选地，通过累积贡献率法选取主元的个数k。

优选地，每个样本的T²统计量为：

其中，T²(t)表示样本x(t)的T²统计量，x(t)表示t时刻的样本，P是由V的前k列即∑_X'的前k个特征值对应的特征向量所组成的矩阵，又称负载矩阵，是∑_X'的特征矩阵，λ₁,λ₂,...,λ_k是∑_X'的特征值且λ₁≥λ₂,...,≥λ_k，/>表示Λ_k的逆矩阵，P^T、x^T(t)分别代表P和x(t)的转置矩阵；

优选地，每个样本的SPE统计量为：

SPE(t)＝||x(t)·(I-PP^T)||²

其中，SPE(t)表示样本x(t)的SPE统计量，x(t)表示t时刻的样本，I为k阶单位矩阵，P为负载矩阵。

优选地，所述时间序列是按照样本的观测顺序，依次计算出每个样本的SPE统计量或者T²统计量，并排成时间序列。

优选地，所述特征提取包括以下步骤：

假设是y(t)是需要特征提取的原始时间序列，y(i)表示y(t)在t＝i时刻的值，对于时间序列第一个值y(1)，保留其原值；依次计算时间序列y(t)在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值AMAV或方根幅值SRAV：

按以下顺序依次组成新的y-AMAV或y-SRAV时间序列：

y-AMAV(1)＝y(1)；

y-AMAV(2)＝时间序列y(1)、y(2)的AMAV值；

y-AMAV(3)＝时间序列y(1)、y(2)、y(3)的AMAV值；

y-AMAV(4)＝时间序列y(1)、y(2)、y(3)、y(4)的AMAV值；

......

y-AMAV(t)＝时间序列y(1)、y(2)、y(3)、y(4)、...、y(t)的AMAV值；

y-SRAV(1)＝y(1)；

y-SRAV(2)＝时间序列y(1)、y(2)的SRAV值；

y-SRAV(3)＝时间序列y(1)、y(2)、y(3)的SRAV值；

y-SRAV(4)＝时间序列y(1)、y(2)、y(3)、y(4)的SRAV值；

......

y-SRAV(t)＝时间序列y(1)、y(2)、y(3)、y(4)、...、y(t)的SRAV值；

其中，y-AMAV(t)和y-SRAV(t)分别代表用AMAV和SRAV特征提取后的新时间序列在t时刻的值；y-AMAV、y-SRAV分别代表用AMAV和SRAV对y(t)特征提取后得到的新时间序列。

本发明与现有的技术相比，具有如下优点与有益效果：

1、本发明能够通过特征提取方法有效地细化并放大SPE统计量和T²统计量中蕴含的故障信息。

2、本发明通过对传统的SPE统计量和T²统计量中进行简单的处理就能有效改善其故障检测效果，因而在改善效果的同时未增加算法的复杂度。

3、本发明在检测污水处理厂污泥膨胀时能够明显降低误报率和漏报率，因此能够减轻污水处理厂工作人员的工作负担，同时又能及时发现早期故障，为污水厂设备的维护预留足够的时间，节省维护费用。

4、本发明所采用的新统计量的值会随着污泥膨胀的加重而逐渐增大，因此能够通过新统计量与控制限的差值反映出污泥膨胀的严重程度，从而为现场的工作人员做出维护策略提供了参考信息。

附图说明

图1是本发明的检测流程图；

图2是本发明实施例一的SPE-AMAV统计量故障检测图；

图3是本发明实施例二的SPE-SRAV统计量故障检测图；

图4是本发明实施例三的T²-AMAV统计量故障检测图；

图5是本发明实施例四的T²-SRAV统计量故障检测图。

具体实施方式

为了使本发明的技术方案更加清楚，下面结合附图和具体实施例进一步说明。

实施例一

如图1所示的一种针对污泥膨胀的特征提取主成分分析在线监测方法。该方法首先利用污水厂正常工况时的数据即离线数据建立主元模型(所述主元模型是用原始变量的一些线性组合(即主元)来代替原始变量进行分析的模型)，然后对采集到的实时现场数据进行预处理，再依次计算出每个实时观测样本的SPE统计量，按照观测的顺序构成时间序列(把观测到的第一个样本的SPE计算出来，再计算出第二个、第三个样本的，依次类推，按顺序排成序列：第一个样本的统计量排在第一个，第二个样本的统计量排在第二个，以此类推)。最后对其特征提取，如果处理后的值超出控制限则可判定发生了污泥膨胀。具体包括以下步骤：

1)、确定观测变量并设定相同的采样间隔，将从污水处理厂采集到的正常运行工况时的数据矩阵作为训练集，并按照下式进行数据预处理：

其中，X∈R^m×n是原始的训练集，R^m×n表示m行n列的实矩阵，其中每一行代表一个观测样本，每一列代表一个观测变量，观测变量包括温度、PH值等等。μ_X和σ_X表示X中各观测变量的样本均值和样本标准差，X'表示预处理后的数据矩阵。

2)、估计X'的协方差矩阵，并对其进行特征值分解：

其中∑_X'为X'的协方差矩阵，m为X'中包含的样本个数，X'^T代表X'的转置矩阵，是∑_X'的特征矩阵，n是观测变量的个数，λ₁,λ₂,...,λ_n是∑_X'的特征值且λ₁≥λ₂,...,≥λ_n，V是∑_X'的特征矩阵，它的各列是λ₁,λ₂,...,λ_n所依次对应的特征向量，V^T代表V的转置矩阵。

3)、选取置信度，计算SPE控制限：

其中SPE_β代表置信度为β时的SPE控制限，β是SPE控制限的置信度，参数λ_j表示Σ_X'的第k+1～第n个特征值，λ_j ⁱ表示λ_j的i次方，参数c_β为标准正态分布在置信度水平β下的阈值。

至此完成建模，可实现对污泥膨胀的在线监测。

4)、采集实时观测数据作为测试集，首先进行数据预处理，预处理的方法与训练集相同。预处理完成后，按照实时的观测顺序计算每个样本的对应的SPE统计量：

SPE(t)＝||x(t)·(I-PP^T)||²

其中，x(t)表示t时刻的样本，SPE(t)表示样本x(t)的SPE统计量，I为k阶单位矩阵，P为负载矩阵。

5)、按观测的先后顺序(把第一个样本的统计量排在第一个，第二个样本的统计量排在第二个，就这样构成统计量的时间序列)计算时间区间[1,t]内每个样本的SPE统计量，得到时间序列，对时间序列进行特征提取，具体包括以下步骤：

①对于第一个样本的SPE统计量即SPE(1)，保留原值不做任何处理。因为污泥膨胀是一个随时间积累的过程，而在t＝1时只能得到当前时刻的故障信息，无法通过特征提取累积过去时刻的故障信息，从而无法放大故障特征；

②依次计算测试集中的SPE统计量时间序列在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值(absolute mean amplitude value，AMAV)或方根幅值(square root amplitude value，SRAV)：

③按以下顺序顺序组成新的SPE-AMAV统计量时间序列：

SPE-AMAV(1)＝SPE(1)；

SPE-AMAV(2)＝时间序列SPE(1)、SPE(2)的AMAV值；

SPE-AMAV(3)＝时间序列SPE(1)、SPE(2)、SPE(3)的AMAV值；

SPE-AMAV(4)＝时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)的AMAV值；

......

SPE-AMAV(t)＝时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)、...、SPE(t)的AMAV值；

其中，SPE-AMAV(t)代表t时刻SPE-AMAV统计量的值，SPE-AMAV代表用AMAV对SPE统计量特征提取后得到的新统计量；

其中，特征提取后新的时间序列的第一个值是原始时间序列的第一个值；第二个值是原始时间序列中前两个值的绝对均值(AMAV)；第三个值是原始时间序列中前三个值的绝对均值(AMAV)，依次类推；

6)、若SPE-AMAV(t)≥SPE_β，则表示在观测时刻t发生了污泥膨胀，否则表示正常工况。

7)、当新的观测样本到达时，只需更新测试集并重复步骤4)～6)即可。

步骤②的依次指的是指的是先计算y(t)中前两个值的AMAV，然后计算前三个值的AMAV，再计算前四个值的AMAV，后面以此类推，SRAV同理。

在本实施例中以北京某污水厂提供的污泥膨胀数据对其进行验证。该观测数据包括213个样本，均以1天为间隔进行采样，观测变量一共9个，包括SRT、T、MLSS、SNO、COD、TP、BOD₅、TN、SVI，各观测变量的含义如表1所示。大约从观测的第71天起，污泥膨胀现象略有发生，持续时间约半年以上。

表1实验数据观测变量

序号	符号	描述	单位
				1	SRT	生物固体停留时间	天
2	T	温度	摄氏度
				3	MLSS	混合液悬浮固体浓度	毫克每升
4	SNO	硝态氮浓度	毫克每升
				5	COD	化学需氧量	毫克每升
6	TP	总磷量	毫克每升
				7	BOD₅	5日生物化学需氧量	毫克每升
8	TN	总氮量	毫克每升
				9	SVI	污泥容积指数	毫克每升

如图1所示，上述的污水厂污泥膨胀检测方法的大致过程为：将观测数据分为两部分，前50天的样本作为训练集，用来构建模型，后163天的样本作为测试集，用来验证所提方法的有效性。首先利用训练集建立主元模型，然后对测试集进行预处理，再依次计算出每个样本的平方预测误差(squared predicted errors，SPE)统计量，由此构成时间序列。最后对其特征提取，如果处理后的值超出控制限则可判定发生了污泥膨胀。具体步骤如下：

1)将训练集按照下式进行数据预处理：

其中，X∈R^50×9是原始的训练集，R^50×9表示50行9列的实矩阵，其中每一行代表一个观测样本，每一列代表一个观测变量。μ_X和σ_X表示X中各观测变量的样本均值和样本标准差，X'表示预处理后的训练集。

2)由于SPE统计量反应的是样本在残差子空间中的投影，检测的是污水厂质量无关的那部分故障，所以主元个数不宜过多，因此取累积贡献率为90％，得出主元个数k＝6。

3)由于主元个数不宜过多，置信度可适当提高，因此，选取置信度为99％，计算得出SPE控制限为2.71。

建模完成后，可实现对污泥膨胀的在线监测。

4)对于一个新的测试集，首先进行数据预处理，做法与训练集相同。预处理完成后，设x(t)表示在t时刻采集到的实时样本，计算对应的SPE统计量：

SPE(t)＝||x(t)·(I-PP^T)||²

其中，SPE(t)表示样本x(t)的SPE统计量，I为k＝6阶单位矩阵，P为负载矩阵。

5)按顺序计算时间区间[1,t]内每个样本的SPE统计量得到时间序列后，即可对其特征提取：

①对于第一个样本的SPE统计量即SPE(1)，保留原值不做任何处理。因为污泥膨胀是一个随时间积累的过程，而在t＝1时只能得到当前时刻的故障信息，无法与过去时刻进行比较，从而无法放大故障特征。

②依次计算测试集的SPE统计量时间序列在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值(absolute mean amplitude value，AMAV)：

③按顺序组成新的SPE-AMAV统计量时间序列：

SPE-AMAV(1)＝SPE(1)；

SPE-AMAV(2)＝时间序列SPE(1)、SPE(2)的AMAV值；

SPE-AMAV(3)＝时间序列SPE(1)、SPE(2)、SPE(3)的AMAV值；

SPE-AMAV(4)＝时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)的AMAV值；

......

SPE-AMAV(163)＝时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)、...、SPE(163)的AMAV值；其中，SPE-AMAV(t)代表t时刻SPE-AMAV统计量的值，SPE-AMAV代表用AMAV对SPE统计量特征提取后得到的新统计量；

6)若SPE-AMAV(t)≥2.71，则表示t时刻发生了污泥膨胀，否则表示正常工况。

特征提取的优势在于很好地利用了之前的时间序列中所包含的故障信息，每一个元素都积累了之前所有元素所包含的故障信息。将这种累计的计算方法与绝对均值结合，得出的新时间序列比原统计量时间时间序列包含更为明显的故障特征。

在采取上述方案后，可以及时、稳定地检测出污泥膨胀，同时工作人员能判断出污泥膨胀的严重程度，并采取相应的对策。

从图2的实验结果来看，SPE-AMAV统计量在第15天开始报警，且报警后没有遗漏。随着时间的推移，污泥膨胀的程度在逐渐加深，而SPE-AMAV统计量值也在不断变大，而控制限SPE_β代表了污水厂在发生污泥膨胀时的临界状态，因此，差值SPE-AMAV(t)-SPE_β越大，则污泥膨胀的程度越严重。从实验结果来看，当发生报警后，SPE-AMAV(t)-SPE_β从0.54逐渐增大到11.19，可作为判断污泥膨胀严重程度的一个参考标准。

实施例二

仍然采用实施例一中的实验数据，继续使用SPE统计量，建模过程中设置的参数与实施例一中相同，计算出来的控制限仍为2.71。所不同的是，在对SPE统计量特征提取时使用SRAV，最终得到的新统计量为SPE-SRAV。

从图3的实验结果来看，SPE-SRAV统计量在第21天开始报警，且报警后没有遗漏。随着时间的推移，污泥膨胀的程度在逐渐加深，而SPE-SRAV统计量值也在不断变大，而控制限SPE_β代表了污水厂在发生污泥膨胀时的临界状态，因此，差值SPE-SRAV(t)-SPE_β越大，则污泥膨胀的程度越严重。从实验结果来看，当发生报警后，SPE-SRAV(t)-SPE_β从0.31逐渐增大到6.37，可作为判断污泥膨胀严重程度的一个参考标准

实施例三

仍然采用实施例一中的实验数据，但统计量使用T²统计量(Hotelling统计量，T²统计量对应的控制限就叫T²控制限)。

由于T²统计量反应的是样本在主元子空间中的投影，检测的是污水厂质量相关的那部分故障，所以主元个数可适当增多，因此取累积贡献率为97％，得出主元个数k＝8。由于主元个数增多，置信度可适当降低，因此，选取置信度为90％，计算得出T²控制限为17.33，最后使用AMAV对T²统计量特征提取得到T²-AMAV统计量用于故障检测。

从图4的实验结果来看，T²-AMAV统计量在第18天开始报警，且报警后没有遗漏。随着时间的推移，污泥膨胀的程度在逐渐加深，而T²-AMAV统计量值也在不断变大，而控制限代表了污水厂在发生污泥膨胀时的临界状态，因此，差值/>越大，则污泥膨胀的程度越严重。从实验结果来看，当发生报警后，/>从0.33逐渐增大到110.7，可作为判断污泥膨胀严重程度的一个参考标准。

实施例四

仍然采用实施例三中的实验数据，继续使用T²统计量，建模过程中设置的参数与实施例三中相同，计算出来的控制限仍为17.33。所不同的是，在对T²统计量特征提取时使用SRAV，最终得到的新统计量为T²-SRAV。

从图5的实验结果来看，SPE-SRAV统计量在第23天开始报警，且报警后没有遗漏。随着时间的推移，污泥膨胀的程度在逐渐加深，而T²-SRAV统计量值也在不断变大，而控制限代表了污水厂在发生污泥膨胀时的临界状态，因此，差值/>越大，则污泥膨胀的程度越严重。从实验结果来看，当发生报警后，/>从0.11逐渐增大到55.56，可作为判断污泥膨胀严重程度的一个参考标准。

通过以上实施例可以看出本发明开发的特征提取主成分分析相比于传统的主成分分析具有更为令人满意的性能。表2列出了主成分分析和本发明开发的特征提取主成分分析对本观测数据的在线监测效果，从表2的统计结果可以发现，特征提取后得到的新统计量比原始统计量均具有更好的性能，所不同的是，AMAV在改善漏报率时更为优越，而SRAV在改善误报率时有着更为优越的性能。因此，具体需要使用哪种方式，可以根据污水厂的实际情况来确定。

表2主成分分析与特征提取主成分分析的故障检测结果对比

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，包括以下步骤：

(4)、采集实时观测数据作为测试集，对测试集预处理后，按照采集的时间顺序依次计算出测试集中每个样本的SPE统计量或T²统计量并构成时间序列，并进行特征提取，得到新的统计量；

所述特征提取包括以下步骤：

按以下顺序依次组成新的y-AMAV或y-SRAV时间序列：

y-AMAV(1)＝y(1)；

y-AMAV(2)＝时间序列y(1)、y(2)的AMAV值；

y-AMAV(3)＝时间序列y(1)、y(2)、y(3)的AMAV值；

y-AMAV(4)＝时间序列y(1)、y(2)、y(3)、y(4)的AMAV值；

……

y-AMAV(t)＝时间序列y(1)、y(2)、y(3)、y(4)、...、y(t)的AMAV值；

y-SRAV(1)＝y(1)；

y-SRAV(2)＝时间序列y(1)、y(2)的SRAV值；

y-SRAV(3)＝时间序列y(1)、y(2)、y(3)的SRAV值；

y-SRAV(4)＝时间序列y(1)、y(2)、y(3)、y(4)的SRAV值；

……

y-SRAV(t)＝时间序列y(1)、y(2)、y(3)、y(4)、…、y(t)的SRAV值；

其中，y-AMAV(t)和y-SRAV(t)分别代表用AMAV和SRAV特征提取后的新时间序列在t时刻的值；y-AMAV、y-SRAV分别代表用AMAV和SRAV对y(t)特征提取后得到的新时间序列；

(7)、若在某一时刻检测到发生污泥膨胀，则将该时刻的观测样本的统计量的值与由主元模型得到的控制限做差，得到的差越大，则说明污泥膨胀越严重；

每个样本的T²统计量为：

每个样本的SPE统计量为：

SPE(t)＝||x(t)·(I-PP^T)||²

2.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，所述预处理包括：

3.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，所述预处理包括：采用极差标准化法，即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理：

4.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，训练集X'的特征值分解为：

5.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，所述的T²控制限为：

其中α是T²控制限的置信度，代表置信度为α时的T²控制限，k为主元个数且k≤n，n表示观测变量的个数，m表示预处理后的训练集中包含的样本个数，F_k,m-k,α是带有k和m-k个自由度、置信水平为α的F分布临界值。

6.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，所述的SPE控制限为：

其中β是SPE控制限的置信度，SPE_β代表置信度为β时的SPE控制限，参数n表示观测变量的个数，λ_j表示预处理后的训练集X'的协方差矩阵∑_X'的第k+1～第n个特征值，/>表示λ_j的i次方，参数/>c_β为标准正态分布在置信度水平β下的阈值。

7.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法，其特征在于，所述时间序列是按照样本的观测顺序，依次计算出每个样本的SPE统计量或者T²统计量，并排成时间序列。