CN113848307B - 一种针对污泥膨胀的特征提取主成分分析在线监测方法 - Google Patents
一种针对污泥膨胀的特征提取主成分分析在线监测方法 Download PDFInfo
- Publication number
- CN113848307B CN113848307B CN202111094212.7A CN202111094212A CN113848307B CN 113848307 B CN113848307 B CN 113848307B CN 202111094212 A CN202111094212 A CN 202111094212A CN 113848307 B CN113848307 B CN 113848307B
- Authority
- CN
- China
- Prior art keywords
- spe
- amav
- srav
- sample
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000010802 sludge Substances 0.000 title claims abstract description 82
- 238000000605 extraction Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012544 monitoring process Methods 0.000 title claims abstract description 22
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 41
- 241000190711 Amapari mammarenavirus Species 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 29
- 239000010865 sewage Substances 0.000 claims description 27
- 238000007781 pre-processing Methods 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 15
- 229910052698 phosphorus Inorganic materials 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000011428 standard deviation standardization method Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 241000233866 Fungi Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- MMDJDBSEMBIJBB-UHFFFAOYSA-N [O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O.[NH6+3] Chemical compound [O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O.[NH6+3] MMDJDBSEMBIJBB-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000010842 industrial wastewater Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/24—Earth materials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Geology (AREA)
- Pathology (AREA)
- Remote Sensing (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Evolutionary Computation (AREA)
- Environmental & Geological Engineering (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Activated Sludge Processes (AREA)
Abstract
本发明公开了一种针对污泥膨胀的特征提取主成分分析在线监测方法,该方法首先利用离线数据建立主元模型,然后对采集到的现场数据进行预处理,再依次计算出每个实时观测样本的传统统计量,由此构成时间序列,最后对其特征提取得到新的统计量。如果新统计量的值未超出控制限则说明工况正常;相反,如果新统计量的值超过控制限则可判定该观测时刻发生了污泥膨胀。本发明充分考虑到早期污泥膨胀故障信号微弱的特点,通过特征提取来精细化故障特征,解决了基于主元分析的在线监测无法及时、准确地检测出污泥膨胀的问题,同时,新统计量的值可以作为判断污泥膨胀严重程度的一个参考标准。
Description
技术领域
本发明涉及污水处理厂污泥膨胀在线监测的技术领域,特别涉及一种针对污泥膨胀的特征提取主成分分析在线监测方法。
背景技术
现阶段,我国工业化速度日益加快,使得污水的排放量显著增加。为了应对日益增加的工业废水,建设自动化程度高的污水处理厂已经成为社会发展的需要之一。在这样的背景下,活性污泥法作为一种成本低廉、处理效果较好的污水处理法被广泛地应用于污水处理厂中。然而,丝状菌过度增殖所引起的污泥膨胀常常会造成二沉池中的活性污泥难以沉降,进而导致出水水质恶化。实际的污水厂情况非常复杂,污泥膨胀会在多种因素的共同作用下突然发生,甚至不同情况下发生的污泥膨胀的优势菌种都可能不尽相同,因此,污泥膨胀的早期预警仍是一个难题(郝二成袁星阜崴.污泥膨胀原因及控制措施研究郝二成[J].环境工程,2017,35(7).)。
污泥膨胀属于典型的微小漂移故障。在污泥膨胀的早期阶段,整个污水处理系统的运行过程相对比较稳定,所以故障信号相对微弱(程洪超,黄道平,刘乙奇,吴菁.基于鲁棒自适应典型相关分析的污水厂污泥膨胀检测方法:202010832523.8[P].[2020.8.18].)。因此,由传统的主成分分析构造的统计量所提取的故障信号不明显,常常导致早期污泥膨胀检测效果不够稳定,甚至难以被检测,最终导致故障的漏报问题。
发明内容
针对以上问题,本发明提出了一种针对污泥膨胀的特征提取主成分分析在线监测方法,利用特征提取方法将绝对均值或方根幅值与统计量相结合,得到了能够准确检测早期污泥膨胀并获得稳定检测效果的新统计量。同时,新统计量的还能作为判断污泥膨胀严重程度的一个参考标准。这为污水处理厂高效、准确地检测污泥膨胀提供了可能,克服了传统主成分分析在监测早期污泥膨胀时的不足,同时,工作人员可以根据新统计量的值来判断污泥膨胀的严重程度。
本发明至少通过如下技术方案之一实现。
一种针对污泥膨胀的特征提取主成分分析在线监测方法,包括以下步骤:
(1)、确定观测变量并设定采样间隔,采集正常工况时的观测数据作为训练集,并对训练集进行预处理,得到预处理后的训练集,对预处理后的训练集进行特征值分解;
(3)、选取置信度,计算T2或者SPE控制限,对污泥膨胀的在线监测;
(4)、采集实时观测数据作为测试集,对测试集预处理后,按照采集的时间顺序依次计算出测试集中每个样本的平方预测误差统计量或T2统计量并构成时间序列,并进行特征提取,得到新的统计量;
(5)、判断是否发生污泥膨胀:如果新统计量的值未超出控制限则说明工况正常;相反,如果新统计量的值超过控制限则判定该观测时刻发生污泥膨胀;
(6)、若检测出污泥膨胀,则故障报警,否则,当新的观测样本到达时,更新测试集,并重复步骤(4)~(5);
(7)、若在某一时刻检测到发生污泥膨胀,则将该时刻的观测样本的统计量的值与由主元模型得到的控制限做差,得到的差越大,则说明污泥膨胀越严重。
优选地,所述预处理包括:
采用标准差标准化法,即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:
其中,X∈Rm×n是原始的观测数据矩阵,Rm×n表示m行n列的实矩阵,X的每一行代表一个观测样本,每一列代表一个观测变量,μX和σX表示X中各观测变量的样本均值和样本标准差,X'表示预处理后的训练集。
优选地,所述预处理包括:采用极差标准化法,即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:
其中,X∈Rm×n是原始的观测数据矩阵,Rm×n表示m行n列的实矩阵,X的每一行代表一个观测样本,每一列代表一个观测变量,X'表示预处理后的训练集,X(i,j)、X'(i,j)分别表示X和X'的第i行第j列位置上的元素,X(j)max、X(j)min分别表示X的第j列中的最大值和最小值。
优选地,训练集X'的特征值分解为:
其中∑X'为预处理后的训练集X'的协方差矩阵,m为X'中包含的样本个数,X'T代表X'的转置矩阵;是∑X'的特征矩阵,n是观测变量的个数,λ1,λ2,...,λn是∑X'的特征值且λ1≥λ2,...,≥λn;V是∑X'的特征矩阵,V的各列是λ1,λ2,...,λn所依次对应的特征向量,VT代表V的转置矩阵。
优选地,所述的T2控制限为:
其中α是T2控制限的置信度,代表置信度为α时的T2控制限,k为主元个数且k≤n,n表示观测变量的个数,m表示预处理后的训练集中包含的样本个数,Fk,m-k,α是带有k和m-k个自由度、置信水平为α的F分布临界值;
优选地,所述的SPE控制限为:
其中β是SPE控制限的置信度,SPEβ代表置信度为β时的SPE控制限,参数n表示观测变量的个数,λj表示预处理后的训练集X'的协方差矩阵∑X'的第k+1~第n个特征值,/>表示λj的i次方,参数/>cβ为标准正态分布在置信度水平β下的阈值;
优选地,通过累积贡献率法选取主元的个数k。
优选地,每个样本的T2统计量为:
其中,T2(t)表示样本x(t)的T2统计量,x(t)表示t时刻的样本,P是由V的前k列即∑X'的前k个特征值对应的特征向量所组成的矩阵,又称负载矩阵,是∑X'的特征矩阵,λ1,λ2,...,λk是∑X'的特征值且λ1≥λ2,...,≥λk,/>表示Λk的逆矩阵,PT、xT(t)分别代表P和x(t)的转置矩阵;
优选地,每个样本的SPE统计量为:
SPE(t)=||x(t)·(I-PPT)||2
其中,SPE(t)表示样本x(t)的SPE统计量,x(t)表示t时刻的样本,I为k阶单位矩阵,P为负载矩阵。
优选地,所述时间序列是按照样本的观测顺序,依次计算出每个样本的SPE统计量或者T2统计量,并排成时间序列。
优选地,所述特征提取包括以下步骤:
假设是y(t)是需要特征提取的原始时间序列,y(i)表示y(t)在t=i时刻的值,对于时间序列第一个值y(1),保留其原值;依次计算时间序列y(t)在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值AMAV或方根幅值SRAV:
按以下顺序依次组成新的y-AMAV或y-SRAV时间序列:
y-AMAV(1)=y(1);
y-AMAV(2)=时间序列y(1)、y(2)的AMAV值;
y-AMAV(3)=时间序列y(1)、y(2)、y(3)的AMAV值;
y-AMAV(4)=时间序列y(1)、y(2)、y(3)、y(4)的AMAV值;
......
y-AMAV(t)=时间序列y(1)、y(2)、y(3)、y(4)、...、y(t)的AMAV值;
y-SRAV(1)=y(1);
y-SRAV(2)=时间序列y(1)、y(2)的SRAV值;
y-SRAV(3)=时间序列y(1)、y(2)、y(3)的SRAV值;
y-SRAV(4)=时间序列y(1)、y(2)、y(3)、y(4)的SRAV值;
......
y-SRAV(t)=时间序列y(1)、y(2)、y(3)、y(4)、...、y(t)的SRAV值;
其中,y-AMAV(t)和y-SRAV(t)分别代表用AMAV和SRAV特征提取后的新时间序列在t时刻的值;y-AMAV、y-SRAV分别代表用AMAV和SRAV对y(t)特征提取后得到的新时间序列。
本发明与现有的技术相比,具有如下优点与有益效果:
1、本发明能够通过特征提取方法有效地细化并放大SPE统计量和T2统计量中蕴含的故障信息。
2、本发明通过对传统的SPE统计量和T2统计量中进行简单的处理就能有效改善其故障检测效果,因而在改善效果的同时未增加算法的复杂度。
3、本发明在检测污水处理厂污泥膨胀时能够明显降低误报率和漏报率,因此能够减轻污水处理厂工作人员的工作负担,同时又能及时发现早期故障,为污水厂设备的维护预留足够的时间,节省维护费用。
4、本发明所采用的新统计量的值会随着污泥膨胀的加重而逐渐增大,因此能够通过新统计量与控制限的差值反映出污泥膨胀的严重程度,从而为现场的工作人员做出维护策略提供了参考信息。
附图说明
图1是本发明的检测流程图;
图2是本发明实施例一的SPE-AMAV统计量故障检测图;
图3是本发明实施例二的SPE-SRAV统计量故障检测图;
图4是本发明实施例三的T2-AMAV统计量故障检测图;
图5是本发明实施例四的T2-SRAV统计量故障检测图。
具体实施方式
为了使本发明的技术方案更加清楚,下面结合附图和具体实施例进一步说明。
实施例一
如图1所示的一种针对污泥膨胀的特征提取主成分分析在线监测方法。该方法首先利用污水厂正常工况时的数据即离线数据建立主元模型(所述主元模型是用原始变量的一些线性组合(即主元)来代替原始变量进行分析的模型),然后对采集到的实时现场数据进行预处理,再依次计算出每个实时观测样本的SPE统计量,按照观测的顺序构成时间序列(把观测到的第一个样本的SPE计算出来,再计算出第二个、第三个样本的,依次类推,按顺序排成序列:第一个样本的统计量排在第一个,第二个样本的统计量排在第二个,以此类推)。最后对其特征提取,如果处理后的值超出控制限则可判定发生了污泥膨胀。具体包括以下步骤:
1)、确定观测变量并设定相同的采样间隔,将从污水处理厂采集到的正常运行工况时的数据矩阵作为训练集,并按照下式进行数据预处理:
其中,X∈Rm×n是原始的训练集,Rm×n表示m行n列的实矩阵,其中每一行代表一个观测样本,每一列代表一个观测变量,观测变量包括温度、PH值等等。μX和σX表示X中各观测变量的样本均值和样本标准差,X'表示预处理后的数据矩阵。
2)、估计X'的协方差矩阵,并对其进行特征值分解:
其中∑X'为X'的协方差矩阵,m为X'中包含的样本个数,X'T代表X'的转置矩阵,是∑X'的特征矩阵,n是观测变量的个数,λ1,λ2,...,λn是∑X'的特征值且λ1≥λ2,...,≥λn,V是∑X'的特征矩阵,它的各列是λ1,λ2,...,λn所依次对应的特征向量,VT代表V的转置矩阵。
3)、选取置信度,计算SPE控制限:
其中SPEβ代表置信度为β时的SPE控制限,β是SPE控制限的置信度,参数λj表示ΣX'的第k+1~第n个特征值,λj i表示λj的i次方,参数cβ为标准正态分布在置信度水平β下的阈值。
至此完成建模,可实现对污泥膨胀的在线监测。
4)、采集实时观测数据作为测试集,首先进行数据预处理,预处理的方法与训练集相同。预处理完成后,按照实时的观测顺序计算每个样本的对应的SPE统计量:
SPE(t)=||x(t)·(I-PPT)||2
其中,x(t)表示t时刻的样本,SPE(t)表示样本x(t)的SPE统计量,I为k阶单位矩阵,P为负载矩阵。
5)、按观测的先后顺序(把第一个样本的统计量排在第一个,第二个样本的统计量排在第二个,就这样构成统计量的时间序列)计算时间区间[1,t]内每个样本的SPE统计量,得到时间序列,对时间序列进行特征提取,具体包括以下步骤:
①对于第一个样本的SPE统计量即SPE(1),保留原值不做任何处理。因为污泥膨胀是一个随时间积累的过程,而在t=1时只能得到当前时刻的故障信息,无法通过特征提取累积过去时刻的故障信息,从而无法放大故障特征;
②依次计算测试集中的SPE统计量时间序列在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值(absolute mean amplitude value,AMAV)或方根幅值(square root amplitude value,SRAV):
③按以下顺序顺序组成新的SPE-AMAV统计量时间序列:
SPE-AMAV(1)=SPE(1);
SPE-AMAV(2)=时间序列SPE(1)、SPE(2)的AMAV值;
SPE-AMAV(3)=时间序列SPE(1)、SPE(2)、SPE(3)的AMAV值;
SPE-AMAV(4)=时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)的AMAV值;
......
SPE-AMAV(t)=时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)、...、SPE(t)的AMAV值;
其中,SPE-AMAV(t)代表t时刻SPE-AMAV统计量的值,SPE-AMAV代表用AMAV对SPE统计量特征提取后得到的新统计量;
其中,特征提取后新的时间序列的第一个值是原始时间序列的第一个值;第二个值是原始时间序列中前两个值的绝对均值(AMAV);第三个值是原始时间序列中前三个值的绝对均值(AMAV),依次类推;
6)、若SPE-AMAV(t)≥SPEβ,则表示在观测时刻t发生了污泥膨胀,否则表示正常工况。
7)、当新的观测样本到达时,只需更新测试集并重复步骤4)~6)即可。
步骤②的依次指的是指的是先计算y(t)中前两个值的AMAV,然后计算前三个值的AMAV,再计算前四个值的AMAV,后面以此类推,SRAV同理。
在本实施例中以北京某污水厂提供的污泥膨胀数据对其进行验证。该观测数据包括213个样本,均以1天为间隔进行采样,观测变量一共9个,包括SRT、T、MLSS、SNO、COD、TP、BOD5、TN、SVI,各观测变量的含义如表1所示。大约从观测的第71天起,污泥膨胀现象略有发生,持续时间约半年以上。
表1实验数据观测变量
序号 | 符号 | 描述 | 单位 |
1 | SRT | 生物固体停留时间 | 天 |
2 | T | 温度 | 摄氏度 |
3 | MLSS | 混合液悬浮固体浓度 | 毫克每升 |
4 | SNO | 硝态氮浓度 | 毫克每升 |
5 | COD | 化学需氧量 | 毫克每升 |
6 | TP | 总磷量 | 毫克每升 |
7 | BOD5 | 5日生物化学需氧量 | 毫克每升 |
8 | TN | 总氮量 | 毫克每升 |
9 | SVI | 污泥容积指数 | 毫克每升 |
如图1所示,上述的污水厂污泥膨胀检测方法的大致过程为:将观测数据分为两部分,前50天的样本作为训练集,用来构建模型,后163天的样本作为测试集,用来验证所提方法的有效性。首先利用训练集建立主元模型,然后对测试集进行预处理,再依次计算出每个样本的平方预测误差(squared predicted errors,SPE)统计量,由此构成时间序列。最后对其特征提取,如果处理后的值超出控制限则可判定发生了污泥膨胀。具体步骤如下:
1)将训练集按照下式进行数据预处理:
其中,X∈R50×9是原始的训练集,R50×9表示50行9列的实矩阵,其中每一行代表一个观测样本,每一列代表一个观测变量。μX和σX表示X中各观测变量的样本均值和样本标准差,X'表示预处理后的训练集。
2)由于SPE统计量反应的是样本在残差子空间中的投影,检测的是污水厂质量无关的那部分故障,所以主元个数不宜过多,因此取累积贡献率为90%,得出主元个数k=6。
3)由于主元个数不宜过多,置信度可适当提高,因此,选取置信度为99%,计算得出SPE控制限为2.71。
建模完成后,可实现对污泥膨胀的在线监测。
4)对于一个新的测试集,首先进行数据预处理,做法与训练集相同。预处理完成后,设x(t)表示在t时刻采集到的实时样本,计算对应的SPE统计量:
SPE(t)=||x(t)·(I-PPT)||2
其中,SPE(t)表示样本x(t)的SPE统计量,I为k=6阶单位矩阵,P为负载矩阵。
5)按顺序计算时间区间[1,t]内每个样本的SPE统计量得到时间序列后,即可对其特征提取:
①对于第一个样本的SPE统计量即SPE(1),保留原值不做任何处理。因为污泥膨胀是一个随时间积累的过程,而在t=1时只能得到当前时刻的故障信息,无法与过去时刻进行比较,从而无法放大故障特征。
②依次计算测试集的SPE统计量时间序列在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值(absolute mean amplitude value,AMAV):
③按顺序组成新的SPE-AMAV统计量时间序列:
SPE-AMAV(1)=SPE(1);
SPE-AMAV(2)=时间序列SPE(1)、SPE(2)的AMAV值;
SPE-AMAV(3)=时间序列SPE(1)、SPE(2)、SPE(3)的AMAV值;
SPE-AMAV(4)=时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)的AMAV值;
......
SPE-AMAV(163)=时间序列SPE(1)、SPE(2)、SPE(3)、SPE(4)、...、SPE(163)的AMAV值;其中,SPE-AMAV(t)代表t时刻SPE-AMAV统计量的值,SPE-AMAV代表用AMAV对SPE统计量特征提取后得到的新统计量;
6)若SPE-AMAV(t)≥2.71,则表示t时刻发生了污泥膨胀,否则表示正常工况。
特征提取的优势在于很好地利用了之前的时间序列中所包含的故障信息,每一个元素都积累了之前所有元素所包含的故障信息。将这种累计的计算方法与绝对均值结合,得出的新时间序列比原统计量时间时间序列包含更为明显的故障特征。
在采取上述方案后,可以及时、稳定地检测出污泥膨胀,同时工作人员能判断出污泥膨胀的严重程度,并采取相应的对策。
从图2的实验结果来看,SPE-AMAV统计量在第15天开始报警,且报警后没有遗漏。随着时间的推移,污泥膨胀的程度在逐渐加深,而SPE-AMAV统计量值也在不断变大,而控制限SPEβ代表了污水厂在发生污泥膨胀时的临界状态,因此,差值SPE-AMAV(t)-SPEβ越大,则污泥膨胀的程度越严重。从实验结果来看,当发生报警后,SPE-AMAV(t)-SPEβ从0.54逐渐增大到11.19,可作为判断污泥膨胀严重程度的一个参考标准。
实施例二
仍然采用实施例一中的实验数据,继续使用SPE统计量,建模过程中设置的参数与实施例一中相同,计算出来的控制限仍为2.71。所不同的是,在对SPE统计量特征提取时使用SRAV,最终得到的新统计量为SPE-SRAV。
从图3的实验结果来看,SPE-SRAV统计量在第21天开始报警,且报警后没有遗漏。随着时间的推移,污泥膨胀的程度在逐渐加深,而SPE-SRAV统计量值也在不断变大,而控制限SPEβ代表了污水厂在发生污泥膨胀时的临界状态,因此,差值SPE-SRAV(t)-SPEβ越大,则污泥膨胀的程度越严重。从实验结果来看,当发生报警后,SPE-SRAV(t)-SPEβ从0.31逐渐增大到6.37,可作为判断污泥膨胀严重程度的一个参考标准
实施例三
仍然采用实施例一中的实验数据,但统计量使用T2统计量(Hotelling统计量,T2统计量对应的控制限就叫T2控制限)。
由于T2统计量反应的是样本在主元子空间中的投影,检测的是污水厂质量相关的那部分故障,所以主元个数可适当增多,因此取累积贡献率为97%,得出主元个数k=8。由于主元个数增多,置信度可适当降低,因此,选取置信度为90%,计算得出T2控制限为17.33,最后使用AMAV对T2统计量特征提取得到T2-AMAV统计量用于故障检测。
从图4的实验结果来看,T2-AMAV统计量在第18天开始报警,且报警后没有遗漏。随着时间的推移,污泥膨胀的程度在逐渐加深,而T2-AMAV统计量值也在不断变大,而控制限代表了污水厂在发生污泥膨胀时的临界状态,因此,差值/>越大,则污泥膨胀的程度越严重。从实验结果来看,当发生报警后,/>从0.33逐渐增大到110.7,可作为判断污泥膨胀严重程度的一个参考标准。
实施例四
仍然采用实施例三中的实验数据,继续使用T2统计量,建模过程中设置的参数与实施例三中相同,计算出来的控制限仍为17.33。所不同的是,在对T2统计量特征提取时使用SRAV,最终得到的新统计量为T2-SRAV。
从图5的实验结果来看,SPE-SRAV统计量在第23天开始报警,且报警后没有遗漏。随着时间的推移,污泥膨胀的程度在逐渐加深,而T2-SRAV统计量值也在不断变大,而控制限代表了污水厂在发生污泥膨胀时的临界状态,因此,差值/>越大,则污泥膨胀的程度越严重。从实验结果来看,当发生报警后,/>从0.11逐渐增大到55.56,可作为判断污泥膨胀严重程度的一个参考标准。
通过以上实施例可以看出本发明开发的特征提取主成分分析相比于传统的主成分分析具有更为令人满意的性能。表2列出了主成分分析和本发明开发的特征提取主成分分析对本观测数据的在线监测效果,从表2的统计结果可以发现,特征提取后得到的新统计量比原始统计量均具有更好的性能,所不同的是,AMAV在改善漏报率时更为优越,而SRAV在改善误报率时有着更为优越的性能。因此,具体需要使用哪种方式,可以根据污水厂的实际情况来确定。
表2主成分分析与特征提取主成分分析的故障检测结果对比
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (7)
1.一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,包括以下步骤:
(1)、确定观测变量并设定采样间隔,采集正常工况时的观测数据作为训练集,并对训练集进行预处理,得到预处理后的训练集,对预处理后的训练集进行特征值分解;
(3)、选取置信度,计算T2或者SPE控制限,对污泥膨胀的在线监测;
(4)、采集实时观测数据作为测试集,对测试集预处理后,按照采集的时间顺序依次计算出测试集中每个样本的SPE统计量或T2统计量并构成时间序列,并进行特征提取,得到新的统计量;
所述特征提取包括以下步骤:
假设是y(t)是需要特征提取的原始时间序列,y(i)表示y(t)在t=i时刻的值,对于时间序列第一个值y(1),保留其原值;依次计算时间序列y(t)在时间区间[1,2]、[1,3]、[1,4]、......、[1,t]内的绝对均值AMAV或方根幅值SRAV:
按以下顺序依次组成新的y-AMAV或y-SRAV时间序列:
y-AMAV(1)=y(1);
y-AMAV(2)=时间序列y(1)、y(2)的AMAV值;
y-AMAV(3)=时间序列y(1)、y(2)、y(3)的AMAV值;
y-AMAV(4)=时间序列y(1)、y(2)、y(3)、y(4)的AMAV值;
……
y-AMAV(t)=时间序列y(1)、y(2)、y(3)、y(4)、...、y(t)的AMAV值;
y-SRAV(1)=y(1);
y-SRAV(2)=时间序列y(1)、y(2)的SRAV值;
y-SRAV(3)=时间序列y(1)、y(2)、y(3)的SRAV值;
y-SRAV(4)=时间序列y(1)、y(2)、y(3)、y(4)的SRAV值;
……
y-SRAV(t)=时间序列y(1)、y(2)、y(3)、y(4)、…、y(t)的SRAV值;
其中,y-AMAV(t)和y-SRAV(t)分别代表用AMAV和SRAV特征提取后的新时间序列在t时刻的值;y-AMAV、y-SRAV分别代表用AMAV和SRAV对y(t)特征提取后得到的新时间序列;
(5)、判断是否发生污泥膨胀:如果新统计量的值未超出控制限则说明工况正常;相反,如果新统计量的值超过控制限则判定该观测时刻发生污泥膨胀;
(6)、若检测出污泥膨胀,则故障报警,否则,当新的观测样本到达时,更新测试集,并重复步骤(4)~(5);
(7)、若在某一时刻检测到发生污泥膨胀,则将该时刻的观测样本的统计量的值与由主元模型得到的控制限做差,得到的差越大,则说明污泥膨胀越严重;
每个样本的T2统计量为:
其中,T2(t)表示样本x(t)的T2统计量,x(t)表示t时刻的样本,P是由V的前k列即∑X'的前k个特征值对应的特征向量所组成的矩阵,又称负载矩阵,是∑X'的特征矩阵,λ1,λ2,...,λk是∑X'的特征值且λ1≥λ2,...,≥λk,/>表示Λk的逆矩阵,PT、xT(t)分别代表P和x(t)的转置矩阵;
每个样本的SPE统计量为:
SPE(t)=||x(t)·(I-PPT)||2
其中,SPE(t)表示样本x(t)的SPE统计量,x(t)表示t时刻的样本,I为k阶单位矩阵,P为负载矩阵。
2.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,所述预处理包括:
采用标准差标准化法,即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:
其中,X∈Rm×n是原始的观测数据矩阵,Rm×n表示m行n列的实矩阵,X的每一行代表一个观测样本,每一列代表一个观测变量,μX和σX表示X中各观测变量的样本均值和样本标准差,X'表示预处理后的训练集。
3.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,所述预处理包括:采用极差标准化法,即将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:
其中,X∈Rm×n是原始的观测数据矩阵,Rm×n表示m行n列的实矩阵,X的每一行代表一个观测样本,每一列代表一个观测变量,X'表示预处理后的训练集,X(i,j)、X'(i,j)分别表示X和X'的第i行第j列位置上的元素,X(j)max、X(j)min分别表示X的第j列中的最大值和最小值。
4.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,训练集X'的特征值分解为:
其中∑X'为预处理后的训练集X'的协方差矩阵,m为X'中包含的样本个数,X'T代表X'的转置矩阵;是∑X'的特征矩阵,n是观测变量的个数,λ1,λ2,...,λn是∑X'的特征值且λ1≥λ2,...,≥λn;V是∑X'的特征矩阵,V的各列是λ1,λ2,...,λn所依次对应的特征向量,VT代表V的转置矩阵。
5.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,所述的T2控制限为:
其中α是T2控制限的置信度,代表置信度为α时的T2控制限,k为主元个数且k≤n,n表示观测变量的个数,m表示预处理后的训练集中包含的样本个数,Fk,m-k,α是带有k和m-k个自由度、置信水平为α的F分布临界值。
6.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,所述的SPE控制限为:
其中β是SPE控制限的置信度,SPEβ代表置信度为β时的SPE控制限,参数n表示观测变量的个数,λj表示预处理后的训练集X'的协方差矩阵∑X'的第k+1~第n个特征值,/>表示λj的i次方,参数/>cβ为标准正态分布在置信度水平β下的阈值。
7.根据权利要求1所述的一种针对污泥膨胀的特征提取主成分分析在线监测方法,其特征在于,所述时间序列是按照样本的观测顺序,依次计算出每个样本的SPE统计量或者T2统计量,并排成时间序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094212.7A CN113848307B (zh) | 2021-11-19 | 2021-11-19 | 一种针对污泥膨胀的特征提取主成分分析在线监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094212.7A CN113848307B (zh) | 2021-11-19 | 2021-11-19 | 一种针对污泥膨胀的特征提取主成分分析在线监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113848307A CN113848307A (zh) | 2021-12-28 |
CN113848307B true CN113848307B (zh) | 2024-06-07 |
Family
ID=78974616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111094212.7A Active CN113848307B (zh) | 2021-11-19 | 2021-11-19 | 一种针对污泥膨胀的特征提取主成分分析在线监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113848307B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114528479B (zh) * | 2022-01-20 | 2023-03-21 | 华南理工大学 | 一种基于多尺度异构图嵌入算法的事件检测方法 |
CN114636788B (zh) * | 2022-02-28 | 2022-12-16 | 华南理工大学 | 基于改进贡献图和格兰杰因果分析的污泥膨胀诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105259890A (zh) * | 2015-08-18 | 2016-01-20 | 浙江中烟工业有限责任公司 | 超高速包装设备的统计监测与故障诊断方法 |
CN111160776A (zh) * | 2019-12-30 | 2020-05-15 | 华东理工大学 | 利用分块主成分分析的污水处理过程异常工况检测方法 |
CN112114103A (zh) * | 2020-08-18 | 2020-12-22 | 华南理工大学 | 基于鲁棒自适应典型相关分析的污水厂污泥膨胀检测方法 |
CN113469061A (zh) * | 2021-07-03 | 2021-10-01 | 刘汉有 | 一种基于主成分分析法的燃气轮机故障检测方法 |
-
2021
- 2021-11-19 CN CN202111094212.7A patent/CN113848307B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105259890A (zh) * | 2015-08-18 | 2016-01-20 | 浙江中烟工业有限责任公司 | 超高速包装设备的统计监测与故障诊断方法 |
CN111160776A (zh) * | 2019-12-30 | 2020-05-15 | 华东理工大学 | 利用分块主成分分析的污水处理过程异常工况检测方法 |
CN112114103A (zh) * | 2020-08-18 | 2020-12-22 | 华南理工大学 | 基于鲁棒自适应典型相关分析的污水厂污泥膨胀检测方法 |
CN113469061A (zh) * | 2021-07-03 | 2021-10-01 | 刘汉有 | 一种基于主成分分析法的燃气轮机故障检测方法 |
Non-Patent Citations (2)
Title |
---|
Integrated design of monitoring, analysis and maintenance for filamentous sludge bulking in wastewater treatment;Yiqi Liu等;《Measurement》;第第155 卷卷;107548:1-11页 * |
基于特征提取典型相关分析的污泥膨胀检测方法;黄志鹏等;第32届中国过程控制会议(CPCC2021);第1页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113848307A (zh) | 2021-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113848307B (zh) | 一种针对污泥膨胀的特征提取主成分分析在线监测方法 | |
CN107025338B (zh) | 一种基于递归rbf神经网络的污泥膨胀故障辨识方法 | |
CN109086804B (zh) | 一种基于多源状态监测信息和可靠性特征融合的液压设备早期故障预测方法 | |
CN108564229A (zh) | 一种基于arima模型的工业污水进水量预测的方法 | |
CN111160776A (zh) | 利用分块主成分分析的污水处理过程异常工况检测方法 | |
CN106295800A (zh) | 一种基于递归自组织rbf神经网络的出水总氮tn智能检测方法 | |
CN108898215A (zh) | 一种基于二型模糊神经网络的污泥膨胀智能辨识方法 | |
CN112417765B (zh) | 一种基于改进师生网络模型的污水处理过程故障检测方法 | |
CN103632032A (zh) | 一种城市污水处理过程出水指标在线软测量预测方法 | |
CN108088974B (zh) | 一种厌氧同时反硝化产甲烷过程出水硝氮的软测量方法 | |
CN111126870A (zh) | 利用集成主成分分析的污水处理过程异常工况检测方法 | |
WO2021114320A1 (zh) | 一种oica和rnn融合模型的污水处理过程故障监测方法 | |
CN102778548B (zh) | 一种污水处理过程污泥膨胀指数预测方法 | |
CN114636654A (zh) | 一种通过噪声数据特征实现纳滤膜污染预测的方法 | |
CN117776336A (zh) | 水预处理方法及厌氧氨氧化水处理工艺 | |
CN106647274B (zh) | 一种连续生产过程中运行工况稳态判别方法 | |
CN116046048B (zh) | 一种基于数据驱动的污水处理传感器故障诊断方法 | |
CN116339275A (zh) | 基于全结构动态自回归隐变量模型的多尺度过程故障检测方法 | |
CN114781166B (zh) | 基于加权概率慢特征模型的污水处理过程软测量方法 | |
CN114372096B (zh) | 一种针对污泥膨胀的特征提取典型相关分析在线监测方法 | |
CN111126671A (zh) | 一种炼油生产中初馏塔冲塔故障预警的方法 | |
CN113449789B (zh) | 基于大数据的全光谱水质监测设备监测水质的质控方法 | |
CN109273058A (zh) | 一种用于厌氧过程挥发性脂肪酸超标预警的复合算法 | |
CN112591887B (zh) | 一种基于核主成分分析和贝叶斯网络的污泥膨胀诊断方法 | |
Ling et al. | A soft sensor based on influent mode discrimination neural network for a wastewater treatment process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |