CN112634347B - 一种活性污泥形态学和污泥体积指数svi软测量方法 - Google Patents

一种活性污泥形态学和污泥体积指数svi软测量方法 Download PDF

Info

Publication number
CN112634347B
CN112634347B CN202110016058.5A CN202110016058A CN112634347B CN 112634347 B CN112634347 B CN 112634347B CN 202110016058 A CN202110016058 A CN 202110016058A CN 112634347 B CN112634347 B CN 112634347B
Authority
CN
China
Prior art keywords
svi
model
activated sludge
feature
morphological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110016058.5A
Other languages
English (en)
Other versions
CN112634347A (zh
Inventor
赵立杰
邹世达
黄明忠
张宇红
范文玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Chemical Technology
Original Assignee
Shenyang University of Chemical Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Chemical Technology filed Critical Shenyang University of Chemical Technology
Priority to CN202110016058.5A priority Critical patent/CN112634347B/zh
Publication of CN112634347A publication Critical patent/CN112634347A/zh
Application granted granted Critical
Publication of CN112634347B publication Critical patent/CN112634347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • CCHEMISTRY; METALLURGY
    • C02TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02FTREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02F3/00Biological treatment of water, waste water, or sewage
    • C02F3/02Aerobic processes
    • C02F3/12Activated sludge processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W10/00Technologies for wastewater treatment
    • Y02W10/10Biological treatment of water, waste water, or sewage

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Geometry (AREA)
  • Hydrology & Water Resources (AREA)
  • Environmental & Geological Engineering (AREA)
  • Water Supply & Treatment (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Activated Sludge Processes (AREA)
  • Image Analysis (AREA)

Abstract

一种活性污泥形态学和污泥体积指数SVI软测量方法,涉及一种污水智能检测方法,本发明方法包括活性污泥显微图像特征提取、集成特征选择、SVI软测量模型建模、SVI预报四个步骤:其中活性污泥显微图像特征提取,用于提取生化池活性污泥显微图像絮体和丝状菌形态学特征;集成特征选择,采用皮尔逊相关系数法、最大互信息系数、Lasso回归模型、平均不纯度减少法、稳定性选择方法、递归特征消除法六种特征选择方法;SVI软测量模型,采用快速随机配置神经网络FastSCN方法,构建SVI模型;SVI预报,提取和选择新样本形态学特征。本发明能够有效提取活性污泥微生物形态学特征,可靠稳定预报污泥沉降性能SVI指标,为污水处理操作和优化提供出水水质和操作参数动态变化信息。

Description

一种活性污泥形态学和污泥体积指数SVI软测量方法
技术领域
本发明涉及一种污水智能检测方法,特别是涉及一种活性污泥形态学和污泥体积指数SVI软测量方法。是一种活性污泥形态学特征选择和污泥体积指数(Sludge VolumeIndex,SVI)软测量方法。
背景技术
城市污水处理厂多采用活性污泥法,依靠微生物群体新陈代谢活动,降解污水中有机污染物,具有处理效率高,操作费用低等优势。活性污泥系统的成功取决于微生物絮凝体和丝状细菌之间的生态系统平衡,一旦平衡遭到破坏,容易引发污泥膨胀,严重影响污水处理厂运行。污泥沉降性能是活性污泥工艺的关键。污泥体积指数SVI是表征污泥沉降性能的主要指标。因此及时准确预报活性污泥指数SVI,有助于及时了解污泥沉降性能,为早期污泥膨胀、污泥上浮等污水处理异常现象提供预警信息。
常规SVI指标依赖于实验室离线化验分析,具有耗时、费力、化验频次低等问题。由于污水水质成分复杂、进水波动不可控,动力学参数多、非线性强等综合复杂性,一般难以建立准确的机理模型。基于数据驱动的预测模型建立方法受到广泛关注,例如韩红桂等人(CN108898215A)基于数据建模方法出发,提出一种基于二型模糊神经网络的污泥膨胀智能辨识方法,选取与SVI相关的污水处理过程变量,溶解氧浓度DO,总氮TN,污泥负荷F/M,酸碱度pH,温度T作为软测量模型的输入,建立SVI软测量模型。
SVI指标与活性污泥内部结构、化学组成和微生物生态学特征高度相关,能够反映污水处理厂的运行工况动态变化和出水水质变化,因此基于活性污泥显微图像定量分析,为SVI预测提供了有效途径。其中,污泥形态学特征参数提取和选择是实现高可靠性SVI模型的关键。
发明内容
本发明的目的在于提供一种活性污泥形态学和污泥体积指数SVI软测量方法,本发明通过集成六种特征选择方法对所获取的丝状菌和絮体各27个形态学特征变量进行综合评价,选取一组与SVI相关性高、特征间冗余性低的形态学特征参数作为SVI模型输入变量,然后采用FastSCN学习方法训练SVI软测量模型,最后基于构建的SVI模型进行预报。
本发明的目的是通过以下技术方案实现的:
一种活性污泥形态学和污泥体积指数SVI软测量方法,所述方法包括活性污泥显微图像特征提取、集成特征选择、SVI软测量模型建模、SVI预报4个步骤:
所述活性污泥显微图像特征提取,用于提取生化池活性污泥显微图像絮体和丝状菌形态学特征;
所述集成特征选择,采用皮尔逊相关系数法、最大互信息系数、Lasso回归模型、平均不纯度减少法、稳定性选择方法、递归特征消除法六种特征选择方法,根据活性污泥显微图像絮体和丝状菌形状、结构、紧密度、大小等形态学特征得分,选取一组冗余性低且与SVI相关性较高的活性污泥絮体和丝状菌形态学特征;
所述SVI软测量模型,模型输入为活性污泥絮体和丝状菌k个形态学特征,模型输出是SVI值,采用快速随机配置神经网络FastSCN(Fast Stochastic ConfigurationNetwork)方法,构建SVI模型;
所述SVI预报,通过对新样本形态学特征提取和选择,利用已经构建的FastSCN污泥体积指数软测量模型,实现新样本SVI指标的预报。
所述的一种活性污泥形态学和污泥体积指数SVI软测量方法,所述活性污泥显微图像特征提取,形态学特征包括总闭合面数量N,闭合区域总面积TA,闭合区域平均面积A,长轴长度length,短轴长度width,周长P,凸周长PConvex,等效圆直径Deq,欧拉数NEuler,凸包络面积AConvex,外接矩形面积ABox,填充后面积AFilled,最大费雷特(Feret)直径max DF,最小费雷特直径min DF,最大费雷特角度max AF,最小费雷特角度min AF,形状因子(formfactor,FF),圆度(Roundness,R),回旋半径(radius of gyration,RG),纵横比(aspect ratio,AR),凸度(Convexity,C),分形维数(Fractal dimension,FD),坚固度(Solidity,Sol),充实度(Extent,Ext),孔率(Porosity,Poe),偏心率(Eccentricity,Ecc),紧密度(Compactness,Comp)。
所述的一种活性污泥形态学和污泥体积指数SVI软测量方法,所述集成特征选择,设X=[X1,X2,…,Xm]∈RN×m为N张图像分别对絮体和丝状菌提取的,共m种形态学特征,Y∈RN ×1则为对应的SVI指标;其中特征评分方法:
①所述皮尔逊相关系数(Pearson Correlation Coefficient)评价特征数据得分,
其中Sp(Xi)表示为第Xi个形态学特征的皮尔逊相关系数评价得分;
②所述最大互信息系数(Maximal Information Coefficient),计算每种特征变量的得分
上式I(Xi;Y)表示为Xi与Y的互信息,a、b分别表示为Xi、Y方向上所划分的网格区域数量,B被定义为B=N0.6
③所述Lasso回归模型计算所有特征变量的得分,Lasso模型权重计算如下
W=argmaxW||σ(XW)-Y||2+α||W||1 (3)
其中为‘S’型激活函数,SLasso(Xi)为归一化0到1的W取值;
④所述平均不纯度减少法(Mean Decrease Impurity,MDI),使用随机森林回归计算各个特征变量对所有树的平均不纯度减少量,作为各个变量的得分,
其中,es表示随机森林模型训练前的初始误差,表示为生成随机森林模型时,若分别添加特征节点,添加第i个特征节点时得到模型的输出;
⑤所述稳定性选择(Stability selection,SS)方法,这里采用Lasso回归模型使用稳定性选择对特征进行打分Sss(Xi);
⑥所述线性回归模型和递归特征消除法(Recursive feature elimination,RFE)计算各个特征得分SRFE(Xi);
活性污泥显微图像各种形态学特征综合得分为
S(Xi)=Sp(Xi)+SMIC(Xi)+SLasso(Xi)+SMDI(Xi)+SSS(Xi)+SRFE(Xi)i=1,…,m (5)
根据特征变量得分情况,计算得分向量[S(X1),S(X2),…,S(Xm)]的三分位数κ,S(xi)>k值作为Xi特征入选的条件,确定k个形态学特征作为SVI软测量模型输入
所述的一种活性污泥形态学和污泥体积指数SVI软测量方法,所述SVI软测量模型建模,基于快速随机配置神经网络FastSCN(Fast Stochastic Configuration Network)构建;设N个训练样本特征维数是k,则模型的增广形式的输入矩阵为Xs=[1,x1,…,xk]∈RN ×(k+1),其中特征变量x1,…,xk已进行零均值、1方差的标准化,对应的SVI指标为Y∈RN×1;FastSCN是一种增量构建的单隐含层全连接网络,包括输入层、输出层和隐含层,隐含层的激活函数采用双曲正切函数
假设已经建立了具有L-1个隐含层节点的神经网络为,
其中为第L-1个隐含层节点的增广形式的输入权重,bL-1为对应偏置项,βL-1为第L-1个隐含层节点的输出权重,在增量建模过程中,模型当前残差为
eL-1=Y-fL-1(Xs)∈RN×1 (8)
为了构建以使得eL≤eL-1,新加入的隐含层节点hL(Xs)需要满足如下条件,
其中0<r<1,{μL}是一个非负实数序列且满足limL→∞μL=0,μL≤(1-r);
为找到满足上述条件(9)的节点
对应的参数可以采用如下两种方式确定
①方式一,反求法确定输入权重,满足条件不等式(9)的可以表示为
其中被定义为
此时恰好满足条件表达式(9);上式(11)可以采用带有L2正则的最小二乘法计算,其中arctanh()是反双曲正切函数,0≤γw≤1为求解输入权重时的L2项惩罚系数,越大越严格,当γw取为0时,则该问题转变为标准最小二乘法求解;
②方式二,采用SCN方式批量添加节点,在输入权重范围λ∈[λ1,λ2,…λn]=Ω,生成Tmax组隐含层节点的候选集合并计算{ξL,1,…,ξL,m},选出满足ξ>0的多个候选节点添加到网络中,其中某个候选节点可表示为
其中实数序列在满足∪(-1,1)均匀分布中随机生成;
当HL=[h1,h2,…,hL]已确定,模型的全局输出权重β*采用如下方式计算,
数据样本数大于当前隐含层数(N>L)时
数据样本数小于等于当前隐含层数(N≤L)时
其中γ是求解输出权重L2正则项系数;
输入权重计算方式默认以方式一开始,用户自定义误差降速阈值a,当出现
||(eL-1-eL-2)/eL-2||2≤a (16)
切换到方式二,采用SCN方式批量添加节点,阈值a默认设置为0.01;
停止条件,该模型增量训练过程中,根据用户定义停止条件eTol和模型最大节点数Lmax,若eL-1<eTol或当前模型节点数达到Lmax时,训练停止;
所述的一种活性污泥形态学和污泥体积指数SVI软测量方法,所述SVI的预报,对新活性污泥样本M张显微图像提取形态学特征,根据集成特征选择确定的k个形态学特征,获得活性污泥形态特征数据XTest=[X1,…,XM]T∈RM×k,利用训练好的FastSCN形态学特征污泥体积指数软测量模型对新数据进行预报,SVI估计值
本发明的优点与效果是:
本发明提供一种活性污泥形态学特征选择和污泥体积指数SVI软测量方法,通过活性污泥镜检显微图像,获得多个丝状菌和絮体的形态学特征,并采用6种特征选择算法,选取一组与SVI密切相关、变量间冗余性低的形态学特征作为模型的输入,来训练FastSCN网络,实现对活性污泥法中SVI指标的测量。
本发明的技术构成,包括活性污泥显微图像特征提取、集成特征选择、SVI软测量模型建模、SVI预报四个步骤:其中活性污泥显微图像特征提取,用于提取生化池活性污泥显微图像絮体和丝状菌形态学特征;集成特征选择,采用皮尔逊相关系数法、最大互信息系数、Lasso回归模型、平均不纯度减少法、稳定性选择方法、递归特征消除法六种特征选择方法,根据活性污泥显微图像絮体和丝状菌形状、结构、紧密度、大小等形态学特征得分,选取一组与SVI相关性高、特征间冗余性低的活性污泥形态学特征;SVI软测量模型,采用快速随机配置神经网络FastSCN(Fast Stochastic Configuration Network)方法,构建SVI模型;SVI预报,提取和选择新样本形态学特征,利用已经构建的FastSCN污泥体积指数软测量模型,实现新样本SVI指标的预报。本发明能够有效提取活性污泥微生物形态学特征,可靠稳定预报污泥沉降性能SVI指标,为污水处理操作和优化提供出水水质和操作参数动态变化信息。
本发明的创新主要体现在:
(1)本发明针对活性污泥法SVI预报问题,采用27种图像形态学特征,包括总闭合面数量N,闭合区域总面积TA,闭合区域平均面积A,长轴长度length,短轴长度width,周长P,凸周长PConvex,等效圆直径Deq,欧拉数NEuler,凸包络面积AConvex,外接矩形面积ABox,填充后面积AFilled,最大费雷特(Feret)直径max DF,最小费雷特直径min DF,最大费雷特角度maxAF,最小费雷特角度min AF,形状因子(form factor,FF),圆度(Roundness,R),回旋半径(radius of gyration,RG),纵横比(aspect ratio,AR),凸度(Convexity,C),分形维数(Fractal dimension,FD),坚固度(Solidity,Sol),充实度(Extent,Ext),孔率(Porosity,Por),偏心率(Eccentricity,Ecc),紧密度(Compactness,Comp),分别对絮体和丝状菌区域图像进行特征提取;然后用集成特征选择,利用皮尔逊相关系数法、最大互信息系数法、Lasso回归模型法、平均不纯度减少法、稳定性选择法、递归特征消除法六种方法来评价各个形态学特征与SVI的相关程度,并在皮尔逊相关系数法中额外考虑特征间自相关程度,根据所定义的集成特征选择方法对各个特征综合评分,选择出与SVI相关性较高、特征间冗余性较低的一组特征子集作为SVI预报模型的输入变量,确定了用于SVI建模的有效特征。
(2)本发明采用FastSCN网络,对选取出的特征变量进行快速建模,所建立的模型结构较简单且泛化性能好,SVI推理时间短,易于部署使用。
附图说明
图1是活性污泥形态学特征选择和污泥体积指数SVI软测量方法流程图;
图2是污泥体积指数SVI模型测试结果对比曲线。
具体实施方式
下面结合附图所示实施例对本发明进行详细说明。
实现本发明步骤如下:
(1)从活性污泥处理流程中获取活性污泥镜检显微图像,针对絮体和丝状菌分别进行27种形态学特征提取。具体特征说明如表1所示
表1形态学特征描述
(2)使用多种特征选择方法的组合,对活性污泥形态学特征数据进行评分,根据得分总和,并考虑特征间相关性,以选取一组冗余性较低,并与预测指标SVI相关度较高的形态学特征作为模型的输入变量。设X=[X1,X2,…,Xm]∈RN×m为N张图像分别对絮体和丝状菌提取,共m种形态学特征组成的变量数据,Y∈RN×1则为所有图像对应的SVI指标。分别使用如下特征评分方法;
(a).使用皮尔逊相关系数(Pearson Correlation Coefficient)评价特征数据得分,表达式
其中Sp(Xi)表示为第Xi个形态学特征的皮尔逊相关系数评价得分
(b).使用最大互信息系数(Maximal Information Coefficient),计算每种特征变量的得分,表达式如下
上式I(Xi;Y)表示为Xi与Y的互信息a、b分别表示为Xi、Y方向上所划分的网格区域数量,B被定义为B=N0.6.
(c).使用Lasso回归模型计算所有特征变量的得分,Lasso模型权重计算如下
W=argmaxW||σ(XW)-Y||2+α||W||1 (3)
其中为‘S’型激活函数,SLasso(Xi)为归一化0到1的W取值;
(d).平均不纯度减少法(Mean Decrease Impurity,MDI),使用随机森林回归计算各个特征变量对所有树的平均不纯度减少量,作为各个变量的得分,
其中,es表示随机森林模型训练前的初始误差,表示为生成随机森林模型时,若分别添加特征节点,添加第i个特征节点时得到模型的输出。
(e).使用稳定性选择(Stability selection,SS)方法,这里采用Lasso回归模型使用稳定性选择对特征进行打分SSS(Xi)
(f).使用线性回归模型和递归特征消除法(Recursive feature elimination,RFE)计算各个特征得分SRFE(Xi)。
由这六种特征选择方法,分别获得活性污泥显微镜下各种形态学特征变量的得分为
S(Xi)=Sp(Xi)+SMIC(Xi)+SLasso(Xi)+SMDI(Xi)+SSS(Xi)+SRFE(Xi),i=1,…,m(5)
根据特征变量得分情况,计算得分向量[S(X1),S(X2),…,S(Xm)]的三分位数κ,S(xi)>k值作为Xi特征入选的条件。根据该方法,入选的絮体的形态学特征变量有k个。
(3)设计一种使用形态学特征变量预报SVI的软测量模型,使用可以快速建模的随机配置神经网络模型FastSCN(Fast Stochastic Configuration Network),以上述选择的27个形态学特征变量作为模型的输入,SVI值作为模型的输出,快速建立SVI的软测量模型。FastSCN是一种增量构建的单隐含层全连接网络,包括输入层、输出层和隐含层,隐含层的激活函数采用双曲正切函数
若有N个训练样本且特征维数是k,则模型的增广形式的输入矩阵为Xs=[1,x1,…,xk]∈Rx×(k+1),其中特征变量x1,…,xk已进行零均值、1方差的标准化,对应的SVI指标为Y∈RN×1,并假设已经建立了具有L-1个隐含层节点的神经网络为,
其中为第L-1个隐含层节点的增广形式的输入权重,bL-1为对应偏置项,βL-1为第L-1个隐含层节点的输出权重,在增量建模过程中,模型当前残差为
eL-1=Y-fL-1(Xs)∈RN×1 (8)
为了构建以使得eL≤eL-1,新加入的隐含层节点hL(Xs)需要满足如下条件(Wang et al.2017),
其中0<r<1,{μL}是一个非负实数序列且满足limL→∞μL=0,μL≤(1-r)。
为找到满足上述条件表达式(9)的节点
对应的参数可以采用如下两种方式确定
①方式一,反求法确定输入权重,满足条件不等式(9)的可以表示为
其中被定义为
此时/>恰好满足条件表达式(9)。上式(11)可以采用带有L2正则的最小二乘法计算,其中arctanh()为反双曲正切函数,0≤γw≤1为求解输入权重时的L2项惩罚系数,越大越严格,当γw取为0时,则该问题转变为标准最小二乘法求解。
②方式二,采用SCN方式批量添加节点,在输入权重范围λ∈[λ1,λ2,…λn]=Ω,生成Tmax组隐含层节点的候选集合并计算{ξL,1,…,ξL,m},选出满足ξ>0的多个候选节点添加到网络中,其中某个候选节点可表示为
其中实数序列在满足∪(-1,1)均匀分布中随机生成。
当HL=[h1,h2,…,hL]已确定,模型的全局输出权重β*采用如下方式计算,
①数据样本数大于当前隐含层数(N>L)时
②数据样本数小于等于当前隐含层数(N≤L)时
其中γ是求解输出权重L2正则项系数。
输入权重计算方式默认以方式一开始,用户自定义误差降速阈值a,当出现
||(eL-1-eL-2)/eL-2||2≤a (16)
切换到方式二,采用SCN方式批量添加节点,阈值a默认设置为0.01。
停止条件,该模型增量训练过程中,根据用户定义停止条件eTol和模型最大节点数Lmax,若eL-1<eTol或当前模型节点数达到Lmax时,训练停止。
(4)SVI的预报,提取新活性污泥样本M张显微图像形态学特征,根据集成特征选择确定的k个形态学特征,获得活性污泥形态学特征数据XTest=[X1,…,XM]T∈RM×k,利用训练好的FastSCN形态学特征污泥体积指数软测量模型对新数据进行预报,则SVI估计值如下
实施例
实验数据来自与某污水处理厂活性污泥工艺不同观测点采集的污泥样本,制成载玻片,通过显微镜下观察获取的33种不同运行条件下共计353张图像,以及人工化验获得的对应SVI值,这些图像在放大倍数为100倍的光学显微镜下获取的,分辨率为2048×1536,通过人工分割方式获取絮体和丝状菌较为精确的区域信息。实验样本被划分为185张训练,168张用于测试。
从图1建模的流程图可以看出,整体过程包括下述步骤;
步骤一,提取形态学特征,从活性污泥处理流程中获取353活性污泥镜检显微图像,对每张图像中的絮体和丝状菌区域,分别进行27种形态学特征提取,表1给出了形态学特征提取相关的公式及其说明。
步骤二,形态学特征的选择,使用多种特征选择方法的组合,对活性污泥形态学特征数据进行评分,根据得分总和,并考虑特征间相关性,以选取一组冗余性较低,并与预测指标SVI相关度较高的形态学特征作为模型的输入变量。设Xo=[X1,X2,…,X54]∈R353×54为353张图像分别对絮体和丝状菌提取的27种形态学特征组成的变量数据,Y∈R353×1则为所有图像对应的SVI指标。分别使用如下特征评分方法;
(a).使用皮尔逊相关系数(Pearson Correlation Coefficient)评价特征数据得分,表达式
其中Sp(Xi)表示为第xi个形态学特征的皮尔逊相关系数评价得分;
(b).使用最大互信息系数(Maximal Information Coefficient),计算每种特征变量的得分,表达式如下
上式I(Xi;Y)表示为Xi与r的互信息,a、b分别表示为xi、Y方向上所划分的网格区域数量,B被定义为B=N0.6.
(c).使用Lasso回归模型计算所有特征变量的得分,Lasso模型权重计算如下
W=argrnaxW||σ(XW)-Y||2+α||W||1 (20)
其中为‘S’型激活函数,SLasso(Xi)为归一化0到1的W取值;
(d).平均不纯度减少法(Mean Decrease Impurity,MDI),使用随机森林回归计算各个特征变量对所有树的平均不纯度减少量,作为各个变量的得分,
其中,es表示随机森林模型训练前的初始误差,表示为生成随机森林模型时,若分别添加特征节点,添加第i个特征节点时得到模型的输出。
(e).使用稳定性选择(Stability selection,SS)方法,这里采用Lasso回归模型使用稳定性选择对特征进行打分SSS(Xi)
(f).使用线性回归模型和递归特征消除法(Recursive feature elimination,RFE)计算各个特征得分SRFE(Xi)。
由这六种特征选择方法,分别获得活性污泥显微镜下各种形态学特征变量的得分为
S(Xi)=Sp(Xi)+SMIC(Xi)+SLasso(Xi)+SMDI(Xi)+SSS(Xi)+SRFE(Xi),i=1,…,m (22)
经过上述6种方法计算,表2给出了絮体和丝状菌共计54个特征变量在6种特征选择方法上的详细得分表,其中对丝状菌提取的对应形态学特征以“s_X”方式表示。
表2特征变量得分详细表
/>
/>
计算得分向量[S(X1),S(X2),…,S(Xm)]的三分位数κ=1.353,S(Xi)>κ值作为Xi特征入选的条件。根据该方法,入选的絮体的形态学特征变量有15个,包括絮体数量N,絮体总面积TA,等效椭圆长轴长length和短轴长width,等效圆直径Deq,凸包络面积AConvex,最小外接矩形面积ABox,孔洞填充后面积AFilled,最大和最小费雷特直径max DF,min DF,最小费雷特角度min AF,形状因子FF,圆度R,凸度C,分形维数FD;入选的丝状菌形态学特征变量有12个,包括丝状菌平均面积s_A,等效圆直径s_Deq,孔洞填充后面积s_AFilled,最小费雷特直径min s_DF,形状因子s_FF,回转半径s_RG,纵横比s_AR,凸度s_C,分形维数s_FD,坚固度s_Sol,充实度s_Ext,紧密度s_Comp.
步骤三,训练用于SVI预报的FastSCN模型,以上述选择的27个形态学特征变量组成的数据作为模型的输入,SVI值作为模型的输出,快速建立SVI的软测量模型。FastSCN是一种增量构建的单隐含层全连接网络,包括输入层、输出层和隐含层,隐含层的激活函数采用双曲正切函数
模型训练样本有185个且特征维数是27,则模型的增广形式的输入矩阵为Xs=[1,x1,…,x27]∈R185×28,其中特征变量x1,…,x27已进行零均值、1方差的标准化,对应的SVI指标为Y∈R185×1并假设已经建立了具有L-1个隐含层节点的神经网络为,
其中为第L-1个隐含层节点的增广形式的输入权重,bL-1为对应偏置项,βL-1为第L-1个隐含层节点的输出权重,在增量建模过程中,模型当前残差为
eL-1=Y-fL-1(Xs)∈R185×1 (25)
为了构建以使得eL≤eL-1,新加入的隐含层节点hL(Xs)需要满足如下条件,
其中0<r<1,{μL}是一个非负实数序列且满足limL→∞μL=0,μL≤(1-r)。
为找到满足上述条件表达式(26)的节点
对应的参数可以采用如下两种方式确定
①方式一,反求法确定输入权重,满足条件不等式(9)的可以表示为
其中/>被定义为
此时恰好满足条件表达式(26)。上式(28)可以采用带有L2正则的最小二乘法计算,其中arctanh()为反双曲正切函数,0≤γw≤1为求解输入权重时的L2项惩罚系数,越大越严格,当γw取为0时,则该问题转变为标准最小二乘法求解。
②方式二,采用SCN方式批量添加节点,在输入权重范围λ∈[λ1,λ2,…λn]=Ω,生成Tmax组隐含层节点的候选集合并计算{ξL,1,…,ξL,m},选出满足ξ>0的多个候选节点添加到网络中,其中某个候选节点可表示为
其中实数序列在满足∪(-1,1)均匀分布中随机生成;
当HL=[h1,h2,…,hL]已确定,模型的全局输出权重β*采用如下方式计算,
③数据样本数大于当前隐含层数(N>L)时
④数据样本数小于等于当前隐含层数(N≤L)时
其中γ是求解输出权重L2正则项系数。
输入权重计算方式默认以方式一开始,用户自定义误差降速阈值a,当出现
||(eL-1-eL-2)/eL-2||2≤a (33)
切换到方式二,采用SCN方式批量添加节点,阈值a默认设置为0.01。
停止条件,该模型增量训练过程中,根据用户定义停止条件eTol和模型最大节点数Lmax,若eL-1<eTol或当前模型节点数达到Lmax时,训练停止。
步骤四,SVI的预报,通过镜检取样获取33组不重复的活性污泥显微图像168张,并通过分割方法获得对应丝状菌和絮体的区域,根据上面选取的形态学特征并计算,获得测试数据并利用训练好的FastSCN形态学特征污泥体积指数软测量模型对新数据进行预报,第i组有Mi张图像,其输出结果的均值作为SVI估计值
SVI模型最终预测结果和实际真实输出曲线如图2所示。
本发明采用基于FastSCN网络及集成特征选择方法。集成的6种方法包括:(a)皮尔逊相关系数法、(b)最大互信息系数法、(c)Lasso回归模型法、(d)平均不纯度减少法、(e)稳定性选择法、(f)递归特征消除法。只要采用这6种特征选择方法确定的活性污泥形态学特征并使用FastSCN建模,用于SVI软测量方法的研究都属于本发明范围。

Claims (1)

1.一种活性污泥形态学和污泥体积指数SVI软测量方法,其特征在于,所述方法包括活性污泥显微图像特征提取、集成特征选择、SVI软测量模型建模、SVI预报4个步骤:
所述活性污泥显微图像特征提取,用于提取生化池活性污泥显微图像絮体和丝状菌形态学特征;
所述集成特征选择,采用皮尔逊相关系数法、最大互信息系数、Lasso回归模型、平均不纯度减少法、稳定性选择方法、递归特征消除法六种特征选择方法,根据活性污泥显微图像絮体和丝状菌的形态学特征得分,选取一组冗余性低且与SVI相关性较高的活性污泥絮体和丝状菌形态学特征;
所述SVI软测量模型,模型输入为活性污泥絮体和丝状菌k个形态学特征,模型输出是SVI值,采用快速随机配置神经网络FastSCN(Fast Stochastic Configuration Network)方法,构建SVI模型;
所述SVI预报,通过对新样本形态学特征提取和选择,利用已经构建的FastSCN污泥体积指数软测量模型,实现新样本SVI指标的预报;
所述活性污泥显微图像絮体和丝状菌形态学特征提取,形态学特征包括总闭合面数量N,闭合区域总面积TA,闭合区域平均面积A,长轴长度length,短轴长度width,周长P,凸周长PConvex,等效圆直径Deq,欧拉数NEuler,凸包络面积AConvex,外接矩形面积ABox,填充后面积AFilled,最大费雷特(Feret)直径max DF,最小费雷特直径min DF,最大费雷特角度max AF,最小费雷特角度min AF,形状因子(form factor,FF),圆度(Roundness,R),回旋半径(radiusof gyration,RG),纵横比(aspect ratio,AR),凸度(Convexity,C),分形维数(Fractaldimension,FD),坚固度(Solidity,Sol),充实度(Extent,Ext),孔率(Porosity,Por),偏心率(Eccentricity,Ecc)和紧密度(Compactness,Comp);
所述集成特征选择,设X=[X1,X2,…,Xn]∈RN×m为N张图像分别对絮体和丝状菌提取的,共m种形态学特征,Y∈RN×1则为对应的SVI指标;其中特征评分方法:
①所述皮尔逊相关系数(Pearson Correlation Coefficient)评价特征数据得分,
其中Sp(Xi)表示为第Xi个形态学特征的皮尔逊相关系数评价得分;
②所述最大互信息系数(Maximal Information Coefficient),计算每种特征变量的得分
上式I(Xi;Y)表示为Xi与Y的互信息,a、b分别表示为Xi、Y方向上所划分的网格区域数量,B被定义为B=N0.6
③所述Lasso回归模型计算所有特征变量的得分,Lasso模型权重计算如下
其中为‘S’型激活函数,SLasso(Xi)为归一化0到1的W取值;
④所述平均不纯度减少法(Mean Decrease Impurity,MDI),使用随机森林回归计算各个特征变量对所有树的平均不纯度减少量,作为各个变量的得分,
其中,es表示随机森林模型训练前的初始误差,表示为生成随机森林模型时,若分别添加特征节点,添加第i个特征节点时得到模型的输出;
⑤所述稳定性选择(Stability selection,SS)方法,这里采用Lasso回归模型使用稳定性选择对特征进行打分SSS(Xi);
⑥所述线性回归模型和递归特征消除法(Recursive feature elimination,RFE)计算各个特征得分SRFE(Xi);
活性污泥显微图像各种形态学特征综合得分为S(Xi)=Sp(Xi)+SMIC(Xi)+SLasso(Xi)+SMDI(Xi)+SSS(Xi)+SRFE(Xi)i=1,…,m (5)
根据特征变量得分情况,计算得分向量[S(X1),S(X2),....,S(Xm)]的三分位数κ,S(Xi)>κ值作为Xi特征入选的条件,确定k个形态学特征作为SVI软测量模型输入;
所述SVI软测量模型建模,基于快速随机配置神经网络FastSCN(Fast StochasticConfiguration Network)构建;设N个训练样本特征维数是k,则模型的增广形式的输入矩阵为Xs=[1,x1,…,xk]∈RN×(k+1),其中特征变量x1,…,xk已进行零均值、1方差的标准化,对应的SVI指标为Y∈RN×1;FastSCN是一种增量构建的单隐含层全连接网络,包括输入层、输出层和隐含层,隐含层的激活函数采用双曲正切函数
假设已经建立了具有L-1个隐含层节点的神经网络为,
其中为第L-1个隐含层节点的增广形式的输入权重,bL-1为对应偏置项,βL-1为第L-1个隐含层节点的输出权重,在增量建模过程中,模型当前残差为
eL-1=Y-fL-1(Xs)∈RN×1 (8)
为了构建以使得eL≤eL-1,新加入的隐含层节点hL(Xs)需要满足如下条件,
其中0<r<1,{μL}是一个非负实数序列且满足
为找到满足上述条件(9)的节点
对应的参数可以采用如下两种方式确定
①方式一,反求法确定输入权重,满足条件不等式(9)的可以表示为
其中被定义为
此时恰好满足条件表达式(9);上式(11)可以采用带有L2正则的最小二乘法计算,其中arctanh()是反双曲正切函数,0≤γw≤1为求解输入权重时的L2项惩罚系数,越大越严格,当γw取为0时,则该问题转变为标准最小二乘法求解;
②方式二,采用SCN方式批量添加节点,在输入权重范围λ∈[λ1,λ2,…λn]=Ω,生成Tmax组隐含层节点的候选集合并计算{ξL,1,…,ξL,m},选出满足ξ>0的多个候选节点添加到网络中,其中某个候选节点可表示为
其中实数序列在满足U(-1,1)均匀分布中随机生成;
当HL=[h1,h2,…,hL]已确定,模型的全局输出权重β*采用如下方式计算,
数据样本数大于当前隐含层数(N>L)时
数据样本数小于等于当前隐含层数(N≤L)时
其中γ是求解输出权重L2正则项系数;
输入权重计算方式默认以方式一开始,用户自定义误差降速阈值a,当出现
||(eL-1-eL-2)/eL-2||2≤a (16)
切换到方式二,采用SCN方式批量添加节点,阈值a默认设置为0.01;
停止条件,该模型增量训练过程中,根据用户定义停止条件eTol和模型最大节点数Lmax,若eL-1<eTol或当前模型节点数达到Lmax时,训练停止;
SVI的预报,对新活性污泥样本M张显微图像提取形态学特征,根据集成特征选择确定的k个形态学特征,获得活性污泥形态特征数据XTest=[X1,…,XM]T∈RM×k,利用训练好的FastSCN形态学特征污泥体积指数软测量模型对新数据进行预报,SVI估计值
CN202110016058.5A 2021-01-07 2021-01-07 一种活性污泥形态学和污泥体积指数svi软测量方法 Active CN112634347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110016058.5A CN112634347B (zh) 2021-01-07 2021-01-07 一种活性污泥形态学和污泥体积指数svi软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110016058.5A CN112634347B (zh) 2021-01-07 2021-01-07 一种活性污泥形态学和污泥体积指数svi软测量方法

Publications (2)

Publication Number Publication Date
CN112634347A CN112634347A (zh) 2021-04-09
CN112634347B true CN112634347B (zh) 2023-09-15

Family

ID=75290990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110016058.5A Active CN112634347B (zh) 2021-01-07 2021-01-07 一种活性污泥形态学和污泥体积指数svi软测量方法

Country Status (1)

Country Link
CN (1) CN112634347B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116135797B (zh) * 2023-04-19 2023-07-04 江苏海峡环保科技发展有限公司 污水处理智能控制系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63175696A (ja) * 1987-01-16 1988-07-20 Meidensha Electric Mfg Co Ltd Sviを用いたバルキング制御方法
JPH02229597A (ja) * 1989-03-03 1990-09-12 Ebara Infilco Co Ltd 活性汚泥の画像認識方法
CN102494979A (zh) * 2011-10-19 2012-06-13 北京工业大学 一种污泥沉降体积指数svi的软测量方法
CN103605882A (zh) * 2013-10-28 2014-02-26 北京工业大学 一种丝状菌污泥膨胀指数svi特征模型的构建方法
CN111177971A (zh) * 2019-12-13 2020-05-19 沈阳化工大学 一种污泥体积指数分布式软测量方法
CN111192236A (zh) * 2019-12-13 2020-05-22 沈阳化工大学 一种基于活性污泥相差显微图像的svi测量方法
CN111814868A (zh) * 2020-07-03 2020-10-23 苏州动影信息科技有限公司 一种基于影像组学特征选择的模型、构建方法和应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63175696A (ja) * 1987-01-16 1988-07-20 Meidensha Electric Mfg Co Ltd Sviを用いたバルキング制御方法
JPH02229597A (ja) * 1989-03-03 1990-09-12 Ebara Infilco Co Ltd 活性汚泥の画像認識方法
CN102494979A (zh) * 2011-10-19 2012-06-13 北京工业大学 一种污泥沉降体积指数svi的软测量方法
CN103605882A (zh) * 2013-10-28 2014-02-26 北京工业大学 一种丝状菌污泥膨胀指数svi特征模型的构建方法
CN111177971A (zh) * 2019-12-13 2020-05-19 沈阳化工大学 一种污泥体积指数分布式软测量方法
CN111192236A (zh) * 2019-12-13 2020-05-22 沈阳化工大学 一种基于活性污泥相差显微图像的svi测量方法
CN111814868A (zh) * 2020-07-03 2020-10-23 苏州动影信息科技有限公司 一种基于影像组学特征选择的模型、构建方法和应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Researches of Intelligent Control System for the Sludge Activity in the Aeration Tank of Wastewater Treatment;Shaode ZHANG等;《Chinese Control and Decision Conference》;756-762 *
Segmentation of Activated Sludge Phase Contrast Microscopy Images Using U-Net Deep Learning Model;Zhao L J等;《Sensors and Materials》;第31卷(第6期);2013-2028 *
基于正则化随机配置网络的球磨机工况识别;赵立杰等;《控制工程》;1-7 *

Also Published As

Publication number Publication date
CN112634347A (zh) 2021-04-09

Similar Documents

Publication Publication Date Title
US10570024B2 (en) Method for effluent total nitrogen-based on a recurrent self-organizing RBF neural network
CN104182794B (zh) 一种基于神经网络的污水处理过程出水总磷tp软测量方法
CN110969346B (zh) 基于指标筛选的流域水生态功能分区治理需求评价方法
CN109657790B (zh) 一种基于pso的递归rbf神经网络出水bod预测方法
CN106056127A (zh) 一种带模型更新的gpr在线软测量方法
CN112989704B (zh) 一种基于de算法的irfm-cmnn出水bod浓度预测方法
CN110889085A (zh) 基于复杂网络多元在线回归的废水智能监控方法及系统
CN111242380A (zh) 一种基于人工智能算法的湖(库)富营养化预测方法
CN110309609A (zh) 一种基于粗糙集和小波神经网络的建筑室内空气品质评价方法
CN109858755B (zh) 一种评价水体质量的方法
CN112765902B (zh) 一种基于TentFWA-GD的RBF神经网络的农村生活污水处理过程中COD浓度的软测量建模方法
CN112634347B (zh) 一种活性污泥形态学和污泥体积指数svi软测量方法
CN109978024B (zh) 一种基于互联模块化神经网络的出水bod预测方法
CN110163537B (zh) 基于梯形云模型的水体富营养化评价方法
CN114580266A (zh) 一种陆源污染物智能综合评价方法及系统
CN109408896A (zh) 一种污水厌氧处理产气量多元智能实时监控方法
CN105160422B (zh) 基于自组织级联神经网络的污水处理出水总磷预测方法
CN114242156A (zh) 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统
CN112001436A (zh) 一种基于改进的极限学习机的水质分类方法
CN112446168A (zh) 一种基于mic及rbfnn的出水bod浓度软测量方法
CN114417740B (zh) 一种深海养殖态势感知方法
Varkeshi et al. Predicting the performance of Gorgan wastewater treatment plant using ANN-GA, CANFIS, and ANN models
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
Kiran et al. Classification of groundwater by applying Simplified Fuzzy Adaptive Resonance Theory.
Yoo et al. Adaptive modeling and classification of the secondary settling tank

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant