CN104914227B - 基于多高斯核自优化相关向量机的污水水质软测量方法 - Google Patents

基于多高斯核自优化相关向量机的污水水质软测量方法 Download PDF

Info

Publication number
CN104914227B
CN104914227B CN201510332330.5A CN201510332330A CN104914227B CN 104914227 B CN104914227 B CN 104914227B CN 201510332330 A CN201510332330 A CN 201510332330A CN 104914227 B CN104914227 B CN 104914227B
Authority
CN
China
Prior art keywords
parameter
sigma
model
nuclear parameter
optimizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510332330.5A
Other languages
English (en)
Other versions
CN104914227A (zh
Inventor
许玉格
刘莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201510332330.5A priority Critical patent/CN104914227B/zh
Publication of CN104914227A publication Critical patent/CN104914227A/zh
Application granted granted Critical
Publication of CN104914227B publication Critical patent/CN104914227B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多高斯核自优化相关向量机的污水水质软测量方法,包括以下步骤:1)剔除污水输入和输出的数据中的异常点,由于各输入变量量纲的不同,对其进行归一化处理,归一化到[0,1]区间中;2)多高斯核函数相关向量机软测量模型模块;3)多高斯核函数核参数自优化算法;4)遗传优化算法对初始参数寻优模块;5)多高斯核函数自优化相关向量机软测量模型建模。本发明通过自优化方法确定各尺度上的核参数,运用遗传优化算法对初始参数寻优,建立最优模型,在保证模型收敛性和稀疏性的情况下,有效提高污水中BOD输出精度。

Description

基于多高斯核自优化相关向量机的污水水质软测量方法
技术领域
本发明涉及软测量的技术领域,尤其是指一种基于多高斯核自优化相关向量机的污水水质软测量方法。
背景技术
随着全球经济的增长和人们生活水平的提高,城市生活污水和工业污水的排放量日益增大,有限水资源受到不同程度的污染,防止水污染保护人们赖以生存的水环境是人类面临的当务之急。保护水资源的一个重要方面就是要提高污水处理的技术水平和检测手段。污水处理过程相当复杂,具有参数时变,多变量耦合、强非线性,严重滞后等特点。使得出水水质不易在线测量,废水处理成本高。污水处理过程中一些自动化检测设备、仪表的功能还不完善,处理周期太长,远远达不到国家对环境保护的要求。同时国家对环境保护的投入加大,污水处理技术越来越受到更多的关注。国家发展规划中明确提出要研发并推广低能耗、有效的污水处理技术。解决污水生物处理过程中参数在线测量的方法有两种:一是改进测量仪表,二是深入研究软测量技术,这对于出水的优化排放有着重大的实际意义和应用价值。由于在线仪表设备投资大,维护困难以及分析周期长、准确性不高,而软仪表成本低廉,测量具有实时性,尽管IAWQ推出ASMs和ADM1等机理模型,但实际的污水处理现场条件太多,过程太复杂,很难建立精确的机理模型,而神经网络、支持向量机等非机理建模都存在局限性。相关向量机具有解更稀疏、核函数选择更自由,泛化能力更强,鲁棒性更好等优点,使其在污水领域的应用中越来越受重视。但是传统高斯核函数核参数均匀统一,限制了rvm模型的灵活性和预测精度。
污水排放标准中,衡量是否达标的参数指标有:化学需氧量COD、生化需氧量BOD、氨氮、磷、固体悬浮物等。其中生化需氧量BOD和化学需氧量COD反映水被有机污染的程序,BOD/COD的比率反映出了污水的生物降解能力。这两个参数的测量对控制污水处理具有非常重要的价值。化学需氧量COD是指,水样在一定条件下,以氧化1升水样中还原性物质所消耗的氧化剂的量为指标,折算成每升水样全部被氧化后,需要的氧的毫克数,以mg/L表示。生化需氧量BOD是指微生物在一定的温度和时间条件下分解氧化有机物所消耗的溶解氧量,以mg/L表示。
现在的污水处理一般都采用稀释法、传感器等测量污水中BOD、COD的浓度,但由于分析测定这两个指标的周期较长,测量中时常出现误差,不能及时反应污水处理的现场情况,因而污水控制系统存在着较大的延时,不能发挥其最佳的性能。
软测量技术就是利用易测量过程变量,依据这些易测量的过程变量和难以直接测量的待测过程变量之间的数学模型,通过各种数学计算和估计方法,用计算机软件实现待测量过程变量的测量。是近年在过程控制和检测领域涌现的一种新技术。软测量作为现代复杂过程工业中较难甚至无法由硬件在线检测参量实时估计的有效手段,具有投资低、维护保养简单等优点。将软测量技术用于污水处理过程,能降低污水处理厂的能耗,节约成本,避免污水处理过程中严重滞后等不足。但是污水过程非常复杂,传统的机理建模无法适应,而神经网络、支持向量机等非机理建模都存在局限性,本发明提出多高斯核函数自优化相关向量机模型,打破了传统高斯核函数参数均匀统一对预测精度的限制,使模型更灵活。在保证模型收敛性和稀疏性的情况下,有效提高污水中BOD输出精度。该模型是对基本rvm的改进,不仅离线情况下获得良好效果,在此基础上展开基于多尺度高斯核自优化相关向量机的污水出水在线软测量研究也很有意义。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于多高斯核自优化相关向量机的污水水质软测量方法,通过自优化方法确定各尺度上的核参数,运用遗传优化算法对初始参数寻优,建立最优模型。在保证模型收敛性和稀疏性的情况下,有效提高污水中BOD输出精度。
为实现上述目的,本发明所提供的技术方案为:基于多高斯核自优化相关向量机的污水水质软测量方法,包括以下步骤:
1)剔除污水输入和输出的数据中的异常点,由于各输入变量量纲的不同,对其进行归一化处理,归一化到[0,1]区间中;
2)多高斯核函数相关向量机软测量模型模块,其计算公式:
给定一组输入和目标值xn∈RM,且考虑目标函数只是一个标量,根据概率方程式,假设目标函数是模型的样本并且带有附加噪声:
tn=y(xn,w)+εn (1)
式中εn为附加噪声,服从(0,σ2)的高斯分布,且彼此间相互独立,因此p(tn|y(xn),σ2)服从高斯分布,其分布由期望y(xn)和方差σ2决定,其中y(xn)可由核函数的加权模型表示:
y ( x , w ) = Σ i = 1 N w i k ( x , x i ) + w 0 - - - ( 2 )
wi为模型权值;k是核函数,φi=k(x,xi);t=[t1,t2,...tn]T为N维列向量,假设tn服从独立分布,数据集的似然估计概率为:
p ( t | w , σ 2 ) = ( 2 πσ 2 ) - N / 2 exp { - 1 2 σ 2 | | t - Φ w | | 2 } - - - ( 3 )
φ(xn)=[1,k(xn,x1),k(xn,x2),...k(xn,xn)]T为(N+1)*1维矩阵,贝叶斯矩阵表示为:Φ=[φ(x1),φ(x2),...,φ(xn)]T,其是N*(N+1)维;为了约束rvm模型中权值w,假设其服从(0,αi -1)高斯分布,且设各权值间相互独立,其先验概率表示如下:
p ( w | α ) = Π i = 0 N N ( w i | 0 , α i - 1 ) - - - ( 4 )
α为N+1维超参数,引入超参数导致算法的稀疏性;
根据贝叶斯准则,可得到后验概率公式:
给定新的测试样本x,预测相应的目标t*,按照预测分布:
p ( t * | t ) = ∫ p ( t * | w , α , σ 2 ) p ( w , α , σ 2 | t ) d w d α d σ 2
无法计算后验概率,因为无法计算
所以将后验概率分解:p(w,α,σ2|t)=p(w|t,α,σ2)p(α,σ2|t)
可得权重的后验概率为:
p ( w | t , α , σ 2 ) = p ( t | w , σ 2 ) p ( w | α ) p ( t | α , σ 2 ) = ( 2 π ) - ( N + 1 ) / 2 | Σ | - 1 / 2 exp { - 1 2 ( w - u ) T Σ - 1 ( w - u ) } - - - ( 5 )
其后验协方差和均值分别为:
∑=(σ-2ΦTΦ+A)-1 (6)
u=σ-2∑ΦTt (7)
因为p(α,σ2|t)∝p(t|α,σ2)p(α)p(σ2),所以可以用后者等价前者:
p ( t | a , σ 2 ) = ∫ p ( t | w , β ) p ( w | α ) d w = ( 2 π ) - N / 2 | σ 2 I + ΦA - 1 Φ T | - 1 / 2 exp ( - 1 2 t T C t )
其中矩阵C=(σ2I+ΦA-1ΦT)-1,对上述式子取对数得:
L = log p ( t | α , β ) = - 1 2 ( N l o g ( 2 π ) + l o g | C | + t T C - 1 t ) - - - ( 8 )
为了找到超参数的优化值,我们对上述似然估计最大化得到超参数的更新公式:
a i = γ i u i σ 2 = | | t - Φ u | | 2 N - Σ i = 1 N γ i - - - ( 9 )
式中γi=1-αiii
相较于线性核函数,多项式核函数,sigmoid核函数,高斯核函数使用得更多;传统高斯核函数核参数均匀统一,限制了rvm模型的灵活性和预测精度;基于提高预测精度的考虑,且不破坏其它性能,提出使用如下多高斯核函数:
k ( x m , x n ) = exp ( - Σ k = 1 d η k ( x m k - x n k ) 2 )
其各个尺度上使用不同核参数,ηk是第k个核参数的平方的倒数,d是输入向量的属性个数,则多尺度核参数可表示为:η=(η12,...ηd);用φnm=k(xm,xn)来表示贝叶斯矩阵的元素,则似然估计对第k个核参数的梯度为:
∂ L ∂ η k = Σ n = 1 N Σ m = 1 N ∂ L ∂ φ n m ∂ φ n m ∂ η k
该式的第一部分与贝叶斯核参数无关,用来表示,得到矩阵:
D=(C-1ttTC-1-C-1)ΦA-1
=β[(t-y)uT-Φ∑] (10)
似然估计对核参数求导为:
3)多高斯核函数核参数自优化算法
为了避免核参数过大或过小引起过平滑和过适应问题,增加限制条件从而避免出现上述问题:
Σ k = 1 d logη k = d log 1 h 2
h是核参数几何平均值,则似然估计模型变成:
该模型对核参数求导为:
∂ L - ∂ η k = ∂ L ∂ η k + λ η k , k = 1 , ... , d
∂ L - ∂ η k = Σ m = 1 N Σ n = 1 N - D n m Φ n m ( x m k - x n k ) 2 + λ η k , k = 1 , ... , d
当上式第一部分对核参数求导时,所得梯度同号,为了保证所得核参数均大于零且最大似然估计尽可能的大,可用如下公式更新核参数,
若不满足同号,为了保证核参数均大于零,且最大似然估计尽可能的大,梯度小于零的核参数其更新公式为:
ηinew=p kηi (13)
梯度大于零的核参数其更新公式为:
式中i表示梯度小于零的属性列,j表示梯度大于零的属性列,p表示大于零的梯度个数;
4)遗传优化算法对初始参数寻优模块
在建模过程中,多高斯核函数自优化相关向量机模型有两类参数,一类属于核函数参数,核参数的个数由输入属性个数决定,核参数可通过上述算法中介绍的自优化方法来确定;另一类是相关向量机模型的初始参数,多高斯核函数自优化相关向量机的初始参数包括核参数几何平均值h和pk,其中核参数几何平均值决定初始核参数的值,pk影响核参数的自优化过程;提出采用遗传优化算法,对多高斯核函数自优化相关向量机模型中的初始参数h,pk进行优化,具体优化算法的流程如下:
4.1)设定种群规模,遗传进化代数,染色体采用二进制编码,每个算子由两段编码组成,两段编码分别代表两个参数h,pk,并确定各参数取值范围,生成初始种群;
4.2)用初始种群训练多高斯核函数自优化相关向量机模型,目标函数取测试样本的均方根误差函数RMSE;
4.3)个体进行选择、重组、变异,终止条件若达到最大进化数,则停止进化,输出优化参数,否则继续寻优;
5)多高斯核函数自优化相关向量机软测量模型建模
污水处理中与BOD出水水质息息相关的输入属性为可降解固体浓度RD-SED-G,悬浮固体浓度RD-SS-G,生化需氧量RD-DBO-G,化学需氧量RD-DQO-G,初沉池中的生化需氧量RD-DBO-P,悬浮固体浓度RD-SS-P,二沉池中的生化需氧量RD-DBO-S,化学需氧量RD-DQO-S,入水中的生化需氧量DBO,化学需氧量DQO,二级处理中的化学需氧量DQO,生化需氧量DBO,悬浮固体浓度SS,PH值PH-S,可降解固体浓度SED,出水的化学需氧量DQO-S,可降解固体浓度SED-S,悬浮固体浓度SS-S,PH值PH-S;输入xn∈RM,是第n个输入值,tn是BOD的输出值,则出水BOD的预测算法步骤如下:
5.1)对上述输入属性的污水数据进行归一化,去误差平滑处理,然后确定训练数据和测试数据;
5.2)根据训练样本中的污水数据建立初始化模型,初始化模型参数:α=[1/N2,1/N2,...,1/N2]T,σ2=0.1var(t),采用上面提到的遗传优化算法得到最佳初始核参数几何平均值h=24.3372,pk=0.2379,初始核参数η=[1/h2,1/h2,...,1/h2]T
5.3)循环迭代
5.3.1)按上式(6),(7)更新u,∑;
5.3.2)按上式(9)更新超参数α,β;
5.3.3)如果超参数αi大于给定的大值,则认为该超参数趋于无穷,从而将相应的权值行设为零,并且忽略相应的贝叶斯矩阵列;否则,训练数据的相应训练样本则为相关向量;
5.3.4)如果最大似然估计值变大,连续两代间的核参数最大变化值大于一定的小值,则按上面公式(12),(13),(14)更新核参数η,并更新贝叶斯矩阵Φ,否则停止更新;
5.3.5)如果连续两代间的超参数α最大变化值小于给定的小值,则迭代结束;
5.4)输出模型权值w,核参数η,相关向量机,噪声方差σ2
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明建立了一种基于多高斯核函数自优化相关向量机的软测量模型,模型通过自优化方法确定各尺度上的核参数,同时运用遗传优化算法对初始参数寻优,建立最优模型,在保证模型收敛性和稀疏性的情况下,有效提高污水中BOD输出精度,该模型是对基本rvm的改进,不仅离线情况下获得良好效果,在此基础上展开基于多尺度高斯核自优化相关向量机的污水出水在线软测量研究也很有意义。
2、本发明的核函数由多个高斯函数组成,具有多尺度核参数,打破了传统高斯核函数参数均匀统一对预测精度的限制,使模型更灵活。
附图说明
图1为本发明模型对出水BOD结果拟合图。
图2为本发明模型与基本rvm模型预测误差对比图。
图3为本发明模型与基本rvm模型收敛性对比图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施例所述的基于多高斯核自优化相关向量机的污水水质软测量方法,通过自优化方法确定各尺度上的核参数,运用遗传优化算法对初始参数寻优,建立最优模型,在保证模型收敛性和稀疏性的情况下,有效提高污水中BOD输出精度。其具体情况如下:
1)剔除污水输入和输出的数据中的异常点,由于各输入变量量纲的不同,对其进行归一化处理,归一化到[0,1]区间中;
2)多高斯核函数相关向量机软测量模型模块,其计算公式:
给定一组输入和目标值xn∈RM,且考虑目标函数只是一个标量,根据概率方程式,假设目标函数是模型的样本并且带有附加噪声:
tn=y(xn,w)+εn (1)
式中εn为附加噪声,服从(0,σ2)的高斯分布,且彼此间相互独立,因此p(tn|y(xn),σ2)服从高斯分布,其分布由期望y(xn)和方差σ2决定,其中y(xn)可由核函数的加权模型表示:
y ( x , w ) = Σ i = 1 N w i k ( x , x i ) + w 0 - - - ( 2 )
wi为模型权值;k是核函数,φi=k(x,xi);t=[t1,t2,...tn]T为N维列向量,假设tn服从独立分布,数据集的似然估计概率为:
p ( t | w , σ 2 ) = ( 2 πσ 2 ) - N / 2 exp { - 1 2 σ 2 | | t - Φ w | | 2 } - - - ( 3 )
φ(xn)=[1,k(xn,x1),k(xn,x2),...k(xn,xn)]T为(N+1)*1维矩阵,贝叶斯矩阵表示为:Φ=[φ(x1),φ(x2),...,φ(xn)]T,其是N*(N+1)维;为了约束rvm模型中权值w,假设其服从(0,αi -1)高斯分布,且设各权值间相互独立,其先验概率表示如下:
p ( w | α ) = Π i = 0 N N ( w i | 0 , α i - 1 ) - - - ( 4 )
α为N+1维超参数,引入超参数导致算法的稀疏性;
根据贝叶斯准则,可得到后验概率公式:
给定新的测试样本x,预测相应的目标t*,按照预测分布:
p ( t * | t ) = ∫ p ( t * | w , α , σ 2 ) p ( w , α , σ 2 | t ) d w d α d σ 2
无法计算后验概率,因为无法计算
所以将后验概率分解:p(w,α,σ2|t)=p(w|t,α,σ2)p(α,σ2|t)
可得权重的后验概率为:
p ( w | t , α , σ 2 ) = p ( t | w , σ 2 ) p ( w | α ) p ( t | α , σ 2 ) = ( 2 π ) - ( N + 1 ) / 2 | Σ | - 1 / 2 exp { - 1 2 ( w - u ) T Σ - 1 ( w - u ) } - - - ( 5 )
其后验协方差和均值分别为:
∑=(σ-2ΦTΦ+A)-1 (6)
u=σ-2∑ΦTt (7)
因为p(α,σ2|t)∝p(t|α,σ2)p(α)p(σ2),所以可以用后者等价前者:
p ( t | a , σ 2 ) = ∫ p ( t | w , β ) p ( w | α ) d w = ( 2 π ) - N / 2 | σ 2 I + ΦA - 1 Φ T | - 1 / 2 exp ( - 1 2 t T C t )
其中矩阵C=(σ2I+ΦA-1ΦT)-1,对上述式子取对数得:
L = log p ( t | α , β ) = - 1 2 ( N l o g ( 2 π ) + l o g | C | + t T C - 1 t ) - - - ( 8 )
为了找到超参数的优化值,对上述似然估计最大化得到超参数的更新公式:
a i = γ i u i σ 2 = | | t - Φ u | | 2 N - Σ i = 1 N γ i - - - ( 9 )
式中γi=1-αiii
相较于线性核函数,多项式核函数,sigmoid核函数,高斯核函数使用得更多;传统高斯核函数核参数均匀统一,限制了rvm模型的灵活性和预测精度;基于提高预测精度的考虑,且不破坏其它性能,本文提出使用如下多高斯核函数:
k ( x m , x n ) = exp ( - Σ k = 1 d η k ( x m k - x n k ) 2 )
其各个尺度上使用不同核参数,ηk是第k个核参数的平方的倒数,d是输入向量的属性个数,则多尺度核参数可表示为:η=(η12,...ηd);用φnm=k(xm,xn)来表示贝叶斯矩阵的元素,则似然估计对第k个核参数的梯度为:
∂ L ∂ η k = Σ n = 1 N Σ m = 1 N ∂ L ∂ φ n m ∂ φ n m ∂ η k
该式的第一部分与贝叶斯核参数无关,用来表示,得到矩阵:
D=(C-1ttTC-1-C-1)ΦA-1
=β[(t-y)uT-Φ∑] (10)
似然估计对核参数求导为: ∂ L ∂ η k = Σ m = 1 N Σ n = 1 N - D n m Φ n m ( x m k - x n k ) 2
3)多高斯核函数核参数自优化算法
为了避免核参数过大或过小引起过平滑和过适应问题,增加限制条件从而避免出现上述问题:
Σ k = 1 d logη k = d log 1 h 2
h是核参数几何平均值,则似然估计模型变成:
该模型对核参数求导为:
∂ L - ∂ η k = ∂ L ∂ η k + λ η k , k = 1 , ... , d
∂ L - ∂ η k = Σ m = 1 N Σ n = 1 N - D n m Φ n m ( x m k - x n k ) 2 + λ η k , k = 1 , ... , d
当上式第一部分对核参数求导时,所得梯度同号,为了保证所得核参数均大于零且最大似然估计尽可能的大,可用如下公式更新核参数,
若不满足同号,为了保证核参数均大于零,且最大似然估计尽可能的大,梯度小于零的核参数其更新公式为:
ηinew=p kηi (13)
梯度大于零的核参数其更新公式为:
式中i表示梯度小于零的属性列,j表示梯度大于零的属性列,p表示大于零的梯度个数;
4)遗传优化算法对初始参数寻优模块
在建模过程中,多高斯核函数自优化相关向量机模型有两类参数,一类属于核函数参数,核参数的个数由输入属性个数决定,核参数可通过上述算法中介绍的自优化方法来确定;另一类是相关向量机模型的初始参数,多高斯核函数自优化相关向量机的初始参数包括核参数几何平均值h和pk,其中核参数几何平均值决定初始核参数的值,pk影响核参数的自优化过程;本文采用遗传优化算法,对多高斯核函数自优化相关向量机模型中的初始参数h,pk进行优化,具体优化算法的流程如下:
4.1)设定种群规模,遗传进化代数,染色体采用二进制编码,每个算子由两段编码组成,两段编码分别代表两个参数h,pk,并确定各参数取值范围,生成初始种群;
4.2)用初始种群训练多高斯核函数自优化相关向量机模型,目标函数取测试样本的均方根误差函数RMSE;
4.3)个体进行选择、重组、变异,终止条件若达到最大进化数,则停止进化,输出优化参数,否则继续寻优;
5)多高斯核函数自优化相关向量机软测量模型建模
污水处理中与BOD出水水质息息相关的输入属性为可降解固体浓度RD-SED-G,悬浮固体浓度RD-SS-G,生化需氧量RD-DBO-G,化学需氧量RD-DQO-G,初沉池中的生化需氧量RD-DBO-P,悬浮固体浓度RD-SS-P,二沉池中的生化需氧量RD-DBO-S,化学需氧量RD-DQO-S,入水中的生化需氧量DBO,化学需氧量DQO,二级处理中的化学需氧量DQO,生化需氧量DBO,悬浮固体浓度SS,PH值PH-S,可降解固体浓度SED,出水的化学需氧量DQO-S,可降解固体浓度SED-S,悬浮固体浓度SS-S,PH值PH-S;输入xn∈RM,是第n个输入值,tn是BOD的输出值,则出水BOD的预测算法步骤如下:
5.1)对上述输入属性的污水数据进行归一化,去误差平滑处理,然后确定训练数据和测试数据;
5.2)根据训练样本中的污水数据建立初始化模型,初始化模型参数:α=[1/N2,1/N2,...,1/N2]T,σ2=0.1var(t),采用上面提到的遗传优化算法得到最佳初始核参数几何平均值h=24.3372,pk=0.2379,初始核参数η=[1/h2,1/h2,...,1/h2]T
5.3)循环迭代
5.3.1)按上式(6),(7)更新u,∑;
5.3.2)按上式(9)更新超参数α,β;
5.3.3)如果超参数αi大于给定的大值,则认为该超参数趋于无穷,从而将相应的权值行设为零,并且忽略相应的贝叶斯矩阵列;否则,训练数据的相应训练样本则为相关向量;
5.3.4)如果最大似然估计值变大,连续两代间的核参数最大变化值大于一定的小值,则按上面公式(12),(13),(14)更新核参数η,并更新贝叶斯矩阵Φ,否则停止更新;
5.3.5)如果连续两代间的超参数α最大变化值小于给定的小值,则迭代结束;
5.4)输出模型权值w,核参数η,相关向量机,噪声方差σ2
下面我们以加州大学数据库(UCI)中的污水数据为例进行说明,其情况如下:
BOD是反映水体被有机物污染程度的综合指标。与悬浮固体浓度,进出水的化学需氧量,进水的生物需氧量,流量,PH值等变量密切相关温度。建模所需辅助变量为可降解固体浓度RD-SED-G,悬浮固体浓度RD-SS-G,生化需氧量RD-DBO-G,化学需氧量RD-DQO-G,初沉池中的生化需氧量RD-DBO-P,悬浮固体浓度RD-SS-P,二沉池中的生化需氧量RD-DBO-S,化学需氧量RD-DQO-S,入水中的生化需氧量DBO,化学需氧量DQO,二级处理中的化学需氧量DQO,生化需氧量DBO,悬浮固体浓度SS,PH值PH-S,可降解固体浓度SED,出水的化学需氧量DQO-S,可降解固体浓度SED-S,悬浮固体浓度SS-S,PH值PH-S。由上可知,输入属性19个,输出属性1个。选取处理后的400组数据,其中200组用于训练模型,200组用作新数据测试模型精度。本发明模型对出水BOD结果拟合如图1所示,本发明模型与基本rvm模型预测误差对比如图2所示,本发明模型与基本rvm模型收敛性对比如图3所示。
算法步骤:
1.对上述输入属性的污水数据进行归一化,去误差平滑处理,然后确定训练数据和测试数据。
2.根据训练样本中的污水数据建立初始化模型,初始化模型参数:α=[1/N2,1/N2,...,1/N2]T,σ2=0.1var(t),采用上节提到的遗传优化算法得到最佳初始核参数几何平均值h=24.3372,pk=0.2379,初始核参数η=[1/h2,1/h2,...,1/h2]T
3.循环迭代
1)按式(6),(7)更新u,∑。
2)按式(9)更新超参数α,β。
3)如果超参数αi大于给定的大值,则认为该超参数趋于无穷,从而将相应的权值行设为零,并且忽略相应的贝叶斯矩阵列。否则,训练数据的相应训练样本则为相关向量。
4)如果最大似然估计值变大,连续两代间的核参数最大变化值大于一定的小值,则按公式(12),(13),(14)更新核参数η,并更新贝叶斯矩阵Φ,否则停止更新。
5)如果连续两代间的超参数α最大变化值小于某一小值,则迭代结束。
4.输出模型权值w,核参数η,相关向量机,噪声方差σ2
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (1)

1.基于多高斯核自优化相关向量机的污水水质软测量方法,其特征在于,包括以下步骤:
1)剔除污水输入和输出的数据中的异常点,由于各输入变量量纲的不同,对其进行归一化处理,归一化到[0,1]区间中;
2)多高斯核函数相关向量机软测量模型模块,其计算公式:
给定一组输入和目标值xn∈RM,且考虑目标函数只是一个标量,根据概率方程式,假设目标函数是模型的样本并且带有附加噪声:
tn=y(xn,w)+εn (1)
式中εn为附加噪声,服从(0,σ2)的高斯分布,且彼此间相互独立,因此p(tn|y(xn),σ2)服从高斯分布,其分布由期望y(xn)和方差σ2决定,其中y(xn)可由核函数的加权模型表示:
y ( x , w ) = Σ i = 1 N w i k ( x , x i ) + w 0 - - - ( 2 )
wi为模型权值;k是核函数,φi=k(x,xi);t=[t1,t2,...tn]T为N维列向量,假设tn服从独立分布,数据集的似然估计概率为:
p ( t | w , σ 2 ) = ( 2 πσ 2 ) - N / 2 exp { - 1 2 σ 2 | | t - Φ w | | 2 } - - - ( 3 )
φ(xn)=[1,k(xn,x1),k(xn,x2),...k(xn,xn)]T为(N+1)*1维矩阵,贝叶斯矩阵表示为:Φ=[φ(x1),φ(x2),...,φ(xn)]T,其是N*(N+1)维;为了约束rvm模型中权值w,假设其服从(0,αi -1)高斯分布,且设各权值间相互独立,其先验概率表示如下:
p ( w | α ) = Π i = 0 N N ( w i | 0 , α i - 1 ) - - - ( 4 )
α为N+1维超参数,引入超参数导致算法的稀疏性;
根据贝叶斯准则,可得到后验概率公式:
给定新的测试样本x,预测相应的目标t*,按照预测分布:
p ( t * | t ) = ∫ p ( t * | w , α , σ 2 ) p ( w , α , σ 2 | t ) d w d α d σ 2
无法计算后验概率,因为无法计算
所以将后验概率分解:p(w,α,σ2|t)=p(w|t,α,σ2)p(α,σ2|t)
可得权重的后验概率为:
p ( w | t , α , σ 2 ) = p ( t | w , σ 2 ) p ( w | α ) p ( t | α , σ 2 ) = ( 2 π ) - ( N + 1 ) / 2 | Σ | - 1 / 2 exp { - 1 2 ( w - u ) T Σ - 1 ( w - u ) } - - - ( 5 )
其后验协方差和均值分别为:
∑=(σ-2ΦTΦ+A)-1 (6)
u=σ-2∑ΦTt (7)
因为p(α,σ2|t)∝p(t|α,σ2)p(α)p(σ2),所以可以用后者等价前者:
p ( t | a , σ 2 ) = ∫ p ( t | w , β ) p ( w | α ) d w = ( 2 π ) - N / 2 | σ 2 I + ΦA - 1 Φ T | - 1 / 2 exp ( - 1 2 t T C t )
其中矩阵C=(σ2I+ΦA-1ΦT)-1,对上述式子取对数得:
L = log p ( t | α , β ) = - 1 2 ( N log ( 2 π ) + l o g | C | + t T C - 1 t ) - - - ( 8 )
为了找到超参数的优化值,对上述似然估计最大化得到超参数的更新公式:
a i = γ i u i σ 2 = | | t - Φ u | | 2 N - Σ i = 1 N γ i - - - ( 9 )
式中γi=1-αiii
传统高斯核函数核参数均匀统一,限制了rvm模型的灵活性和预测精度;
基于提高预测精度的考虑,且不破坏其它性能,提出使用如下多高斯核函数:
k ( x m , x n ) = exp ( - Σ k = 1 d η k ( x m k - x n k ) 2 )
其各个尺度上使用不同核参数,ηk是第k个核参数的平方的倒数,d是输入向量的属性个数,则多尺度核参数可表示为:η=(η12,...ηd);用φnm=k(xm,xn)来表示贝叶斯矩阵的元素,则似然估计对第k个核参数的梯度为:
∂ L ∂ η k = Σ n = 1 N Σ m = 1 N ∂ L ∂ φ n m ∂ φ n m ∂ η k
该式的第一部分与贝叶斯核参数无关,用来表示,得到矩阵:
D=(C-1ttTC-1-C-1)ΦA-1
=β[(t-y)uT-Φ∑] (10)
似然估计对核参数求导为:
3)多高斯核函数核参数自优化算法
为了避免核参数过大或过小引起过平滑和过适应问题,增加限制条件从而避免出现上述问题:
Σ k = 1 d logη k = d log 1 h 2
h是核参数几何平均值,则似然估计模型变成:
该模型对核参数求导为:
∂ L - ∂ η k = ∂ L ∂ η k + λ η k , k = 1 , ... , d
∂ L - ∂ η k = Σ m = 1 N Σ n = 1 N - D n m Φ n m ( x m k - x n k ) 2 + λ η k , k = 1 , ... , d
当上式第一部分对核参数求导时,所得梯度同号,为了保证所得核参数均大于零且最大似然估计尽可能的大,可用如下公式更新核参数,
若不满足同号,为了保证核参数均大于零,且最大似然估计尽可能的大,梯度小于零的核参数其更新公式为:
ηinew=p kηi (13)
梯度大于零的核参数其更新公式为:
式中i表示梯度小于零的属性列,j表示梯度大于零的属性列,p表示大于零的梯度个数;
4)遗传优化算法对初始参数寻优模块
在建模过程中,多高斯核函数自优化相关向量机模型有两类参数,一类属于核函数参数,核参数的个数由输入属性个数决定,核参数可通过上述算法中介绍的自优化方法来确定;另一类是相关向量机模型的初始参数,多高斯核函数自优化相关向量机的初始参数包括核参数几何平均值h和pk,其中核参数几何平均值决定初始核参数的值,pk影响核参数的自优化过程;提出采用遗传优化算法,对多高斯核函数自优化相关向量机模型中的初始参数h,pk进行优化,具体优化算法的流程如下:
4.1)设定种群规模,遗传进化代数,染色体采用二进制编码,每个算子由两段编码组成,两段编码分别代表两个参数h,pk,并确定各参数取值范围,生成初始种群;
4.2)用初始种群训练多高斯核函数自优化相关向量机模型,目标函数取测试样本的均方根误差函数RMSE;
4.3)个体进行选择、重组、变异,终止条件若达到最大进化数,则停止进化,输出优化参数,否则继续寻优;
5)多高斯核函数自优化相关向量机软测量模型建模
污水处理中与BOD出水水质息息相关的输入属性为可降解固体浓度RD-SED-G,悬浮固体浓度RD-SS-G,生化需氧量RD-DBO-G,化学需氧量RD-DQO-G,初沉池中的生化需氧量RD-DBO-P,悬浮固体浓度RD-SS-P,二沉池中的生化需氧量RD-DBO-S,化学需氧量RD-DQO-S,入水中的生化需氧量DBO,化学需氧量DQO,二级处理中的化学需氧量DQO,生化需氧量DBO,悬浮固体浓度SS,PH值PH-S,可降解固体浓度SED,出水的化学需氧量DQO-S,可降解固体浓度SED-S,悬浮固体浓度SS-S,PH值PH-S;输入xn∈RM,是第n个输入值,tn是BOD的输出值,则出水BOD的预测算法步骤如下:
5.1)对上述输入属性的污水数据进行归一化,去误差平滑处理,然后确定训练数据和测试数据;
5.2)根据训练样本中的污水数据建立初始化模型,初始化模型参数:α=[1/N2,1/N2,...,1/N2]T,σ2=0.1var(t),初始核参数η=[1/h2,1/h2,...,1/h2]T
5.3)循环迭代
5.3.1)按上式(6),(7)更新u,∑;
5.3.2)按上式(9)更新超参数α,β;
5.3.3)如果超参数αi大于给定的大值,则认为该超参数趋于无穷,从而将相应的权值行设为零,并且忽略相应的贝叶斯矩阵列;否则,训练数据的相应训练样本则为相关向量;
5.3.4)如果最大似然估计值变大,连续两代间的核参数最大变化值大于一定的小值,则按上面公式(12),(13),(14)更新核参数η,并更新贝叶斯矩阵Φ,否则停止更新;
5.3.5)如果连续两代间的超参数α最大变化值小于给定的小值,则迭代结束;
5.4)输出模型权值w,核参数η,相关向量机,噪声方差σ2
CN201510332330.5A 2015-06-16 2015-06-16 基于多高斯核自优化相关向量机的污水水质软测量方法 Expired - Fee Related CN104914227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510332330.5A CN104914227B (zh) 2015-06-16 2015-06-16 基于多高斯核自优化相关向量机的污水水质软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510332330.5A CN104914227B (zh) 2015-06-16 2015-06-16 基于多高斯核自优化相关向量机的污水水质软测量方法

Publications (2)

Publication Number Publication Date
CN104914227A CN104914227A (zh) 2015-09-16
CN104914227B true CN104914227B (zh) 2016-10-05

Family

ID=54083475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510332330.5A Expired - Fee Related CN104914227B (zh) 2015-06-16 2015-06-16 基于多高斯核自优化相关向量机的污水水质软测量方法

Country Status (1)

Country Link
CN (1) CN104914227B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021924B (zh) * 2016-05-19 2019-01-18 华南理工大学 基于多属性高斯核函数快速相关向量机的污水在线软测量方法
CN106647718B (zh) * 2017-01-20 2019-01-11 中国石油大学(华东) 基于贝叶斯核慢特征分析的非线性工业过程故障检测方法
CN108984851B (zh) * 2018-06-22 2020-08-04 江南大学 一种带时延估计的加权高斯模型软测量建模方法
CN111652445B (zh) * 2020-06-11 2024-03-22 广东科创智水科技有限公司 基于高斯分布的污水设备优化运行控制方法
CN112381221A (zh) * 2020-10-28 2021-02-19 华南理工大学 一种基于半监督学习的污水监测的多输出软测量方法
CN113065242B (zh) * 2021-03-13 2024-10-22 宁波大学科学技术学院 一种基于kplsr模型的污水处理出水总氮浓度软测量方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101566612A (zh) * 2009-05-27 2009-10-28 复旦大学 一种污水化学需氧量软测量方法
CN101625353A (zh) * 2009-03-06 2010-01-13 北京工商大学 污水处理出水水质软测量方法及在线智能检测仪表
CN103793604A (zh) * 2014-01-25 2014-05-14 华南理工大学 一种基于相关向量机的污水处理软测量方法
CN104680015A (zh) * 2015-03-02 2015-06-03 华南理工大学 一种基于快速相关向量机的污水处理在线软测量方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07101217B2 (ja) * 1991-02-15 1995-11-01 工業技術院長 Bodの測定方法
JP3301428B2 (ja) * 2000-03-09 2002-07-15 株式会社 小川環境研究所 廃水処理試験方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625353A (zh) * 2009-03-06 2010-01-13 北京工商大学 污水处理出水水质软测量方法及在线智能检测仪表
CN101566612A (zh) * 2009-05-27 2009-10-28 复旦大学 一种污水化学需氧量软测量方法
CN103793604A (zh) * 2014-01-25 2014-05-14 华南理工大学 一种基于相关向量机的污水处理软测量方法
CN104680015A (zh) * 2015-03-02 2015-06-03 华南理工大学 一种基于快速相关向量机的污水处理在线软测量方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
余伟 等.基于多神经网络的污水氨氮预测模型.《华南理工大学学报(自然科学版)》.2010,第38卷(第12期), *
叶洪涛 等.基于新型免疫算法的污水处理过程最优控制.《华南理工大学学报(自然科学版)》.2010,第38卷(第2期), *

Also Published As

Publication number Publication date
CN104914227A (zh) 2015-09-16

Similar Documents

Publication Publication Date Title
CN104914227B (zh) 基于多高斯核自优化相关向量机的污水水质软测量方法
Sharafati et al. The potential of new ensemble machine learning models for effluent quality parameters prediction and related uncertainty
Newhart et al. Data-driven performance analyses of wastewater treatment plants: A review
CN102854296B (zh) 一种基于集成神经网络的污水处理软测量方法
US10570024B2 (en) Method for effluent total nitrogen-based on a recurrent self-organizing RBF neural network
CN111291937A (zh) 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
Jeppsson Modelling aspects of wastewater treatment processes
Haimi et al. Data-derived soft-sensors for biological wastewater treatment plants: An overview
CN100561509C (zh) 一种改进的混合遗传算法优化水质模型参数的设计方法
CN104182794B (zh) 一种基于神经网络的污水处理过程出水总磷tp软测量方法
Lee et al. Sequential modelling of a full-scale wastewater treatment plant using an artificial neural network
CN104680015A (zh) 一种基于快速相关向量机的污水处理在线软测量方法
CN110320335B (zh) 一种关于污水处理出水水质指标的多元鲁棒软测量方法
CN103632032A (zh) 一种城市污水处理过程出水指标在线软测量预测方法
CN103235096A (zh) 污水水质检测方法与装置
CN108088974B (zh) 一种厌氧同时反硝化产甲烷过程出水硝氮的软测量方法
CN115356930B (zh) 一种污水处理过程中的多目标优化控制系统及方法
CN111762958A (zh) 基于asm2d模型的污水处理厂深井曝气工艺优化方法及装置
Qiao et al. A repair algorithm for radial basis function neural network and its application to chemical oxygen demand modeling
Yasmin et al. Improved support vector machine using optimization techniques for an aerobic granular sludge
Chen et al. An efficient approach based on bi-sensitivity analysis and genetic algorithm for calibration of activated sludge models
CN117923657A (zh) 基于厌氧氨氧化反应器的废水处理方法及系统
CN117388457B (zh) 一种耦合水力停留时间提高污水厂出水预测精度的方法
CN201330211Y (zh) 污水处理厂运行参数自寻优模拟系统
Bakht et al. Ingredient analysis of biological wastewater using hybrid multi-stream deep learning framework

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161005