CN111125964B - 一种基于克里金插值法的污水处理过程代理模型构建方法 - Google Patents

一种基于克里金插值法的污水处理过程代理模型构建方法 Download PDF

Info

Publication number
CN111125964B
CN111125964B CN201911378432.5A CN201911378432A CN111125964B CN 111125964 B CN111125964 B CN 111125964B CN 201911378432 A CN201911378432 A CN 201911378432A CN 111125964 B CN111125964 B CN 111125964B
Authority
CN
China
Prior art keywords
model
sample
steady
training
sewage treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911378432.5A
Other languages
English (en)
Other versions
CN111125964A (zh
Inventor
钱锋
钟伟民
杜文莉
周钊
彭鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN201911378432.5A priority Critical patent/CN111125964B/zh
Publication of CN111125964A publication Critical patent/CN111125964A/zh
Application granted granted Critical
Publication of CN111125964B publication Critical patent/CN111125964B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W10/00Technologies for wastewater treatment
    • Y02W10/10Biological treatment of water, waste water, or sewage

Abstract

本发明涉及一种利用克里金插值法构建污水处理动态模型稳态仿真结果的代理模型的方法。该方法在测得样本的输入变量后,能够准确地预测出稳态仿真结果的输出值。本发明方法包括:1)设定采样策略并获得训练样本和预测样本;2)根据污水处理动态模型进行稳态仿真,并记录结果;3)根据PSO算法优化的克里金插值法拟合训练样本,并生成验证样本稳态输出的预测值;4)比较预测值与真实值的差异,当差异大于设定的阈值时增加训练样本个数重复以上操作。该方法可根据待测样本自适应地建立代理模型,当真实输入样本被采集到时,就能够准确快速预测出稳态仿真的结果,大幅减少计算量。

Description

一种基于克里金插值法的污水处理过程代理模型构建方法
技术领域
本发明属于污水处理模型领域,具体涉及利用PSO优化的克里金插值法构建污水处理动态模型的稳态代理模型的方法。
背景技术
活性污泥1号模型(Activated Sludge Model 1,ASM1)作为污水处理的主要过程,其主要反应过程包括微生物的碳氧化、硝化和反硝化作用。该模型以矩阵的形式表述了污水中各个生物化学成分在好氧、缺氧条件下所发生的8个不同反应的微分方程。这8种生化反应过程涵盖了不同化学组分的水解、微生物的生长、衰减等。图1给出了ASM1模型的工艺流程示意图。
不过,活性污泥1号模型构建的是动态模型,但是在实际应用过程中并不需要动态模型,而是需要特定输入在任意时刻模型的输出。解决该问题的一种方法是对稳态过程的数学模型进行建模。然而,直接利用动态模型计算稳态模型的结果所消耗的计算量无法满足优化和控制的实时性要求。
因此,本领域需要一种污水处理动态模型的稳态代理模型。
发明内容
鉴于上述问题,本发明提出了一种利用粒子群算法(PSO)优化的克里金插值法构建污水处理动态模型、特别是污水处理典型过程活性污泥1号数学模型的稳态代理模型的方法。该方法在获得污水处理动态模型的基础上,设定采样策略并获得训练样本和验证样本的输入变量;根据污水处理动态模型对训练样本和验证样本的输入变量进行仿真;根据训练样本构建代理模型:根据代理模型对于验证样本的输出变量的预测效果对代理模型进行评价,并根据结果决定是否继续增加训练样本的数量。
具体而言,本发明提供一种利用克里金插值法构建污水处理动态模型稳态仿真的代理模型的方法,包括以下步骤:
步骤一:设定采样策略,对污水处理动态模型稳态仿真的训练样本和验证样本的输入变量进行采样;
步骤二:搭建污水处理动态模型;
步骤三:对步骤一获得的训练样本和验证样本的输入变量进行放缩,并将其输入到步骤二中的污水处理动态模型进行稳态仿真,得到训练样本和验证样本的输出变量;
步骤四:利用基于粒子群算法优化的克里金代理模型对训练样本进行拟合,对代理模型进行训练;
步骤五:利用步骤四中训练后的克里金代理模型对验证样本的输出变量进行预测,并记录克里金代理模型对于验证样本的输出变量的预测结果;
步骤六:对代理模型对于验证样本的输出变量的预测结果和步骤三的稳态仿真得到的验证样本的输出变量进行比较,如果两者之间的差异大于设定的阈值,则增加训练样本的组数,并返回步骤一;如果两者之间的差异小于等于设定的阈值,则代理模型构建成功。
在一个或多个实施方案中,步骤一中,所述污水处理动态模型为活性污泥污水处理过程的动态模型。
在一个或多个实施方案中,步骤一中,所述污水处理动态模型为活性污泥1号数学模型。
在一个或多个实施方案中,步骤一中,采样策略为拉丁超立方采样或随机采样;优选地,采用蒙特卡洛采样方法对验证样本进行采样,采用拉丁超立方采样对训练样本进行采样。
在一个或多个实施方案中,步骤一中,设定训练样本和验证样本的初始采样组数为200-400组,优选为300组。
在一个或多个实施方案中,步骤一中,首先设定代理模型是具有7个输入变量和3个输出变量的模型,通过构建三个具有7个输入变量和1个输出变量的模型来进行替代,之后确定初始训练样本和验证样本的组数和采样策略。
在一个或多个实施方案中,设定初始训练样本和验证样本均是300组。
在一个或多个实施方案中,步骤一中,设定训练样本和验证样本的输入变量的取值范围为[0,1]之间。
在一个或多个实施方案中,步骤二中,采用活性污泥1号数学模型作为污水处理动态模型。
在一个或多个实施方案中,步骤三中,对训练样本和验证样本的输入变量进行线性放缩,使其落入活性污泥1号数学模型典型输入数据±10%的范围内,然后将其输入到活性污泥1号数学模型进行稳态仿真。
在一个或多个实施方案中,步骤四中,采用基于粒子群算法优化的克里金插值法对训练样本进行拟合包括以下步骤:
(1)利用粒子群算法求出变异函数
Figure BDA0002341635650000031
的参数c0、c和a:
对于任意两个不同的数据点xi,xj,其变异函数的形式满足
Figure BDA0002341635650000032
Figure BDA0002341635650000033
采用高斯变异函数,该变异函数符合如下形式
Figure BDA0002341635650000034
利用粒子群算法寻找c0、c和a三个变量的最优值,调用粒子群算法优化目标函数的步骤包括:初始种群、利用粒子群算法迭代策略优化种群、判断算法是否满足停止条件、输出最终结果;其中,目标函数选用变异函数的实际值与变异函数的理论值之间的欧式距离作为衡量标准来评价变异函数模型拟合的好坏,欧式距离f计算如下:
Figure BDA0002341635650000035
(2)根据变异函数求出权重系数λi
Figure BDA0002341635650000036
根据上述线性方程组求解权重系数λi
(3)根据权重系数得到Z(x0)的估计值
Figure BDA0002341635650000037
的计算公式:
Figure BDA0002341635650000041
根据以上表达式得出样本点x0的估计值
Figure BDA0002341635650000042
在一个或多个实施方案中,步骤五中,将步骤一中的验证样本的输入变量放入步骤四中的训练后的模型中进行验证。
在一个或多个实施方案中,步骤六中,对代理模型对于验证样本的输出变量的预测结果(预测值)和步骤三的稳态仿真得到的验证样本的输出变量(仿真值)进行比较,得到能够体现两者之间的差异的定量指标。
在一个或多个实施方案中,定量指标选自平均均方误差、R2分数(线性回归决定系数)、平均绝对误差、均方根误差、最大绝对误差和相关系数。
在一个或多个实施方案中,定量指标包括均方根误差、最大绝对误差和相关系数。
在一个或多个实施方案中,步骤六中,当代理模型对于验证样本的输出变量的预测结果与稳态仿真得到的验证样本的输出变量之间的差异大于设定的阈值时,每次增加训练样本的组数为200-400组,优选为300组。
在一个或多个实施方案中,采用平均均方误差标准衡量代理模型对于验证样本的输出变量的预测结果和使用动态模型对验证样本进行真实仿真得到的输出变量之间的差异。
在一个或多个实施方案中,输出数据有3个变量,优选3个输出分别是出料Ss浓度Ss、出料So浓度So和出料Xh浓度Xh;优选地,出料Ss浓度Ss、出料So浓度So和出料Xh浓度Xh的平均均方误差的阈值分别设定为0.5、0.001和50。
在一个或多个实施方案中,当当代理模型对于验证样本的输出变量的预测结果与稳态仿真得到的验证样本的输出变量之间的平均均方误差大于设定的阈值时,每次增加的训练样本的组数为200-400组,优选为300组。
附图说明
图1为活性污泥1号模型工艺流程示意图。
图2为本发明的基于粒子群算法(PSO)优化的克里金插值法构建的代理模型的建模流程图。
图3为本发明的方法中利用PSO优化克里金插值法的变异函数的流程图。
图4为实施例1基于PSO优化的克里金插值法构建的代理模型的预测效果图。
图5为基于线性回归构建的代理模型的预测效果图。
图6为基于偏最小二乘法构建的代理模型的预测效果图。
具体实施方式
为使本领域技术人员可了解本发明的特点及效果,以下谨就说明书及权利要求书中提及的术语及用语进行一般性的说明及定义。除非另有指明,否则文中使用的所有技术及科学上的字词,均为本领域技术人员对于本发明所了解的通常意义,当有冲突情形时,应以本说明书的定义为准。
本文中,为使描述简洁,未对各个实施方案或实施例中的各个技术特征的所有可能的组合都进行描述。因此,只要这些技术特征的组合不存在矛盾,各个实施方案或实施例中的各个技术特征可以进行任意的组合,所有可能的组合都应当认为是本说明书记载的范围。
图2给出了本发明的基于粒子群算法(PSO)优化的克里金插值法构建的代理模型的建模流程图。本发明的利用PSO优化的克里金插值法构建污水处理动态模型稳态仿真的代理模型(简称代理模型)的方法,包括以下步骤:
步骤一:设定采样策略,对污水处理动态模型稳态仿真的训练样本和验证样本的输入变量进行采样;
步骤二:搭建污水处理动态模型;
步骤三:对步骤一获得的训练样本和验证样本的输入变量进行放缩,并将其输入到污水处理动态模型进行稳态仿真,得到训练样本和验证样本的输出变量;
步骤四:利用基于粒子群算法优化的克里金代理模型对训练样本进行拟合,对代理模型进行训练;
步骤五:利用步骤四中训练后的克里金代理模型对验证样本的输出变量进行预测,并记录克里金代理模型对于验证样本的输出变量的预测结果;
步骤六:对代理模型对于验证样本的输出变量的预测结果和步骤三的稳态仿真得到的验证样本的输出变量进行比较,如果两者之间的差异大于设定的阈值,则增加训练样本的组数,并返回步骤一;如果两者之间的差异小于等于设定的阈值,则代理模型构建成功。
下文将对这些步骤进行详细描述。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成优选的技术方案。
一、设定污水处理动态模型稳态仿真的代理模型的采样策略并获得训练样本和预测样本
适用于本发明的污水处理动态模型不受特别限制,优选为活性污泥污水处理过程的动态模型,更优选为活性污泥1号模型(ASM1模型)。ASM1模型是7输入3输出的动态模型,具有7个输入变量和3个输出变量。本发明构建的代理模型可以是多输入单输出的代理模型。本发明可通过构建多个多输入单输出的代理模型来替代多输入多输出的污水处理动态模型,例如,通过构建三个7输入单输出的代理模型来替代ASM1模型。
本文中,训练样本又称训练数据,验证样本又称验证数据;输入变量又称输入数据,输出变量又称输出数据;输入变量和输出变量的个数又称输入变量和输出变量的维度。
通常,根据污水处理动态模型的输入变量的维度设定训练数据和验证数据的输入变量的维度,例如,当污水处理动态模型为ASM1时,设定训练数据和验证数据的输入变量的维度是七维。
步骤一中,对训练数据和验证数据的输入变量进行采样。本领域技术人员可以理解的是,本文中,采样是指根据采样策略生成数据。采样策略可以是拉丁超立方采样或随机采样。优选地,采用蒙特卡洛采样方法对验证数据进行采样,采用拉丁超立方采样对训练数据进行采样。
步骤一中,可根据经验设定训练样本和验证样本的初始采样组数。在优选的实施方案中,例如当污水处理动态模型为ASM1时,训练样本和验证样本的初始采样组数优选为200-400组,例如300组左右。在某些实施方案中,初始训练样本的组数和验证样本的组数相同。本领域技术人员可以理解的是,一组数据包含多个变量的数据。
步骤一中,优选设定训练样本和验证样本的输入变量的取值范围为[0,1]之间。
二、搭建污水处理动态模型
本发明中,搭建污水处理动态模型的方法可以是本领域已知的。搭建的污水处理动态模型优选为活性污泥污水处理过程的动态模型,更优选为ASM1动态模型。
ASM1模型为本领域所熟知,其动态过程主要包括:(1)异养生物的需氧生长,(2)异养生物的缺氧生长,(3)自养生物的需氧生长,(4)异养生物的衰减,(5)自养生物的衰减,(6)可溶性有机氮的氨化,(7)包埋有机物的水解,(8)包封有机氮的水解。
三、对步骤一获得的训练数据和验证数据的输入数据进行放缩,并将其输入到污水处理动态模型进行稳态仿真
本发明中,稳态仿真(简称仿真)具有本领域周知的含义,指的是利用动态机理模型运行至收敛的稳态状态。
步骤三中,通常将训练数据和验证数据的输入数据缩放到污水处理动态模型典型输入范围内(例如,当污水处理动态模型为ASM1模型时,通常将训练数据和验证数据的输入数据缩放到ASM1模型典型输入变量±10%的范围内),并将其输入到污水处理动态模型进行仿真。
输入数据经过污水处理动态模型仿真后,得到输出数据。仿真得到的输出数据又称为仿真值。
四、利用粒子群(PSO)算法优化的克里金代理模型对训练样本进行拟合利用代理模型对训练样本进行拟合的过程又称为代理模型的训练。
假定代理模型对应的函数Z(x)满足二阶平稳和本征假设。克里金插值法就是通过算法确定一组权重系数λi,其中位置样本在点x0处的Z(x0)的估计值
Figure BDA0002341635650000081
采用的是n个已知训练样本点的结果值的加权和,即
Figure BDA0002341635650000082
本发明利用PSO算法求算克里金插值法中用到的变异函数。图3给出了本发明的方法中利用PSO优化克里金插值法的变异函数的流程图。
步骤四中,采用PSO算法确定变异函数
Figure BDA0002341635650000083
其中,将变异函数的实际值γ(h)与变异函数的理论值
Figure BDA0002341635650000084
之间的欧式距离之和作为PSO算法的目标函数,即目标函数为:
Figure BDA0002341635650000085
根据变异函数γ(h)求出克里金代理模型对应的函数Z(x)。
假定变异函数
Figure BDA0002341635650000086
且满足本征假设。
在无偏条件下,使估计方差达到最小,根据拉格朗日乘数原理:
Figure BDA0002341635650000087
其中,
Figure BDA0002341635650000088
克里金插值得到的方差为
Figure BDA0002341635650000089
故只要确定变异函数γ(h),即可通过上式求解Z(x0)的估计值
Figure BDA00023416356500000810
和方差σ2
对于变异函数γ(h),通常假定其只与它的模相关,即γ(h)=γ(|h|),本发明采用的主要是高斯模型变异函数,它的解析式如下
Figure BDA00023416356500000811
Figure BDA00023416356500000812
故当确定变量c0、c、a后,变异函数即可唯一确定。本发明采用PSO算法确定这三个变量的值,其目标函数是变异函数的实际值与变异函数的理论值的差异,即通过计算两者之间的欧式距离之和f作为目标函数:
Figure BDA0002341635650000091
在设计好优化目标后,主要通过合适的超参数使得最终的结果收敛到可接受的局部最优解,而不消耗过多的时间。调用PSO算法优化目标函数步骤主要包括初始种群、利用PSO算法迭代策略优化种群、判断算法是否满足停止条件、输出最终结果。
通过本发明的步骤四得到Z(x0)的估计值
Figure BDA0002341635650000092
的计算公式:
Figure BDA0002341635650000093
Figure BDA0002341635650000094
即为克里金代理模型对应的函数,利用该函数即可根据输入变量xi得到克里金代理模型对于输出变量的预测值
Figure BDA0002341635650000095
五、利用步骤四中的克里金代理模型对验证数据进行预测,并记录验证样本的输出数据的预测结果
步骤五中,将步骤一中的验证数据的输入变量放入步骤四的模型中进行验证,并得到代理模型对于验证样本的输出变量的预测结果(又称为预测值)。
六、将代理模型的预测结果与仿真得到的验证数据的输出数据进行比较,确定是否需要调整训练样本数量
步骤六中,对代理模型对于验证样本的输出变量的预测结果(预测值)和步骤三的稳态仿真得到的验证样本的输出变量(仿真值)进行比较,得到能够体现两者之间的差异的定量指标,将定量指标与设定的阈值进行比较,如果大于设定的阈值,则增加训练样本的组数,返回步骤一,重新进行步骤一到六。
可以理解的是,当污水处理动态模型具有多个输出变量时,表征各个输出变量的预测试和仿真值之间的差异的定量指标可以不同,各自设定的阈值也可以不同。
本发明中,定量指标可以是预测值和仿真值之间的平均均方误差、R2分数(线性回归决定系数)、平均绝对误差、均方根误差、最大绝对误差、相关系数等。
本发明中,阈值根据模型的要求确定。例如,阈值可以是与验证样本的输出变量相对应的训练样本的相应输出变量的标准差的线性放缩,例如标准差的0.05倍。
在某些实施方案中,污水处理动态模型为ASM1,定量指标为预测值和仿真值之间的平均均方误差,ASM1的输出1(出料Ss浓度Ss)的平均均方误差的阈值为0.5,ASM1的输出2(出料So浓度So)的平均均方误差的阈值为0.001,ASM1的输出3(出料Xh浓度Xh)的平均均方误差的阈值为50。
本发明中,每次增加的训练样本的组数可根据经验设定。在某些实施方案中,每次增加的训练样本的组数与训练样本或验证样本的初始采样组数相同。在某些实施方案中,例如,当污水处理动态模型为ASM1时,每次增加的训练样本的组数优选为200-400组,例如300组左右。
本发明在构建污水处理动态模型的代理模型时,首先采用步骤一确定代理模型的采样策略,生成训练、测试样本,在步骤二中搭建仿真使用的模型,随后通过步骤三进行仿真,并根据步骤四所述的方法对样本的训练集进行拟合,并且利用步骤五和步骤六对该代理模型的性能进行定量评估,最后根据预测效果动态地调整训练样本的个数,并循环进行仿真。
本发明具有以下有益效果:
本发明方法测试方式简单、快速、实用,利用克里金代理模型预测稳态输出值,与传统的测量方法相比,大大缩短了计算时间、减少了人力、物力,为污水处理的控制和优化提供了条件。
下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,本领域技术人员根据本发明的内容作出的任何非本质的改进和调整,仍属于本发明的保护范围。实施例中未明确说明的算法和方法,为本领域公知的算法或方法,或为本文所述的算法或方法。实施例中未明确说明的代数具有本领域公知的或本文所述的含义。
实施例1
以下以活性污泥1号数学模型(ASM1)的稳态克里金代理模型建模的实施例来说明本发明的具体步骤。
构建ASM1的输出1(出料Ss浓度Ss)的稳态克里金代理模型包括:
步骤一:设定所仿真的代理模型的动态模型为ASM1,其七维输入变量分别是回流污泥、剩余污泥、进料流量、进料流速、进料Ss浓度、进料So浓度和进料Xh浓度,其三维输出变量分别是出料Ss浓度Ss、出料So浓度So和出料Xh浓度Xh;设定训练数据和验证数据的初始采样组数均为300组;设定训练样本和验证样本的输入变量的取值范围为[0,1]之间;采用蒙特卡洛采样方法对验证样本的输入变量进行采样,采用拉丁超立方采样对训练样本的输入变量进行采样;
步骤二:搭建ASM1动态模型;
步骤三:对训练样本和验证样本的输入变量进行线性放缩,使其落入ASM1模型典型输入数据±10%的范围内;
步骤四:采用基于粒子群(PSO)算法优化的克里金插值法对训练样本进行拟合,对代理模型进行训练,包括以下步骤:
(1)利用PSO算法求出变异函数
Figure BDA0002341635650000111
的参数c0、c和a:
对于任意两个不同的数据点xi,xj,其变异函数的形式满足
Figure BDA0002341635650000112
Figure BDA0002341635650000113
采用高斯变异函数,该变异函数符合如下形式
Figure BDA0002341635650000114
利用PSO算法寻找c0、c和a三个变量的最优值,调用PSO算法优化目标函数的步骤包括:初始种群、利用PSO算法迭代策略优化种群、判断算法是否满足停止条件、输出最终结果;其中,目标函数选用变异函数的实际值与变异函数的理论值之间的欧式距离作为衡量标准来评价变异函数模型拟合的好坏,欧式距离f计算如下:
Figure BDA0002341635650000121
(2)根据变异函数求出权重系数λi
Figure BDA0002341635650000122
根据上述线性方程组求解权重系数λi
(3)根据权重系数得到Z(x0)的估计值
Figure BDA0002341635650000123
的计算公式:
Figure BDA0002341635650000124
根据以上表达式得出样本点x0的估计值
Figure BDA0002341635650000125
步骤五:利用步骤四中的训练后的克里金代理模型对验证样本的输出1(出料Ss浓度Ss)进行预测,并记录预测结果;
步骤六:将代理模型对于验证样本的输出1的预测结果(预测值)与稳态仿真得到的验证样本的输出1(仿真值)进行比较,两者之间的平均均方误差小于设定的阈值(对于输出1而言,阈值是0.5),由此完成对ASM1的输出1的稳态克里金代理模型的构建。
实施例1的ASM1的输出1的稳态克里金代理模型对于输出1的预测值与仿真值的比较结果如表1所示,输出1的预测值与仿真值整体上的差异如图4(1)所示。
采用与上述构建ASM1的输出1(出料Ss浓度Ss)的稳态克里金代理模型相同的方法,构建ASM1的输出2(出料So浓度So)和输出3(出料Xh浓度Xh)的稳态克里金代理模型;在步骤六中,得到如表1所示的输出2和输出3的预测值与仿真值之间的平均均方误差;由表1可见,输出2和输出3的预测值与仿真值之间的平均均方误差也小于设定的阈值(分别为0.001和50)故不需要再增加训练样本,由此完成对ASM1的输出2和输出3的稳态克里金代理模型的构建。
实施例1的ASM1的输出2和输出3的稳态克里金代理模型对于输出2和输出3的预测值与仿真值的比较结果如表1所示,输出2和输出3的预测值与仿真值整体上的差异分别如图4(2)和图4(3)所示。
实施例1所构建的ASM1的输出1、输出2和输出3的代理模型的效果如图4(1)-(3)所示,可以看到预测值与实际值相当吻合;预测值与实际值的比较结果如表1所示,其中,输出1的预测值与实际值之间的平均均方误差为0.055501,R2分数(线性回归决定系数)达0.999575,均方根误差为0.141646。可见,本发明的方法具有预测过程快速、简单,预测结果准确的优点。。
图5、图6和表1给出了两种常见的机器学习模型——线性回归(LinearRegression,LR)和偏最小二乘回归(Partial Least Squares Regression,PLS)对ASM1的输出1、输出2和输出3的预测效果。使用这些机器学习模型进行ASM1的代理模型的建模时,将实施例1中的步骤四和步骤五的克里金模型的训练和预测过程代替为机器学习模型的训练和预测过程(以线性回归为例就是利用y=Wx+b对W和b进行估计,在预测时根据估计出的W和b和验证数据x得到输出y的估计值),步骤六中不增加训练样本的组数,其他步骤不变,从而得到图5、图6和表1的结果。
图5为基于线性回归(最小二乘法)对ASM1的输出1、输出2和输出3的预测效果图。图6为基于偏最小二乘法对ASM1的输出1、输出2和输出3的预测效果图。可见,与其他常见机器学习算法相比,本发明在相同数据规模下预测精度更高。
表1:不同算法对ASM1三个输出的预测效果评价
Figure BDA0002341635650000131
Figure BDA0002341635650000141

Claims (14)

1.一种利用克里金插值法构建污水处理动态模型稳态仿真的代理模型的方法,其特征在于,所述方法包括以下步骤:
步骤一:设定采样策略,对污水处理动态模型稳态仿真的训练样本和验证样本的输入变量进行采样,并确定仿真设计中使用的超参数;
步骤二:搭建污水处理动态模型;
步骤三:对步骤一获得的训练样本和验证样本的输入变量进行放缩,并将其输入到步骤二的污水处理动态模型进行稳态仿真,得到训练样本和验证样本的输出变量;
步骤四:利用基于粒子群算法优化的克里金代理模型对训练样本进行拟合,对代理模型进行训练;
步骤五:利用步骤四中训练后的克里金代理模型对验证样本的输出变量进行预测,并记录克里金代理模型对于验证样本的输出变量的预测结果;
步骤六:对代理模型对于验证样本的输出变量的预测结果和步骤三的稳态仿真得到的验证样本的输出变量进行比较,如果代理模型对于验证样本的输出变量的预测结果与稳态仿真得到的验证样本的输出变量之间的差异大于设定的阈值,则增加训练样本的组数,并返回步骤一;如果两者之间的差异小于等于设定的阈值,则代理模型构建成功;
其中,步骤四中,采用基于粒子群算法优化的克里金插值法对训练样本进行拟合,包括以下步骤:
(1)利用粒子群算法求出变异函数的参数
对于任意两个不同的数据,其变异函数的形式满足
采用高斯变异函数,该变异函数符合如下形式
利用粒子群算法寻找三个变量的最优值,调用粒子群算法优化目标函数的步骤包括:初始种群、利用粒子群算法迭代策略优化种群、判断算法是否满足停止条件、输出最终结果;其中,目标函数选用变异函数的实际值与变异函数的理论值之间的欧式距离作为衡量标准来评价变异函数模型拟合的好坏,欧式距离f计算如下:
(2)根据变异函数求出权重系数
根据上述线性方程组求解权重系数
(3)根据权重系数得到的估计值的计算公式:
根据以上表达式得出样本点 的估计值
2.如权利要求1所述的方法,其特征在于,步骤一中,所述污水处理动态模型为活性污泥1号数学模型。
3.如权利要求1所述的方法,其特征在于,步骤一中,采样策略为拉丁超立方采样或随机采样。
4.如权利要求1所述的方法,其特征在于,步骤一中,采用蒙特卡洛采样方法对验证样本进行采样,采用拉丁超立方采样对训练样本进行采样。
5.如权利要求1所述的方法,其特征在于,步骤一中,设定训练样本和验证样本的初始采样组数为200-400组。
6.如权利要求1所述的方法,其特征在于,步骤一中,设定训练样本和验证样本的初始采样组数为300组。
7.如权利要求1所述的方法,其特征在于,步骤一中,设定训练样本和验证样本的输入变量的取值范围为[0,1]之间。
8.如权利要求1所述的方法,其特征在于,步骤二中,采用活性污泥1号数学模型作为污水处理动态模型。
9.如权利要求1所述的方法,其特征在于,步骤三中,对训练样本和验证样本的输入变量进行线性放缩,使其落入活性污泥1号数学模型典型输入数据±10%的范围内,然后将其输入到活性污泥1号数学模型进行稳态仿真。
10.如权利要求1所述的方法,其特征在于,步骤五中,将步骤一中得到的验证样本的输入变量放入步骤四中训练后的代理模型中进行验证。
11.如权利要求1所述的方法,其特征在于,步骤六中,当代理模型对于验证样本的输出变量的预测结果与稳态仿真得到的验证样本的输出变量之间的差异大于设定的阈值时,每次增加训练样本的组数为200-400组;所述阈值根据模型的要求确定。
12.如权利要求1所述的方法,其特征在于,步骤六中,当代理模型对于验证样本的输出变量的预测结果与稳态仿真得到的验证样本的输出变量之间的差异大于设定的阈值时,每次增加训练样本的组数为300组;所述阈值根据模型的要求确定。
13.如权利要求11或12所述的方法,其特征在于,所述阈值为对应训练样本相应输出变量的标准差的线性放缩。
14.如权利要求11或12所述的方法,其特征在于,所述阈值为对应训练样本相应输出变量的标准差的0.05倍。
CN201911378432.5A 2019-12-27 2019-12-27 一种基于克里金插值法的污水处理过程代理模型构建方法 Active CN111125964B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911378432.5A CN111125964B (zh) 2019-12-27 2019-12-27 一种基于克里金插值法的污水处理过程代理模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911378432.5A CN111125964B (zh) 2019-12-27 2019-12-27 一种基于克里金插值法的污水处理过程代理模型构建方法

Publications (2)

Publication Number Publication Date
CN111125964A CN111125964A (zh) 2020-05-08
CN111125964B true CN111125964B (zh) 2023-04-21

Family

ID=70504038

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911378432.5A Active CN111125964B (zh) 2019-12-27 2019-12-27 一种基于克里金插值法的污水处理过程代理模型构建方法

Country Status (1)

Country Link
CN (1) CN111125964B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116048106B (zh) * 2023-02-08 2024-04-12 海南大学 一种多水下机器人自适应采样的海洋观测控制方法及装置
CN115809749B (zh) * 2023-02-09 2023-09-12 四川文韬工程技术有限公司 污水处理综合性在线预测模型的建立方法及预测预警方法
CN116502319B (zh) * 2023-06-28 2023-10-20 长江三峡集团实业发展(北京)有限公司 一种混凝土坝三维温度场重构方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600534A (zh) * 2016-12-12 2017-04-26 中国石油大学(华东) 一种基于多尺度小波支持向量机优化的克里金空间插值方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190251458A1 (en) * 2018-02-15 2019-08-15 Institute For Development And Research In Banking Technology System and method for particle swarm optimization and quantile regression based rule mining for regression techniques

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600534A (zh) * 2016-12-12 2017-04-26 中国石油大学(华东) 一种基于多尺度小波支持向量机优化的克里金空间插值方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
支持向量机和粒子群算法在结构优化中的应用研究;向国齐等;《计算机应用研究》;20090615(第06期);全文 *
粒子群优化协同克里金法在确定山地斜坡土层厚度中的应用;王桂林等;《土木建筑与环境工程》;20181116(第06期);全文 *

Also Published As

Publication number Publication date
CN111125964A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111125964B (zh) 一种基于克里金插值法的污水处理过程代理模型构建方法
Zeng et al. A new multivariable grey prediction model with structure compatibility
Arel-Bundock et al. When can multiple imputation improve regression estimates?
CN113837356B (zh) 基于融合神经网络的污水处理智能预测方法
Lim et al. Influences of energy data on Bayesian calibration of building energy model
CN108304679A (zh) 一种自适应可靠性分析方法
CN110824915B (zh) 基于ga-dbn网络的废水处理智能监控方法及系统
CN110889085A (zh) 基于复杂网络多元在线回归的废水智能监控方法及系统
CN103235096A (zh) 污水水质检测方法与装置
Lee et al. Durability reliability demonstration test methods
CN110824914A (zh) 一种基于pca-lstm网络的废水处理智能监控方法
CN112364560A (zh) 矿山凿岩装备作业工时智能预测方法
CN115982141A (zh) 一种针对时序数据预测的特征优化方法
CN103748588A (zh) 用于建立模型的方法
Jahani et al. Stochastic prognostics under multiple time-varying environmental factors
JPWO2020004575A5 (zh)
Dobrzański et al. Application of artificial neural networks in modelling of normalised structural steels mechanical properties
Dattner et al. Application of one‐step method to parameter estimation in ODE models
CN110542748B (zh) 一种基于知识的鲁棒型出水氨氮软测量方法
CN112163632A (zh) 基于蝙蝠算法的半监督极限学习机在工业检测中的应用
Zhang et al. Multivariate discrete grey model base on dummy drivers
CN110991616A (zh) 一种基于删减型前馈小世界神经网络出水bod预测方法
CN115935196A (zh) 工艺与生产线的匹配度计算方法、优化方法和装置
CN113868848A (zh) 加权灰靶算法和模拟退火法的变压器状态评估方法
CN109858699B (zh) 水质定量模拟方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant