CN117388457B - 一种耦合水力停留时间提高污水厂出水预测精度的方法 - Google Patents
一种耦合水力停留时间提高污水厂出水预测精度的方法 Download PDFInfo
- Publication number
- CN117388457B CN117388457B CN202311332650.1A CN202311332650A CN117388457B CN 117388457 B CN117388457 B CN 117388457B CN 202311332650 A CN202311332650 A CN 202311332650A CN 117388457 B CN117388457 B CN 117388457B
- Authority
- CN
- China
- Prior art keywords
- data set
- retention time
- hydraulic retention
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 239000010865 sewage Substances 0.000 title claims abstract description 47
- 230000014759 maintenance of location Effects 0.000 title claims abstract description 31
- 230000008878 coupling Effects 0.000 title claims abstract description 14
- 238000010168 coupling process Methods 0.000 title claims abstract description 14
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 64
- 230000008569 process Effects 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000010801 machine learning Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 15
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 14
- 239000001301 oxygen Substances 0.000 claims description 14
- 229910052760 oxygen Inorganic materials 0.000 claims description 14
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000005273 aeration Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 8
- 239000007787 solid Substances 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 8
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 7
- 229910052698 phosphorus Inorganic materials 0.000 claims description 7
- 239000011574 phosphorus Substances 0.000 claims description 7
- 229910052757 nitrogen Inorganic materials 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 claims description 2
- 239000010802 sludge Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 125000001477 organic nitrogen group Chemical group 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 239000002351 wastewater Substances 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000005276 aerator Methods 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 238000006065 biodegradation reaction Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- -1 hydrogen ions Chemical class 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 239000002957 persistent organic pollutant Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Abstract
本发明公开了一种耦合水力停留时间提高污水厂出水预测精度的方法,该方法包括:获取污水处理厂的历史数据并构建原始数据集;基于不同工艺单元的水力停留时间对所述原始数据集进行矫正,得到矫正后的数据集;基于多任务学习算法构建机器学习模型;基于所述矫正后的数据集对所述机器学习模型进行训练,得到预测模型;基于所述预测模型进行出水水质预测。通过使用本发明,能够综合不同处理单元水力停留时间的数据,对多水质任务同时进行较高精度的预测。本发明可广泛应用于水质预测领域。
Description
技术领域
本发明涉及水质预测领域,尤其涉及一种耦合不同污水处理单元的水力停留时间提高污水厂出水预测精度的方法。
背景技术
在城镇污水处理过程中,出水水质是污水处理厂中污染物处理效果的直接表现,同时出水水质情况也密切影响着处理工艺、出水指标的过程控制。
对于出水水质的控制一般采用基于进水水质的前馈调节或基于出水水质的反馈调节。前者对水质变化反应敏感且迅速、但对出水水质把控较弱;后者可以控制出水水质,但由于污水处理过程中对进出水水质的监测都是基于各类硬件设备的直接监测,会存在滞后,无法及时调整处理单元中仪器设备的参数,因此,研究如何利用模型来预测出水的水质数据,进而降低数据获取的滞后性以便更及时进行污水处理的调整是非常有必要的,但目前的预测方法大多仅是利用历史数据进行模型,没有对其中的数据集进行优化,导致模型的预测精度不高。
发明内容
有鉴于此,为了解决现有预测方法中没有对用于训练的数据集进行优化,进而导致训练得到的模型的预测精度不高的问题,本发明提出一种耦合不同污水处理单元的水力停留时间提高污水厂出水预测精度的方法,能够快速准确地预测多项出水水质指标,解决反馈调节调整法的时滞性问题,为提前调整工艺和设备参数、保证出水水质提供参考。
本发明所采用的技术方案包括以下步骤:
获取污水处理厂的历史数据并构建原始数据集;
基于不同工艺单元的水力停留时间对所述原始数据集进行矫正,得到矫正后的数据集;
基于多任务学习算法构建机器学习模型;
基于所述矫正后的数据集对所述机器学习模型进行训练,得到预测模型;
基于所述预测模型进行出水水质预测。
在一些实施例中,所述获取污水处理厂的历史数据并构建原始数据集这一步骤,其具体包括:
获取污水处理厂的连续监测历史数据;
根据预测需求选择数据指标,结合所述连续监测历史数据构建原始数据集;
所述数据指标包括进出水化学需氧量、总氮、总磷、pH、悬浮固体、流量,好氧池溶解氧浓度、污泥浓度和曝气风机的风量。
其中,所述数据指标可以根据用户需要进行不同的设定。
在一些实施例中,所述基于不同工艺单元的水力停留时间对所述原始数据集进行矫正,得到矫正后的数据集这一步骤,其具体包括:
计算污水处理工艺中不同工艺单元的水力停留时间造成的时间差异,并矫正原始数据集;
根据数据重复规律,按预设比例进行下采样,结合数据分布情况矫正原始数据集。
通过该优选步骤,对原始数据集进行矫正,已得到更具有代表性的数据集,进而利用该数据集得到更准确的预测模型。
在一些实施例中,所述计算污水处理工艺中不同工艺单元的水力停留时间造成的时间差异,并矫正原始数据集这一步骤,其具体包括:
获取污水处理厂工艺设计资料,计算各处理单元水力停留时间;
确定各数据指标在处理工艺中的位置,并计算其相对进水的滞后时间;
根据滞后时间,调整中间处理单元和出水的水质数据、工艺参数在数据集中的前后位置。
在一些实施例中,所述结合数据分布情况矫正原始数据集具体包括:
根据箱线图原理剔除原始数据集中的异常值;
根据贝叶斯回归插值填补原始数据集中的空白值;
去除原始数据集中含有未被检测负数的组;
基于Box-Cox变换原理,对原始数据集进行变换,使其接近正态分布;
基于minmax标准化原理,将原始数据集中的特征变量映射至0~1之间;
通过该优选步骤,利用不同的数据处理方法对数据集进行异常剔除、空白填补、变换和筛选等处理,以使数据集更加优化。
在一些实施例中,所述基于所述矫正后的数据集对所述机器学习模型进行训练,得到预测模型这一步骤,其具体包括:
预设机器学习模型的超参数调整范围并构建超参数组合;
基于超参数组合,利用所述矫正后的数据集和交叉验证法对所述机器学习模型进行训练;
通过优化算法挑选出最佳预测性能的模型,得到预测模型。
通过该优选步骤,完成模型训练并挑选最优性能的模型。
在一些实施例中,还包括:
构建测试集;
将测试集中的多项出水水质数据作为实际值,其余数据指标输入至所述预测模型中,得到出水水质数据的预测值;
根据所述实际值与所述预测值计算均方根误差和决定系数;
根据均方根误差、决定系数和模型总体拟合图,对所述预测模型准确度进行评估。
在一些实施例中,还包括:
若决定系数小于预设值,则重新构建预测模型。
基于上述方案,本发明提供了一种耦合水力停留时间提高污水厂出水预测精度的方法,搭建一种预测模型,根据预测需求选择合适的数据指标构建原始数据库;综合考虑污水处理工艺如不同工艺单元的水力停留时间矫正数据集后,训练预测模型;实现了多项污水出水水质的提前预测预警,解决反馈调节调整法的时滞性问题,为提前调整工艺和设备参数、保证出水水质提供参考。
附图说明
图1是本发明一种耦合水力停留时间提高污水厂出水预测精度的步骤流程图;
图2是本发明具体实施例贝叶斯优化方法示意图;
图3是本发明具体实施例预测模型测试结果示意图。
具体实施方式
针对背景技术中提出的利用设备获取出水数据存在滞后性、以及当前预测模型的预测精度不高的技术问题,本发明针对于数据集进行优化,选择合适的指标,以提高出水数据预测的准确性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
应当理解,本申请中使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换该词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
在本申请实施例的描述中,“多个”是指两个或多于两个。以下术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
另外,本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
参照图1,为本发明提出的耦合水力停留时间提高污水厂出水预测精度的方法的一可选示例的流程示意图,该方法可以适用于计算机设备,本实施例提出的该成像方法可以包括但并不局限于以下步骤:
步骤S1、获取污水处理厂的历史数据并构建原始数据集;
步骤S1.1、获取污水处理厂的连续监测历史数据;
在本实施例中,所获取的污水处理厂的连续监测历史数据为广东某污水处理厂从2019年8月1日至2023年3月30日的数据。
步骤S1.2、根据预测需求选择数据指标,结合所述连续监测历史数据构建原始数据集;
在本事实例中,选择进水指标包括化学需氧量(COD)、生化需氧量(BOD)、总氮(TN)、总磷(TP)、pH、固体悬浮物浓度(SS)和流量(Q),选择的过程指标包括溶解氧(DO)、混合液固体悬浮物浓度(MLSS)、好氧区鼓风量(VOL),共计17766组进水水质指标数据。
其中,化学需氧量是指用化学方法测量水样中需要被氧化的还原性物质的量,即每升水样被全部氧化后所需氧的毫克数,以mg/L表示。它反映了还原性物质污染的程度。
生化需氧量是指在一定条件下,微生物分解存在于水中的可生化降解有机物所进行的生物化学反应过程中所消耗的溶解氧的数量。它是反映水中有机污染物含量的指标。
总氮指水中各种形态无机和有机氮的总量,包括、和等无机氮和蛋白质、氨基酸和有机胺等有机氮,即每升水样含氮的毫克数,以mg/L表示。总氮常用于表示营养物质污染水体的程度。
总磷是指水样经消解后将各种形态的磷转变成正磷酸盐后每升水样含磷毫克数,以mg/L表示。总磷是用于鉴别水体是否可能会出现富营养化或赤潮的重要指标。
pH指污水中氢离子浓度的对数,它反映了污水的酸碱性。同时pH对污水处理中微生物的生长、代谢和酶的活性等造成一定影响,因此需要根据处理工艺的不同来调整pH。
固体悬浮物浓度指水中悬浮的固体物质,包括泥沙、无机物、有机物等。
流量是指污水处理厂进水流量,即在单位时间内进入污水厂的污水量。流量的大小会对水处理过程产生一定的影响。
好氧区溶解氧可以促进生物降解、氨氮的氧化等反应。溶解氧过高会增加曝气量和电力消耗,导致电力浪费;过低则会导致出水污染物超标。
混合液固体悬浮物浓度,是指曝气池中单位体积混合液所含悬浮固体的浓度,它间接反映混合液中所含微生物量的指标,并影响净化效率。
曝气量是指通过曝气机曝入水体中气量,单位是L/min。曝气可以为水中的微生物提供氧气,同时充分搅拌污水。曝气所消耗的电力是污水处理厂用电的主要部分。
步骤S2、基于不同工艺单元的水力停留时间对所述原始数据集进行矫正,得到矫正后的数据集;
步骤S2.1、计算污水处理工艺中不同工艺单元的水力停留时间造成的时间差异,并矫正原始数据集;
在本实施例中,计算各单元的水力停留时间,累加计算得到进水口到好氧池、进水口到出水口的滞后时间,并将位于不同处理单元的数据指标按相应的滞后时间调整其在数据集中的位置。具体的,在本例中DO、MLSS等好氧池的数据指标延后57个时间单位,TN、TP等出水数据指标延后73个时间单位。
步骤S2.2、根据数据重复规律,按预设比例进行下采样,结合数据分布情况矫正原始数据集。
具体的,下采样以避免数据重复,在本例中通过分析污水处理厂数据发现进水数据存在重复情况,依据大多数情况下单条数据在12条记录以后不会重复出现的规律,在污水处理厂数据中以每12条抽取1条为标准进行下采样,得到作为模型训练的原始数据集;在抽取时若进水数据出现重复项则进行重新抽取。
步骤S2.2.1、根据箱线图原理剔除原始数据集中的异常值;
具体的,在本例中由于数据集存在异常值,使用箱线图法识别异常值。该法分别取各变量的上下四分位数计算上下边缘,不在上边缘与下边缘之间的数为异常值。将被识别的异常值替换为空白值。
IQR=Q3-Q1
upWisker=Q3+1.5*IQR
lowWisker=Q1-1.5*IQR
其中:IQR表示四分位距;Q3表示上四分位数;Q1表示下四分位数;upWisker表示上边缘线;lowWisker表示下边缘线。
步骤S2.2.2、根据贝叶斯回归插值填补原始数据集中的空白值;
在本例中由于数据集中存在空白值,为了模型可充分提取信息,使用贝叶斯回归法,根据数据集进行参数估计,并依据参数进行插数。
贝叶斯回归优化原理参照下式:
p(ω|λ)=N(ω|0,λ-1Ip)
其中,ω表示先验概率;p(ω|λ)表示当参数为λ时,ω的概率;λ表示对ω分布最大似然估计的假设;Ip表示大小为p的单位矩阵用于指定权重ω的高斯先验分布。
步骤S2.2.3、去除原始数据集中含有未被检测负数的组;
具体的,在数据集中,箱线图法存在无法识别某些较大负数的情况,因此去除所有含负数的单条数据,并完成数据清洗工作。
步骤S2.2.4、基于Box-Cox变换原理,对原始数据集进行变换,使其接近正态分布;
在本例中对数据使用Box-Cox变换,改善其分布情况,令其服从正态分布以利于提高模型预测能力。具体变换方法如下式所示,同时保存方便复原数据时使用。
其中:x表示i特征变量的原始值;x(λ)表示变换后的特征变量;λ表示变换参数。
步骤S2.2.5、基于minmax标准化原理,将原始数据集中的特征变量映射至0~1之间。
具体的,在本例中使用minmax标准化方法,将特征变量映射到0至1之间,统一各个变量的量纲与数值范围,从而达到提高模型训练速度的目的。具体标准化方法如公下式:
其中:x'i表示标准化后的特征变量;xi表示标准化前的特征变量;xmax表示第i个特征变量的最大值;xmin表示第i个特征变量的最小值。
步骤S3、基于多任务学习算法构建机器学习模型;
步骤S3.1、基于机器学习算法构建单任务预测模型;
具体的,本例中使用随机森林算法构建单任务预测模型;所使用的随机森林算法属于集成学习,具有准确度高、不易过拟合、训练速度快等优点;在本例中使用基于Python的scikit-learn软件包中的RandomForestRegressor方法构建单任务预测模型。
步骤S3.2、基于多任务算法将单任务预测模型构建为多任务预测模型。
具体的,在本例中使用基于Python的scikit-learn软件包中的MultiOutputRegressor方法将基于随机森林算法的单任务预测模型重构为多任务预测模型。
步骤S4、基于所述矫正后的数据集对所述机器学习模型进行训练,得到预测模型;
步骤S4.1、预设机器学习模型的超参数调整范围并构建超参数组合;
具体的,基于随机森林算法构建的多任务预测模型中包含许多超参数,如:max_depth、max_features、n_estimators等;在本例中,预设了max_depth、max_features、n_estimators的调整范围,组合出超参数集。
步骤S4.2、基于超参数组合,利用所述矫正后的数据集和交叉验证法对所述机器学习模型进行训练;
具体的,在本例中使用5折交叉优化算法对水质预测模型的决定系数(R2)进行计算,得到该超参数组合下水质预测模型的拟合度。
其中:yi表示第i个样本的预测值;表示第i个样本的标签;/>表示标签的平均值。
均方根误差RMSE是展示预测值和真实出水值之间差异的指标,它等于模型预测值和实际值之差的平方和的平均值的根。RMSE越小,说明预测值越接近真实值,当RMSE为0时,预测值与真实值完全相等。
其中:yi表示第i个样本的预测值;表示第i个样本的标签。
当R2>0.7时,模型对实际的拟合程度较好,若R2小于预设值0.6,则重新构建水质预测模型。
步骤S4.3、通过优化算法挑选出最佳预测性能的模型,得到预测模型。
具体的,在本例中采用贝叶斯优化算法。贝叶斯优化也称基于树结构的贝叶斯优化。为提高超参数调优速度,减少调优时间,使用贝叶斯优化算法对模型的超参数进行优化。贝叶斯优化流程见图2。
用贝叶斯优化法重复S5.2的步骤;比较不同模型间的和RMSE,前者越高、后者越低则表示该模型预测性能好、预测误差低;在多个模型中优选出最佳水质预测模型。
步骤S5、基于所述预测模型进行出水水质预测。
在一些可行的实施例中,还包括步骤S6、对预测模型进行测试,其具体包括:
S6.1、构建测试集;
具体地,在本例中将数据库按照训练集:测试集=4:1划分,80%的数据作为训练集,其余20%的数据作为测试集,其中训练集样本数据量为14162组,测试集的样本数据量为3540组。
S6.2、将测试集中的多项出水水质数据作为实际值,其余数据指标输入至所述预测模型中,得到出水水质数据的预测值;
在本例中将测试集3540组数据中的TN、TP作为实际值,用于与预测值对比;其余数据指标作为实际输入项输入到水质预测模型中,得到TN、TP的预测值;
S6.3、根据所述实际值与所述预测值计算均方根误差和决定系数;
S6.4、根据均方根误差、决定系数和模型总体拟合图,对所述预测模型准确度进行评估。
具体的,观察模型在测试集的和RMSE,前者越高、后者越低则表示该模型预测性能好、预测误差低;若过低则表示模型泛化能力较差,存在过拟合或欠拟合的风险,无法对未知数据进行准确的预测,需要重新构建模型;在本例中,以0.7作为指标的评估线,在低于0.7时,需要重新调整算法、优化超参数、构建新模型;在本例中,模型通过测试集检验后,使用散点图分别展示模型预测TP和TN的拟合效果,如图3所示。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (6)
1.一种耦合水力停留时间提高污水厂出水预测精度的方法,其特征在于,包括以下步骤:
获取污水处理厂的历史数据并构建原始数据集;
基于不同工艺单元的水力停留时间对所述原始数据集进行矫正,得到矫正后的数据集;
基于多任务学习算法构建机器学习模型;
基于所述矫正后的数据集对所述机器学习模型进行训练,得到预测模型;
基于所述预测模型进行出水水质预测;
所述基于不同工艺单元的水力停留时间对所述原始数据集进行矫正,得到矫正后的数据集这一步骤,其具体包括:
计算污水处理工艺中不同工艺单元的水力停留时间造成的时间差异,并矫正原始数据集;
根据数据重复规律,按预设比例进行下采样,结合数据分布情况矫正原始数据集;
所述计算污水处理工艺中不同工艺单元的水力停留时间造成的时间差异,并矫正原始数据集这一步骤,其具体包括:
获取污水处理厂工艺设计资料,计算各处理单元水力停留时间;
确定各数据指标在处理工艺中的位置,基于各处理单元水力停留时间计算数据指标相对进水的滞后时间;
累加计算得到进水口到好氧池、进水口到出水口的滞后时间;
根据所述滞后时间,调整中间处理单元和出水的水质数据、工艺参数在数据集中的前后位置,得到矫正后的数据集。
2.根据权利要求1所述一种耦合水力停留时间提高污水厂出水预测精度的方法,其特征在于,所述获取污水处理厂的历史数据并构建原始数据集这一步骤,其具体包括:
获取污水处理厂的连续监测历史数据;
根据预测需求选择数据指标,结合所述连续监测历史数据构建原始数据集;
所述数据指标包括进出水化学需氧量、总氮、总磷、pH、悬浮固体、流量,好氧池溶解氧浓度、污泥浓度和曝气风机的风量。
3.根据权利要求1所述一种耦合水力停留时间提高污水厂出水预测精度的方法,其特征在于,所述结合数据分布情况矫正原始数据集具体包括:
根据箱线图原理剔除原始数据集中的异常值;
根据贝叶斯回归插值填补原始数据集中的空白值;
去除原始数据集中含有未被检测负数的组;
基于Box-Cox变换原理,对原始数据集进行变换,使其接近正态分布;
基于minmax标准化原理,将原始数据集中的特征变量映射至0~1之间。
4.根据权利要求1所述一种耦合水力停留时间提高污水厂出水预测精度的方法,其特征在于,所述基于所述矫正后的数据集对所述机器学习模型进行训练,得到预测模型这一步骤,其具体包括:
预设机器学习模型的超参数调整范围并构建超参数组合;
基于超参数组合,利用所述矫正后的数据集和交叉验证法对所述机器学习模型进行训练;
通过优化算法挑选出最佳预测性能的模型,得到预测模型。
5.根据权利要求2所述一种耦合水力停留时间提高污水厂出水预测精度的方法,其特征在于,还包括:
构建测试集;
将测试集中的多项出水水质数据作为实际值,其余数据指标输入至所述预测模型中,得到出水水质数据的预测值;
根据所述实际值与所述预测值计算均方根误差和决定系数;
根据均方根误差、决定系数和模型总体拟合图,对所述预测模型准确度进行评估。
6.根据权利要求5所述一种耦合水力停留时间提高污水厂出水预测精度的方法,其特征在于,还包括:
若决定系数小于预设值,则重新构建预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311332650.1A CN117388457B (zh) | 2023-10-16 | 一种耦合水力停留时间提高污水厂出水预测精度的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311332650.1A CN117388457B (zh) | 2023-10-16 | 一种耦合水力停留时间提高污水厂出水预测精度的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117388457A CN117388457A (zh) | 2024-01-12 |
CN117388457B true CN117388457B (zh) | 2024-05-31 |
Family
ID=
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9120217D0 (en) * | 1991-09-21 | 1991-11-06 | Osc Process Engineering Ltd | Process and plant for the treatment of high-strength ammoniacal liquors |
CN101786721A (zh) * | 2010-02-05 | 2010-07-28 | 重庆大学 | 城市污水处理厂出水有机物浓度的随机过程预测方法 |
JP2013215698A (ja) * | 2012-04-12 | 2013-10-24 | Hitachi Ltd | 水処理プラントの状態診断方法及び装置 |
CN103771582A (zh) * | 2013-12-06 | 2014-05-07 | 浙江浙大中控信息技术有限公司 | 污水处理的曝气控制方法 |
CN110110466A (zh) * | 2019-05-17 | 2019-08-09 | 中冶华天工程技术有限公司 | 一种机器学习和工艺仿真的污水处理目标参数预测方法 |
CN110308705A (zh) * | 2019-06-19 | 2019-10-08 | 上海华高汇元工程服务有限公司 | 一种基于大数据和人工智能水质预测的设备控制方法 |
CN111291937A (zh) * | 2020-02-25 | 2020-06-16 | 合肥学院 | 基于支持向量分类与gru神经网络联合的处理污水水质预测方法 |
CN113429013A (zh) * | 2021-06-03 | 2021-09-24 | 阿里巴巴新加坡控股有限公司 | 混凝剂投放量的确定方法以及化合物投放量的确定方法 |
CN113589684A (zh) * | 2021-05-20 | 2021-11-02 | 北京工业大学 | 一种基于自调整多任务粒子群算法的污水处理过程优化控制方法 |
CN113744083A (zh) * | 2021-08-27 | 2021-12-03 | 暨南大学 | 一种基于环境不平衡数据的水质预测方法 |
CN114295707A (zh) * | 2021-12-28 | 2022-04-08 | 南京大学 | 一种基于机器学习的污水有机氮生物有效性评价方法 |
CN114386579A (zh) * | 2022-01-13 | 2022-04-22 | 安徽工业大学 | 一种基于多任务学习的污水处理水质监测自动控制方法 |
CN114671523A (zh) * | 2021-12-31 | 2022-06-28 | 广东长天思源环保科技股份有限公司 | 一种基于预测控制的污水处理节能方法 |
CN115793471A (zh) * | 2023-02-10 | 2023-03-14 | 森海环保集团有限公司 | 一种基于污水处理监测的可调式控制方法及系统 |
CN115859195A (zh) * | 2023-01-05 | 2023-03-28 | 北京北控悦慧环境科技有限公司 | 一种基于随机森林算法模型的河道水质指标软测量方法 |
CN116165974A (zh) * | 2022-12-14 | 2023-05-26 | 上海市政工程设计研究总院(集团)有限公司 | 污水处理工艺的曝气控制方法、系统、终端及介质 |
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9120217D0 (en) * | 1991-09-21 | 1991-11-06 | Osc Process Engineering Ltd | Process and plant for the treatment of high-strength ammoniacal liquors |
CN101786721A (zh) * | 2010-02-05 | 2010-07-28 | 重庆大学 | 城市污水处理厂出水有机物浓度的随机过程预测方法 |
JP2013215698A (ja) * | 2012-04-12 | 2013-10-24 | Hitachi Ltd | 水処理プラントの状態診断方法及び装置 |
CN103771582A (zh) * | 2013-12-06 | 2014-05-07 | 浙江浙大中控信息技术有限公司 | 污水处理的曝气控制方法 |
CN110110466A (zh) * | 2019-05-17 | 2019-08-09 | 中冶华天工程技术有限公司 | 一种机器学习和工艺仿真的污水处理目标参数预测方法 |
CN110308705A (zh) * | 2019-06-19 | 2019-10-08 | 上海华高汇元工程服务有限公司 | 一种基于大数据和人工智能水质预测的设备控制方法 |
CN111291937A (zh) * | 2020-02-25 | 2020-06-16 | 合肥学院 | 基于支持向量分类与gru神经网络联合的处理污水水质预测方法 |
CN113589684A (zh) * | 2021-05-20 | 2021-11-02 | 北京工业大学 | 一种基于自调整多任务粒子群算法的污水处理过程优化控制方法 |
CN113429013A (zh) * | 2021-06-03 | 2021-09-24 | 阿里巴巴新加坡控股有限公司 | 混凝剂投放量的确定方法以及化合物投放量的确定方法 |
CN113744083A (zh) * | 2021-08-27 | 2021-12-03 | 暨南大学 | 一种基于环境不平衡数据的水质预测方法 |
CN114295707A (zh) * | 2021-12-28 | 2022-04-08 | 南京大学 | 一种基于机器学习的污水有机氮生物有效性评价方法 |
CN114671523A (zh) * | 2021-12-31 | 2022-06-28 | 广东长天思源环保科技股份有限公司 | 一种基于预测控制的污水处理节能方法 |
CN114386579A (zh) * | 2022-01-13 | 2022-04-22 | 安徽工业大学 | 一种基于多任务学习的污水处理水质监测自动控制方法 |
CN116165974A (zh) * | 2022-12-14 | 2023-05-26 | 上海市政工程设计研究总院(集团)有限公司 | 污水处理工艺的曝气控制方法、系统、终端及介质 |
CN115859195A (zh) * | 2023-01-05 | 2023-03-28 | 北京北控悦慧环境科技有限公司 | 一种基于随机森林算法模型的河道水质指标软测量方法 |
CN115793471A (zh) * | 2023-02-10 | 2023-03-14 | 森海环保集团有限公司 | 一种基于污水处理监测的可调式控制方法及系统 |
Non-Patent Citations (3)
Title |
---|
Use of fugacity model to analyze temperature-dependent removal of micro-contaminants in sewage treatment plants;Thompson, K, 等;CHEMOSPHERE;20110831;第84卷(第8期);第1066-1071页 * |
人工智能与生态文明建设学科交叉教学实践与改革;祝新哲; 赵宝全; 孙连鹏; 李若泓;高教学刊;20231117(第33期);第42-45页 * |
随机模型预测UASB反应器对奶牛养殖废水处理效果;张迪; 郭婷; 郑萍; 姜佰文;东北农业大学学报;20171207;第48卷(第11期);第42-51页 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Haimi et al. | Data-derived soft-sensors for biological wastewater treatment plants: An overview | |
JP5022610B2 (ja) | 下水処理場運転支援装置 | |
Regmi et al. | The future of WRRF modelling–outlook and challenges | |
CN110320335B (zh) | 一种关于污水处理出水水质指标的多元鲁棒软测量方法 | |
CN103235096A (zh) | 污水水质检测方法与装置 | |
CN112417765B (zh) | 一种基于改进师生网络模型的污水处理过程故障检测方法 | |
De Pauw et al. | Practical aspects of sensitivity function approximation for dynamic models | |
CN115470702A (zh) | 一种基于机器学习的污水处理水质预测方法及系统 | |
Han et al. | A sludge volume index (SVI) model based on the multivariate local quadratic polynomial regression method | |
Baeza et al. | In-line fast OUR (oxygen uptake rate) measurements for monitoring and control of WWTP | |
AU2018418038B2 (en) | System and method for predicting a parameter associated with a wastewater treatment process | |
CN104914227A (zh) | 基于多高斯核自优化相关向量机的污水水质软测量方法 | |
CN113077847B (zh) | 在线模型水质转换方法、系统、电子设备及介质 | |
Chen et al. | An efficient approach based on bi-sensitivity analysis and genetic algorithm for calibration of activated sludge models | |
CN103605882A (zh) | 一种丝状菌污泥膨胀指数svi特征模型的构建方法 | |
CN117388457B (zh) | 一种耦合水力停留时间提高污水厂出水预测精度的方法 | |
CN117776336A (zh) | 水预处理方法及厌氧氨氧化水处理工艺 | |
US20200262726A1 (en) | Treatment of wastewater | |
CN116679026A (zh) | 自适应无偏有限脉冲响应滤波的污水溶解氧浓度估计方法 | |
CN110542748B (zh) | 一种基于知识的鲁棒型出水氨氮软测量方法 | |
CN117388457A (zh) | 一种耦合水力停留时间提高污水厂出水预测精度的方法 | |
Lim et al. | A systematic model calibration methodology based on multiple errors minimization method for the optimal parameter estimation of ASM1 | |
Corominas Tabares | Control and optimization of an SBR for nitrogen removal: from model calibration to plant operation | |
CN115356930A (zh) | 一种污水处理过程中的多目标优化控制系统及方法 | |
Jeppsson | A simplified control-oriented model of the activated sludge process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |