CN114842921A - 基于线性回归和决策树模型的市政污水除磷药剂投加方法 - Google Patents

基于线性回归和决策树模型的市政污水除磷药剂投加方法 Download PDF

Info

Publication number
CN114842921A
CN114842921A CN202210457289.4A CN202210457289A CN114842921A CN 114842921 A CN114842921 A CN 114842921A CN 202210457289 A CN202210457289 A CN 202210457289A CN 114842921 A CN114842921 A CN 114842921A
Authority
CN
China
Prior art keywords
data
model
sewage
phosphorus removal
linear regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210457289.4A
Other languages
English (en)
Inventor
詹敏述
章春花
程国坚
袁芳
徐伟
李龙胜
蒲一凡
陆永杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Environmental Protection Water Investment Co ltd
Jitri Institute For Process Modelling And Optimization Co ltd
CECEP Engineering Technology Research Institute Co Ltd
Original Assignee
China Environmental Protection Water Investment Co ltd
Jitri Institute For Process Modelling And Optimization Co ltd
CECEP Engineering Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Environmental Protection Water Investment Co ltd, Jitri Institute For Process Modelling And Optimization Co ltd, CECEP Engineering Technology Research Institute Co Ltd filed Critical China Environmental Protection Water Investment Co ltd
Priority to CN202210457289.4A priority Critical patent/CN114842921A/zh
Publication of CN114842921A publication Critical patent/CN114842921A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Activated Sludge Processes (AREA)

Abstract

本发明公开了一种基于线性回归和决策树模型的市政污水除磷药剂投加方法,包括数据模型建立、数据模型现场部署及运行和控制系统自动投加三个步骤,其中,数据模型建立步骤包括采集历史数据,进行数据预处理,计算污水小时流量系数,训练SVM分类器,分别建立线性回归模型和决策树模型;数据模型现场部署及运行步骤包括将封装好的数据模型部署到市政污水处理现场并接入实时数据,计算当前状态下所需的除磷药剂投加量,控制系统自动投加则依据数据模型运算结果完成除磷药剂投加。本发明方法依据市政污水每日水量变化规律,选择不同除磷药剂投加量预测模型计算最优除磷药剂投加量,节约计算资源、提高运算速度和预测精度。

Description

基于线性回归和决策树模型的市政污水除磷药剂投加方法
技术领域
本发明涉及市政污水药剂投加领域,尤其涉及一种基于线性回归和决策树模型的市政污水除磷药剂投加方法。
背景技术
市政污水是人们日常生活排放的污水,包括居民、公共设施和工厂的厨房、卫生间等生活设施的污水。这类污水不同于工业废水,其水质、水量的小时变化系数较大,尤其白天和夜间的变化显著,且短期内用水量变化又具有周期性。其中,进水流量的变化会对污水加药除磷工艺的絮凝沉淀过程产生很大的影响。当进水流量增加时,就会缩短絮体碰撞凝聚成大颗粒的时间,使得絮体生成不充分,同时也减少了絮体的沉降时间,降低了杂质去除率,从而影响出水水质。因此,当进水流量增大时,为了保证出水水质,需要增加除磷药剂投加量,反之则减少除磷药剂投加量。
在市政污水处理中需要根据进水流量变化正确控制除磷药剂投加量。当水量变化较小时,除磷药剂投加量、进水流量之间及水质参数之间呈现出较明显的对应关系;但水量变化较大时,除磷药剂投加量、进水流量及水质参数之间的数据多呈现非线性。
因此,基于上述存在的问题,有必要提供一种新的技术方案。
发明内容
鉴于此,本发明的目的是提出一种基于线性回归和决策树模型的市政污水除磷药剂投加方法,以解决上述除磷药剂投加过程中存在的问题。
本发明提供了以下技术方案:
一种基于线性回归和决策树模型的市政污水除磷药剂投加方法,包括如下步骤:
数据模型建立:采用多个数据采集组件获取包括实时数据和历史数据的加药数据;依据除磷药剂投加原理对历史数据进行数据预处理;计算污水小时流量系数;由污水小时流量系数将历史数据划分为正负样和负样本,并用正样本和负样本训练SVM分类器;根据水质参数分别建立除磷药剂投加量预测的线性回归模型和决策树模型,从而完成除磷药剂投加量预测模型的建立与训练。
数据模型现场部署及运行:将数据模型封装后部署到污水处理工艺流程现场,将实时数据接入到除磷药剂投加量预测模型;运行除磷药剂投加量预测模型,计算当前状态下所需的除磷药剂投加量。
控制系统自动投加:将除磷药剂投加量数据传递给控制系统,控制系统依据数据模型运算结果完成除磷药剂的自动投加。
进一步地,多个数据采集组件包括:流量计、正磷酸盐在线分析仪、温度计、电磁控制泵和总磷测定仪等;
所述除磷药剂投加量预测模型包括线性回归模型和决策树模型,所述数据模型包括训练好的SVM分类器和除磷药剂投加量预测模型。
进一步地,加药数据包括:进水流量、正磷酸盐浓度、水温、除磷药剂投加量和出口总磷等数据,并将加药数据接入控制系统中便于后续的数据预处理和数据模型训练。
进一步地,数据预处理包括:根据停留时间计算公式确定历史数据的对应关系;由于仪器检修等因素的影响,采集到的原始历史数据必然存在缺失值、噪声点和离群点,因而需要审核原始历史数据的完整性和准确性,删除原始历史数据中的缺失值、噪声点或离群点,修复原始历史数据中参数间时序性偏差,减小数据模型训练过程中的误差;通过以上数据预处理,提高数据模型建模速度和精度。
进一步地,污水小时流量系数计算公式如下:
Figure BDA0003619218480000031
其中:kh,i为污水小时流量系数;Qh,i为污水的小时流量;i为时刻,i=1,2,…,24。
假设市政污水流量在1小时内是均匀的,依据进水流量的每小时数据,即污水的小时流量,计算污水小时流量系数kh,i;污水小时流量系数kh,i随市政污水流量的不同而变化,市政污水流量越大且变化幅度越小,污水小时流量系数kh,i也越小,反之则kh,i越大。
由于市政污水每日用水集中和水量变化趋势存在规律性,而进水流量大小直接影响到后续除磷药剂投加量,因此需要根据历史数据计算污水小时流量系数kh,i,作为污水水量变化稳定性的判断标准。
进一步地,得到历史数据中的污水进水流量的污水小时流量系数范围之后,通过样本全局分析,选择合适的污水小时流量系数值kh,i *作为划分进水流量正样本和负样本的标准;
kh,i′为当前进水流量与上一小时进水流量的变化度,计算公式如下:
Figure BDA0003619218480000041
若kh,i′≤kh,i *,则看作当前进水流量变化较为稳定,将此时的历史数据划分为负样本;若kh,i′>kh,i *,则看作当前进水流量变化幅度较大,水量不稳定,将此时的历史数据划分为正样本;据此将历史数据划分出正样本和负样本,并用正样本和负样本训练SVM分类器;
进一步地,SVM分类器的输出结果w仅取两个值:-1和1,当输出结果w取-1时选择线性回归模型,当输出结果w取1时选择决策树模型;SVM分类器基于对历史数据的学习,动态决策出当前的水量变化是否稳定,从而提高后续根据实时水量来选择除磷药剂投加量预测模型的准确性。
进一步地,根据水质参数分别建立除磷药剂投加量预测的线性回归模型和决策树模型具体方式为:当污水进水流量变化较为稳定时,对应的历史数据用线性回归模型训练;当污水进水流量变化幅度较大、情况较为复杂时,对应的历史数据采用决策树模型进行训练;通过这一分类训练的方法,能有效利用数据模型特点挖掘数据信息,提高数据模型运算速度和除磷药剂投加量预测准确度。
进一步地,将训练好的SVM分类器和除磷药剂投加量预测模型封装部署到污水处理工艺流程现场中,并将数据采集装置采集的实时数据接入到数据模型。
进一步地,根据实时数据,先由SVM分类器判断进水流量变化幅度,选择出合适的除磷药剂投加量预测模型;然后计算出在当前市政污水进水流量和水质参数条件下所需的除磷药剂投加量。
与现有技术相比,本发明至少具有如下一种或多种有益效果:
本发明针对市政污水在不同时间的进水流量和水质差异较大的变化特质,建立不同水量变化特点的除磷药剂投加量预测算法,不仅能减少数据模型的计算量,而且可以提高运算速度和预测精度,同时能够实现自动最优化处理市政污水,对于市政污水除磷药剂投加具有十分重要的现实意义,应用性很强。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,图中相同的标记表示相同的部件,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图,重点在于示出本发明的主旨。
图1是本发明实施例所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法流程图;
图2是本发明实施例所述的SVM分类器判别水量变化流程图;
图3是本发明实施例所述的决策树模型预测流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的其它所有实施例,都属于本发明保护的范围。
实施例
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步的详细说明,如图1所示,该方法包括以下步骤:
S1:加药数据采集
加药数据采集包括:采用流量计采集市政污水的进水流量、采用正磷酸盐在线分析仪检测市政污水中的正磷酸盐浓度、采用温度计采集市政污水的水温、采用电磁控制泵采集除磷药剂加入到市政污水中的除磷药剂投加量、采用总磷测定仪采集市政污水的出口总磷,以上多个数据采集组件每小时采集一次加药数据,收集加药数据的历史数据和实时数据,为后续数据模型构建做准备,示例中,污水处理工艺流程现场包括控制系统和多个数据采集组件,多个数据采集组件与控制系统通讯连接,多个数据采集组件包括流量计、正磷酸盐在线分析仪、温度计、电磁控制泵和总磷测定仪等,控制系统安装于上位机内,上位机设置于污水处理工艺流程现场。
依据除磷药剂投加原理对原始历史数据进行数据预处理,数据预处理为根据停留时间计算公式确定历史数据的对应关系,停留时间为市政污水进入污水处理工艺流程现场的混凝沉淀池,然后与除磷药剂充分反应,最终流出混凝沉淀池所经历的时间,其中,市政污水进入混凝沉淀池的流量为进水流量。停留时间计算公式包括估算公式和精确公式,估算公式为:
Figure BDA0003619218480000071
精确计算公式跟流动相关,通过CFD的流动方程求解出精确的停留时间。
历史数据的对应关系是历史数据中各参数的入口和出口的数据对应关系。由于停留时间的存在,在当前时刻采集记录的混凝沉淀池的入口数据,然后经历停留时间之后到达出口,再检测出口的数据。因此,在历史数据库中,根据计算停留时间,找到入口采集数据对应的出口数据,即确定这样的历史数据的对应关系。确定历史数据对应关系的目的是解决加药数据中参数间时序性偏差的问题。
由于仪器检修等因素的影响,采集到的原始数据必然存在缺失值、噪声点和离群点,根据停留时间计算公式确定加药数据的对应关系时,需要审核加药数据的完整性和准确性,删除加药数据中的缺失值、噪声点或离群点,减小数据模型训练过程中的误差;通过以上数据预处理,提高数据模型建模速度和精度。
S2:计算污水小时流量系数
Figure BDA0003619218480000072
其中:kh,i为污水小时流量系数;Qh,i为污水的小时流量;i为时刻,i=1,2,…,24。污水小时流量系数作为市政污水水量变化稳定性的判断标准。
假设市政污水流量在1小时内是均匀的,依据进水流量的每小时数据,即污水的小时流量,计算污水小时流量系数kh,i;污水小时流量系数kh,i随市政污水流量的不同而变化,市政污水流量越大且变化幅度越小,kh,i也越小,反之则kh,i越大。
得到历史数据中的进水流量的污水小时流量系数范围之后,通过样本全局分析,选择合适的污水小时流量系数值kh,i *作为划分进水流量正样本和负样本的标准,即kh,i *为标准污水小时流量系数值;
kh,i′为当前进水流量与上一小时进水流量的变化度,计算公式如下:
Figure BDA0003619218480000081
若kh,i′≤kh,i *,则看作当前进水流量变化较为稳定,若kh,i′>kh,i *,则看作当前进水流量变化幅度较大,市政污水的水量不稳定;据此将历史数据划分出正样本和负样本,即当kh,i′≤kh,i *,时,此历史数据划分为正样本,当kh,i′>kh,i *时,此历史数据划分为负样本,并用这些正样本和负样本训练SVM分类器;
S3:SVM分类器判别水量变化是否稳定
如图2所示,先将步骤S1收集的历史数据划分为训练数据集和测试数据集,划分训练数据集和测试数据集时采用随机不放回抽样的方式,划分出两个互斥的集合,并均应保持训练数据集和测试数据集内数据分布的一致性,即类别比例相似,可以采用分层抽样的方式。示例中,训练数据集和测试数据集划分时采用7:3的比例。训练数据集内的历史数据称为样本数据,训练数据集又称训练样本,针对训练数据集,选择核函数以及其对应的参数,其中,SVM分类器中主要有4种核函数,(1)线性核函数:K(X,Y)=XTY;(2)多项式核函数:K(X,Y)=(γXTY+r)d,其中,d用来设置多项式核函数的最高此项次数;γ用来设置核函数的系数;r用来设置核函数中的常数项;(3)双曲正切核函数:K(X,Y)=tanh(γXTY+r),其中,d用来设置多项式核函数的最高此项次数;γ用来设置核函数的系数;r用来设置核函数中的常数项;(4)高斯径向基核函数:K(X,Y)=e-γ‖X-Y‖2,其中,d用来设置多项式核函数的最高此项次数;γ用来设置核函数的系数;r用来设置核函数中的常数项。核函数的选择主要通过不同核函数和参数的组合实验找到最优值。SVM分类器是通过在特征空间中建立分类超平面实现对样本数据的划分,分类超平面的函数表达式为:WTX+b=0,而位于分类超平面两侧的样本数据计算则分别为WTX+b=1和WTX+b=-1,以此将分类超平面两侧的样本数据分为正样本数据和负样本数据,因而SVM分类器是一种典型的线性二分类机器学习模型,SVM分类器也可称为SVM模型,当样本数据在二维空间内无法进行线性分割时,需要利用核函数将样本数据映射到三维空间内帮助构建分类超平面,而根据核函数选择的差异,其参数也各有不同。随后在SVM模型中输入预测因子和污水小时流量系数并运行SVM模型,得到样本数据的预测值,预测值包括正预测值和负预测值,其中,预测因子可包括影响污水小时流量系数计算的各参数,示例中,输入的预测因子是输入的进水量。通过步骤S2中标准污水小时流量系数值kh,i *将样本数据划分为正真实值和负真实值,正真实值和负真实值统称真实值,将预测值和真实值按照准确率、召回率和F值等SVM模型评价指标进行分析,找出最优的分类超平面。
根据分类超平面的函数表达式,该最优的分类超平面需确保位于分类超平面两侧的正样本数据和负样本数据到分类超平面的距离都尽可能远,实现间隔最大化,才能使得SVM分类器具有更好的泛化性能,提高分类准确性。通过最小二乘法计算样本数据的真实值和SVM模型对样本数据的预测值间的平方损失函数来确定该最优的分类超平面,平方损失函数的计算表达式为:L(Y,f(X))=(Y-f(X))2,其中X为SVM模型输入的预测因子,f(X)为SVM模型对样本数据的预测值,Y为样本数据的真实值。通过测试数据集计算出最小化平方损失函数,并以最小化平方损失函数来判断当前SVM模型的预测精度是否满足要求,其是否满足要求,通过计算SVM模型的平方损失函数是否已经达到最小化来判断,如不满足要求,则需要重新选择核函数和参数进行SVM模型的训练,直至SVM模型的平方损失函数达到最小化,从而得到最优的SVM分类器。
训练后的SVM分类器,其输出结果w仅取两个值:-1和1,输出结果w能根据输入的实时数据判断当前进水流量变化稳定性。当输出结果w为-1时表示进水流量变化幅度小,水量较为稳定,后续选择线性回归模型,当输出结果w为1时表示进水流量变化幅度大,后续应选择决策树模型。
S4:线性回归模型预测除磷药剂投加量。
由于市政污水除磷环节的影响参数较多,当选择线性回归建立除磷药剂投加量预测模型时,多选用多元线性回归模型,该多元线性回归模型定义为:f(x1,x2,…xn)=w0+w1x1+w2x2+…+wnxn,其中,w0为常数项,xi为影响目标值f(x1,x2,…xn)的特征参数,wi为特征参数的权重,wi表示特征参数对目标值f(x1,x2,…xn)的影响程度,其中i=1,2,…,m。如增加一个特征参数值x0=1,该方程就可以简化为
Figure BDA0003619218480000111
进一步可以表达为矩阵形式f(X)=WTX,即
Figure BDA0003619218480000112
其中f(X)为m×1的向量,X为m×(n+1)的向量,W为1×(n+1)的向量,m代表样本数据的个数,n代表样本数据的特征数,yi为线性回归模型针对第i个样本数据给出的预测目标的预测值,其中i=1,2,…,m。
确定多元线性回归模型的方程后,需要求出该方程的损失函数,一般线性回归模型的方程采用均方误差作为损失函数,损失函数的计算公式为:
Figure BDA0003619218480000113
其中
Figure BDA0003619218480000114
表示第i个样本数据预测目标的真实值,这样做是为了将方程组的求特征参数问题转化成求最优解问题,使得损失函数最小化,一般采用最小二乘法进行求解。
最小二乘法进行求解,先对所有的w求偏导数,得到n个方程组
Figure BDA0003619218480000115
表示第i个样本数据的第k个特征参数,解得
Figure BDA0003619218480000121
Figure BDA0003619218480000122
向量化后得到XTXW=XTY,W=(XTX)-1XTY,从而求解出多元线性回归模型的特征参数的权重,使得损失函数最小化。
在除磷药剂投加量预测中,水质参数和除磷药剂投加量都是特征参数xi,他们的波动会影响到反应沉淀池内的絮凝沉淀过程,从而影响到目标值出口总磷f(x)。当基于历史数据对多元线性回归模型进行训练后,得到常数项w0和特征参数的权重值wi,随后根据不同的水质参数和除磷药剂投加量就能预测出该条件下的出口总磷,判断出口总磷是否满足不小于0.5mg/L的国家指标。将多元线性回归模型进行变形,得到除磷药剂投加量xi=(f(x)-w0-w1x1-w2x2-…wi-1xi-1-wi+1xi+1…-wnxn)/wi,将f(x)设为污水处理厂的出水总磷排放目标值,其余参数均为多元线性回归模型训练过程中计算出的结果,就可以在不同的水质条件下,求出合理的除磷药剂投加量,减少药耗成本,该除磷药剂投加量即为线性回归模型的输出结果y1
S5:决策树模型预测除磷药剂投加量。
如图3所示的决策树模型预测流程图,决策树模型不同于线性回归模型,是典型的针对非线性数据的回归方法,当水量变化幅度较大时,水质参数常常也会发生变化,加药数据多呈现非线性,普通的线性回归模型则不能满足除磷药剂投加量的预测需求,故采用具有很高复杂度和非线性的决策树模型方法。
假设X和Y分别为特征参数和预测目标,训练数据集为D={(x1,y1),(x2,y2)…(xm,ym)},其中
Figure BDA0003619218480000131
为特征向量,m代表样本数据的个数,n代表样本数据的特征数。决策树模型采用启发式方法,每次划分都遍历当前训练数据集中所有特征参数的全部取值,直到找到一个最优划分点,使得在该最优划分点将整个训练数据集分成两个子集时的损失函数最小。对样本数据中第j个特征变量xj和它的取值s作为切分变量和切分点,并定义如下两个区域R1(j,s)={x|xj≤s}和R2(j,s)={x|xj>s},为了找出最优的j和s,需求解算式
Figure BDA0003619218480000132
Figure BDA0003619218480000133
也就是找出使要划分的两个区域平方误差和最小时的j和s,其中,c1为划分的区域R1内的固定输出值,c2为划分的区域R2内的固定输出值,方括号内的两个min表示使用的是最优的c1和c2,也就是选取的固定输出值c1使区域R1内的平方误差和最小,选取的固定输出值c2使区域R2内的平方误差和最小,在一维空间内使样本均值的平方误差和最小的固定输出值是最优的固定输出值,所以这两个最优的固定输出值c1和c2就是各自对应区域内Y的均值,上式可写为
Figure BDA0003619218480000134
其中
Figure BDA0003619218480000135
Figure BDA0003619218480000136
找出最优的j和s后,依次将训练数据集中的样本数据划分到上述的两个区域,区域内划分的样本数据构成子集,两个区域形成了两个子集,没有被划分的样本数据称为叶子节点,叶子节点内的样本称为元素。
再分别寻找训练数据集的两个子集的最优划分点继续切分,直至达到预设的终止条件才停止划分,此时叶子节点所含训练数据集的均值即为该叶子节点的输出值。当输入新的加药数据后,通过之前训练好的划分准则,将该加药数据最后落到的叶子节点的输出值作为该加药数据的预测值。在市政污水除磷药剂投加量预测中,同样将水质参数和除磷药剂投加量作为特征值,将出口总磷作为该条件下的预测值,当其他条件保持不变,调整除磷药剂投加量,可以精确的计算出目前的预测出口总磷,从而得到最合适的除磷药剂投加量y2,方便污水处理的技术人员针对特征参数的变化及时调整除磷药剂投加量,对建立节能环保型水厂具有深远的现实意义。
S6:数据模型现场部署及运行。
将训练好的SVM分类器和除磷药剂投加量预测模型封装后部署到污水处理工艺流程现场,接入实时数据;运行除磷药剂投加量预测模型,计算当前状态下所需的除磷药剂投加量。其中,所述除磷药剂投加量预测模型包括线性回归模型和决策树模型,当前状态包括当前市政污水进水流量和水质参数。
S7:控制系统自动投加。
将除磷药剂投加量数据传递给控制系统,控制系统依据数据模型运算结果完成除磷药剂自动投加。
以上对本发明实施例进行了详细介绍,以上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本技术领域的普通技术人员来说,依据本发明的思想,在具体实施方式及应用范围上均会有所改变,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,包括如下步骤:
数据模型建立:采用多个数据采集组件获取包括实时数据和历史数据的加药数据,依据除磷药剂投加原理对原始历史数据进行数据预处理;计算污水小时流量系数;由污水小时流量系数将历史数据划分为正负样和负样本,并用正样本和负样本训练SVM分类器;根据水质参数分别建立除磷药剂投加量预测的线性回归模型和决策树模型,完成除磷药剂投加量预测模型的建立与训练;
数据模型现场部署及运行:将数据模型封装后部署到污水处理工艺流程现场,将实时数据接入到除磷药剂投加量预测模型;运行除磷药剂投加量预测模型,计算当前状态下所需的除磷药剂投加量;
控制系统自动投加:将除磷药剂投加量数据传递给控制系统,控制系统依据数据模型运算结果完成除磷药剂的自动投加。
2.根据权利要求1所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,多个数据采集组件包括流量计、正磷酸盐在线分析仪、温度计、电磁控制泵和总磷测定仪;
所述除磷药剂投加量预测模型包括线性回归模型和决策树模型,所述数据模型包括训练好的SVM分类器和除磷药剂投加量预测模型。
3.根据权利要求2所述的基于线性回归和决策树模型的市政污水磷药剂投加方法,其特征在于,加药数据包括市政污水的进水流量、正磷酸盐浓度、水温、除磷药剂投加量和出口总磷,所述历史数据被配置的接入控制系统用于数据预处理和数据模型训练。
4.根据权利要求1所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,所述数据预处理包括:根据停留时间计算公式确定历史数据的对应关系,删除原始历史数据中的缺失值、噪声点或离群点,修复原始历史数据中参数间时序性偏差。
5.根据权利要求1所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,所述污水小时流量系数的计算公式如下:
Figure FDA0003619218470000021
其中:kh,i为污水小时流量系数;Qh,i为污水的小时流量;i为时刻,i=1,2,...,24;
依据市政污水进水流量的每小时数据,即污水的小时流量计算污水小时流量系数kh,i
6.根据权利要求5所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于:根据污水小时流量系数将历史数据划分为正负样和负样本的具体步骤包括:
根据获得的污水小时流量系数的范围,选取标准污水小时流量系数值kh,i *;计算当前进水流量与上一小时进水流量的变化度kh,i′,计算公式如下:
Figure FDA0003619218470000022
若kh,i′≤kh,i *,判定当前进水流量变化较为稳定,将此时的历史数据划分为负样本;若kh,i′>kh,i *,判定当前进水流量变化幅度较大,水量不稳定,将此时的历史数据划分为正样本。
7.根据权利要求6所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,训练SVM分类器,SVM分类器的输出结果w仅取两个值:-1和1,当输出结果w取-1时选择线性回归模型,当输出结果w取1时选择决策树模型。
8.根据权利要求1所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,根据水质参数分别建立除磷药剂投加量预测的线性回归模型和决策树模型具体方式为:当污水进水流量变化稳定时,该对应的历史数据用线性回归模型训练;当污水进水流量变化幅度较大、情况较为复杂时,该对应的历史数据采用决策树模型训练。
9.根据权利要求1所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,所述数据模型现场部署为:将包括训练好的SVM分类器和除磷药剂投加量预测模型的数据模型封装部署到污水处理工艺流程现场中,利用多个数据采集组件采集实时数据,将实时数据接入到数据模型。
10.根据权利要求7所述的基于线性回归和决策树模型的市政污水除磷药剂投加方法,其特征在于,运行除磷药剂投加量预测模型的步骤具体包括:根据实时数据,由SVM分类器判断市政污水进水流量变化幅度,根据SVM分类器的输出结果选择对应的除磷药剂投加量预测模型,运行该除磷药剂投加量预测模型,计算当前市政污水进水流量和水质参数条件下所需的除磷药剂投加量。
CN202210457289.4A 2022-04-27 2022-04-27 基于线性回归和决策树模型的市政污水除磷药剂投加方法 Pending CN114842921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210457289.4A CN114842921A (zh) 2022-04-27 2022-04-27 基于线性回归和决策树模型的市政污水除磷药剂投加方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210457289.4A CN114842921A (zh) 2022-04-27 2022-04-27 基于线性回归和决策树模型的市政污水除磷药剂投加方法

Publications (1)

Publication Number Publication Date
CN114842921A true CN114842921A (zh) 2022-08-02

Family

ID=82567124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210457289.4A Pending CN114842921A (zh) 2022-04-27 2022-04-27 基于线性回归和决策树模型的市政污水除磷药剂投加方法

Country Status (1)

Country Link
CN (1) CN114842921A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117238389A (zh) * 2023-11-14 2023-12-15 江苏海峡环保科技发展有限公司 基于智能加药的含氟废水处理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107219779A (zh) * 2016-03-22 2017-09-29 周楠 一种水处理药剂的投加方法及装置
CN108171379A (zh) * 2017-12-28 2018-06-15 无锡英臻科技有限公司 一种用电负荷预测方法
CN111291937A (zh) * 2020-02-25 2020-06-16 合肥学院 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
CN112906936A (zh) * 2021-01-07 2021-06-04 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107219779A (zh) * 2016-03-22 2017-09-29 周楠 一种水处理药剂的投加方法及装置
CN108171379A (zh) * 2017-12-28 2018-06-15 无锡英臻科技有限公司 一种用电负荷预测方法
CN111291937A (zh) * 2020-02-25 2020-06-16 合肥学院 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
CN112906936A (zh) * 2021-01-07 2021-06-04 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
侯艳玲: "市污水处理厂化学除磷工艺优化运行与控制系统研究", 中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑, no. 02, 15 February 2012 (2012-02-15), pages 027 - 722 *
周志中: "西部开发与生态环境保护", 31 August 2005, 中国环境科学出版社, pages: 697 *
张仁志: "水污染治理技术", vol. 2, 31 August 2018, 武汉理工大学出版社, pages: 216 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117238389A (zh) * 2023-11-14 2023-12-15 江苏海峡环保科技发展有限公司 基于智能加药的含氟废水处理系统及方法
CN117238389B (zh) * 2023-11-14 2024-01-30 江苏海峡环保科技发展有限公司 基于智能加药的含氟废水处理系统及方法

Similar Documents

Publication Publication Date Title
CN111291937A (zh) 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
CN111046018B (zh) 基于多目标优化的发电设备运行工况库构建方法和装置
CN108241901B (zh) 一种基于预测数据的变压器预警评估方法及装置
CN113556629B (zh) 一种智能电表误差远程估计方法及装置
CN112348290B (zh) 河流水质预测方法、装置、存储介质及设备
CN102531121A (zh) 水处理混凝剂最佳投量预测系统及预测方法
CN108595892A (zh) 基于时间差分模型的软测量建模方法
CN112686481A (zh) 一种径流量预报方法、处理器
CN110969282A (zh) 一种基于lstm复合网络的径流量稳定预测方法
CN117078114B (zh) 引水工程影响下受水湖泊水质评价方法和系统
CN110490369A (zh) 一种基于ewt和lssvm模型的短期电力负荷预测方法
CN117235595A (zh) 一种基于LSTM-Attention的污水处理加药量预测方法及系统
CN109345021A (zh) 一种采用lstm建模预测劳动力需求增量的方法
CN114842921A (zh) 基于线性回归和决策树模型的市政污水除磷药剂投加方法
CN104914227A (zh) 基于多高斯核自优化相关向量机的污水水质软测量方法
CN106547899B (zh) 一种基于多尺度时变聚类中心变化的间歇过程时段划分的方法
CN114819599A (zh) 水环境调度参数的确定方法、装置、设备及存储介质
CN114881347A (zh) 一种采用加权残差聚类的天然气负荷预测区间估计方法
CN114861535A (zh) 利用cfd做数据预处理的水处理过程机器学习建模方法
CN118183886A (zh) 基于神经网络的水质模型基础参数动态调优方法及装置
CN108254038A (zh) 一种原油储罐油水界面数据去伪及液位测量的计算方法
CN116956156A (zh) 一种基于人工智能的污水处理智能曝气方法及系统
CN117577225A (zh) 用于沉降罐的水质评价方法及装置
CN114841277A (zh) 一种转炉出钢合金收得率预测方法和系统
Li et al. Design and application of soft sensors in rural sewage treatment facilities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination