CN111859263B - 一种用于自来水处理的精准投药方法 - Google Patents
一种用于自来水处理的精准投药方法 Download PDFInfo
- Publication number
- CN111859263B CN111859263B CN202010536580.1A CN202010536580A CN111859263B CN 111859263 B CN111859263 B CN 111859263B CN 202010536580 A CN202010536580 A CN 202010536580A CN 111859263 B CN111859263 B CN 111859263B
- Authority
- CN
- China
- Prior art keywords
- water
- turbidity
- value
- data
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000008399 tap water Substances 0.000 title claims abstract description 18
- 235000020679 tap water Nutrition 0.000 title claims abstract description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 142
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 51
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 20
- 238000002922 simulated annealing Methods 0.000 claims abstract description 15
- 238000012417 linear regression Methods 0.000 claims abstract description 11
- 238000010219 correlation analysis Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000005096 rolling process Methods 0.000 claims 2
- 238000004519 manufacturing process Methods 0.000 abstract description 7
- 229920006395 saturated elastomer Polymers 0.000 abstract description 2
- 239000000701 coagulant Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000015271 coagulation Effects 0.000 description 2
- 238000005345 coagulation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- -1 aluminum ions Chemical class 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 239000011151 fibre-reinforced plastic Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000008213 purified water Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/17—Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Algebra (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Geometry (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于自来水处理的精准投药方法,包括:数据预处理:0值、空值和异常值处理;通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;构建日均进水浊度与日均投药量线性回归方程;利用系统动态方程算法构建出水浊度预测模型;利用K‑L信息法确定投药出水浊度滞后时间;根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析;利用模拟退火算法进行投药量寻优最优解分析。本发明实用性强,实现对自来水生产工艺中精准投药的控制,保证出水水质的情况下,有效避免人工饱和式投药带来的经济损失,意义重大。
Description
技术领域
本发明涉及水务技术领域,更具体的说,是一种用于自来水处理的精准投药方法。
背景技术
混凝加药是自来水生产工艺中的核心环节,直接影响到出水水质,而影响混凝效果的最重要的因素,是混凝剂的投加量。
目前所用的混凝剂多为铝盐,研究表明,水中铝离子浓度过高会影响人的身体健康,并对水质及输水系统产生不良影响。另一方面净水的混凝剂药剂费是仅次于电费而构成制水成本的第二大要素,混凝剂投加量直接影响到制水成本以至水价,在保证处理效果的前提下,节约混凝剂消耗,是降低净水成本的重要措施,经济意义十分重大。因此,实现精确控制投药不但可以充分利用混凝剂的效能,保证出水水质,而且对于控制生产成本也同样意义重大。
发明内容
本发明的目的是提供一种用于自来水处理的精准投药方法,以解决现有模式中人工饱和式投药对水质造成不利影响和带来巨大经济损失等问题。
为了实现上述目的,本发明提供如下技术方案:
一种用于自来水处理的精准投药方法,包括:
数据预处理:0值、空值和异常值处理。
通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;
构建日均进水浊度与日均投药量线性回归方程。
利用系统动态方程算法构建出水浊度预测模型。
利用K-L信息法确定投药出水浊度滞后时间。
根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析。
利用模拟退火算法进行投药量寻优最优解分析。
优选的,数据预处理:0值、空值和异常值处理,包括:
空值转化为零值。
历史存量数据中0值的处理。
实时增量数据中0值的处理。
历史存量数据中异常值的处理。
实时增量数据中异常值的处理。
优选的,0值、空值和异常值处理方法,包括:
空值处理:将空值转化为零值。
历史存量数据中0值的处理:
第一步:记历史投药输入数据{Qi|i=1,2,...,n},定义目标点为Qi(目标点从开始到结束依次扫描);
第二步:定位得到Qi=0值的点位;
第三步:向前回滚10个点的时间窗口,筛选非空非零记录,筛选后中位数作为0值的填充值。
实时增量数据中0值的处理:
第一步:判断是否为0;
第二步:向前回滚10个点的时间窗口,筛选非空非零记录,筛选后中位数作为0值的填充值。
历史存量数据中异常值的处理:
第一步:记历史投药输入数据{Qi|i=1,2,...,n},定义目标点为Qi(目标点从开始到结束依次扫描);
第二步 历史投药输入数据求Ui=Qi-Qi-1,Ui-1=Qi-1-Qi-2得到
{Ui|i=1,2,...,n-1},定义目标点Qi对应的目标相关点为Ui和Ui-1;
第三步 除目标相关点外逐次执行分箱操作,即:
Pup=B+1.5*(A-C)
Pdown=B-1.5*(A-C)
其中Pup为上边界,Pdown为下边界,B为因子中非空非零的中位数,A为上四分位数,C为下四分位数;
第四步 判断Qi异常情况。若Ui和Ui-1都不在边界内,则判定目标点Qi为异常值。否则不是异常值;
第五步 识别出异常值后,采用当前计算点向前10个点中位数代替。
实时增量数据中异常值的处理:
第一步:同样的,获取目标点及其之前n个点的数据(历史数据已经处理过了);
第二步:然后执行1中的异常值识别过程;
第三步:采用当前计算点向前回滚10个点的非空非零记录的中位数代替均值代替。
优选的,所述的通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系,包括:
采用皮尔逊相关系数分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系。
变量相关分析是考虑多个变量之间的线性关系的一种统计方法,用于衡量多个变量因素之间的相关程度。皮尔逊相关系数的全称为:皮尔逊积矩相关系数(Pearsonproduct-moment correlation coefficient)。该系数广泛用于度量两个变量之间的相关程度。定义的公式如下:
其中,xi和yi分别为i时刻变量x和y的值,和/>分别为x和y的平均值。如,计算进水温度与出水浊度之间的相关程度,xi为i时刻的进水温度值,yi为i时刻的出水浊度值,x为进水温度的平均值,/>为出水浊度的平均值。
优选的,所述的构建日均进水浊度与日均投药量线性回归方程,包括:
获取日均进水浊度数据。
获取日均投药量数据。
根据所得日均进水浊度与日均投药量数据采用最小二乘法拟合线性回归方程,并将所得函数关系记为f2。
其中,为日均进水浊度,/>为日均投药量,a和b为线性回归参数。
优选的,所述的利用系统动态方程算法构建出水浊度预测模型,包括:
在明确出水浊度相关因素的情况下,相关因素包括进水温度、进水浊度、进水流量等,采用系统动态方程算法构建出水浊度预测模型,模型定义为:
其中,Th,Zh,Qh,Mh,Ch+L分别为h时刻的进水温度、进水浊度、进水流量、投药量和h+L时刻的出水浊度数据。
将该模型定义为f1模型,供后续寻优模块的调用。
优选的,系统动态方程算法,包括:
系统的状态方程和输出方程一起,称为系统状态空间表达式,或称为系统动态方程。在经典控制理论中,对线性定常系统常采用常微分方程和传递函数来描述系统输入和输出关系,而现代控制理论,则由描述系统输入、输出动态关系的微分方程和传递函数建立系统动态方程,步骤如下:
首先,确定状态变量、输入变量、输出变量
若给定初始条件及t≥0的输入u(t),则系统行为被完全确定。故选择/>为系统的一组状态变量,令:
其次,根据所确定的状态变量得到微分方程组;
将上述方程组两边对t求导,化为状态变量x1,x2,…xn的一阶微分方程组;
最后,针对所得微分方程组,写出状态变量、输入变量、输出变量表示的状态方程和输出方程。
对于建立好的输出方程,给定输入变量的值即可得到输出变量的值。
优选的,所述利用K-L信息法确定投药出水浊度滞后时间,包括:
K-L信息量法是本世纪中叶,由Kull-back和Leibler提出,用以判定两个概率分布的接近程度。其原理是以基准序列为理论分布,备选指标为样本分布,不断变化备选指标与基准序列时差,计算K-L信息量。K-L信息量最小时对应的时差数确定为备选指标的最终时差。
设基准指标为y={y1,y2,…,yn},由于任意满足的序列P均可视为随机变量的概率分布,因此,对基准指标做标准化处理,使得指标的和为单位1,处理后的序列记为P,则:
被选指标x={x1,x2,…,xn},做标准化处理,处理后的序列记为q,则:
K-L信息量计算公式为:
其中,l被称为时差或延迟数,L是最大延迟数,nl表示数据取齐后的数据个数。当计算出2L+1个K-L信息量后,从所有的kl值中选出一个最小值kln作为被选指标x关于基准指标y信息量,即:
kl'=minkl,其中l'就是被选指标最适当的滞后时间。
优选的,所述采用根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析,包括:
当模型在运行的时候,首先获取得到关键指标i时刻的即时值:
[Ti,Zi,Qi]
根据曼哈顿距离算法寻找历史样本中的近似样本为:
[Tih,Zih,Qih,Mih|(i=1,2,3,4,5)]
优选的,所述曼哈顿距离算法,包括:
曼哈顿距离算法是十九世纪的赫尔曼·闵可夫斯基所创词汇,是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和。公式:
曼哈顿距离——两点在南北方向上的距离加上在东西方向上的距离,即d(i,j)=|xi-xj|+|yi-yj|。对于一个具有正南正北、正东正西方向规则布局的城镇街道,从一点到达另一点的距离正是在南北方向上旅行的距离加上在东西方向上旅行的距离,因此,曼哈顿距离又称为出租车距离。曼哈顿距离不是距离不变量,当坐标轴变动时,点间的距离就会不同。
优选的,所述利用模拟退火算法进行投药量寻优最优解分析,包括:
将投药量近似样本[Tih,Zih,Qih,Mih|(i=1,2,3,4,5)]中的投药量取平均值Mh作为投药量最优解的近似解。
在投药量近似最优解附近,根据模拟退火算法计算f1输出出水浊度与标准出水浊度的最小值对应的最优投药量。
根据拟合得到的日均进水浊度与日均投药量线性关系函数,得到函数关系f2最小值对应的投药量。
计算minf1与f2两者最小值对应的最优投药量。
优选的,所述模拟退火算法,包括:
模拟退火算法(Simulate Anneal Arithmetic,SAA)是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解。
模拟退火算法可以分解为解空间、目标函数和初始解三部分。
模拟退火的基本思想:
(1)初始化:初始值T(充分大),初始解状态S(是算法迭代的起点),每个T值的迭代次数L。
(2)对k=1,……L做第(3)至第6步。
(3)产生新解S'。
(4)计算增量Δt'=C(S')-C(S),其中C(S)为评价函数或优化目标。
(5)若Δt'<0则接受S'作为新的当前解,否则以概率exp(-Δt'/T)接受S'作为新的当前解。
(6)如果满足终止条件则输出当前解作为最优解,结束算法。终止条件通常取为连续若干个新解都没有被接受时终止算法。
(7)减小T,转到第2步,直到T小于初始设定的阈值。
与现有方法相比,本申请并不采用人工经验法,而是利用智能算法对数据进行分析,实现系统精准投药。
算法首先对0值、空值和异常值进行了处理,提高数据集质量,为后续精准投药奠定基础。
其次,利用系统动态方程算法构建出水浊度预测模型,并使用K-L信息法确定投药出水浊度滞后时间,避免时滞因素对系统的影响。根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析,再构建日均进水浊度与日均投药量线性关系函数,进行投药量寻优最优解分析,获得在满足国家出水浊度标准情况下的最优投药量。
且本文提出的精准投药方法不仅考虑了各进水指标、投药量与出水浊度之间的数据规律,也考虑了出水在浊度与投药量之间的时滞关系。避免了人工饱和式投药对水质造成的不利影响和巨大的经济损失。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种用于自来水处理的精准投药方法的流程图;
图2为本发明实施例提供的一种用于自来水处理的精准投药方法中0值和空值处理数据处理流程图;
图3为本发明实施例提供的一种用于自来水处理的精准投药方法中异常值识别处理流程图;
图4为本发明实施例提供的一种用于自来水处理的精准投药方法中相关因素分析流程图;
图5为本发明实施例提供的一种用于自来水处理的精准投药方法中系统动态方程算法构建出水浊度预测模型流程图;
图6为本发明实施例提供的一种用于自来水处理的精准投药方法中K-L信息法确定投药出水浊度滞后时间求解流程图;
图7为本发明实施例提供的一种用于自来水处理的精准投药方法中投药量近似最优解分析流程图;
图8为本发明实施例提供的一种用于自来水处理的精准投药方法中进行投药量寻优最优解分析流程图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种用于自来水处理的精准投药方法的流程图,包括:
S101:数据预处理:0值、空值和异常值处理。
因为采集失败或者网络传送失败导致数据为0或者空值的情况时有发生,基于此,设计了历史存量和增量异常数据识别与处理两种方式,以提升建模数据质量。
S102:通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系。
采用皮尔逊相关系数分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系。
变量相关分析是考虑多个变量之间的线性关系的一种统计方法,用于衡量多个变量因素之间的相关程度。皮尔逊相关系数的全称为:皮尔逊积矩相关系数(Pearsonproduct-moment correlation coefficient)。该系数广泛用于度量两个变量之间的相关程度。定义的公式如下:
其中,xi和yi分别为i时刻变量x和y的值,和/>分别为x和y的平均值。如,计算进水温度与出水浊度之间的相关程度,xi为i时刻的进水温度值,yi为i时刻的出水浊度值,/>为进水温度的平均值,/>为出水浊度的平均值。
S103:利用构建日均进水浊度与日均投药量线性回归方程。
获取日均进水浊度数据。
获取日均投药量数据。
根据所得日均进水浊度与日均投药量数据采用最小二乘法拟合线性回归方程,并将所得函数关系记为f2。
其中,为日均进水浊度,/>为日均投药量,a和b为线性回归参数。
S104:利用系统动态方程算法构建出水浊度预测模型。
在明确出水浊度相关因素的情况下,相关因素包括进水温度、进水浊度、进水流量等,采用系统动态方程算法构建出水浊度预测模型,模型定义为:
其中,Th,Zh,Qh,Mh,Ch+L分别为h时刻的进水温度、进水浊度、进水流量、投药量和h+L时刻的出水浊度数据。
将该模型定义为f1模型,供后续寻优模块的调用。
系统动态方程算法具体步骤展示如下:
首先,确定状态变量、输入变量、输出变量
若给定初始条件及t≥0的输入u(t),则系统行为被完全确定。故选择/>为系统的一组状态变量,令:
其次,根据所确定的状态变量得到微分方程组;
将上述方程组两边对t求导,化为状态变量x1,x2,…xn的一阶微分方程组;
最后,针对所得微分方程组,写出状态变量、输入变量、输出变量表示的状态方程和输出方程。
S105:利用K-L信息法确定投药出水浊度滞后时间。
K-L信息量法是本世纪中叶,由Kull-back和Leibler提出,用以判定两个概率分布的接近程度。其原理是以基准序列为理论分布,备选指标为样本分布,不断变化备选指标与基准序列时差,计算K-L信息量。K-L信息量最小时对应的时差数确定为备选指标的最终时差。
设基准指标为y={y1,y2,…,yn},由于任意满足的序列P均可视为随机变量的概率分布,因此,对基准指标做标准化处理,使得指标的和为单位1,处理后的序列记为P,则:
被选指标x={x1,x2,…,xn},做标准化处理,处理后的序列记为q,则:
K-L信息量计算公式为:
其中,l被称为时差或延迟数,L是最大延迟数,nl表示数据取齐后的数据个数。当计算出2L+1个K-L信息量后,从所有的kl值中选出一个最小值kln作为被选指标x关于基准指标y信息量,即:
kl'=minkl,其中l'就是被选指标最适当的滞后时间。
S106:采用根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析。
当模型在运行的时候,首先获取得到关键指标i时刻的即时值:
[Ti,Zi,Qi]
根据曼哈顿距离算法寻找历史样本中的近似样本为:
[Tih,Zih,Qih,Mih|(i=1,2,3,4,5)]
曼哈顿距离的数据表达:
S107:利用模拟退火算法进行投药量寻优最优解分析。
将投药量近似样本[Tih,Zih,Qih,Mih|(i=1,2,3,4,5])中的投药量取平均值Mh作为投药量最优解的近似解。
将经过投药量近似最优解分析结果[Tih,Zih,Qih,Mih]中的投药量Mih作为投药量最优解的近似解。
在投药量近似最优解附近,根据模拟退火算法计算f1输出出水浊度与标准出水浊度的最小值对应的最优投药量。
根据拟合得到的日均进水浊度与日均投药量线性关系函数,得到函数关系f2最小值对应的投药量。
计算minf1与f2两者最小值对应的最优投药量。
模拟退火的基本思想:
(1)初始化:初始值T(充分大),初始解状态S(是算法迭代的起点),每个T值的迭代次数L。
(2)对k=1,……L做第(3)至第6步。
(3)产生新解S'。
(4)计算增量Δt'=C(S')-C(S),其中C(S)为评价函数或优化目标。
(5)若Δt'<0则接受S'作为新的当前解,否则以概率exp(-Δt'/T)接受S'作为新的当前解。
(6)如果满足终止条件则输出当前解作为最优解,结束算法。终止条件通常取为连续若干个新解都没有被接受时终止算法。
(7)减小T,转到第2步,直到T小于初始设定的阈值。
上述实施例中,可选的,0值和空值处理数据处理流程图,如图2所示:
采集到的数据往往存在大量的0至和空值,不能直接使用,需进行数据处理。
S201:将空值转化为零值。
S202:历史存量数据中0值的处理:
第一步:记历史投药输入数据{Qi|i=1,2,...,n},定义目标点为Qi(目标点从开始到结束依次扫描);
第二步:定位得到Qi=0值的点位;
第三步:向前回滚10个点的时间窗口,筛选非空非零记录,筛选后中位数作为0值的填充值。
S203:实时增量数据中0值的处理:
第一步:判断是否为0;
第二步:向前回滚10个点的时间窗口,筛选非空非零记录,筛选后中位数作为0值的填充值。
上述实施例中,可选的,异常值识别处理流程图,如图3所示:
经0值和空值处理后的数据可能依然存在异常值,为了减小异常值对算法的影响,还需进行异常值处理。
S301:记历史投药输入数据{Qi|i=1,2,...,n},定义目标点为Qi(目标点从开始到结束依次扫描)。
S302:历史投药输入数据求Ui=Qi-Qi-1,Ui-1=Qi-1-Qi-2得到{Ui|i=1,2,...,n-1},定义目标点Qi对应的目标相关点为Ui和Ui-1。
S303:除目标相关点外逐次执行分箱操作,即:
Pup=B+1.5*(A-C)
Pdown=B-1.5*(A-C)
其中Pup为上边界,Pdown为下边界,B为因子中非空非零的中位数,A为上四分位数,C为下四分位数。
S304:判断Qi异常情况。若Ui和Ui-1都不在边界内,则判定目标点Qi为异常值。否则不是异常值。
S305:识别出异常值后,采用当前计算点向前10个点中位数代替。
上述实施例中,可选的,相关因素分析流程图,如图4所示:
S401:获取进水流量、进水浊度、进水PH、投药量与出水浊度等历史数据。
S402:采用皮尔逊相关系数分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系。
S403:筛选出相关性高的因素,为预测建模提供依据。
上述实施例中,可选的,系统动态方程算法构建出水浊度预测模型流程图,如图5所示:
S501:在明确出水浊度相关因素的情况下,确定状态变量、输入变量、输出变量。
S502:根据所确定的状态变量得到微分方程组。
S503:针对微分方程组,写出状态变量、输入变量、输出变量表示的状态方程和输出方程,构建出水浊度预测模型,模型定义为:
其中,Th,Zh,Qh,Mh,Ch+L分别为h时刻的进水温度、进水浊度、进水流量、投药量和h+L时刻的出水浊度数据。
将该模型定义为f1模型,供后续寻优模块的调用。
上述实施例中,可选的,K-L信息法确定投药出水浊度滞后时间求解流程图,如图6所示:
K-L信息量法是本世纪中叶,由Kull-back和Leibler提出,用以判定两个概率分布的接近程度。其原理是以基准序列为理论分布,备选指标为样本分布,不断变化备选指标与基准序列时差,计算K-L信息量。K-L信息量最小时对应的时差数确定为备选指标的最终时差。
S601:设基准指标为y={y1,y2,…,yn},由于任意满足的序列P均可视为随机变量的概率分布,因此,对基准指标做标准化处理,使得指标的和为单位1,处理后的序列记为P,则:
被选指标x={x1,x2,…,xn},做标准化处理,处理后的序列记为q,则:
K-L信息量计算公式为:
其中,l被称为时差或延迟数,L是最大延迟数,nl表示数据取齐后的数据个数。当计算出2L+1个K-L信息量后,从所有的kl值中选出一个最小值kln作为被选指标x关于基准指标y信息量,即:
kl'=minkl,其中l'就是被选指标最适当的滞后时间。
上述实施例中,可选的,投药量近似最优解分析流程图,如图7所示:
S701:当模型在运行的时候,首先获取得到关键指标i时刻的即时值:
[Ti,Zi,Qi]
S702:根据曼哈顿距离算法寻找历史样本中的近似样本为:
[Tih,Zih,Qih,Mih|(i=1,2,3,4,5)]。
上述实施例中,可选的,投药量寻优最优解分析流程图,如图8所示:
S801:将投药量近似样本[Tih,Zih,Qih,Mih|(i=1,2,3,4,5)]中的投药量取平均值作为投药量最优解的近似解。
S802:在投药量近似最优解附近,根据模拟退火算法计算f1输出出水浊度与标准出水浊度的最小值对应的最优投药量。
S803:根据拟合得到的日均进水浊度与日均投药量线性关系函数,得到函数关系f2最小值对应的投药量。
S804:计算minf1与f2两者最小值对应的最优投药量。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (5)
1.一种用于自来水处理的精准投药方法,其特征在于,包括:
数据预处理:0值、空值和异常值处理;
通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;
构建日均进水浊度与日均投药量线性回归方程;
构建日均进水浊度与日均投药量线性回归方程,包括:
获取日均进水浊度数据;
获取日均投药量数据;
根据所得日均进水浊度与日均投药量数据采用最小二乘法拟合线性回归方程,并将所得函数关系记为f2
其中,为日均进水浊度,/>为日均投药量,a和b为线性回归参数;
利用系统动态方程算法构建出水浊度预测模型;
利用系统动态方程算法构建出水浊度预测模型,包括:
在明确出水浊度相关因素的情况下,相关因素包括进水温度、进水浊度、进水流量,采用系统动态方程算法构建出水浊度预测模型,模型定义为:
其中,Th,Zh,Qh,Mh,Ch+L分别为h时刻的进水温度、进水浊度、进水流量、投药量和h+L时刻的出水浊度数据;
将该模型定义为f1模型,供后续寻优模块的调用;
利用K-L信息法确定投药出水浊度滞后时间;
利用K-L信息法确定投药出水浊度滞后时间,包括:
K-L信息量法计算K-L信息量,K-L信息量最小时对应的时差数确定为备选指标的最终时差;
设基准指标为y={y1,y2,…,yn},由于任意满足的序列P均可视为随机变量的概率分布,因此,对基准指标做标准化处理,使得指标的和为单位1,处理后的序列记为P,则:
被选指标x={x1,x2,…,xn},做标准化处理,处理后的序列记为q,则:
K-L信息量计算公式为:
其中,l被称为时差或延迟数,L是最大延迟数,nl表示数据取齐后的数据个数;当计算出2L+1个K-L信息量后,从所有的kl值中选出一个最小值kln作为被选指标x关于基准指标y信息量,即:
kl'=minkl,其中l'就是被选指标最适当的滞后时间;
根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析;
采用根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析,包括:
当模型在运行的时候,首先获取得到关键指标i时刻的即时值:
[Ti,Zi,Qi]
根据曼哈顿距离算法寻找历史样本中的近似样本为:
[Tih,Zih,Qih,Mih|(i=1,2,3,4,5)]
曼哈顿距离的数据表达:
利用模拟退火算法进行投药量最优解分析;
利用模拟退火算法进行投药量寻优最优解分析,包括:
将经过投药量近似最优解分析结果[Tih,Zih,Qih,Mih]中的投药量Mih作为投药量最优解的近似解;
在投药量近似最优解附近,根据模拟退火算法计算f1输出出水浊度与标准出水浊度的最小值对应的最优投药量;
根据拟合得到的日均进水浊度与日均投药量线性关系函数,得到函数关系f2最小值对应的投药量;
计算minf1与f2两者最小值对应的最优投药量。
2.根据权利要求1所述的方法,其特征在于,数据预处理:0值、空值和异常值处理,包括:
空值转化为零值;
历史存量数据中0值的处理;
实时增量数据中0值的处理;
历史存量数据中异常值的处理;
实时增量数据中异常值的处理。
3.根据权利要求2所述的方法,其特征在于,0值、空值和异常值处理方法,包括:
空值处理:将空值转化为零值;
历史存量数据中0值的处理:
第一步:记历史投药输入数据{Qi|i=1,2,...,n},定义目标点为Qi;
第二步:定位得到Qi=0值的点位;
第三步:向前回滚10个点的时间窗口,筛选非空非零记录,筛选后中位数作为0值的填充值;
实时增量数据中0值的处理:
第一步:判断是否为0;
第二步:向前回滚10个点的时间窗口,筛选非空非零记录,筛选后中位数作为0值的填充值;
历史存量数据中异常值的处理:
第一步:记历史投药输入数据{Qi|i=1,2,...,n},定义目标点为Qi;
第二步历史投药输入数据求Ui=Qi-Qi-1,Ui-1=Qi-1-Qi-2得到{Ui|i=1,2,...,n-1},定义目标点Qi对应的目标相关点为Ui和Ui-1;
第三步除目标相关点外逐次执行分箱操作,即:
Pup=B+1.5*(A-C)
Pdown=B-1.5*(A-C)
其中Pup为上边界,Pdown为下边界,B为因子中非空非零的中位数,A为上四分位数,C为下四分位数;
第四步判断Qi异常情况,若Ui和Ui-1都不在边界内,则判定目标点Qi为异常值,否则不是异常值;
第五步识别出异常值后,采用当前计算点向前10个点中位数代替;
实时增量数据中异常值的处理:
第一步:同样的,获取目标点及其之前n个点的数据;
第二步:然后执行1中的异常值识别过程;
第三步:采用当前计算点向前回滚10个点的非空非零记录的中位数代替均值代替。
4.根据权利要求1所述的方法,其特征在于,通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系,包括:
采用皮尔逊相关系数分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;
变量相关分析是考虑多个变量之间的线性关系的一种统计方法,用于衡量多个变量因素之间的相关程度,皮尔逊相关系数的全称为:皮尔逊积矩相关系数(Pearson product-moment correlation coefficient),该系数广泛用于度量两个变量之间的相关程度,定义的公式如下:
其中,xi和yi分别为i时刻变量x和y的值,和/>分别为x和y的平均值;如,计算进水温度与出水浊度之间的相关程度,xi为i时刻的进水温度值,yi为i时刻的出水浊度值,/>为进水温度的平均值,/>为出水浊度的平均值。
5.根据权利要求1所述的方法,其特征在于,系统动态方程算法,包括:
系统的状态方程和输出方程一起,称为系统状态空间表达式,由描述系统输入、输出动态关系的微分方程和传递函数建立系统动态方程,步骤如下:
首先,确定状态变量、输入变量、输出变量
若给定初始条件及t≥0的输入u(t),则系统行为被完全确定,故选择/>为系统的一组状态变量,令:
其次,根据所确定的状态变量得到微分方程组;
将上述方程组两边对t求导,化为状态变量x1,x2,…xn的一阶微分方程组;
最后,针对所得微分方程组,写出状态变量、输入变量、输出变量表示的状态方程和输出方程;
对于建立好的输出方程,给定输入变量的值即可得到输出变量的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010536580.1A CN111859263B (zh) | 2020-06-12 | 2020-06-12 | 一种用于自来水处理的精准投药方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010536580.1A CN111859263B (zh) | 2020-06-12 | 2020-06-12 | 一种用于自来水处理的精准投药方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111859263A CN111859263A (zh) | 2020-10-30 |
CN111859263B true CN111859263B (zh) | 2024-04-12 |
Family
ID=72987807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010536580.1A Active CN111859263B (zh) | 2020-06-12 | 2020-06-12 | 一种用于自来水处理的精准投药方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111859263B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434857B (zh) * | 2023-03-24 | 2024-03-15 | 青岛思普润水处理股份有限公司 | 一种污水处理系统的智能加药设置方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5675504A (en) * | 1995-12-15 | 1997-10-07 | Universite Laval | Method of predicting residual chlorine in water supply systems |
CN106502093A (zh) * | 2016-10-25 | 2017-03-15 | 大唐(北京)水务工程技术有限公司 | 基于ga‑svr的水岛加药在线控制方法和装置 |
CN110515411A (zh) * | 2019-09-05 | 2019-11-29 | 江苏环保产业技术研究院股份公司 | 一种水处理加药量控制方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7440817B2 (en) * | 2005-10-20 | 2008-10-21 | Liang Fu | Method and control unit for medication administering devices |
US9999788B2 (en) * | 2014-06-05 | 2018-06-19 | International Business Machines Corporation | Fast and accurate proton therapy dose calculations |
-
2020
- 2020-06-12 CN CN202010536580.1A patent/CN111859263B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5675504A (en) * | 1995-12-15 | 1997-10-07 | Universite Laval | Method of predicting residual chlorine in water supply systems |
CN106502093A (zh) * | 2016-10-25 | 2017-03-15 | 大唐(北京)水务工程技术有限公司 | 基于ga‑svr的水岛加药在线控制方法和装置 |
CN110515411A (zh) * | 2019-09-05 | 2019-11-29 | 江苏环保产业技术研究院股份公司 | 一种水处理加药量控制方法及系统 |
Non-Patent Citations (1)
Title |
---|
水处理中线性回归和BPNN预测混凝投药量的比较;阎有运;常波;;工业安全与环保(11);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111859263A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101480B (zh) | 一种多变量聚类与融合的时间序列组合预测方法 | |
CN108510741B (zh) | 一种基于Conv1D-LSTM神经网络结构的交通流预测方法 | |
CN111415752B (zh) | 一种融合气象因素和搜索指数的手足口病预测方法 | |
CN112289034A (zh) | 基于多模态时空数据的深度神经网络鲁棒交通预测方法 | |
CN109637128B (zh) | 一种基于Markov的灰色Verhulst短时交通流预测方法及系统 | |
CN106407874A (zh) | 基于笔迹坐标序列的手写识别方法 | |
CN110648014A (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
CN111292525A (zh) | 基于神经网络的交通流预测方法 | |
CN111126658A (zh) | 一种基于深度学习的煤矿瓦斯预测方法 | |
CN107293118B (zh) | 一种交通速度动态区间短时预测方法 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN110619084B (zh) | 一种根据图书馆读者借阅行为进行图书推荐的方法 | |
CN112966891A (zh) | 一种河流水环境质量预测方法 | |
CN114596726B (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN108959188A (zh) | 基于量化最小误差熵准则的格兰杰因果判辨方法 | |
CN111859263B (zh) | 一种用于自来水处理的精准投药方法 | |
CN116956189A (zh) | 一种电流异常检测系统、方法、电子设备及介质 | |
CN116386899A (zh) | 基于图学习的药物疾病关联关系预测方法及相关设备 | |
CN113868938A (zh) | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 | |
CN115392477A (zh) | 基于深度学习的Skyline查询基数估计方法及装置 | |
CN117708625B (zh) | 一种乏数据背景下大坝监测历史数据填补方法 | |
CN116258260A (zh) | 一种基于门控双重卷积神经网络的概率电力负荷预测方法 | |
CN111863153A (zh) | 一种基于数据挖掘的废水中悬浮固体总量的预测方法 | |
CN111144424A (zh) | 一种基于聚类算法的人员特征检分析方法 | |
CN116011654A (zh) | 基于电力负荷数据的小区人气指数预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |