CN116542382A - 基于混合优化算法的污水处理溶解氧浓度预测方法 - Google Patents
基于混合优化算法的污水处理溶解氧浓度预测方法 Download PDFInfo
- Publication number
- CN116542382A CN116542382A CN202310520981.1A CN202310520981A CN116542382A CN 116542382 A CN116542382 A CN 116542382A CN 202310520981 A CN202310520981 A CN 202310520981A CN 116542382 A CN116542382 A CN 116542382A
- Authority
- CN
- China
- Prior art keywords
- algorithm
- sewage treatment
- optimal
- data
- dissolved oxygen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000010865 sewage Substances 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 43
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 title claims abstract description 39
- 229910052760 oxygen Inorganic materials 0.000 title claims abstract description 39
- 239000001301 oxygen Substances 0.000 title claims abstract description 39
- 238000005457 optimization Methods 0.000 title claims abstract description 34
- 239000002245 particle Substances 0.000 claims abstract description 75
- 238000013528 artificial neural network Methods 0.000 claims abstract description 36
- 230000002068 genetic effect Effects 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000015654 memory Effects 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 22
- 230000013016 learning Effects 0.000 claims description 18
- 230000035772 mutation Effects 0.000 claims description 16
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 8
- 238000010219 correlation analysis Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000007787 long-term memory Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000006403 short-term memory Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 238000005273 aeration Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000009326 social learning Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006065 biodegradation reaction Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010908 decantation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000002431 foraging effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 230000033116 oxidation-reduction process Effects 0.000 description 1
- 208000014451 palmoplantar keratoderma and congenital alopecia 2 Diseases 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W10/00—Technologies for wastewater treatment
- Y02W10/10—Biological treatment of water, waste water, or sewage
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于混合优化算法的污水处理溶解氧浓度预测方法,该方法首先采集实际污水处理数据并进行数据预处理,然后构建多指标输入、单指标输出的长短期记忆神经网络预测模型,采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,得到最优预测模型,并利用训练集对最优预测模型进行训练,最后利用测试集对最优预测模型进行验证。本发明采用融合了遗传算法和粒子群算法的混合优化算法寻找长短期记忆神经网络的最优解,从而在兼顾全局性和局部性的同时提高算法的优化能力,使得最优预测模型具有更高的预测精度,同时模型结构简单、实施高效、误差率小,在污水处理溶解氧浓度预测方面表现良好。
Description
技术领域
本发明涉及污水处理技术领域和人工智能技术领域,特别是涉及一种基于混合优化算法的污水处理溶解氧浓度预测方法。
背景技术
随着我国推进工业化和城镇化,水资源形势严峻,污水治理势在必行。目前,CASS工艺是城镇污水处理中应用较广泛的一种工艺。该工艺主要包括进水、曝气、静沉和滗水四个阶段。溶解氧浓度是污水处理中一个重要的指标,通常通过曝气来实现。曝气的成本占整个污水处理运行成本的60%左右。
污水处理中溶解氧浓度的预测具有重要的意义。在污水处理过程中,通常需要添加氧气来促进生物降解污染物,提高污水处理效率。对溶解氧浓度的预测可以帮助我们更好地控制氧气的添加量,确保处理效果和成本效益的平衡。此外,污水处理厂通常需要满足一定的出水标准,其中溶解氧浓度是一个重要的指标之一。通过对溶解氧浓度的预测,可以帮助污水处理厂更好地控制出水水质,避免对环境造成不良影响。
发明内容
为了达到节能和提高污水处理效率的目的,本发明提供了一种基于混合优化算法的污水处理溶解氧浓度预测方法,该方法利用污水厂实际生产数据进行模型训练,能够准确预测污水处理过程中的溶解氧浓度,从而实现污水处理工艺的优化。
为实现上述目的,本发明采取如下的技术方案:
一种基于混合优化算法的污水处理溶解氧浓度预测方法,包括以下步骤:
步骤1:利用传感器采集污水厂的实际污水处理数据,并对所述实际污水处理数据依次进行数据补全、数据相关性分析、数据去噪以及数据归一化处理,得到处理后的数据,再将处理后的数据划分为训练集和测试集;
步骤2:构建多指标输入、单指标输出的长短期记忆神经网络预测模型,所述长短期记忆神经网络预测模型采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,其中输入的多指标为鼓风机出力、进水PH值、电导率以及水温,输出的单指标为未来一个时间点的溶解氧浓度;
步骤3:采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合,并保存生成的最优预测模型;
步骤4:将所述训练集输入到所述最优预测模型中进行训练,训练后得到预测结果;
步骤5:将所述测试集输入到所述最优预测模型中进行验证,验证后得到预测结果,验证时采用的评估指标包括拟合优度、均方误差以及平均绝对误差。
本发明的主要有益效果如下:
(1)本发明基于污水厂的实际污水处理数据,基于污水处理过程中的内在变化规律及潜在影响因素,通过相关性分析筛选出影响因素并将其作为模型输入,提高了预测模型的准确性;
(2)本发明采用融合了粒子群算法(Particle swarm optimization,PSO)和遗传算法(Genetic Algorithm,GA)的混合优化算法寻找长短期记忆神经网络的最优解,从而在兼顾全局性和局部性的同时提高算法的优化能力,该混合优化算法自适应调整交叉概率、变异概率和粒子群算法的参数,通过迭代搜索最优参数,优化长短期记忆神经网络预测模型的参数,获得最优预测模型,使得最优预测模型具有更高的预测精度,同时该最优预测模型结构简单、实施高效、误差率小,在污水处理溶解氧浓度预测方面表现良好。
附图说明
图1为本发明其中一个实施例所述的一种基于混合优化算法的污水处理溶解氧浓度预测方法的流程图;
图2为长短期记忆神经网络预测模型的输入、输出之间的具体指标关系图;
图3为粒子群算法的流程图;
图4为遗传算法的流程图;
图5为长短期记忆神经网络的结构图。
具体实施方式
下面将结合附图及较佳实施例对本发明的技术方案进行详细描述。
在其中一个实施例中,如图1所示,本实施例提供一种基于混合优化算法的污水处理溶解氧浓度预测方法,该方法具体包括以下步骤:
步骤1:利用传感器采集污水厂的实际污水处理数据,并对采集的实际污水处理数据进行数据预处理,包括数据补全、数据相关性分析、数据去噪以及数据归一化。
数据补全:由于污水处理的水下生态环境较为复杂,传感器采集的数据可能存在缺失或异常,因此在预处理阶段对原始数据采用均值法对缺失值进行补充或对异常值进行替换。均值法公式如下所示:
其中xn为缺失值,xn-1为缺失值的左侧临近值,xn+1为缺失值的右侧临近值。
数据相关性分析:为了降低数据维度,筛选出与溶解氧浓度相关的影响因素,通过皮尔逊相关系数法分析,选取影响污水处理溶解氧的主要影响因子作为模型的输入参数。
式中X为溶解氧浓度,Y为影响因素,P表示数据总量个数,最终得出相关性较大的影响因素,结果越接近1或者-1表示两个变量的线性相关性越强,越接近0表示线性相关性越弱。
数据去噪:为了降低噪声的干扰,本发明选取了一种可以高效抑制噪声的SG滤波方法对数据进行去噪,它可以提高信号的信噪比。
数据归一化:按照一定的比例对样本数据进行缩放,使其落入特定的范围内,减少因数据的绝对值对预测模型产生的不良影响,加快预测模型的训练速度提升预测模型的精度。归一化计算公式如下:
其中,x为归一化前的值,xk为经过归一化的值,xmax为最大值,xmin为最小值。
数据集的划分:经过上述数据补全、数据相关性分析、数据去噪以及数据归一化处理后,得到处理后的数据,将处理后的数据按照8∶2的比例划分为训练集和测试集,训练集用于训练模型,找出预测模型的最优解,测试集对训练模型进行性能评估。
步骤2:构建多指标输入、单指标输出的长短期记忆神经网络预测模型。如图2所示选取多指标输入、单指标输出;同时本发明将鼓风机出力、进水PH值、电导率以及水温做为输入,预测未来一个时间点(输出)的溶解氧浓度。
步骤3:采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合,并保存生成的最优预测模型。
本实施例提出了一种混合优化算法,基于粒子群算法和遗传算法的优缺点,将二者相融合。发挥出遗传算法全局性好的优点,粒子群算法局部搜索强的优点,进而得到更优的神经网络超参数。具体步骤如下:
初始化:需要进行初始化的参数有:种群U的粒子个数m、算法的最大迭代次数N、粒子群优化算法中的初始速度vi和位置xi、最大速度Vmax、惯性权重ω、学习因子c1和c2,遗传算法中的交叉概率pc、变异概率pm等参数。
粒子群迭代:用单一的粒子群算法进行寻优,将每个粒子的位置和速度信息不断进行更新,并根据预先设定好的优化要求选取合适的适应度函数。
粒子分类:根据适应度函数得到每个粒子的适应度,根据适应度对粒子进行评价,将评价后的粒子,按照适应度值的高低进行排序,一分为二,将高的部分定义为子种群U1,低的部分定义为子种群U2。
引入遗传算法:将子种群U1定义为适应度好的种群,直接保留进入到下一代,将U2定义为适应度差的种群,通过概率将一部分的粒子随机挑选出来通过变异概率pm进行变异。变异后新产生的粒子再次根据适应度函数进行评价,评价较好的进行保留。
更新极值:引入遗传算法后,每个粒子都产生一个新的适应度值,将其和原本的个体极值pbesti做对比,如果优于原本的个体极值则进行替换。如果出现某个个体极值与全局极值gbest相比更优越也进行替换。
算法循环寻优:若粒子的迭代次数达到最大值或者适应度达到预先设定的要求,则此时输出的全局极值就是神经网络的最优解。若未达到设定要求则继续循环,直至找到最优解。
本实施例中的长短期记忆神经网络预测模型采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,以提高污水处理过程中溶解氧浓度的预测精度。其中采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合的过程具体包括以下步骤:
步骤3.1:进行参数初始化以及定义目标函数与适应度函数,需要进行初始化的参数有:种群U的粒子个数m,算法的最大迭代次数N,粒子群优化算法中的初始速度vi和位置xi,最大速度Vmax,惯性权重ω,学习因子c1和c2,遗传算法中的交叉概率pc和变异概率pm;
步骤3.2:初始化粒子种群后,使用粒子群算法进行寻优,并且粒子群算法采用非线性变化的惯性权重策略和异步变化的学习因子策略进行寻优,满足终止条件后,输出局部最优解;
步骤3.3:在粒子群算法的基础上引入遗传算法,遗传算法采用自适应的交叉概率和变异概率策略对粒子进行选择、交叉、变异操作,满足终止条件后,输出全局最优解,即为最优的超参数集合。将最优的超参数集合代入到长短期记忆神经网络预测模型中,生成并保存最优预测模型。
本实施例采取的粒子群算法的流程图如图3所示,粒子群算法以鸟类的群体行为作为灵感,基于成员之间的相互协作和共享信息。在鸟类觅食的过程中,搜索到距离食物最近的鸟,以它们当前所在的区域进行高效的捕食,从而实现了群体进化。
该算法的具体流程为将粒子群的参数(粒子的位置和速度)进行初始化,选择均方误差(MSE)作为适应度函数,计算出每个粒子的适应度值。将粒子群中的个体极值以及全局极值进行更新,将迭代后粒子的速度与位置进行更新,对算法进行判断,看是否达到终止条件即是否达到目标函数的收敛精度或者达到最大迭代次数,如果达到终止条件,最终输出的结果就是通过粒子群算法搜索到的局部最优解,没达到则重复上述步骤直至达到终止条件。
粒子群算法把群体中的每个粒子通过位置、速度以及适应度值作为标签,这样每个粒子就可能是一个最优解,最后通过预先设计好的适应度函数来计算每个粒子的适应度值进行评价。
粒子群算法描述为:在一个D维搜索空间,m个粒子构成的一个种群X={x1,x2,…,xm},其中xi=[xi1,xi2,…,xiD],设t时刻xi的特征信息为:
位置:
速度:
个体最优位置:
全局最优位置:
则该粒子在t+1时刻的速度和位置信息更新:
式中:ω为惯性权重,控制粒子在全局探测和局部开采间有效平衡;c1和c2为学习因子,分别调整飞向自身和全局最好方向的步长,基本上选取都为非负数;r1和r2为均匀分布在[0,1]之间的随机数;分别对应的是当前时刻粒子的位置、速度、局部最优解以及全局最优解。
传统的粒子群算法,它的参数都是设定好的,这样的一个缺点就是导致了不能做到局部性和全局性的平衡,在粒子群算法中,惯性权重w的选择对算法的精度和收敛性有着重要的影响。为了更好地探索搜索空间,本发明采用非线性变化的惯性权重策略。具体来说,当目标值趋于一致或局部最优时,可以适当增加惯性权重,以增强搜索的跳跃性;当目标值分散时,可以适当减小惯性权重,以提高搜索的局部精度。另外,对于那些目标函数值优于平均目标值的粒子,应该采用较小的惯性权重来保护它们,防止其过早地跳出搜索空间;而对于那些目标函数值差于平均目标值的粒子,应该采用较大的惯性权重,以使它们向更好的搜索区域靠拢,从而提高整个算法的收敛速度和精度。
在粒子群算法中,学习因子c1和c2的选择对算法的性能和收敛速度有着重要的影响。为了提高粒子的自我学习能力和全局搜索能力,本发明采用异步变化的学习因子策略。具体来说,在算法的初始阶段,我们可以选择较小的学习因子,以便粒子更加注重自我学习;而在算法的后期阶段,我们可以选择较大的学习因子,以增强粒子的社会学习能力,从而更好地探索全局最优解。这种策略能够使得算法具有较强的收敛性和全局搜索能力,从而更有利于找到全局最优解。
所以本发明采用自适应调整参数的形式,表达式为:
在上述公式中:ω为惯性权重,ωmax、ωmin分别为惯性权重的最大值和最小取值,c1和c2为学习因子,c1i和c1e分别为自学习因子的初始参数、结束参数,c2i和c2e分别为社会学习因子的初始参数、结束参数,tmax为最大迭代次数。
接下来,在粒子群算法的基础上引入遗传算法,遗传算法的流程图如图4所示,遗传算法是仿照自然界中的自然选择以及生物进化,通过选择、交叉和变异等一系列操作,生成新种群的一种算法。
该算法的具体流程为对LSTM的超参数采取编码的手段进行处理,即将个体进行编码,然后对遗传算法的参数进行初始化。选择均方误差(MSE)作为适应度函数,计算出每个粒子的适应度值。然后进行选择、交叉以及变异操作,判断算法的结束条件则是看输出的个体是否为想要寻找的最优解,是的话直接输出最优解,不是的话再次进行迭代直至达到结束条件为止。
在遗传算法中,交叉概率和变异概率是重要的参数,它们直接影响着算法的搜索能力和收敛速度。为了在不同的搜索阶段获得更好的性能,我们可以采用自适应的交叉概率和变异概率策略。具体来说,当群体适应度值趋于一致或局部最优时,我们可以适当地增加交叉概率和变异概率,以更好地探索解空间;而当群体适应度值比较分散时,我们则可以适当减小交叉概率和变异概率,以保持群体的多样性。
此外,在自适应的交叉概率和变异概率策略中,适应度值高于群体平均适应度值的个体对应较低的交叉概率和变异概率,以保护这些优秀的个体能够进入下一代。而适应度值低于平均值的个体则对应较高的交叉概率和变异概率,以促使它们被淘汰。
这种自适应的交叉概率和变异概率策略能够在保持群体多样性的同时,保证算法的收敛性,从而更好地找到全局最优解。此外,自适应遗传算法还能够提供相对于某个解的最佳交叉概率和变异概率,以进一步提高算法的性能。
调整后的自适应表达式为:
其中,f'为交叉操作中最优个体的适应度值,f为即将变异的个体适应度值,favg为适应度的平均值,fmax为适应度的最大值,这里设定pc1=0.9,pc2取[0.5,1]区间的值,pm1=0.1,pm2取[0.05,0.1]区间的值,即可实现自适应调整。
通过上述GA-PSO算法对LSTM神经网络的学习率、隐含神经元个数、迭代次数以及时间步长这四个参数进行优化后,得到预测模型的最优超参数,进而得到最优预测模型。
LSTM神经网络具有能学习长距离时序依赖的优点,因此选来作为污水处理溶解氧浓度预测的模型。
根据图5对LSTM神经网络的结构进行公式表达,记忆单元与隐藏状态一起记忆序列数据的历史信息。记忆单元中的信息受3个门控单元的控制。遗忘门根据ht-1和xt删除记忆单元中的信息。遗忘门为:
ft=σ(Wf[ht-1xt])+bf
式中:σ()为sigmoid激活函数;Wf为遗忘门权重;bf为遗忘门偏置。
输入门根据ht-1和xt向记忆单元中新增信息,如下所示:
it=σ(Wi[ht-1xt])+bi
式中:it为需要记忆的信息;为候选记忆单元,用于更新记忆单元;Wi和Wc为输入门权重;bi和bc为输入门偏置。
遗忘门和输出门计算完成后,更新记忆单元公式:
式中为哈达玛乘积。输出门根据ht-1,xt,Ct,决定ht。
式中:Wo为输出门权重;bo为输出门偏置。
步骤4:将训练集数据输入到最优预测模型中进行训练,最终得到预测结果。
步骤5:利用先前划分好的测试集对最优预测模型进行验证,验证后得到预测结果,验证时采用的评估指标包括拟合优度(R2)、均方误差(RMSE)以及平均绝对误差(MAE)。经过验证后的最优预测模型用于实际对污水处理溶解氧浓度进行预测。
R2的值越接近1,说明回归方程对观测值的拟合程度越好,预测值越接近实测值,公式如下所示:
RMSE是均方根误差,用来衡量预测值真实值之间的偏差程度,数值越小说明构建的预测模型精度越高。公式如下所示:
MAE是平均绝对误差,可以反映出实际预测误差的大小,数值越小说明误差越小。公式如下所示:
上述三个评价指标中,n表示测试集中数据的个数,yi代表真实值,代表预测值,为测试集数据的平均数。
下面给出一个将本发明应用于某污水处理厂的实例,具体步骤如下:
步骤一,数据预处理。污水厂的数据包括2021年4月1日~2021年9月30日,共采集了8640个时间点数据,其中包括了生产设备因素(鼓风机出力、生化池液位、管道阻力),环境因素(水温、大气压力、空气湿度),污水水质因素(进水COD、进水BOD、进水PH值),以及其他因素(氧化还原电位、电导率)。在预处理阶段对原始数据采用均值法对缺失值进行补充或对异常值进行替换。公式如下所示:
其中xn为缺失值,xn-1为缺失值的左侧临近值,xn+1为缺失值的右侧临近值。
通过皮尔逊相关系数法分析,选取影响污水处理溶解氧的主要影响因子作为模型的输入参数。
式中X为溶解氧浓度,Y为影响因素,P表示数据总量个数。最终得出相关性较大的影响因素。最终选取鼓风机出力、进水PH值、电导率以及水温四个重要影响因素。
数据去噪:选取了一种可以高效抑制噪声的SG滤波方法。
据归一化:按照一定的比例对样本数据进行缩放,使其落入特定的范围内,减少因数据的绝对值对预测模型产生的不良影响,加快预测模型的训练速度提升预测模型的精度。
其中,x为归一化前的值,xk为经过归一化的值,xmax为最大值,xmin为最小值
步骤二,取了多指标输入、单指标输出,同时本发明采取了历史24个时间点数据为输入,预测未来1个时间点输出,同时为模型训练划分训练集和测试集。在训练集上,使用GA和PSO优化LSTM模型的参数,得到最佳的模型结构和参数。在测试集上,计算预测值与实际值之间的误差,并评估模型的预测准确度。
步骤三:本发明提出了一种混合优化算法,基于粒子群算法和遗传算法的优缺点,将二者相融合。发挥出遗传算法全局性好的优点,粒子群算法局部搜索强的优点,进而得到更优的神经网络超参数。再通过GA-PSO算法对LSTM神经网络的学习率、隐含神经元个数、迭代次数以及时间步长这四个参数进行优化,得到最佳的LSTM模型即最优预测模型。
传统的粒子群算法的参数都是设定好的,导致不能做到局部性和全局性的平衡,所以本发明采用自适应调整参数的形式,表达式为:
在上述公式中:ω为惯性权重,ωmax、ωmin分别为惯性权重的最大值和最小取值,c1和c2为学习因子,c1i和c1e分别为自学习因子的初始参数、结束参数,c2i和c2e分别为社会学习因子的初始参数、结束参数,tmax为最大迭代次数。
传统的遗传算法中交叉概率和变异概率都是固定值,本发明在此基础上进行了调整,调整后的自适应表达式为:
其中,f'为交叉操作中最优个体的适应度值,f为即将变异的个体适应度值,favg为适应度的平均值,fmax为适应度的最大值,这里设定pc1=0.9,pc2取[0.5,1]区间的值,pm1=0.1,pm2取[0.05,0.1]区间的值,即可实现自适应调整。
LSTM是一种常用于时间序列预测的神经网络算法,其特点在于可以处理长期依赖性问题。相比于普通的前馈神经网络,LSTM网络可以保存并利用历史数据中的信息,因此在处理时间序列数据时具有优势。因此在污水处理溶解氧预测上具有较强的优势。
步骤四:将训练集输入到优化后的GA-PSO-LSTM模型即最优预测模型中进行训练,预测污水处理的溶解氧浓度,并将预测结果输出,对预测结果进行评估,根据预测误差进行模型参数和结构的优化。
本发明主要目的是提高污水处理溶解氧预测模型的预测精度,所以选取均方误差(MSE)作为适应度函数,在迭代过程中对粒子的好坏进行评价。适应度函数的计算公式如下所示:
其中,n是训练样本的个数,为第i个个体的预测输出值,yi为第i个个体的真实值。
损失函数用来估计预测值与真实值的差别,损失函数越小,表示预测的结果越精准,更接近真实值。选取均方误差(MSE)作为损失函数。损失函数的计算公式如下所示:
其中,n是训练样本的个数,f(xi)为模型的预测值,yi为样本的真实值。
基于GA-PSO-LSTM的污水处理溶解氧预测是一个多阶段的建模过程,在考虑神经网络结构、参数搜索空间、数据分布和计算资源后,综合考虑以上几个方面,选择Adam作为优化器,因为它可以自适应地调整学习率,并且可以有效地处理不同尺度的梯度,同时可以处理时间序列数据的多个季节性变化和趋势性变化。
各层之间的激活函数选择为tanh函数。
GA-PSO-LSTM模型的基本参数和超参数选取如表1所示:
表1参数选取
输入神经元数 | 4 |
输出神经元数 | 1 |
隐藏层神经元数 | (51,57) |
全连接层神经元数 | 68 |
学习率 | 0.0063 |
迭代次数 | 40 |
时间步长 | 42 |
步骤五:用先前划分好的测试集对最优预测模型进行验证,评估指标采用拟合优度(R2)和均方误差(RMSE)以及平均绝对误差(MAE)。现有技术中的基于PSO-LSTM预测污水处理溶解氧浓度的方法和本发明提出的基于混合优化算法的污水处理溶解氧浓度预测方法的相关指标对比如表2所示:
表2现有技术和本发明提出方法的相关指标对比
R2 | RMSE | MAE | |
现有方法 | 0.7565 | 9.9645 | 6.9054 |
本方法 | 0.9374 | 6.0370 | 3.1965 |
通过表2对比可知,本发明所中的基于GA-PSO-LSTM污水处理溶解氧预测模型综合了遗传算法、粒子群算法和LSTM神经网络的优点,能够充分利用历史数据进行预测并具有较强的适应性和预测能力。通过GA-PSO算法进行优化,寻找到神经网络的最优解。提高了神经网络的预测能力。此外,LSTM神经网络适用于处理时间序列数据,能够自适应地学习数据的特征,从而具有较强的预测能力。该模型能够提高水质监测的准确性和实时性,有助于优化污水处理的过程和效果。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种基于混合优化算法的污水处理溶解氧浓度预测方法,其特征在于,包括以下步骤:
步骤1:利用传感器采集污水厂的实际污水处理数据,并对所述实际污水处理数据依次进行数据补全、数据相关性分析、数据去噪以及数据归一化处理,得到处理后的数据,再将处理后的数据划分为训练集和测试集;
步骤2:构建多指标输入、单指标输出的长短期记忆神经网络预测模型,其中输入的多指标为鼓风机出力、进水PH值、电导率以及水温,输出的单指标为未来一个时间点的溶解氧浓度;
步骤3:采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合,并保存生成的最优预测模型;
步骤4:将所述训练集输入到所述最优预测模型中进行训练,训练后得到预测结果;
步骤5:将所述测试集输入到所述最优预测模型中进行验证,验证后得到预测结果,验证时采用的评估指标包括拟合优度、均方误差以及平均绝对误差。
2.根据权利要求1所述的一种基于混合优化算法的污水处理溶解氧浓度预测方法,其特征在于,采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合的过程包括以下步骤:
步骤3.1:进行参数初始化以及定义目标函数与适应度函数,需要进行初始化的参数有:种群的粒子个数,算法的最大迭代次数,粒子群优化算法中的初始速度和位置,最大速度,惯性权重,学习因子,遗传算法中的交叉概率和变异概率;
步骤3.2:初始化粒子种群后,使用粒子群算法进行寻优,并且所述粒子群算法采用非线性变化的惯性权重策略和异步变化的学习因子策略进行寻优,满足终止条件后,输出局部最优解;
步骤3.3:在所述粒子群算法的基础上引入遗传算法,所述遗传算法采用自适应的交叉概率和变异概率策略对粒子进行选择、交叉、变异操作,满足终止条件后,输出全局最优解,即为最优的超参数集合。
3.根据权利要求2所述的一种基于混合优化算法的污水处理溶解氧浓度预测方法,其特征在于,在步骤1中,采用均值法进行数据补全,采用皮尔逊相关系数法进行数据相关性分析,采用SG滤波方法进行数据去噪。
4.根据权利要求2所述的一种基于混合优化算法的污水处理溶解氧浓度预测方法,其特征在于,最优的超参数集合包括学习率、隐含神经元个数、迭代次数以及时间步长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310520981.1A CN116542382A (zh) | 2023-05-10 | 2023-05-10 | 基于混合优化算法的污水处理溶解氧浓度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310520981.1A CN116542382A (zh) | 2023-05-10 | 2023-05-10 | 基于混合优化算法的污水处理溶解氧浓度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116542382A true CN116542382A (zh) | 2023-08-04 |
Family
ID=87451903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310520981.1A Pending CN116542382A (zh) | 2023-05-10 | 2023-05-10 | 基于混合优化算法的污水处理溶解氧浓度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116542382A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117150896A (zh) * | 2023-08-29 | 2023-12-01 | 上海交通大学 | 基于可解释机器学习的超临界流体传热系数预测方法 |
CN117174198A (zh) * | 2023-11-02 | 2023-12-05 | 山东鸿远新材料科技股份有限公司 | 一种基于氧氯化锆生产的自动检测清洁方法及系统 |
-
2023
- 2023-05-10 CN CN202310520981.1A patent/CN116542382A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117150896A (zh) * | 2023-08-29 | 2023-12-01 | 上海交通大学 | 基于可解释机器学习的超临界流体传热系数预测方法 |
CN117150896B (zh) * | 2023-08-29 | 2024-05-14 | 上海交通大学 | 基于可解释机器学习的超临界流体传热系数预测方法 |
CN117174198A (zh) * | 2023-11-02 | 2023-12-05 | 山东鸿远新材料科技股份有限公司 | 一种基于氧氯化锆生产的自动检测清洁方法及系统 |
CN117174198B (zh) * | 2023-11-02 | 2024-01-26 | 山东鸿远新材料科技股份有限公司 | 一种基于氧氯化锆生产的自动检测清洁方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112116144B (zh) | 一种区域配电网短期负荷预测方法 | |
CN116542382A (zh) | 基于混合优化算法的污水处理溶解氧浓度预测方法 | |
CN110544011B (zh) | 一种智能化的体系作战效能评估和优化方法 | |
CN110020712B (zh) | 一种基于聚类的优化粒子群bp网络预测方法和系统 | |
CN103105246A (zh) | 一种基于遗传算法改进的bp神经网络的温室环境预测反馈方法 | |
CN114399032B (zh) | 一种电能表计量误差预测方法及系统 | |
CN116721537A (zh) | 基于gcn-ipso-lstm组合模型的城市短时交通流预测方法 | |
CN110598902A (zh) | 一种基于支持向量机与knn相结合的水质预测方法 | |
CN112765902A (zh) | 基于TentFWA-GD的RBF神经网络软测量建模方法及其应用 | |
CN109408896B (zh) | 一种污水厌氧处理产气量多元智能实时监控方法 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN105426959A (zh) | 基于bp神经网络与自适应mbfo算法的铝电解节能减排方法 | |
CN116956160A (zh) | 一种基于自适应树种算法的数据分类预测方法 | |
CN111310974A (zh) | 一种基于ga-elm的短期需水预测方法 | |
Drăgoi et al. | Modeling methodology based on Artificial Immune System algorithm and Neural Networks applied to removal of heavy metals from residual waters. | |
CN115713144A (zh) | 基于组合cgru模型的短期风速多步预测方法 | |
CN115619028A (zh) | 一种基于聚类算法融合的电力负荷精准预测方法 | |
Yichang | The application of immune genetic algorithm in BP neural network | |
CN113191526A (zh) | 一种基于随机敏感度的短期风速区间多目标优化预测方法及系统 | |
CN105426960A (zh) | 基于bp神经网络与mbfo算法的铝电解节能减排控制方法 | |
CN110782950A (zh) | 基于偏好网格和莱维飞行的多目标粒子群算法的肿瘤关键基因识别方法 | |
Liu et al. | Exchange rate forecasting method based on particle swarm optimization and probabilistic neural network model | |
Chen | Brain Tumor Prediction with LSTM Method | |
Zhang | A novel sexual adaptive genetic algorithm based on Baldwin effect for global optimization | |
Kumar et al. | Prediction of Rice Production in India Using Artificial Neural Network with Genetic Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |