CN114707692A - 基于混合神经网络的湿地出水氨氮浓度预测方法及系统 - Google Patents

基于混合神经网络的湿地出水氨氮浓度预测方法及系统 Download PDF

Info

Publication number
CN114707692A
CN114707692A CN202210129285.3A CN202210129285A CN114707692A CN 114707692 A CN114707692 A CN 114707692A CN 202210129285 A CN202210129285 A CN 202210129285A CN 114707692 A CN114707692 A CN 114707692A
Authority
CN
China
Prior art keywords
value
neural network
ammonia nitrogen
adopting
optimized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210129285.3A
Other languages
English (en)
Inventor
杨博文
冯骁驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202210129285.3A priority Critical patent/CN114707692A/zh
Publication of CN114707692A publication Critical patent/CN114707692A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Physiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于混合神经网络的湿地出水氨氮浓度预测方法及系统,该方法包括:对获取的人工湿地进出水断面的水质环境数据进行主成分分析及移动平均处理,得到输入数据;所述水质环境数据的指标不少于8个;采用输入数据构建训练集和测试集,采用BP神经网络构建预测模型;采用遗传算法对BP神经网络的权职和阈值进行优化,得到优化的权值和阈值,再将优化好的权值和阈值带入神经网络中,完成对神经网络的优化,得到优化好的模型;对已优化好的模型,采用LM算法进行训练,得到最佳水质参数预测模型;利用测试集对待预测的人工湿地氨氮浓度进行预测。采用本发明的技术方案,提高模型的鲁棒性和泛化能力,提高了出水氨氮浓度预测的精准度。

Description

基于混合神经网络的湿地出水氨氮浓度预测方法及系统
技术领域
本发明属于计算器技术领域,尤其涉及一种基于混合神经网络的湿地出水氨氮浓度预测方法及系统。
背景技术
目前,多维数据驱动模型在出水水质预测方面成果显著,其中又以神经网络技术预测效果最佳。神经网络是人们由生物神经系统简化而提取出的算法模型,近些年来因其鲁棒性高,对多元非线性关系拟合效果好等特点,而广泛应用在在城市污水处理领域。目前常用于污水处理中的神经网络有误差反向传播神经网络、径向基函数神经网络、遗传算法、循环神经网路、长短期记忆神经网络等。但这些方法普遍存在易陷于局部最小值,难以找到全局最优解的问题。而且对于水质预测,输入的水质指标很多,超过8项,如何对输入的多个指标进行处理,提出有用的信息,用于后续的处理并进行准确的预测,降低预测误差,目前存在有一定的难度。
发明内容
针对以上技术问题,本发明公开了一种基于混合神经网络的湿地出水氨氮浓度预测方法及系统,提高了模型的鲁棒性和泛化能力,降低对出水氨氮浓度的预测误差。
对此,本发明采用的技术方案为:
一种基于混合神经网络的湿地出水氨氮浓度预测方法,其包括:
步骤S1,对获取的人工湿地进水断面的水质环境数据进行预处理,得到输入数据;其中所述水质环境数据包括水质指标、水量指标和大气环境指标三类,所述水质环境数据的指标不少于8个;进一步的,所述水质环境数据的指标为11个。
步骤S2,采用输入数据构建训练集和测试集,采用BP神经网络构建预测模型;
步骤S3,采用遗传算法对BP神经网络的权职和阈值进行优化,得到优化的权值和阈值,再将优化好的权值和阈值带入神经网络中,完成对神经网络的优化,得到优化好的模型;
步骤S4,对步骤S3中优化好的模型,采用LM算法进行训练,得到最佳水质参数预测模型;
步骤S5,利用测试集对待预测的人工湿地氨氮浓度进行预测。
其中,采用BP神经网络构建预测模型为采用现有技术的方法。
作为本发明的进一步改进,所述水质指标包括进水COD值、TP值(总磷)、SS值、TH值、BOD5值、pH值,所述水量指标包括进水流速和降雨量,所述大气环境指标包括温度、湿度、大气压。
作为本发明的进一步改进,步骤S1中,采用移动平均法对水质环境数据的指标进行平滑化处理,然后对各个指标数据进行标准化处理,转化为均值为0、方差为1的数列,采用主成分分析法进行数据降维,提取累计贡献率大于设定阈值的样本参数作为输入数据。
优选的,所述标准化处理,采用如下公式进行:
Figure BDA0003501758160000021
其中,yi为该指标标准化处理后的值,max{xj}为该指标的最大值,min{xj}为该指标的最小值,xi为该指标进行标准化处理前的数值。
作为本发明的进一步改进,步骤S4采用LM算法进行训练包括:
步骤S401,获取训练集的数据;
步骤S402,输入前期优化的权值和阈值,并设定精度;
步骤S403,计算初始误差函数R(x);
误差函数:R(x)=|f(x)-g(x)|
其中f(x)为初始模型计算结果值,g(x)为真实值;
步骤S404,构造雅可比矩阵,设定初始修正因子,解如下所述的超定方程:
xt+1=xt-(JTJ+λIn)-1JTr
其中J表示雅克比矩阵,In为单位矩阵,λ为修正因子,r为误差函数结果值;
雅可比矩阵为:
Figure BDA0003501758160000031
其中矩阵中的各项为误差函数模型的一阶偏导数;初始修正因子根据如下公式计算得到:
A0=J(x0)TJ(x0)
Figure BDA0003501758160000032
其中,J(x0)为x0的雅可比矩阵,u0为初始修正因子,x0为初始降维后所得输入值,
Figure BDA0003501758160000033
为A0的对角线元素,τ为0~1间的随机值;
步骤S405,将超定方程的计算结果xt+1,带入误差函数R(x)比较R(xt)与R(xt+1),调整修正因子大小;如果误差减小,则减少修正因子,同时修正权值和阈值;如果误差增大,则增大修正因子;直到达到设定的精度,输出最终解。
作为本发明的进一步改进,步骤S3中采用遗传算法对BP神经网络的权职和阈值进行优化包括:
步骤S301,初始化种群,选择合适的编码方式;
步骤S302,适应度函数的选择,根据个体得到BP神经网络的初始权值和阀值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出之间的误差绝对值和E作为个体适应度值F,计算公式为:
式中,n为网络输出节点数,yi为BP神经网络第i个节点的期望输出,oi为第i个节点的预测输出,k为系数;
步骤S303,选择操作采用轮盘赌法,即基于适应度比例策略,每个个体i的选择概率Pi为:fi=k/Fi,
Figure BDA0003501758160000034
式中,Fi为个体i的适应度,由于适应度值越小越好,所以在个体选择前对适应度值取倒数,N为种群数目,k为系数;
步骤S304,交叉操作,由于个体采用实数编码,所以交叉操作方法采用实数交叉法,第k个染色体ak和第l个染色体al在j位的交叉操作如下:
Figure BDA0003501758160000041
式中,b是[0,1]间的随机数;
步骤S305,变异操作,选取第i个个体的第j个基因aij进行变异,变异操作方法如下:
Figure BDA0003501758160000042
式中,amax为基因aij的上界,amin为基因aij的下界,f(g)=r2(1-g/Gmax)2,r2为一个随机数,g为当前迭代次数,Gmax为最大进化次数,r为[0,1]间的随机数;
步骤S306,将新染色体代替原来染色体,计算适应度,如果满足条件得到优化好的权值和阈值,否则转到步骤S303继续优化。
优化的,所述基于混合神经网络的湿地出水氨氮浓度预测方法还包括:
获取多组实际数据,使用模型评价指标对构建的预测模型进行可靠性评估和反馈调试;
根据验证后的预测模型,模拟出湿地出水浓度,对潜流湿地出水浓度进行长期持续预测。
其中,所述模型评价指标包括平均绝对误差、均方根误差、误差系数。
本发明还公开了基于混合神经网络的湿地出水氨氮浓度预测系统,其包括:
水质环境数据处理模块,对获取的人工湿地进水断面的水质环境数据进行预处理,得到输入数据;其中所述水质环境数据包括水质指标、水量指标和大气环境指标三类,所述水质环境数据的指标不少于8个;
预测模型构建模块,采用输入数据构建训练集和测试集,采用BP神经网络构建预测模型;
遗传算法模块,采用遗传算法对BP神经网络的权职和阈值进行优化,得到优化的权值和阈值,再将优化好的权值和阈值带入神经网络中,完成对神经网络的优化,得到优化好的模型;
训练模块,对步骤S3中优化好的模型,采用LM算法进行训练,得到最佳水质参数预测模型;
预测模块,利用测试集对待预测的人工湿地氨氮浓度进行预测。
作为本发明的进一步改进,所述水质指标包括进水COD(Chemical OxygenDemand,化学需氧量)值、TP值、SS((Suspended Solid,悬浮固体)值、TN(总氮)值、BOD5(水质五日生化需氧量)值、pH值,所述水量指标包括进水流速和降雨量,所述大气环境指标包括温度、湿度、大气压;
所述水质环境数据处理模块采用如下步骤进行处理:
对各个指标数据进行标准化处理,转化为均值为0、方差为1的数列,采用主成分分析法进行数据降维,提取累计贡献率大于设定阈值的样本参数作为输入数据;
所述标准化处理,采用如下公式进行:
Figure BDA0003501758160000051
其中,yi为该指标标准化处理后的值,max{xj}为该指标的最大值,min{xj}为该指标的最小值,xi为该指标进行标准化处理前的数值。
作为本发明的进一步改进,所述遗传算法模块采用如下步骤进行处理:
步骤S301,初始化种群,选择合适的编码方式;
步骤S302,适应度函数的选择,根据个体得到BP神经网络的初始权值和阀值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出之间的误差绝对值和E作为个体适应度值F,计算公式为:
式中,n为网络输出节点数,yi为BP神经网络第i个节点的期望输出,oi为第i个节点的预测输出,k为系数;
步骤S303,选择操作采用轮盘赌法,即基于适应度比例策略,每个个体i的选择概率Pi为:fi=k/Fi,
Figure BDA0003501758160000052
式中,Fi为个体i的适应度,由于适应度值越小越好,所以在个体选择前对适应度值取倒数,N为种群数目,k为系数;
步骤S304,交叉操作,由于个体采用实数编码,所以交叉操作方法采用实数交叉法,第k个染色体ak和第l个染色体al在j位的交叉操作如下:
Figure BDA0003501758160000061
式中,b是[0,1]间的随机数;
步骤S305,变异操作,选取第i个个体的第j个基因aij进行变异,变异操作方法如下:
Figure BDA0003501758160000062
式中,amax为基因aij的上界,amin为基因aij的下界,f(g)=r2(1-g/Gmax)2,r2为一个随机数,g为当前迭代次数,Gmax为最大进化次数,r为[0,1]间的随机数;
步骤S306,将新染色体代替原来染色体,计算适应度,如果满足条件得到优化好的权值和阈值,否则转到步骤S303继续优化。
作为本发明的进一步改进,所述训练模块采用如下步骤进行训练:
步骤S401,获取训练集的数据;
步骤S402,输入前期优化的权值和阈值,并设定精度;
步骤S403,计算初始误差函数R(x);
误差函数:R(x)=|f(x)-g(x)|
其中f(x)为初始模型计算结果值,g(x)为真实值;
步骤S404,构造雅可比矩阵,设定初始修正因子,解如下所述的超定方程:
xt+1=xt-(JTJ+λIn)-1JTr
其中J表示雅克比矩阵,In为单位矩阵,λ为修正因子,r为误差函数结果值;
雅可比矩阵为:
Figure BDA0003501758160000071
其中矩阵中的各项为误差函数模型的一阶偏导数;初始修正因子根据如下公式计算得到:
A0=J(x0)TJ(x0)
Figure BDA0003501758160000072
其中,J(x0)为x0的雅可比矩阵,u0为初始修正因子,x0为初始降维后所得输入值,
Figure BDA0003501758160000073
为A0的对角线元素,τ为0~1间的随机值;
步骤S405,将超定方程的计算结果xt+1,带入误差函数R(x)比较R(xt)与R(xt+1),调整修正因子大小;如果误差减小,则减少修正因子,同时修正权值和阈值;如果误差增大,则增大修正因子;直到达到设定的精度,输出最终解。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,当计算机程序在电子设备上运行时,使得所述电子设备执行如上任意一项所述的基于混合神经网络的湿地出水氨氮浓度预测方法。
本发明还公开了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上任意一项所述的基于混合神经网络的湿地出水氨氮浓度预测方法。
与现有技术相比,本发明的有益效果为:
采用本发明的技术方案,提高模型的鲁棒性和泛化能力,降低对出水氨氮浓度的预测误差,可以实时预测人工湿地的出水水质,从而为人工湿地的运维及管理提供科学依据,构建准确有效的人工湿地水质预测模型。
而且,本发明的技术方案除了实现人工湿地出水浓度的预测功能外,同时在预测之前对待测湿地水质环境数据进行了平滑性处理,增强了数据集的完整性,减弱的异常值对预测结果的影响程度;利用GA解决了传统神经网络易陷入局部最小值的问题,充分利用了GA良好的全局搜索能力,对神经网络的初始权值和阈值进行优化,减少了训练次数,缩短寻找最佳网络结构的时间。此外运用了BP神经网络对多元非线性关系的拟合能力。使用LM算法对模型进行训练,提升了模型准确性,可有效降低迭代时间和模型收敛时间;最后能有效处理冗余参数问题,使模型陷入局部极小值的机会大大减小。
附图说明
图1是本发明实施例的基于混合神经网络的湿地出水氨氮浓度预测方法的流程图。
图2是本发明实施例中GA遗传网络的示意图。
图3是本发明实施例中BP神经网络的示意图。
图4是本发明实施例中LM算法对模型进行训练的流程图。
具体实施方式
下面对本发明的较优的实施例作进一步的详细说明。
如图1~图4所示,一种基于混合神经网络的湿地出水氨氮浓度预测方法,其包括:
步骤S1,对获取的人工湿地进水断面的水质环境数据进行预处理,得到输入数据;其中所述水质环境数据包括水质指标、水量指标和大气环境指标三类,所述水质环境数据的指标不少于8个;进一步的,所述水质环境数据的指标为11个。所述水质指标包括进水COD值、TP值、SS值、TH值、BOD5值、pH值,所述水量指标包括进水流速和降雨量,所述大气环境指标包括温度、湿度、大气压。
此步骤中,先采用移动平均法对水质环境数据的指标进行平滑化处理,然后对各个指标数据进行标准化处理,转化为均值为0、方差为1的数列,采用主成分分析法进行数据降维,提取累计贡献率大于设定阈值的样本参数作为输入数据。
所述标准化处理,采用如下公式进行:
Figure BDA0003501758160000081
其中,yi为该指标标准化处理后的值,max{xj}为该指标的最大值,min{xj}为该指标的最小值,xi为该指标进行标准化处理前的数值。
步骤S2,采用输入数据构建训练集和测试集,采用BP神经网络构建预测模型,设置输入数据作为输入层,设置率定的神经元数为隐含层,得到的输出层为模拟的出水氨氮浓度。
具体包括:通过Matlab神经网络拟合工具建立预测模型,在率定隐含层神经元数前提下进行多次训练的结果,隐含层神经元数采用试错法确定,即分别构建了隐含层神经元数从2到35,层数由1到3的模型进行试错。各层间传递函数设为sigmod,输出函数设为tanh。氨氮参数优化模块的构建是通过MatlabR2020b软件的Genetic AlgorithmOptimization Toolbox工具完成。
步骤S3,采用遗传算法对BP神经网络的权职和阈值进行优化,得到优化的权值和阈值,再将优化好的权值和阈值带入神经网络中,完成对神经网络的优化,得到优化好的模型;本步骤中的优化包括:
步骤S301,初始化种群,选择合适的编码方式;
步骤S302,适应度函数的选择,根据个体得到BP神经网络的初始权值和阀值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出之间的误差绝对值和E作为个体适应度值F,计算公式为:
式中,n为网络输出节点数,yi为BP神经网络第i个节点的期望输出,oi为第i个节点的预测输出,k为系数;
步骤S303,选择操作采用轮盘赌法,即基于适应度比例策略,每个个体i的选择概率Pi为:fi=k/Fi,
Figure BDA0003501758160000091
式中,Fi为个体i的适应度,由于适应度值越小越好,所以在个体选择前对适应度值取倒数,N为种群数目,k为系数;
步骤S304,交叉操作,由于个体采用实数编码,所以交叉操作方法采用实数交叉法,第k个染色体ak和第l个染色体al在j位的交叉操作如下:
Figure BDA0003501758160000092
式中,b是[0,1]间的随机数;
步骤S305,变异操作,选取第i个个体的第j个基因aij进行变异,变异操作方法如下:
Figure BDA0003501758160000101
式中,amax为基因aij的上界,amin为基因aij的下界,f(g)=r2(1-g/Gmax)2,r2为一个随机数,g为当前迭代次数,Gmax为最大进化次数,r为[0,1]间的随机数;
步骤S306,将新染色体代替原来染色体,计算适应度,如果满足条件得到优化好的权值和阈值,否则转到步骤S303继续优化。
步骤S4,对步骤S3中优化好的模型,采用LM(Levenberg-Marquardt)算法进行训练,得到最佳水质参数预测模型;
如图4所示,采用LM算法进行训练包括:
步骤S401,获取训练集的数据;
步骤S402,输入前期优化的权值和阈值,并设定精度;
步骤S403,计算初始误差函数R(x);
误差函数:R(x)=|f(x)-g(x)|
其中f(x)为初始模型计算结果值,g(x)为真实值;步骤S404,构造雅可比矩阵,设定初始修正因子,解如下所述的超定方程:
xt+1=xt-(JTJ+λIn)-1JTr
其中J表示雅克比矩阵,In为单位矩阵,λ为修正因子,r为误差函数结果值;
雅可比矩阵为:
Figure BDA0003501758160000102
其中矩阵中的各项为误差函数模型的一阶偏导数;初始修正因子根据如下公式计算得到:
A0=J(x0)TJ(x0)
Figure BDA0003501758160000103
其中,J(x0)为x0的雅可比矩阵,u0为初始修正因子,x0为初始降维后所得输入值,
Figure BDA0003501758160000104
为A0的对角线元素,τ为0~1间的随机值;
步骤S405,将超定方程的计算结果xt+1,带入误差函数R(x)比较R(xt)与R(xt+1),调整修正因子大小;如果误差减小,则减少修正因子,同时修正权值和阈值;如果误差增大,则增大修正因子;直到达到设定的精度,输出最终解。
步骤S5,利用测试集对待预测的人工湿地氨氮浓度进行预测。
步骤S6,获取多组实际数据,使用模型评价指标对构建的预测模型进行可靠性评估和反馈调试;其中,所述模型评价指标包括平均绝对误差、均方根误差、误差系数。
根据验证后的预测模型,模拟出湿地出水浓度,对潜流湿地出水浓度进行长期持续预测。
此技术方案挑选了三类不同的指标,包括水质指标、水量指标和大气环境指标,使对人工湿地这样一个复杂系统的模拟更加准确。在对数据的处理中,因所收集的各个变量比例相差过大(如进水COD与流速之间比例相差过大),采用PCA主成分分析法不再是去中心化操作,而是标准化操作,首先将各单项数据转化为均值为0、方差为1的数列,之后再进行求协方差矩阵的操作,从而防止了因某些变量比例过大而掩盖掉比例过小变量的问题,使最终PCA在尽可能降维的情况下,涵盖了大量信息。在模型训练过程中使用Levenberg-Marquardt算法,可有效避免参数过多,导致模型过拟合的问题,从而提升模型准确性;其次可有效降低迭代时间和模型收敛时间;最后能有效处理冗余参数问题,使模型陷入局部极小值的机会大大减小。其中,修正因子的选择很重要,选择合适的修正因子可以使模型更快收敛,避免陷入局部最小值,提高其精度。
按照上面的方法结合实施例进行进一步的说明。
实施例1
收集人工湿地进水断面及出水断面的185组水质环境数据,收集的数据为一组11维的数据集,包括水质数据指标COD值、TP值、SS值、TN值、BOD5(水质五日生化需氧量)值、pH值,所水量指标包括进水流速和降雨量,大气环境指标包括温度、湿度、大气压;数据如表1所示:
表1
Figure BDA0003501758160000111
Figure BDA0003501758160000121
Figure BDA0003501758160000131
Figure BDA0003501758160000141
Figure BDA0003501758160000151
Figure BDA0003501758160000161
步骤1:采用移动平均法,利用如下公式将已获取样本的输出指标:出水氨氮进行平滑化处理,具体包括:
公式:Yt=Wt+Wt-1+......+Wt-n
Yt:平均后t日的出水氨氮浓度,
Wt:t日的出水氨氮浓度。
本实施例选用的3天数据进行平均,也就说用t-2、t-1、t日的数据进行平均,如表1所示。
然后对已获取样本的输入指标进行标准化处理,具体包括:
使用MATLAB中的mapminmax归一化处理,防止因数据位数过小而导致其特征被忽略,难以表达。
X'=(X-X_min)/(X_max-X_min)
X’:为归一化后数据;
X:为原数据;
X_min:为原数据中的最小值;
X_max:为原数据中的最大值;
最后将所得标准化数据进行主成分分析,以保留95%信息为提取标准,将11列数据中提取6列作为其主成分,将这4列数组成四维矩阵作为神经网络的输入指标。
步骤3:建立BP神经网络
预测模型的构建是在Matlab神经网络拟合工具中完成,隐含层神经元数的确定采用试错法。
本实施例中,氨氮预测生成模块的构建是在MatlabR2020b软件中进行,具体是由其中的Neural Network Fitting Tool工具完成。建模过程中,输入层变量为:进水COD、TP、SS、PH、BOD5、氨氮以及相应日子的降雨量、流量、温度、湿度、大气压等数据。输出层为氨氮浓度。收集的185组数据中,166组作为训练集,19组作为测试集。隐含层神经元数采用试错法确定:即分别构建了隐含层神经元数从2到35,层数由1到3的模型进行试错。各层间传递函数设为sigmod,输出函数设为tanh。氨氮参数优化模块的构建是通过MatlabR2020b软件的Genetic Algorithm Optimization Toolbox工具完成。
因为遗传算法优化的参数是BP神经网络的初始权值和阈值,只要网络的结构已知,权值和阈值的个数就已知了。
首先采用二进制编码对神经网络权值和阈值编码,得到初始种群。初始种群中的每个个体都包含了一个网络所有权值和阈值,个体通过适应度函数(本实际例中以
Figure BDA0003501758160000171
的倒数为适应度函数)。计算个体适应度值,遗传算法通过选择、交叉和变异操作找到最优适应度值对应的个体。在达到世代次数(本案例为200代,即GEN=200)时结束,用遗传算法得到最优个体对网络进行初始权值和阈值的赋值,即开始训练。
按照上述方法,对2021.7.14~2021.8.1的出水氨氮浓度进行预测,并以GA_BP3方法、BP3神经网络方法、GA_LM_BP方法进行对比,结果如表2所示。可见,采用本发明的技术方案,得到的结果更加准确。
表2预测结果对比表
Figure BDA0003501758160000172
Figure BDA0003501758160000181
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于混合神经网络的湿地出水氨氮浓度预测方法,其特征在于,其包括:
步骤S1,对获取的人工湿地进水断面的水质环境数据进行预处理,得到输入数据;其中所述水质环境数据包括水质指标、水量指标和大气环境指标三类,所述水质环境数据的指标不少于8个;
步骤S2,采用输入数据构建训练集和测试集,采用BP神经网络构建预测模型;
步骤S3,采用遗传算法对BP神经网络的权职和阈值进行优化,得到优化的权值和阈值,再将优化好的权值和阈值带入神经网络中,完成对神经网络的优化,得到优化好的模型;
步骤S4,对步骤S3中优化好的模型,采用LM算法进行训练,得到最佳水质参数预测模型;
步骤S5,利用测试集对待预测的人工湿地氨氮浓度进行预测。
2.根据权利要求1所述的基于混合神经网络的湿地出水氨氮浓度预测方法,其特征在于:所述水质指标包括进水COD值、TP值、SS值、TN值、BOD5值、pH值、出水氨氮值,所述水量指标包括进水流速和降雨量,所述大气环境指标包括温度、湿度、大气压。
3.根据权利要求2所述的基于混合神经网络的湿地出水氨氮浓度预测方法,其特征在于:步骤S1中,对除出水氨氮外的各个指标数据进行标准化处理,转化为均值为0、方差为1的数列,采用主成分分析法进行数据降维,提取累计贡献率大于设定阈值的样本参数作为输入数据;
所述标准化处理,采用如下公式进行:
Figure FDA0003501758150000021
其中,yi为该指标标准化处理后的值,max{xj}为该指标的最大值,min{xj}为该指标的最小值,xi为该指标进行标准化处理前的数值。
4.根据权利要求3所述的基于混合神经网络的湿地出水氨氮浓度预测方法,其特征在于:步骤S4采用LM算法进行训练包括:
步骤S401,获取训练集的数据;
步骤S402,输入前期优化的权值和阈值,并设定精度;
步骤S403,计算初始误差函数R(x);
误差函数:R(x)=|f(x)-g(x)|
其中f(x)为初始模型计算结果值,g(x)为真实值;
步骤S404,构造雅可比矩阵,设定初始修正因子,解如下所述的超定方程:
xt+1=xt-(JTJ+λIn)-1JTr
其中J表示雅克比矩阵,In为单位矩阵,λ为修正因子,r为误差函数结果值;
雅可比矩阵为:
Figure FDA0003501758150000022
其中矩阵中的各项为误差函数模型的一阶偏导数;
初始修正因子根据如下公式计算得到:
A0=J(x0)TJ(x0)
Figure FDA0003501758150000023
其中,J(x0)为x0的雅可比矩阵,u0为初始修正因子,x0为初始降维后所得输入值,
Figure FDA0003501758150000024
为A0的对角线元素,τ为0~1间的随机值;
步骤S405,将超定方程的计算结果xt+1,带入误差函数R(x)比较R(xt)与R(xt+1),调整修正因子大小;如果误差减小,则减少修正因子,同时修正权值和阈值;如果误差增大,则增大修正因子;直到达到设定的精度,输出最终解。
5.根据权利要求3所述的基于混合神经网络的湿地出水氨氮浓度预测方法,其特征在于:步骤S3中采用遗传算法对BP神经网络的权职和阈值进行优化包括:
步骤S301,初始化种群,选择合适的编码方式;
步骤S302,适应度函数的选择,根据个体得到BP神经网络的初始权值和阀值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出之间的误差绝对值和E作为个体适应度值F,计算公式为:
式中,n为网络输出节点数,yi为BP神经网络第i个节点的期望输出,oi为第i个节点的预测输出,k为系数;
步骤S303,选择操作采用轮盘赌法,即基于适应度比例策略,每个个体i的选择概率Pi为:fi=k/Fi,
Figure FDA0003501758150000031
式中,Fi为个体i的适应度,由于适应度值越小越好,所以在个体选择前对适应度值取倒数,N为种群数目,k为系数;
步骤S304,交叉操作,由于个体采用实数编码,所以交叉操作方法采用实数交叉法,第k个染色体ak和第l个染色体al在j位的交叉操作如下:
Figure FDA0003501758150000041
式中,b是[0,1]间的随机数;
步骤S305,变异操作,选取第i个个体的第j个基因aij进行变异,变异操作方法如下:
Figure FDA0003501758150000042
式中,amax为基因aij的上界,amin为基因aij的下界,f(g)=r2(1-g/Gmax)2,r2为一个随机数,g为当前迭代次数,Gmax为最大进化次数,r为[0,1]间的随机数;
步骤S306,将新染色体代替原来染色体,计算适应度,如果满足条件得到优化好的权值和阈值,否则转到步骤S303继续优化。
6.基于混合神经网络的湿地出水氨氮浓度预测系统,其特征在于:其包括:
水质环境数据处理模块,对获取的人工湿地进水断面的水质环境数据进行预处理,得到输入数据;其中所述水质环境数据包括水质指标、水量指标和大气环境指标三类,所述水质环境数据的指标不少于8个;
预测模型构建模块,采用输入数据构建训练集和测试集,采用BP神经网络构建预测模型;
遗传算法模块,采用遗传算法对BP神经网络的权职和阈值进行优化,得到优化的权值和阈值,再将优化好的权值和阈值带入神经网络中,完成对神经网络的优化,得到优化好的模型;
训练模块,对步骤S3中优化好的模型,采用LM算法进行训练,得到最佳水质参数预测模型;
预测模块,利用测试集对待预测的人工湿地氨氮浓度进行预测。
7.根据权利要求6所述的基于混合神经网络的湿地出水氨氮浓度预测系统,其特征在于:所述水质指标包括进水COD值、TP值、SS值、TN值、BOD5值、pH值,所述水量指标包括进水流速和降雨量,所述大气环境指标包括温度、湿度、大气压;
所述水质环境数据处理模块采用如下步骤进行处理:
对除出水氨氮外的各个指标数据进行标准化处理,转化为均值为0、方差为1的数列,采用主成分分析法进行数据降维,提取累计贡献率大于设定阈值的样本参数作为输入数据;
所述标准化处理,采用如下公式进行:
Figure FDA0003501758150000051
其中,yi为该指标标准化处理后的值,max{xj}为该指标的最大值,min{xj}为该指标的最小值,xi为该指标进行标准化处理前的数值。
8.根据权利要求6所述的基于混合神经网络的湿地出水氨氮浓度预测系统,其特征在于:所述遗传算法模块采用如下步骤进行处理:
步骤S301,初始化种群,选择合适的编码方式;
步骤S302,适应度函数的选择,根据个体得到BP神经网络的初始权值和阀值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出之间的误差绝对值和E作为个体适应度值F,计算公式为:
式中,n为网络输出节点数,yi为BP神经网络第i个节点的期望输出,oi为第i个节点的预测输出,k为系数;
步骤S303,选择操作采用轮盘赌法,即基于适应度比例策略,每个个体i的选择概率Pi为:fi=k/Fi,
Figure FDA0003501758150000061
式中,Fi为个体i的适应度,由于适应度值越小越好,所以在个体选择前对适应度值取倒数,N为种群数目,k为系数;
步骤S304,交叉操作,由于个体采用实数编码,所以交叉操作方法采用实数交叉法,第k个染色体ak和第l个染色体al在j位的交叉操作如下:
Figure FDA0003501758150000062
式中,b是[0,1]间的随机数;
步骤S305,变异操作,选取第i个个体的第j个基因aij进行变异,变异操作方法如下:
Figure FDA0003501758150000063
式中,amax为基因aij的上界,amin为基因aij的下界,f(g)=r2(1-g/Gmax)2,r2为一个随机数,g为当前迭代次数,Gmax为最大进化次数,r为[0,1]间的随机数;
步骤S306,将新染色体代替原来染色体,计算适应度,如果满足条件得到优化好的权值和阈值,否则转到步骤S303继续优化;
所述训练模块采用如下步骤进行训练:
步骤S401,获取训练集的数据;
步骤S402,输入前期优化的权值和阈值,并设定精度;
步骤S403,计算初始误差函数R(x);
误差函数:R(x)=|f(x)-g(x)|
其中f(x)为初始模型计算结果值,g(x)为真实值;
步骤S404,构造雅可比矩阵,设定初始修正因子,解如下所述的超定方程:
xt+1=xt-(JTJ+λIn)-1JTr
其中J表示雅克比矩阵,In为单位矩阵,λ为修正因子,r为误差函数结果值雅可比矩阵为:
Figure FDA0003501758150000071
其中矩阵中的各项为误差函数模型的一阶偏导数;
初始修正因子根据如下公式计算得到:
A0=J(x0)TJ(x0)
Figure FDA0003501758150000072
其中,J(x0)为x0的雅可比矩阵,u0为初始修正因子,x0为初始降维后所得输入值,
Figure FDA0003501758150000073
为A0的对角线元素,τ为0~1间的随机值;
步骤S405,将超定方程的计算结果xt+1,带入误差函数R(x)比较R(xt)与R(xt+1),调整修正因子大小;如果误差减小,则减少修正因子,同时修正权值和阈值;如果误差增大,则增大修正因子;直到达到设定的精度,输出最终解。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机程序,当计算机程序在电子设备上运行时,使得所述电子设备执行如权利要求1~5任意一项所述的基于混合神经网络的湿地出水氨氮浓度预测方法。
10.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1~5任意一项所述的基于混合神经网络的湿地出水氨氮浓度预测方法。
CN202210129285.3A 2022-02-11 2022-02-11 基于混合神经网络的湿地出水氨氮浓度预测方法及系统 Pending CN114707692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210129285.3A CN114707692A (zh) 2022-02-11 2022-02-11 基于混合神经网络的湿地出水氨氮浓度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210129285.3A CN114707692A (zh) 2022-02-11 2022-02-11 基于混合神经网络的湿地出水氨氮浓度预测方法及系统

Publications (1)

Publication Number Publication Date
CN114707692A true CN114707692A (zh) 2022-07-05

Family

ID=82166218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210129285.3A Pending CN114707692A (zh) 2022-02-11 2022-02-11 基于混合神经网络的湿地出水氨氮浓度预测方法及系统

Country Status (1)

Country Link
CN (1) CN114707692A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115236149A (zh) * 2022-07-15 2022-10-25 中国地质调查局水文地质环境地质调查中心 一种基于电化学传感器的水质检测方法和系统
CN117174198A (zh) * 2023-11-02 2023-12-05 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855415A (zh) * 2012-09-29 2013-01-02 海南大学 基于pca-lssvm的氢回收膜分离两段流程建模方法
CN108088974A (zh) * 2017-11-30 2018-05-29 华南理工大学 一种厌氧同时反硝化产甲烷过程出水硝氮的软测量方法
CN111382147A (zh) * 2020-03-06 2020-07-07 江苏信息职业技术学院 一种气象数据缺失插补方法和系统
CN113052379A (zh) * 2021-03-17 2021-06-29 河北工程大学 一种基于bas-rbf的番茄需水预测方法
CN113971517A (zh) * 2021-10-25 2022-01-25 中国计量大学 一种基于ga-lm-bp神经网络的水质评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855415A (zh) * 2012-09-29 2013-01-02 海南大学 基于pca-lssvm的氢回收膜分离两段流程建模方法
CN108088974A (zh) * 2017-11-30 2018-05-29 华南理工大学 一种厌氧同时反硝化产甲烷过程出水硝氮的软测量方法
CN111382147A (zh) * 2020-03-06 2020-07-07 江苏信息职业技术学院 一种气象数据缺失插补方法和系统
CN113052379A (zh) * 2021-03-17 2021-06-29 河北工程大学 一种基于bas-rbf的番茄需水预测方法
CN113971517A (zh) * 2021-10-25 2022-01-25 中国计量大学 一种基于ga-lm-bp神经网络的水质评价方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115236149A (zh) * 2022-07-15 2022-10-25 中国地质调查局水文地质环境地质调查中心 一种基于电化学传感器的水质检测方法和系统
CN117174198A (zh) * 2023-11-02 2023-12-05 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统
CN117174198B (zh) * 2023-11-02 2024-01-26 山东鸿远新材料科技股份有限公司 一种基于氧氯化锆生产的自动检测清洁方法及系统

Similar Documents

Publication Publication Date Title
CN111291937A (zh) 基于支持向量分类与gru神经网络联合的处理污水水质预测方法
CN108469507B (zh) 一种基于自组织rbf神经网络的出水bod软测量方法
CN112966954B (zh) 一种基于时间卷积网络的防洪调度方案优选方法
CN114707692A (zh) 基于混合神经网络的湿地出水氨氮浓度预测方法及系统
CN110824915B (zh) 基于ga-dbn网络的废水处理智能监控方法及系统
CN112884056A (zh) 基于优化的lstm神经网络的污水水质预测方法
CN110083125B (zh) 一种基于深度学习的机床热误差建模方法
CN113723010B (zh) 一种基于lstm温度-位移相关模型的桥梁损伤预警方法
CN107346459B (zh) 一种基于遗传算法改进的多模式污染物集成预报方法
CN107463993A (zh) 基于互信息‑核主成分分析‑Elman网络的中长期径流预报方法
CN112733417A (zh) 一种基于模型优化的异常负荷数据检测与修正方法和系统
CN112990500A (zh) 基于改进加权灰色关联分析的台区线损分析方法及系统
CN112765902A (zh) 基于TentFWA-GD的RBF神经网络软测量建模方法及其应用
CN114580762A (zh) 一种基于XGBoost的水文预报误差校正方法
CN113743538A (zh) 基于ipso-bp神经网络的智能楼宇能耗预测方法、设备和介质
CN116542382A (zh) 基于混合优化算法的污水处理溶解氧浓度预测方法
CN109978024B (zh) 一种基于互联模块化神经网络的出水bod预测方法
CN114971090A (zh) 一种电供暖负荷预测方法、系统、设备和介质
CN109408896B (zh) 一种污水厌氧处理产气量多元智能实时监控方法
CN112819087B (zh) 一种基于模块化神经网络的出水bod传感器异常检测方法
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN117454765A (zh) 基于ipso-bp神经网络铜熔炼炉喷枪寿命预测方法
CN110991616B (zh) 一种基于删减型前馈小世界神经网络出水bod预测方法
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
CN112767692A (zh) 基于SARIMA-GA-Elman组合模型的短时交通流量预测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220705