CN107358021B

CN107358021B - 一种基于优化bp神经网络的do预测模型建立方法

Info

Publication number: CN107358021B
Application number: CN201710402265.8A
Authority: CN
Inventors: 李继庚; 张维; 蔡威; 满奕; 张燕忠; 刘焕彬
Original assignee: South China University of Technology SCUT
Current assignee: Guangzhou Poi Intelligent Information Technology Co ltd
Priority date: 2017-06-01
Filing date: 2017-06-01
Publication date: 2020-07-28
Anticipated expiration: 2037-06-01
Also published as: CN107358021A

Abstract

本发明公开了一种基于优化BP神经网络的DO预测模型建立方法，包括步骤：基于曝气池DO预测这一目标进行变量选取；对数据进行预处理；建立曝气池DO的初始预测模型并利用建模数据训练网络模型得到初步建立的DO预测模型，然后进行模型预测效果的分析；对初步建立的DO预测模型进行参数、结构的逐一优化然后利用思维进化算法优化BP网络的初始权、阈值，得到优化的预测模型；得到优化DO预测模型后，评价优化模型的预测精度和预测性能。本发明提高了对时序数据预测的精度，在一定程度改善模型性能、提高了预测准确性，对于污水处理厂进行曝气池曝气的精确控制的实施提供了便利。

Description

一种基于优化BP神经网络的DO预测模型建立方法

技术领域

本发明涉及污水处理技术领域，特别涉及一种基于优化BP神经网络的DO预测模型建立方法。

背景技术

溶解氧(Dissolved Oxygen，DO)在A2O工艺的污水处理过程中起着至关重要的作用。DO的浓度决定着污水处理生化反应的程度：DO不够充足，好氧微生物不能生存并发挥它们氧化分解的作用；DO浓度过高则在污泥回流的时候大量DO回流至缺氧池，有机物的氧化速率提高导致反硝化脱氮的过程因碳源的缺失而无法正常进行。因此，DO必须控制在合适的范围内，才能实现污水净化达标而能耗降低的有效目标。

污水处理过程中影响曝气池溶解氧DO的因素有很多，曝气反应系统的污水流量不断变化、污水污染物负荷波动大、污水回流等各种原因导致的时变性、非线性以及变量之间的耦合性和惯性滞后等问题，不仅涉及到处理工艺和设备，同时还包含物理、化学、生物等多方面的因素，现有基于机理的DO预测模型很难解决这种问题。

采用DO控制的曝气系统，在满足生化反应的前提下，通过调节曝气量控制DO在合理范围，避免过度曝气，达到有效控制运行成本，节能降耗的目的。基于机理的DO预测模型无法准确的预测DO，严重影响了DO的实时控制。

神经网络模型根据不同的实际情况来选择适合解决相应问题的结构参数。但是当需要解决的问题相对比较复杂时，用基本的人工神经网络(Artificial Neural Network，ANN)一般达不到实际应用的需求，即使很小的网络行为也不容易理解，更不用说大规模多层非线性网络结构，而且目前并没有严格的设计规则和成形理论可以遵循。在预测中，这些缺点必然会导致预测的结果和实际输出存在比较大的偏差，达不到预期的预测要求。基于优化算法进行神经网络优化的结合算法是解决上述问题的方法之一。

BP神经网络是一种针对非线性、非周期、无规律、无结构性或半结构性数据建模最常用、效果最佳的模型，结合数据挖掘建立具有时间序列的特征的BP神经网络预测模型对复杂的污水处理过程来说，是非常适合采用的方法。

思维进化算法，是一种20世纪末提出的优化算法，从根本上改变了进化算法的思想方法，不仅具有一般的进化算法(诸如遗传算法)自适应、自学习、自组织等特点，还具有提高整体搜索效率、具有并行计算能力等优点。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提供一种基于优化BP神经网络的DO预测模型建立方法，利用思维进化算法优化神经网络的权、阈值得到最优的BP网络预测模型，进行A2O工艺曝气池溶解氧DO时序变化趋势的揭示和溶解氧DO的预测。

本发明的目的通过以下的技术方案实现：一种基于优化BP神经网络的DO预测模型建立方法，包括以下步骤：

S1、基于“曝气池DO预测”这一目标进行变量选取；

S2、对数据进行预处理；

S3、建立曝气池DO的初始预测模型并利用建模数据训练网络模型得到初步建立的DO预测模型，然后进行模型预测效果的分析；

S4、对初步建立的DO预测模型进行参数、结构的逐一优化然后利用思维进化算法(Mind Evolutionary Algorithm,MEA)优化BP网络的初始权、阈值，得到最优的预测模型；

S5、得到最优DO预测模型后，利用测试样本进行数据预测，给出预测结果并和初始建立的DO预测模型的结果进行对比分析，从而评价优化模型的预测精度和预测性能。

优选的，步骤S1中对采集得到的污水处理厂污水处理相关过程的因素变量进行分析，结合污水处理厂实际情况采集变量数据，通过相关性分析得到各因素变量与曝气池DO之间的相关性，选取与曝气池DO相关性在一定阈值以上的因素变量。

进一步的，采用皮尔逊相关系数进行相关性分析。

优选的，探索步骤S1中选取的对曝气池DO影响显著的各因素变量与曝气池DO的时序滞后关系，通过分析各变量不同滞后期数与当前期数DO的变量之间的滞后相关性，分析得出对当前DO影响最大的滞后期数作为模型的输入变量。

优选的，步骤S2数据预处理包括：数据序列脏数据的清洗、异常数据的剔除、数据滤波与集成和标准化处理。

具体的，数据序列脏数据的清洗：对单点异常的数据，即少数时间点的数值为零、非常大/小或者不存在的情况，采用局部数值填充，利用异常值前一时刻的数值替换异常值；对时段性异常的数据，即某一时间段的数据明显异常于时段前后序列的数值，先剔除异常时段的数值，用零值替换，然后利用局部均值进行填补。

具体的，异常数据的剔除：利用拉依达法则进行异常值的判断，然后利用局部均值替换。

具体的，数据滤波与集成：采用均值滤波、滑动平均滤波、中值滤波、卡尔曼滤波的一种或多种进行滤波处理，然后将选取的变量集成为输入变量的数据框。

具体的，标准化处理：数据的标准化采用最大-最小法，其数学表达式如下：

归一化后的数据，变量的取值都在(0,1)的范围内。

优选的，BP网络每一层的状态只影响下一层神经元的状态，其中隐含层和输出层的激励函数初步选取双曲正弦Sigmoid函数和线性函数Purelin函数，学习算法选择动量梯度下降算法函数traingdm。

具体的，将预测模型得出的DO的预测值和实际值进行比较，分析预测结果，然后根据BP网络预测精度的评价指标进行模型预测效果的分析，模型预测效果的评价指标：选取误差平方和SSE(Sum-squared Error)和识别率DR(Discerning Rate)作为标准进行模型的分析和评价；

误差平方和的表达式如下：

式中，y_i为预测模型的期望输出，y_oi则为预测模型的实际输出；

而识别率的表达式为：

DR＝m/n×100％

其中，m为满足相对的预测误差|(y_i-y_oi)/y_i|×100％＜5％的实际输出的个数，n为预测样本的数目。

优选的，对初步建立的DO预测模型进行参数、结构的逐一优化包括隐含层神经元个数、神经网络的训练次数、隐含层的激励函数、网络模型建立的样本数量的优化。

优选的，对模型的不同优化，需要在前一优化步骤的基础上进行。

具体的，隐含层神经元个数的确定：选择初步建立网络的数据分集，网络模型的参数和初步建立的网络一样，这里只改变隐含层神经元的个数，进而确定预测效果较佳隐含层神经元的数目——选取不同神经元个数进行预测得到预测结果并确定最佳的神经元个数。

具体的，网络训练的次数：选择不同的训练次数进行网络的训练和模型的建立，进行检验数据的预测，对预测结果分析选取最佳的网络训练次数。

具体的，隐含层的激励函数：其他条件不变的情况下，针对激励函数进行参数的改变，对不同隐含层的激励函数进行网络的训练得到不同的预测模型，然后对预测效果分析选取最佳的隐含层激励函数。

具体的，BP网络模型建立的样本数目的确定：其他条件不变，分别选取不同数量的数据作为模型的学习样本，剩余的作为模型的检验数据加以利用,得到的不同训练样本数据建立的预测模型，利用结果分析得出BP网络模型建立的最佳样本数量。

优选的，利用思维进化算法优化BP网络的初始权、阈值，包括：

首先，然后将BP网络模型进行参数、结构的逐一优化得出的结构参数传递给思维进化优化算法,通过设定期望的预测要求为思维进化算法优化目标的判断准则,得到算法运行的优化结果；

然后，将算法得到的优化结果作为BP网络的初始权、阈值，再次进行网络的训练，得到最优的基于BP神经网络的DO预测模型。

本发明与现有技术相比，具有如下优点和有益效果：

本发明针对BP神经网络模型的结构性缺陷，设计了一种基于思维进化算法优化BP神经网络初始权、阈值的预测模型，不仅通过影响因素选择考虑了曝气池相关变量对DO的影响，基于不同变量的滞后期数对DO的影响，考虑了时间序列的特征，同时从BP网络的结果和参数等多个方面进行了模型的优化，优化模型提高了对时序数据预测的精度，在一定程度改善模型性能、提高了预测准确性，对于污水处理厂进行曝气池曝气的精确控制的实施提供了便利，同时为污水处理厂进一步节能降耗提供了前提。

附图说明

图1是DO预测模型的建立流程图；

图2是各影响因素与曝气池溶氧量DO之间的相关性系数图；

图3是进水量F不同滞后期数与曝气池DO之间的相关性系数图；

图4是曝气量Q不同滞后期数与曝气池DO之间的相关性系数图；

图5是曝气池液位LT不同滞后期数与曝气池DO之间的相关性系数图；

图6是曝气池污泥浓度MLSS不同滞后期数与曝气池DO之间的相关性系数图；

图7是BP神经网络模型的拓扑结构图；

图8是污水处理厂进水量F经数据预处理符合建模要求的时序图；

图9是污水处理厂曝气池曝气量Q经数据预处理符合建模要求的时序图；

图10是污水处理厂曝气池液位LT经数据预处理符合建模要求的时序图；

图11是污水处理厂曝气池污泥浓度MLSS经数据预处理符合建模要求的时序图；

图12是污水处理厂曝气池溶氧量DO经数据预处理符合建模要求的时序图；

图13是初始BP神经网络DO预测模型的预测效果分析图；

图14是初始BP神经网络DO预测模型的预测残差图；

图15是最优BP神经网络DO预测模型的预测效果分析图；

图16是最优BP神经网络DO预测模型的预测残差图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1

一种基于优化BP神经网络的DO预测模型建立方法，包括下列步骤：

S1、基于“曝气池DO预测”这一目标进行变量选取。

对采集得到的污水处理厂污水处理相关过程的变量进行分析，结合污水处理厂实际情况采集进水量F、进水COD、曝气池曝气量Q、曝气池液位LT、曝气池污泥浓度MLSS等变量数据，通过相关性分析得到各变量与曝气池DO之间的相关性，选取与曝气池DO相关性较明显的因素变量。

通过从工艺的角度和污水处理厂实际采集的数据进行各变量与曝气池DO的相关性分析，选取对DO影响比较显著的变量，剔除影响不显著的属性，确定模型采用的影响因素是进水量F、曝气量Q、曝气池液位LT和曝气池污泥浓度MLSS。这里采用的是皮尔逊相关系数：

式中，cov(X,Y)表示两个边路间的互协方差，σ_X，σ_Y则分别代表自协方差，E代表的是各个变量的期望。

S2、探索各因素变量与曝气池DO的时序滞后关系。

对于步骤S1中选取的对曝气池DO影响显著的因素进行时序滞后关系的探索，通过分析各变量不同滞后期数与当前期数DO的变量之间的滞后相关性分析得出对当前DO影响最大的滞后期数作为模型的输入变量。

变量滞后期数的选取：通过选取某一时段的DO的时序数据作为基准数据，结合A2O工艺进水到曝气池的水里停留时间(HRT)(一般4～6h)，进行不同变量的不同滞后期数与所选DO基准的时序数据进行相关性的分析，得到对所选DO期数影响最大的不同变量的滞后期数作为DO预测模型的输入变量，曝气池DO作为模型的输出变量。

针对不同变量滞后期数的选取，对各因素变量与曝气池DO的时序滞后关系的探索中，通过选取特定时间段的DO时序数据，然后选取不同变量不同滞后阶次的时序数据，利用步骤S1中的皮尔逊相关系数得出每一个变量影响当前DO的最大相关系数的滞后期数，作为模型DO相对应阶次的输入变量。

S3、对探索后的数据进行数据预处理，达到模型建立的要求。

数据预处理一方面是要提高数据的质量，另一方面是可以更加贴切地适应所采用的预测模型。通过对步骤S2分析的数据进行数据的清洗、数据规约、数据去噪(滤波)来得到满足建模要求的数据，主要针对脏数据进行缺失值的填补、异常值的替换，同时为了排除干扰进行滤波处理，然后进行数据的标准化。

对于数据预处理的过程，考虑时序数据的完整性，采用“异常值先剔除后填补”的方式，对数据的预处理的具体方法为：

步骤S3-1、数据序列脏数据的清洗：对步骤S2选取的变量因素有针对性地进行数据的清洗。单点异常的数据——少数时间点的数值为零、非常大/小或者不存在，采用局部数值填充，利用异常值前一时刻的数值替换异常值；时段性异常的数据——某一时间段的数据明显异常于时段前后序列的数值，先剔除异常时段的数值(用零值替换)，然后利用局部均值进行填补；

步骤S32、异常数据的剔除：异常值的处理——对步骤S3-1清洗过的数据序列进行异常判断并处理异常的数据，利用3δ法原则(拉依达法则)进行异常值的判断，然后利用局部均值替换。拉依达法则检验异常的前提是假设数据的样本量足够大而且数据是服从正态分布的，当采集的某个变量的样本数据x_t满足如下公式：

p(|x-μ|＞3σ)＞0.003 (2)

需要剔除“异常”数据。其中，x表示样本的数据集，其服从单维数据的正态分布。μ和δ分别表示样本的数学期望和方差。而正态分布的数据样本出现大于μ+3δ或者小于μ-3δ的概率总和不到0.3％，因而出现这种情况可视为异常数据。

S3-3、滤波数据的集成：为了排除测量的干扰需要对数据序列进行滤波处理，这里提供采用均值滤波、滑动平均滤波、中值滤波、卡尔曼滤波等不同的滤波方法的效果对比，结合实际案例的工艺情况选取滑动滤波为案例滤波方法，接着将步骤S1选取的变量集成为输入变量的数据框。

S3-4、数据属性的规约：不同的变量数据有其独特的性质，而且各自的量纲也有所不同，如果直接进行模型的建立，会影响模型准确性，进而影响测量结果，从而还需要对经过异常处理后的数据序列进行标准化处理。数据的标准化采用最大-最小法，其数学表达式：

归一化后的数据，变量的取值都在(0,1)的范围内，因此大大降低和消除了量纲和变量特性、数量级等造成的影响。

S4、针对满足建模要求的数据建立曝气池DO的初始预测模型并进行模型预测效果的分析。

S4-1、曝气池DO预测模型的初步建立。

通过步骤S2和S3得到符合DO预测模型的输入变量数据，然后选取经典的三层BP神经网络结构，模型的输入层由选取的进水量F、曝气量Q、曝气池液位LT和曝气池污泥浓度MLSS构成4个神经元，隐含层的神经元初步设定为9个，输出层的神经元只有DO一个。BP网络每一层的状态只影响下一层神经元的状态，其中隐含层和输出层的激励函数初步选取双曲正弦Sigmoid函数和线性函数Purelin函数，学习算法选择动量梯度下降算法函数traingdm，得到初步建立的BP神经网络模型结构并利用建模数据训练网络模型，得到初步的DO预测模型。

同时，考虑BP网络具有的泛化学习能力，网络学习的效果和速度等会受到学习样本数量的影响以及制约。样本数量过少且不完备的话，网络就难以通过智能化的学习总结出数据的规律或数据规律总结的偏差较大；而数据量过大又会导致学习的速率降低，模型训练的时间增加。因而，在实际应用中，对于模型学习泛化样本的选择和确定也非常重要，应该遵循几大原则：

(1)尽可能选择泛化完备的样本数据，如果选取的样本与系统实际差异过大，不仅泛化效果不好，反而大大局限网络的学习速度；

(2)尽量包含拐点等样本数据以保证和提高网络的训练质量；

(3)尽量保证网络的泛化应用符合实际的需求。

S4-2、初始的DO预测模型的效果评价。

利用测试数据和初步建立的DO预测模型进行模型的效果评价。通过预测模型得出DO的预测值和实际值进行比较，分析预测结果，然后根据BP网络预测精度的评价指标进行模型预测效果的分析。模型预测效果的评价指标，这里选取误差平方和SSE(Sum-squaredError)和识别率DR(Discerning Rate)作为标准进行模型的分析和评价。

误差平方和的表达式如下：

式中，y_i为预测模型的期望输出，y_oi则为预测模型的实际输出。

而识别率的表达式为：

DR＝m/n×100％ (5)

S5、对初步建立的DO预测模型进行参数、结构的逐一优化然后利用思维进化算法优化BP网络的初始权、阈值，得到最优的预测模型。

通过对初步得到的DO模型预测效果的分析，从网络影响效果的多个原因诸如隐含层神经元个数、神经网络的训练次数、隐含层的激励函数、网络模型建立的样本数量和网络初始的权、阈值等方面进行模型的优化得到最优的DO预测模型。

具体包括：

S5-1、隐含层神经元个数的确定：BP网络隐含层神经元的个数对训练速度以及模型的预测精度有直接的影响关系。对建模变量进行标准化处理后，依然选择初步建立网络的数据分集。网络模型的参数和初步建立的网络一样，这里只改变隐含层神经元的个数，进而确定预测效果较佳隐含层神经元的数目——选取不同神经元个数进行预测得到预测结果并确定最佳的神经元个数。

S5-2、网络训练的次数：选择不同的训练次数进行网络的训练和模型的建立，进而进行检验数据的预测。网络训练次数的不同，不仅影响模型建立的时间，同时不同的训练次数也影响BP网络经训练确认的网络结构中的权、阈值，通过设定不同的训练次数进行预测，对预测结果分析选取最佳的网络训练次数；

S3、隐含层的激励函数：隐含层激励函数的不同，直接影响BP网络的内部结构，进而影响BP网络模型的预测性能。常用函数有tansig函数和logsig函数，数学表达式如下：

在步骤S5-2的基础上，其他条件不变的情况下，针对激励函数进行参数的改变，对不同隐含层的激励函数进行网络的训练得到不同的预测模型，然后对预测效果分析选取最佳的隐含层激励函数。

S5-4、BP网络模型建立的样本数目的确定：建模的样本数量，理论上来说需要具备所要研究数据序列的完整信息，实际上采集的样本只能最大限度地包含该序列的数据规律，某种程度上来说，样本的数量越多，数据的信息量包含就越多。在步骤S5-3的基础上(其他条件不变)，分别选取不同数量的数据作为模型的学习样本，剩余的作为模型的检验数据加以利用,得到的不同训练样本数据建立的预测模型，利用结果分析得出BP网络模型建立的最佳样本数量。

S5-5、BP网络模型初始权、阈值的优化：在对初始DO预测模型的仿真结果进行分析的时候，发现影响BP网络性能的主要原因在于初始网络的权值、阈值是随机产生的，从而可能使系统陷入局部极小值问题的困境中。这里采用思维进化算法优化DO的BP预测模型网络初始的权值、阈值的算法步骤，基于步骤S5-4的条件采用选取的数据，得到的预测结果从而得出最优的DO预测模型。

首先，基于步骤S5-4的基础,针对曝气池DO的变化特征得出初步符合预测要求的模型,然后将BP网络模型基于S5-4得出的结构参数传递给思维进化优化算法,通过设定期望的预测要求为思维进化算法优化目标的判断准则,得到算法运行的优化结果；

然后,将算法得到的优化结果作为BP网络的初始权、阈值，再次进行网络的训练，得到最优的基于BP神经网络的DO预测模型。

S6、利用准备的数据测试建立的DO最优预测模型，通过分析预测结果进行模型的评价。

得到最优DO预测模型后，通过利用测试样本进行数据预测，给出预测结果并和初始建立的DO预测模型的结果进行对比分析，从而评价优化模型的预测精度和预测性能。

上述方法，主要考虑的是步骤S1中DO影响因素的选取、步骤S2中的不同影响因素不同滞后期数对DO的影响程度和步骤S5中不同方面进行模型的优化三个方面：(a)影响因素选取的不足会影响对DO预测效果的影响，影响因素选取过多会增加建模的工作量；(b)不同变量的滞后期数或者说阶次的选取，某种程度上来说包含模型的时序特征信息在内，滞后阶次选取的不同则会直接影响模型的输入变量的滞后期数，也就是模型的输入变量；(c)对模型优化方面的选取，需要在前一优化步骤的基础上进行，不同的条件下进行的优化是无法进行最优模型的寻找和匹配的。

实施例2

如图1，一种基于优化BP神经网络的DO预测模型建立方法，包含以下的建模和模型评价步骤：

1、通过对某污水处理厂的控制系统获取污水处理过程的相关数据进行初步的查看，选取包含2017-03-03 07:00至2017-03-04 12:00的所有数据(此时段的数据量缺失比较少)，结合污水处理的额A2O工艺，选择与曝气池溶氧量DO相关联的诸如进水量F、进水COD、曝气池曝气量Q、曝气池液位LT、曝气池污泥浓度MLSS等变量。利用实施例1中式(1)的皮尔逊相关系数，通过相关性分析各变量与曝气池DO之间的相关性，选取与曝气池DO在数值上具有明显相关性的变量——进水量F、曝气池曝气量Q、曝气池液位LT和曝气池污泥浓度MLSS。各变量与曝气池DO之间的相关性见附图2，图中横坐标各点的含义见表1。

表1附图2中各横坐标点的含义

序号	对应的变量参数	序号	对应的变量参数
				1	曝气池DO	4	曝气池曝气量
2	进水量	5	曝气池液位
				3	进水COD	6	曝气池污泥浓度

2、根据步骤1中相关性的分析确定了模型的输入输出变量，接着考虑时间尺度上的滞后关系，根据A2O工艺中不同处理工段耗时和水力停留时间(HRT)的长短，时延最久的是进水至曝气池的时间段，结合实际情况，延时的时间在4～6h，以选用数据的DO当前最后三个小时的时序为基准，得到不同变量相对DO的滞后阶次对曝气池DO的相关性见附图3至图6。

根据显示的结果，表明进水量F的延时滞后在148阶时对DO的影响最大，而曝气池的曝气量Q和污泥浓度MLSS对DO是即期相关的，液位LT相对滞后10阶的影响最大，从而得到了BP网络的拓扑结构如附图7所示。

3、接着，对各变量数据进行数据的预处理：

A、数据的清洗和异常值处理——通过对单点异常和时段异常的数据分别采用不同的处理方法进行处理，然后利用3δ法则判断异常值，利用均值替换之后，采用滑动滤波去除噪声，得到可用于建模的时序数据，各变量经异常处理后的时序见附图8至图12。

同时，对于符合建模的各变量数据进行集成，得到模型输入输出变量的初始数据框(分类数据集)。

B、由于不同变量的数据特征不同，而且各自的量纲也有所不同，直接利用数据建立模型会影响模型的准确性，从而需要对经异常处理的数据序列进行标准化处理。数据的标准化处理利用式(3)的最大-最小标准化法，得到输入输出变量的数据框(分类数据集)。

4、建立初始的DO预测模型并进行模型预测效果的评价，具体如下：

A、曝气池BP神经网络的DO预测模型的初步建立——选取经典的三层网络结构，即含有一个输入层、一个隐含层和一个输出层。模型输入层由选取的进水量F、曝气量Q、液位LT和污泥浓度MLSS等变量组成的4个神经元，隐含层的神经元定为9个，输出层只有神经元DO。BP网络每一层的状态只影响下一层神经元的状态，其中隐含层和输出层的激励函数分别为双曲正弦Sigmoid函数和线性函数Purelin函数，学习算法选择动量梯度下降算法函数traingdm。

B、初始DO预测模型的效果评价——对采用的测试数据(选取的数据按比例3:1分为模型建立序列和模型测试序列)，利用记建模序列训练得到的模型进行预测，得到的预测结果见附图13至14。同时，利用预测得到的预测值，可以得到模型预测结果的两个评价指标，误差平方和SSE为0.0146而识别率DR为78.7500。

由附图13和附图14可以看出，模型的预测值与实际值存在较大的误差，预测误差在[-0.5,0.7]之间，大部分的预测误差绝对值在0.4以上，即百分比误差大于10％的预测在30％左右。因而初始BP网络的预测能力并没有达到预期的目标，预测结果与期望输出相差较大，可以说初步建立的BP网络并不是理想的预测模型，初始BP网络的预测误差较大，准确性较低

5、对初步建立的DO预测模型进行多方面的优化，利用实施例1中的评价指标式(4)和(5)评价优化的效果，具体的优化步骤如下：

A、隐含层神经元个数的确定——依然选择初步建立BP网络的数据分集，即选择其中的1300组数据作为建模样本，而其余292组作为模型的检验数据。网络模型的参数和初始BP网络一样，这里只改变隐含层神经元的个数，进而确定预测效果较佳隐含层神经元的数目。选取不同神经元个数进行预测得到的结果如表2所示。

表2隐含层神经元个数对BP网络性能的影响

隐含层神经元个数	SSE	DR	隐含层神经元个数	SSE	DR
						4	0.0413	41.3043	8	0.0166	77.1739
5	0.0785	42.3913	9	0.0141	81.5217
						6	0.1464	46.7391	10	0.0177	75.0000
7	0.0269	58.6957	11	0.0230	65.2174

从表2可以看出，本实例选取隐含层神经元的个数为9个时预测效果最好，SSE仅0.0141而DR达到81以上。隐含层神经元的个数对模型的影响效果是比较复杂的，需要对具体的情况进行多次的试验才能得到比较满意的神经元的个数。

B、网络训练的次数的确定——选择不同的训练次数进行网络的训练和模型的建立，进而进行检验数据的预测。表3给出了不同的训练次数建立的模型预测的效果。

表3不同训练次数对BP网络性能的影响

训练次数	SSE	DR
			500	0.1197	38.0435
700	0.0662	41.3043
			900	0.0210	73.9130
1000	0.0156	89.1304

由表3可以看出，训练次数越多，最终得到的模型预测的效果越好，预测的精度越高。这表明，网络的训练次数越多，网络对于样本数据的规律获取的就越完整，但需要注意的是：这是以训练时间，也就是模型建立的时间的增长为代价换取的结果。在实际的应用中，需要将模型训练的时间和其他的因素和条件综合考虑来决定训练次数的多少。

C、隐含层的激励函数的选择——常用函数有tansig函数和logsig函数，其他条件不变，选取不同的激励函数建立相应的预测模型，模型预测的结果如表4所示。

表4不同隐含层激励函数对BP网络性能的影响

激励函数	SSE	DR
			logsig	0.0106	72.8261
tansig	0.0118	85.8696

从表4可以看出，在一定程度上tansig函数对网络的性能有所优化。所以，其他条件相同的情况下，选择tansig函数作为隐含层的激励函数。

D、模型建立的样本数目的确定——分别选取不同数量的数据作为模型的学习样本，剩余的作为模型的检验数据加以利用,得到的结果如表5所示。

表5不同学习样本的数量对BP网络性能的影响

样本数量	SSE	DR
			600	0.1188	33.8710
800	0.0428	45.9596
			1000	0.0216	69.0878
1200	0.0102	89.2857
			1400	0.0125	84.8958

从表5可以看出，模型学习样本的数据量增加时，一定范围内确实提高了BP网络模型的预测精度。但超过这一范围后，样本数量的增加反而会降低模型的预测精度。主要原因在于学习数据过少时，学习的样本数据没有包含数据的大量的特征，从而无法反映数据序列的规律，导致预测精度过低；而学习样本数据过多时，加重网络的学习负担，数据中存在的离群数据干扰网络学习过程的机会增加，导致网络的预测误差增大。

E、网络模型初始权、阈值的优化——采用思维进化优化得到优化的网络初始权、阈值，然后赋予步骤D建立的优化模型，采用上文选取的数据，得到的预测结果见附图15和附图16。

6、得到最优的DO预测模型后，预测结果和初始建立的预测模型得到的结果见表6。

表6模型优化前后的预测结果

DO预测模型	SSE	DR
			初始网络模型	0.0146	78.5700
最优网络模型	0.0014	99.4898

结合附图13至附图16和表6，最优网络模型的预测结果基本接近检验数据(也就是期望输出)，预测精度比初始网络模型有了明显的提高。查看最优网络模型的残差图(附图16)，可以看到网络的预测残差基本在[-0.2,0.2]的区间内，大部分在0附近，再一次证明优化后的模型预测精度比较高，效果比较好。结合优化的评价指标，最优模型得到的预测结果，SSE为0.0014，DR则高达99.4898,，充分说明优化模型在预测方面的优势。

从而，可以确定基于实例数据的BP网络的最优DO预测模型：模型输入变量为进水量F、曝气量Q、曝气池液位LT和曝气池污泥浓度MLSS，采用9个隐含层神经元、训练次数在选取1592组数据时需要选取1200组作为学习样本进行模型的训练，而训练次数最好不小于1000次，隐含层的激励函数建议选择tansig函数。

从整体上来看，建立的最优DO预测模型能够达到预期的预测要求，而且依赖的影响因素(进水量F、曝气量Q、曝气池液位LT和曝气池污泥浓度MLSS)通过在线传感器的测量也比较方便，可以说模型是很适用的。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于优化BP神经网络的DO预测模型建立方法，其特征在于，包括以下步骤：

S1、基于曝气池DO预测这一目标进行变量选取；

步骤S1中对采集得到的污水处理厂污水处理相关过程的因素变量进行分析，结合污水处理厂实际情况采集变量数据，通过相关性分析得到各因素变量与曝气池DO之间的相关性，选取与曝气池DO相关性在一定阈值以上的因素变量，所述因素变量包括进水量、曝气池曝气量、曝气池液位和曝气池污泥浓度，采用皮尔逊相关系数进行相关性分析；

探索步骤S1中选取的对曝气池DO影响显著的各因素变量与曝气池DO的时序滞后关系，进行变量滞后期数的选取，通过选取某一时段的DO的时序数据作为基准数据，结合A2O工艺进水到曝气池的水里停留时间，进行不同变量的不同滞后期数与所选DO基准的时序数据进行相关性的分析，得到对所选DO期数影响最大的不同变量的滞后期数作为DO预测模型的输入变量；

S2、对数据进行预处理，所述数据预处理包括：数据序列脏数据的清洗、异常数据的剔除、数据滤波与集成和标准化处理，并采用异常数据先剔除后填补的方式，所述异常数据的剔除采用拉依达法则进行异常值的判断，然后利用局部均值替换，对单点异常的数据，采用局部数值填充，对时段性异常的数据，先剔除异常时段的数值，用零值替换，然后利用局部均值进行填补；

S4、对初步建立的DO预测模型进行参数、结构的逐一优化然后利用思维进化算法优化BP网络的初始权、阈值，得到优化的预测模型；

步骤S4中对初步建立的DO预测模型进行参数、结构的逐一优化，包括对隐含层神经元个数、神经网络的训练次数、隐含层的激励函数、网络模型建立的样本数量的优化，所述初步建立的DO预测模型输入层采用由选取的进水量、曝气池曝气量、曝气池液位和曝气池污泥浓度变量组成的4个神经元，所述隐含层神经元个数参数优化后设为9个，所述隐含层的激励函数在参数优化后采用tansig函数；

S5、得到优化DO预测模型后，利用测试样本进行数据预测，评价优化模型的预测精度和预测性能。

2.根据权利要求1所述的DO预测模型建立方法，其特征在于，曝气池DO的初始预测模型选取经典的三层BP神经网络结构，BP网络每一层的状态只影响下一层神经元的状态，其中隐含层和输出层的激励函数初步选取双曲正弦Sigmoid函数和线性函数Purelin函数，学习算法选择动量梯度下降算法函数traingdm。

3.根据权利要求1所述的DO预测模型建立方法，其特征在于，步骤S3中进行模型预测效果的分析：将预测模型得出的DO的预测值和实际值进行比较，分析预测结果，然后根据BP网络预测精度的评价指标进行模型预测效果的分析，模型预测效果的评价指标：选取误差平方和SSE和识别率DR作为标准进行模型的分析和评价；

误差平方和的表达式如下：

而识别率的表达式为：

DR＝m/n×100％

4.根据权利要求1所述的DO预测模型建立方法，其特征在于，对模型的不同优化，需要在前一优化步骤的基础上进行。

5.根据权利要求1所述的DO预测模型建立方法，其特征在于，步骤S4中利用思维进化算法优化BP网络的初始权、阈值，包括：

将BP网络模型进行参数、结构的逐一优化得出的结构参数传递给思维进化优化算法,通过设定期望的预测要求为思维进化算法优化目标的判断准则,得到算法运行的优化结果；

然后，将算法得到的优化结果作为BP网络的初始权、阈值，再次进行网络的训练，直到得到满足优化条件的基于BP神经网络的DO预测模型。