CN117391463A - 一种河流污染的溯源方法 - Google Patents
一种河流污染的溯源方法 Download PDFInfo
- Publication number
- CN117391463A CN117391463A CN202311216784.7A CN202311216784A CN117391463A CN 117391463 A CN117391463 A CN 117391463A CN 202311216784 A CN202311216784 A CN 202311216784A CN 117391463 A CN117391463 A CN 117391463A
- Authority
- CN
- China
- Prior art keywords
- pollution
- river
- neural network
- data
- tracing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000009826 distribution Methods 0.000 claims abstract description 68
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 64
- 238000003062 neural network model Methods 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 32
- 239000003344 environmental pollutant Substances 0.000 claims abstract description 31
- 231100000719 pollutant Toxicity 0.000 claims abstract description 31
- 238000009792 diffusion process Methods 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000012614 Monte-Carlo sampling Methods 0.000 claims abstract description 21
- 238000012544 monitoring process Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 60
- 238000013528 artificial neural network Methods 0.000 claims description 36
- 108090000672 Annexin A5 Proteins 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000001902 propagating effect Effects 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000012805 post-processing Methods 0.000 abstract description 4
- 230000008901 benefit Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种河流污染的溯源方法,包括:收集河流中不同位置的监测数据;获取不同污染因子的纵向扩散系数和一阶衰减系数,建立扩散波模型,模拟计算污染物在水体中的时空分布数据;将监测数据和对应的时空分布数据作为BP神经网络模型的输入数据集,进行迭代训练;然后将待预测的目标河流的监测数据输入训练后的BP神经网络模型,得到目标河流对应的预测结果;引入贝叶斯算法对预测结果进行后处理,获得污染源参数的概率分布;最后采用蒙特卡洛抽样方法对污染源参数的概率分布,进行采样和处理,获得目标河流的溯源结果的近似解。该方法可实现高效、准确且可靠的河流污染溯源,为环境管理提供决策支持。
Description
技术领域
本发明涉及河流污染溯源的技术领域,特别涉及一种河流污染的溯源方法,更具体的说是涉及一种基于扩散波模型、BP神经网络、贝叶斯算法和蒙特卡洛抽样的河流污染溯源方法。
背景技术
目前,随着工业化和城市化的快速发展,河流污染已成为全球面临的严峻环境问题之一。河流污染的溯源工作对于有效的环境管理和保护至关重要。然而,当前的河流污染溯源方法存在一些挑战和限制,包括工作量大、效率低、误差可能性以及模型模拟的不确定性。
传统的人工溯源方法主要依赖现场调查、样品分析和同位素分析等手段来确定污染物的来源和传播路径。这种方法需要耗费大量时间和资源来调查污染原因和寻找污染源,且受到样本获取的限制,效率较低。同时,人为因素可能导致误差的存在。
另一种常用的方法是利用数学模型进行模拟来识别污染源。这些模型模拟污染物在河流中的传输和扩散过程,提供全面的污染溯源信息。然而,模型的准确性和可靠性受到模型参数选择和模型假设的限制。此外,模型模拟需要对河流的物理和化学过程进行合理描述,这在实际操作中存在一定挑战。
因此,需要一种高效、准确且可靠的河流污染溯源方法,能够智能、快速地确定污染发生的位置、污染源的强度和发生时间,为环境管理者采取相应措施提供重要支持,对于后续的应急处理具有重要意义。
发明内容
有鉴于此,本发明提供了一种河流污染的溯源方法,可解决现有技术中污染溯源效率低、误差大、建模受限、准确性低的问题。
为了实现上述目的,本发明采用如下技术方案:
本发明实施例提供一种河流污染的溯源方法,包括以下步骤:
数据收集与预处理步骤:收集河流中不同位置的水文信息、地形信息和污染物浓度,并进行预处理,获得监测数据;所述水文信息包括:水流速度和水深;所述地形信息包括:河道宽度和深度;
扩散波模型建立步骤:获取不同污染因子的纵向扩散系数和一阶衰减系数,基于河流的特性和物理过程,建立扩散波模型,模拟计算污染物在水体中的时空分布数据;
神经网络训练步骤:构建BP神经网络模型,将所述监测数据和对应的时空分布数据作为BP神经网络模型的输入数据集,进行迭代训练;
神经网络预测步骤:将待预测的目标河流的监测数据输入训练后的BP神经网络模型,得到所述目标河流对应的预测污染源位置、污染发生时间和污染强度;
贝叶斯网络构建步骤:引入贝叶斯算法对所述预测污染源位置、污染发生时间和污染强度进行后处理,获得污染源参数的概率分布;
蒙特卡洛抽样步骤:采用蒙特卡洛抽样方法对所述污染源参数的概率分布,进行采样和处理,获得所述目标河流的溯源结果的近似解。
进一步地,所述数据收集与预处理步骤,包括:
利用水质传感器对河流中不同位置的水质参数进行实时监测和采集,包括水文信息和污染物浓度;并收集河道地形信息;所述水文信息包括:水流速度和水深;所述地形信息包括:河道宽度和深度;
对所述水质参数进行数据清洗,根据时间序列对齐和矫正数据,筛选出数据中的错漏值和缺失值,检测异常值并删除;并进行归一化处理;
从处理后的水质参数中提取有效的时间序列特征。
进一步地,所述扩散波模型建立步骤中,所述扩散波模型采用圣维南方程组表述:
式中,C为t时刻沿河道方向距离污染源x处的污染物浓度,mg/L;U为水流平均流速,m/s;D为污染物在水体中的扩散系数,m2/s;K为一级衰减系数,s-1;m为污染源处单位面积上污染物的质量,g。
进一步地,所述神经网络训练步骤,包括:
将所述监测数据和对应的时空分布数据作为数据集,按照预设比例划分为训练集、测试集和验证集;
设计和构建适合河流污染溯源的BP神经网络模型,包括输入层、隐藏层和输出层的设置;
随机初始化权重和偏置,采用Swish激活函数作为每个隐藏层节点的激活函数;
进行模型训练,包括:前向传播、计算损失函数、反向传播、参数更新和重复迭代;
使用所述验证集评估模型的性能,当高于阈值时,则停止训练,作为训练好的BP神经网络模型。
进一步地,设计和构建适合河流污染溯源的BP神经网络模型,包括输入层、隐藏层和输出层的设置,包括:
设计和构建适合河流污染溯源的BP神经网络模型,根据水质参数确定输入层的节点数,每一个节点对应一个水质指标;
根据问题的复杂性和数据集的特点确定隐藏层的节点数和层数;其中,神经元数量的选择采用经验公式:
式中:N为隐藏层神经元个数,s为输入神经元个数,p为输出节点数,c为1~10之间的常数;
确定输出层的节点数:输出层节点数设置为3,包含污染源位置,发生时间和污染强度。
进一步地,进行模型训练的具体过程,包括:
前向传播步骤:将输入数据传递到网络中,通过每一层的加权求和和激活函数计算得到隐藏层和输出层的输出值;
计算损失函数步骤:将前向传播得到的输出结果与实测值进行比较,计算损失函数,即预测值与实际值之间的均方误差MSE:
式中,yi o为实测水质参数值,yi p为模型预测水质参数值;n为预测水质参数的数据个数;i=[1,2,…n];
反向传播步骤:根据损失函数计算输出层和隐藏层的梯度,通过链式法则将梯度反向传播回输入层中更新权重和偏置
参数更新步骤:根据计算得到的梯度,采用梯度下降法进行参数更新,不断调整模型的权重和偏置,使模型能够适应水质参数的特征和关系;
重复迭代步骤:重复进行前向传播、损失计算、反向传播和参数更新步骤,直到达到最大迭代次数或损失函数收敛。
进一步地,使用所述验证集评估模型的性能,当高于阈值时,则停止训练,作为训练好的BP神经网络模型,包括:
使用验证集评估模型的性能,评价指标包括:平均绝对误差MAE,均方根误差RMSE和预测区间覆盖率PICP;
PICP表示实际值落在预测区间内的真实概率,值越大,实测值落在预测区间内的概率越大;Ci表示第i个实际值是否落在预测区间内,0表示否,1表示是;当PICP值大于预设阈值时,则停止训练,作为训练好的BP神经网络模型。
进一步地,所述贝叶斯网络构建步骤,包括:
建立污染源位置和释放量的先验分布;
以BP神经网络模型的预测结果构建贝叶斯算法的似然函数;
根据贝叶斯定理,将所述先验分布和似然函数相乘,得到后验分布,作为污染源参数的概率分布。
进一步地,以BP神经网络模型的预测结果构建贝叶斯算法的似然函数,包括:
将BP神经网络模型的预测结果视为符合高斯分布,实际观测值视为观测数据点;
对每个BP神经网络的预测值,计算其与对应的实际观测值之间的差异;
将所述差异作为高斯分布的标准差;
利用高斯分布的概率密度函数计算每个观测值在该高斯分布下的概率密度。
进一步地,所述蒙特卡洛抽样步骤,包括:
1)从所述先验分布中随机选择一个初始样本作为马尔科夫链的起点;
2)构造一个符合正态分布的提议函数,根据所述提议函数生成一个在参数空间中具有随机性的候选样本;
3)计算接受率,根据所述接受率确定是否接受或拒绝新样本;所述接受率由候选样本的似然函数值和当前样本的似然函数值之间的比较得出;
4)根据接受或拒绝新样本的结果,更新样本;
5)重复迭代步骤2)-4),直到满足设定的迭代次数或迭代过程中的平均值和方差稳定在预设范围内;
6)通过保留马尔科夫链的一系列样本,得到近似的后验分布;通过统计所述一系列样本的均值、方差和置信区间,获得对所述目标河流的溯源结果的近似解。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种河流污染的溯源方法,综合应用了扩散波模型、BP神经网络、贝叶斯算法和蒙特卡洛抽样方法,充分发挥了各自的优势,提高了对河流污染溯源结果的准确性和可靠性。通过本方法,环境管理者可以获得全面的河流污染源信息,支持科学决策和制定有效的污染防控措施。同时,本方法还具有普适性和可操作性,适用于不同河流和污染物的溯源问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的河流污染的溯源方法的流程图。
图2为本发明实施例提供的河流污染的溯源方法的原理框图。
图3为本发明实施例提供的蒙特卡洛抽样流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明涉及一种基于扩散波模型、BP神经网络、贝叶斯算法和蒙特卡洛抽样的河流污染溯源方法,旨在提供一种高精度和可靠性的河流污染源追踪方案,实现对污染源位置、污染发生时间和污染强度的估计,以便为环境管理提供决策支持。本方法综合考虑物理过程、数据驱动的预测能力、不确定性建模和多样性分析,有效地解决了传统河流污染溯源方法中存在的限制和挑战。
参照图1所示,本发明实施例公开了一种河流污染的溯源方法,包括以下步骤:
数据收集与预处理步骤:收集河流中不同位置的水文信息、地形信息和污染物浓度,并进行预处理,获得监测数据;所述水文信息包括:水流速度和水深;所述地形信息包括:河道宽度和深度;
扩散波模型建立步骤:获取不同污染因子的纵向扩散系数和一阶衰减系数,基于河流的特性和物理过程,建立扩散波模型,模拟计算污染物在水体中的时空分布数据;
神经网络训练步骤:构建BP神经网络模型,将所述监测数据和对应的时空分布数据作为BP神经网络模型的输入数据集,进行迭代训练;
神经网络预测步骤:将待预测的目标河流的监测数据输入训练后的BP神经网络模型,得到所述目标河流对应的预测污染源位置、污染发生时间和污染强度;
贝叶斯网络构建步骤:引入贝叶斯算法对所述预测污染源位置、污染发生时间和污染强度进行后处理,获得污染源参数的概率分布;
蒙特卡洛抽样步骤:采用蒙特卡洛抽样方法对所述污染源参数的概率分布,进行采样和处理,获得所述目标河流的溯源结果的近似解。
首先,本方法采用扩散波模型来描述污染物在水体中的传输和扩散过程,该模型综合考虑了水流速度、扩散系数等因素对污染物传播的影响,能够准确描述污染物在水体中的时空分布;其次,本方法引入BP神经网络算法对污染源位置、污染发生时间和污染强度进行预测。通过训练神经网络模型,利用大量的水质监测数据和扩散波模型的模拟结果作为学习数据,该神经网络能够学习到水质指标与污染源位置的复杂关系,从而实现对污染源位置、污染发生时间和污染强度的准确预测。
由于BP神经网络可能存在过拟合等不确定性,本方法引入贝叶斯算法对BP神经网络的预测结果进行后处理,并提供溯源结果的置信度评估,可有效缓模型的过拟合问题;最后,考虑参数的随机性和观测数据的随机误差,采用蒙特卡洛抽样方法对不确定性进行采样,得到一系列多样性的溯源结果,提供更全面的溯源信息,增强了溯源结果的可靠性和鲁棒性。
本发明的优势在于,综合应用了扩散波模型、BP神经网络、贝叶斯算法和蒙特卡洛抽样方法,充分发挥了各自的优势,提高了溯源结果的准确性和可靠性。通过本方法,环境管理者可以获得全面的河流污染源信息,支持科学决策和制定有效的污染防控措施。同时,本方法还具有普适性和可操作性,适用于不同河流和污染物的溯源问题。
以下是如何将扩散波模型与神经网络、贝叶斯算法和蒙特卡洛抽样结合应用于河流污染溯源的一般步骤,参照图2所示,流程如下:
步骤S01:数据收集与准备,具体包括:
1)利用水质传感器等设备,对河流中不同位置的水质参数进行实时监测和采集,数据包括污染物浓度、水流速度、水深;同时收集河道地形数据,包括:河道宽度,河道深度等;
2)通过文献调研获取不同污染因子的纵向扩散系数和一阶衰减系数等;
3)基于收集的所有数据构建数据集,确保数据集包含足够的样本和特征进行训练和评估。
步骤S02:数据预处理,包括:
采集到的实测数据会存在异常值和缺失值等问题,需要对采集的数据进行预处理,包括数据清洗,根据时间序列对齐和矫正数据,筛选出数据中的错漏值和缺失值,检测异常值并删除;处理完之后进行归一化处理,确保数据的可靠性和一致性;
特征提取:整理收集到的数据,并对河流水体的特性进行分析,从水质数据中提取有效的时间序列特征,作为BP神经网络的输入;
步骤S03:扩散波模型建立:
基于河流的特性和物理过程,建立扩散波模型,描述污染物在水体中的传输和扩散行为。由于河流纵向长度通常远大于其宽度和深度,可将河道水流流动概化为一维问题,并采用圣维南方程组表述:
式中,C为t时刻沿河道方向距离污染源x处的污染物浓度,mg/L;U为水流平均流速,m/s;D为污染物在水体中的扩散系数,m2/s;K为一级衰减系数,s-1;m为污染源处单位面积上污染物的质量,g。考虑水流速度、水深、河道地形等因素,对模型的参数进行率定和校准。
针对可能的突发污染点和污染强度,制定不同的情景方案来进行模拟计算:根据实际的河流情况和潜在的污染源位置,可以提前设定多个可能的突发污染点,并考虑不同的污染物释放量或浓度。通过验证后的扩散波模型,模拟计算出污染物在水体中的传播路径、浓度分布和时间变化情况,这些模拟结果将作为BP神经网络模型的输入数据。
步骤S04:神经网络训练与预测:设计和构建适合河流污染溯源的神经网络模型,包括输入层、隐藏层和输出层的设置。利用神经网络模型进行训练,以学习数据中的模式和关联,预测污染源位置、污染发生时间和污染强度。具体步骤如下:
(1)数据划分:将收集到的实测监测数据和扩散波模型的计算结果作为BP神经网络的输入数据集,按照7:3的比例将数据集划分为训练集和测试集,训练集中设置20%的数据作为验证集。训练集用于神经网络模型的训练,验证集用于模型的调参,测试集用于最终的模型评估。
(2)网格架构设计:
2.1)根据水质数据确定输入层的节点数,每一个节点对应一个水质指标;
2.2)根据问题的复杂性和数据集的特点确定隐藏层的节点数和层数;对于河流水质,其数据结构复杂度较低,可采用3层网格结构,即只有1层隐含层;神经元数量的选择可以采用经验公式:
式中:N为隐藏层神经元个数,s为输入神经元个数,p为输出节点数,c为1~10之间的常数;根据以上经验公式可以计算隐藏层节点的大体区间,在区间内选取不同的节点分别建立模型进行计算,根据最终的准确度确定隐藏层节点数;
2.3)确定输出层的节点数:输出层节点数设置为3,包含污染源位置,发生时间和污染强度;
(3)初始化网格参数:随机初始化权重和偏置,采用Swish激活函数作为每个隐藏层节点的激活函数,可以增强网络的非线性表达能力;
(4)模型训练
前向传播:将输入数据传递到网络中,通过每一层的加权求和和激活函数计算得到隐藏层和输出层的输出值。
计算损失函数:将前向传播得到的输出结果与实测值进行比较,计算损失函数,即预测值与实际值之间的均方误差(MSE):
式中,yi o为实测水质值,yi p为模型预测水质值;n为预测水质数据个数;
反向传播:根据损失函数计算输出层和隐藏层的梯度,通过链式法则将梯度反向传播回输入层中更新权重和偏置。
参数更新:根据计算得到的梯度,采用梯度下降法进行参数更新,不断调整模型的权重和偏置,使模型能够适应水质数据的特征和关系。
重复迭代:重复进行前向传播、损失计算、反向传播和参数更新的步骤,直到达到最大迭代次数或损失函数收敛。
(5)模型评估和调优:使用验证集评估模型的性能,评价指标包括:平均绝对误差MAE,均方根误差RMSE和预测区间覆盖率PICP。
PICP表示实际值落在预测区间内的真实概率,值越大,实测值落在预测区间内的概率越大。Ci表示第i个实际值是否落在预测区间内,0表示否,1表示是。当PICP值大于阈值比如95%时,则停止训练,作为训练好的BP神经网络模型。
(6)模型预测:利用训练好的神经网络模型对需要检测的河流新的水质数据进行预测和溯源。将新的水质数据输入到训练好的模型中,获取预测结果,根据模型输出的结果,推断污染源的位置,污染发生时间和污染强度。
步骤S05:贝叶斯网络构建:BP神经网络的优势在于其灵活性和高效性,可以通过反向传播算法来优化参数,并且可以拟合复杂的非线性关系。然而,BP神经网络容易出现过拟合问题,对于数据不确定性处理不足。本发明通过贝叶斯算法弥补BP神经网络不确定性的不足,提供更准确的预测结果和置信区间。以BP神经网络预测的结果构建贝叶斯算法的似然函数,根据先验知识建立贝叶斯网络模型。可以按照以下步骤进行操作:
(1)先验分布的建立:在进行贝叶斯算法处理之前,需要建立污染源位置和释放量的先验分布。根据水质监测数据和扩散波模型中的参数和假设,如污染物释放位置,水流速度和水体特性,建立关键变量先验数据的正态分布概率密度函数。
(2)计算似然函数
贝叶斯模型的似然函数表示给定模型参数下观测值出现的概率,贝叶斯定理公式:
式中,P(X)为污染源未知参数X的先验分布,P(Y|X)似然函数,表示污染源未知参数为X下,污染监测数据Y的条件概率。P(X|Y)为后验概率密度函数,表示在获取监测数据Y后,污染源位置参数X的概率分布,P(Y)为污染监测数据的无条件概率。
BP神经网络可以通过训练得到一个参数化的模型,将输入数据映射到输出结果,包括对污染源的定位和污染物的浓度预测。在贝叶斯框架下,BP神经网络的输出可以被解释为对给定参数下观测数据的概率密度函数。通过将BP神经网络的输出作为似然函数,可以将其与先验分布相乘,从而得到后验概率。基于BP神经网络的输出结果构建似然函数的具体步骤如下:
1)将BP神经网络的预测输出视为符合高斯分布,实际值视为观测数据点;
2)对每个BP神经网络的预测值,计算其与对应的实际观测值之间的差异;
3)将差异作为高斯分布的标准差;
4)利用高斯分布的概率密度函数计算每个观测值在该高斯分布下的概率密度。
(4)计算后验分布
根据贝叶斯定理,将先验分布和似然函数相乘,即可得到后验分布。后验分布表示在观测到数据后,对模型参数的新估计。
后验概率密度函数:
式中,σ为观测误差,n为观测值的量,Yi为观测值,Ti为预测值;后验概率分布是贝叶斯推理的结果,往往比较复杂,没法直观的表示出未知参数的分布情况,为了获取参数的估计值,需要对后验概率密度函数进行抽样处理,得到污染源参数的概率分布。
(5)采用马尔可夫-蒙特卡洛抽样方法(Markov ChainMonte Carlo,MCMC)对后验分布进行采样和处理,以获得溯源结果的近似解。
参照图3所示,以下是基于MCMC的处理步骤:
1)初始样本:从先验分布中随机选择一个初始样本作为马尔可夫链的起点。
2)生成新样本:构造一个符合正态分布的提议函数,根据提议函数生成一个在参数空间中具有一定随机性的候选样本。
3)接受或拒绝新样本:计算接受率,决定是否接受候选样本。接受率通常由候选样本的似然函数值和当前样本的似然函数值之间的比较得出。在Metropolis-Hastings算法中,接受率ar的计算公式为:
pcan是候选样本的似然函数值,pcur是当前样本的似然函数值。
如果新样本的似然函数值较高,接受率将大于1,意味着新样本被接受的概率较高;如果新样本的似然函数值较低,接受率将小于1,意味着新样本被接受的概率较低。
根据接受率进行决策:通过生成一个[0,1]之间的随机数,与接受率进行较。如果随机数小于等于接受率,即落在[0,ar]区间内,那么新样本将被接受并成为下一次迭代的当前样本;如果随机数大于接受率,则新样本被拒绝,当前样本保持不变。
4)更新样本:根据接受或拒绝的结果,更新样本。如果新样本被接受,将其作为下一次迭代的当前样本;如果被拒绝,则重复使用当前样本。
5)迭代:重复步骤2)至4),直到满足设定的迭代次数或迭代过程中的平均值和方差稳定。
6)输出近似后验分布:通过保留马尔可夫链的一系列样本,得到近似的后验分布。可以通过统计这些样本的均值、方差和置信区间,来获得对溯源结果的近似描述。总之,通过不断迭代生成符合后验概率分布的样本,从而实现对污染源位置、污染发生时间和污染强度的估计。抽样的样本数量越多,得到的后验分布近似越精确。
与现有技术相比,本发明的有益效果是:
提高溯源准确性:综合利用多种方法和数据源,可以提高对污染源的定位和识别能力。扩散波模型提供了关于污染物传播过程的物理机制,BP神经网络能够学习数据中的非线性关系,而贝叶斯蒙特卡洛抽样算法则能够对溯源结果进行后处理和优化,综合利用这些方法可以提高溯源的准确性。
提供更多信息:采用多种方法结合的方式,可以融合不同的数据和知识源,提供更多关于污染源的信息。扩散波模型可以提供关于污染源的空间分布信息,BP神经网络可以从水质数据中提取出隐藏的特征和模式,而贝叶斯蒙特卡洛抽样算法可以结合先验知识进行后处理,综合利用这些信息可以更全面地理解和解释溯源结果。
考虑不确定性:贝叶斯蒙特卡洛抽样算法能够通过采样和后处理得到溯源结果的后验分布,从而考虑了结果的不确定性。这可以帮助决策者根据不确定性进行风险评估和决策制定。
潜在发现和解释能力:BP神经网络作为一种数据驱动的方法,可以在数据中发现隐藏的关联和模式,从而提供对污染源特征和影响因素的解释能力。这有助于进一步理解污染源的特征和机制,并为环境管理和污染控制提供更深入的洞察。
综上所述,采用基于扩散波模型、BP神经网络和贝叶斯蒙特卡洛抽样算法进行河流污染溯源相比于现有方法可能带来溯源准确性的提高、提供更多信息、考虑不确定性以及提供潜在发现和解释能力等有益效果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种河流污染的溯源方法,其特征在于,包括以下步骤:
数据收集与预处理步骤:收集河流中不同位置的水文信息、地形信息和污染物浓度,并进行预处理,获得监测数据;所述水文信息包括:水流速度和水深;所述地形信息包括:河道宽度和深度;
扩散波模型建立步骤:获取不同污染因子的纵向扩散系数和一阶衰减系数,基于河流的特性和物理过程,建立扩散波模型,模拟计算污染物在水体中的时空分布数据;
神经网络训练步骤:构建BP神经网络模型,将所述监测数据和对应的时空分布数据作为BP神经网络模型的输入数据集,进行迭代训练;
神经网络预测步骤:将待预测的目标河流的监测数据输入训练后的BP神经网络模型,得到所述目标河流对应的预测污染源位置、污染发生时间和污染强度;
贝叶斯网络构建步骤:引入贝叶斯算法对所述预测污染源位置、污染发生时间和污染强度进行后处理,获得污染源参数的概率分布;
蒙特卡洛抽样步骤:采用蒙特卡洛抽样方法对所述污染源参数的概率分布,进行采样和处理,获得所述目标河流的溯源结果的近似解。
2.根据权利要求1所述的一种河流污染的溯源方法,其特征在于,所述数据收集与预处理步骤,包括:
利用水质传感器对河流中不同位置的水质参数进行实时监测和采集,包括水文信息和污染物浓度;并收集河道地形信息;所述水文信息包括:水流速度和水深;所述地形信息包括:河道宽度和深度;
对所述水质参数进行数据清洗,根据时间序列对齐和矫正数据,筛选出数据中的错漏值和缺失值,检测异常值并删除;并进行归一化处理;
从处理后的水质参数中提取有效的时间序列特征。
3.根据权利要求1所述的一种河流污染的溯源方法,其特征在于,所述扩散波模型建立步骤中,所述扩散波模型采用圣维南方程组表述:
式中,C为t时刻沿河道方向距离污染源x处的污染物浓度,mg/L;U为水流平均流速,m/s;D为污染物在水体中的扩散系数,m2/s;K为一级衰减系数,s-1;m为污染源处单位面积上污染物的质量,g。
4.根据权利要求1所述的一种河流污染的溯源方法,其特征在于,所述神经网络训练步骤,包括:
将所述监测数据和对应的时空分布数据作为数据集,按照预设比例划分为训练集、测试集和验证集;
设计和构建适合河流污染溯源的BP神经网络模型,包括输入层、隐藏层和输出层的设置;
随机初始化权重和偏置,采用Swish激活函数作为每个隐藏层节点的激活函数;
进行模型训练,包括:前向传播、计算损失函数、反向传播、参数更新和重复迭代;
使用所述验证集评估模型的性能,当高于阈值时,则停止训练,作为训练好的BP神经网络模型。
5.根据权利要求4所述的一种河流污染的溯源方法,其特征在于,设计和构建适合河流污染溯源的BP神经网络模型,包括输入层、隐藏层和输出层的设置,包括:
设计和构建适合河流污染溯源的BP神经网络模型,根据水质参数确定输入层的节点数,每一个节点对应一个水质指标;
根据问题的复杂性和数据集的特点确定隐藏层的节点数和层数;其中,神经元数量的选择采用经验公式:
式中:N为隐藏层神经元个数,s为输入神经元个数,p为输出节点数,c为1~10之间的常数;
确定输出层的节点数:输出层节点数设置为3,包含污染源位置,发生时间和污染强度。
6.根据权利要求4所述的一种河流污染的溯源方法,其特征在于,进行模型训练的具体过程,包括:
前向传播步骤:将输入数据传递到网络中,通过每一层的加权求和和激活函数计算得到隐藏层和输出层的输出值;
计算损失函数步骤:将前向传播得到的输出结果与实测值进行比较,计算损失函数,即预测值与实际值之间的均方误差MSE:
式中,yi o为实测水质参数值,yi p为模型预测水质参数值;n为预测水质参数的数据个数;i=[1,2,…n];
反向传播步骤:根据损失函数计算输出层和隐藏层的梯度,通过链式法则将梯度反向传播回输入层中更新权重和偏置
参数更新步骤:根据计算得到的梯度,采用梯度下降法进行参数更新,不断调整模型的权重和偏置,使模型能够适应水质参数的特征和关系;
重复迭代步骤:重复进行前向传播、损失计算、反向传播和参数更新步骤,直到达到最大迭代次数或损失函数收敛。
7.根据权利要求6所述的一种河流污染的溯源方法,其特征在于,使用所述验证集评估模型的性能,当高于阈值时,则停止训练,作为训练好的BP神经网络模型,包括:
使用验证集评估模型的性能,评价指标包括:平均绝对误差MAE,均方根误差RMSE和预测区间覆盖率PICP;
PICP表示实际值落在预测区间内的真实概率,值越大,实测值落在预测区间内的概率越大;Ci表示第i个实际值是否落在预测区间内,0表示否,1表示是;当PICP值大于预设阈值时,则停止训练,作为训练好的BP神经网络模型。
8.根据权利要求1所述的一种河流污染的溯源方法,其特征在于,所述贝叶斯网络构建步骤,包括:
建立污染源位置和释放量的先验分布;
以BP神经网络模型的预测结果构建贝叶斯算法的似然函数;
根据贝叶斯定理,将所述先验分布和似然函数相乘,得到后验分布,作为污染源参数的概率分布。
9.根据权利要求8所述的一种河流污染的溯源方法,其特征在于,以BP神经网络模型的预测结果构建贝叶斯算法的似然函数,包括:
将BP神经网络模型的预测结果视为符合高斯分布,实际观测值视为观测数据点;
对每个BP神经网络的预测值,计算其与对应的实际观测值之间的差异;
将所述差异作为高斯分布的标准差;
利用高斯分布的概率密度函数计算每个观测值在该高斯分布下的概率密度。
10.根据权利要求8所述的一种河流污染的溯源方法,其特征在于,所述蒙特卡洛抽样步骤,包括:
1)从所述先验分布中随机选择一个初始样本作为马尔科夫链的起点;
2)构造一个符合正态分布的提议函数,根据所述提议函数生成一个在参数空间中具有随机性的候选样本;
3)计算接受率,根据所述接受率确定是否接受或拒绝新样本;所述接受率由候选样本的似然函数值和当前样本的似然函数值之间的比较得出;
4)根据接受或拒绝新样本的结果,更新样本;
5)重复迭代步骤2)-4),直到满足设定的迭代次数或迭代过程中的平均值和方差稳定在预设范围内;
6)通过保留马尔科夫链的一系列样本,得到近似的后验分布;通过统计所述一系列样本的均值、方差和置信区间,获得对所述目标河流的溯源结果的近似解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311216784.7A CN117391463A (zh) | 2023-09-20 | 2023-09-20 | 一种河流污染的溯源方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311216784.7A CN117391463A (zh) | 2023-09-20 | 2023-09-20 | 一种河流污染的溯源方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117391463A true CN117391463A (zh) | 2024-01-12 |
Family
ID=89462094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311216784.7A Pending CN117391463A (zh) | 2023-09-20 | 2023-09-20 | 一种河流污染的溯源方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117391463A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117807510A (zh) * | 2024-02-29 | 2024-04-02 | 中国一冶集团有限公司 | 结合多源数据处理的河网动态分区方法及系统 |
-
2023
- 2023-09-20 CN CN202311216784.7A patent/CN117391463A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117807510A (zh) * | 2024-02-29 | 2024-04-02 | 中国一冶集团有限公司 | 结合多源数据处理的河网动态分区方法及系统 |
CN117807510B (zh) * | 2024-02-29 | 2024-05-28 | 中国一冶集团有限公司 | 结合多源数据处理的河网动态分区方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111130839B (zh) | 一种流量需求矩阵预测方法及其系统 | |
Le Son et al. | Remaining useful lifetime estimation and noisy gamma deterioration process | |
Pechlivanidis et al. | Catchment scale hydrological modelling: A review of model types, calibration approaches and uncertainty analysis methods in the context of recent developments in technology and applications | |
Shin et al. | A review of foundational methods for checking the structural identifiability of models: Results for rainfall-runoff | |
Henderson et al. | Leveraging quantum annealing for election forecasting | |
CN117391463A (zh) | 一种河流污染的溯源方法 | |
CN109060760B (zh) | 分析模型建立方法、气体分析装置及方法 | |
Karimi et al. | Bayesian spatial regression models with closed skew normal correlated errors and missing observations | |
CN112307536A (zh) | 一种大坝渗流参数反演方法 | |
CN115982141A (zh) | 一种针对时序数据预测的特征优化方法 | |
Sánchez et al. | Obtaining transparent models of chaotic systems with multi-objective simulated annealing algorithms | |
Laqrichi et al. | Integrating uncertainty in software effort estimation using Bootstrap based Neural Networks | |
Zarei et al. | Pseudo-stochastic EM for sub-Gaussian α-stable mixture models | |
CN115270637A (zh) | 一种基于gbrt的地下排水管道最大应力预测方法 | |
CN114611832A (zh) | 一种基于贝叶斯多模型集对分析的海水入侵预测方法 | |
CN114970674A (zh) | 一种基于关联度对齐的时序数据概念漂移适配方法 | |
Hazra et al. | A simulation-based Bayesian approach to predict the distribution of maximum pit depth in steam generator tubes | |
Wu | Hybrid optimization algorithm to combine neural network for rainfall-runoff modeling | |
Pianosi et al. | ANN-based representation of parametric and residual uncertainty of models | |
Hart et al. | Accuracy and power analysis of social interaction networks | |
CN112561203B (zh) | 一种基于聚类和gru实现水位预警的方法及系统 | |
CN113868957B (zh) | 贝叶斯深度学习下剩余寿命预测及不确定性量化校准方法 | |
CN113627621B (zh) | 一种面向光网络传输质量回归估计的主动学习方法 | |
Zimeras et al. | Bayesian Spatial Uncertainty Analysis | |
CN113686823B (zh) | 基于透射光谱和PLS-Elman神经网络的水体亚硝酸盐含量估算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |