CN113435124A - 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 - Google Patents
一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 Download PDFInfo
- Publication number
- CN113435124A CN113435124A CN202110761199.XA CN202110761199A CN113435124A CN 113435124 A CN113435124 A CN 113435124A CN 202110761199 A CN202110761199 A CN 202110761199A CN 113435124 A CN113435124 A CN 113435124A
- Authority
- CN
- China
- Prior art keywords
- water quality
- prediction
- time
- model
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000006870 function Effects 0.000 title claims abstract description 21
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 13
- 230000015654 memory Effects 0.000 title claims abstract description 7
- 230000008859 change Effects 0.000 claims abstract description 9
- 238000010219 correlation analysis Methods 0.000 claims abstract description 8
- 230000009467 reduction Effects 0.000 claims abstract description 7
- 230000004927 fusion Effects 0.000 claims abstract description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 44
- 229910052757 nitrogen Inorganic materials 0.000 claims description 22
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 21
- 229910052698 phosphorus Inorganic materials 0.000 claims description 21
- 239000011574 phosphorus Substances 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 15
- 238000011144 upstream manufacturing Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000013138 pruning Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000011425 standardization method Methods 0.000 claims description 2
- 230000002596 correlated effect Effects 0.000 claims 6
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 claims 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims 3
- 229910052760 oxygen Inorganic materials 0.000 claims 3
- 239000001301 oxygen Substances 0.000 claims 3
- 239000012286 potassium permanganate Substances 0.000 claims 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims 1
- 238000002474 experimental method Methods 0.000 claims 1
- 238000007499 fusion processing Methods 0.000 claims 1
- 238000003064 k means clustering Methods 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 6
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000004140 cleaning Methods 0.000 abstract 1
- 230000007787 long-term memory Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000003911 water pollution Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明是一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法。考虑水质变化的时空特性和多元相关性,提出了LSTM‑RBF的水质时空融合预测模型。该方法主要分为5个过程。1)数据清洗,并分别构建时间数据集、空间数据集;2)对1)所得时间数据集进行灰色关联分析,再利用深度自编码进行空间特征降维;3)依据2)中特征提取后参数,构建LSTM水质时间维度预测模型,得到时间维度预测结果;4)将2)中特征降维后的结果作为空间维度RBF模型的输入,建立RBF空间维度水质预测模型,得到空间维度预测结果;5)将时间、空间预测结果作为两个新的特征,利用模型树融合,得到时空融合水质参数预测结果。
Description
技术领域:
本发明水质预测方法,具体应用于水环境中重要污染参数的预测,针对水质变化的时间特性,提出了一种基于长短时记忆(Long Short-Term Memory,LSTM)和径向基函数(Radial Basis Function,RBF)神经网络的水质时空关联预测方法。针对水质变化的多元相关性,利用灰色关联分析和深度自编码降维分别进行时间、空间维度特征选择。该方法能够有效提高水质预测模型的精度和泛化能力。
背景技术:
水质预测是水污染治理的重要支撑,是水环境管理的基础。分析水质预测结果,能够更好的了解当地水环境质量的变化趋势,追溯水质恶化的源头,并及时采取相应的治理措施。在京津冀协同发展的大背景下,廊坊市生态环境面临巨大压力。水资源的过度开发,水污染及生态环境恶化成为廊坊市社会经济可持续发展的主要限制因素。
水环境条件错综复杂,水质预测模型多种多样,其中大多数模型都仅针对特定的研究对象,维度低且对随机成分较高的水体预测能力不佳。尽管对于多维度、多支流河段的动态模式已有初步探索,但在综合考虑各种因素方面尚存不足。涉及到实际应用,单一水质预测模型精度不高,不能充分利用水质变化的时空特性和多元相关性。因此本发明提出了一种基于LSTM-RBF的水质时空关联预测方法。
发明内容:
对传统水质预测方法在预测水质参数时存在的不足,本发明提出了一种基于长短时记忆网络和径向基函数神经网络组合的水质时空关联预测方法。首先对数据进行异常值处理、缺失值填充以及归一化;其次,分析得到用于水质空间关联预测的空间数据,分析水质参数与总磷、总氮浓度之间的相关性,分别建立时间、空间维度数据集;接着分别建立时间、空间维度水质预测模型;最后,将时间、空间维度预测结果作为两个新的特征,通过模型树融合,使得水质参数预测准确度提高,模型泛化能力大大增强,更有利于本方法在实际应用中的实现。本发明水质预测方法的流程图参见图4。
一种基于LSTM-RBF的水质时空关联预测方法,依次包括下述步骤:
(1)首先对原始数据集中的相关水质参数进行正态分布检验,水质指标均不服从正态分布,因此采用箱型图法进行异常值识别,取异常值前后相邻两个时刻的平均值代替。采用min-max标准化方法进行归一化处理。
(2)数据集分为两部分:时间维度的时间序列水质数据、空间维度的相关站点水质数据。根据地区各水质自动站的经度、维度、海拔高程、距离等信息,确定用于空间关联分析的数据集。其中空间数据集选择的方法如下所示:
步骤1:利用经度、纬度数据绘制水质自动站分布图;
步骤2:以目标水质自动站为中心作圆,圆的半径为监测站点4h水流平均流速数据乘以监测时间间隔4h。比较落在圆域内的各水质自动站的海拔高程数据;其中海拔高程小的站点位于下游,海拔高程大的站点位于上游;
步骤3:根据步骤2计算结果,确定具有上下游关系的站点,并将具有上下游关系的水质自动站的水质数据分别保存到不同数据集中,构成空间数据集;
(3)选择区域最终需要预测的水质参数,利用灰色关系分析方法分析其他水质参数与目标参数总磷、总氮浓度之间的相关性。
(4)利用目标站点的历史水质数据构建基于LSTM的水质时间序列预测模型。
(5)利用(2)所获得的空间数据集,建立基于RBF的水质空间相关预测模型。
(6)将(4)(5)获得的预测结果,利用模型树融合生成最终的水质时空融合预测模型。
本方法旨在利用LSTM-RBF水质时空关联预测方法,提高水质预测模型的精度和泛化能力,并且能够充分利用水质变化的时间特性、空间关联和多元相关性。与现有技术相比,本发明具有以下优点:
①、提取与目标参数相关性较高的主要水质指标,可以有效滤除其中包含的冗余特征
和噪声;
②空间预测模型的建立能够充分考虑上游水质对下游水质的影响。
③LSTM-RBF时空融合模型,可以弥补单一模型泛化能力低、精度不够的缺点。
附图说明:
图1是空间数据集获取示意图;
图2是深度自编码网络结构图;
图3是LSTM网络基本结构图;
图4是RBF神经网络基本结构图;
图5是本发明所述方法流程图;
具体实施方式:
参见图1水质自动站空间分布示意图,其中圆心代表目标站点,以目标站点为圆心,圆的半径=区域水流流速*水质监测间隔时间。落在区域中的水质自动站包括站点2、站点3、站点6,通过比较三个站点与目标站点的距离、给站点的高程,选择位于目标站点5上游且距离较近的水质自动站构建空间数据集。
本发明的方法流程图参见图5。首先确定预测参数,通过分析区域水质数据,发现水质指标为五类水的指标为预测对象。空间数据集的确定需要用到GIS,根据经纬度数据获得空间站点的分布情况,然后确定空间数据集。对于某一站点时间序列数据集,根据相关性分析进行特征提取;对于空间数据集,利用深度自编码网络进行特征提取,深度自编码网络结构见图2。
为了获得高维非线性网络结构的低维表示,使用了多个非线性函数来执行多层编码和解码,其中第一个隐含层表示如式(1)所示:
第k层隐含层表示如式(2)所示:
其中σ是激活函数,常用sigmoid,W(k)为第k层的权重矩阵,bk为第k层的偏置向量,K为隐含层数量,为经过K个隐含层后,得到的网络的特征表示。为了得到最优化的模型参数,需要将xi和的平均重构误差最小化,本文选择用均方误差表示损失函数,如式(3)所示:
LSTM通过遗忘门决定舍弃哪些不利于后续任务的信息,根据前一时刻的神经元输出和当前时刻的输入ht-1和当前时刻输入xt,通过激活函数sigmoid,得到遗忘门的输出ft,表示如式(4):
ft=sigmoid(Wf×Ct-1+Uf×xt+bf) (4)
其中Wf是遗忘门的权重矩阵,Uf是遗忘门的输入层和隐藏层间的权重矩阵,bf是偏置项。然后通过输入门决定将哪部分新信息存储到长期记忆状态中,这个过程分为两步:第一,利用输入门的sigmoid函数选择要存储的新的信息,记作it;然后根据前一时刻的记忆Ct-1和当前的输入xt,,利用tanh函数创建新的初始值向量表示如下:
it=sigmoid(Wi×ht-1+Ui×xt+bi) (5)
其中W和U分别代表各自门控的权重矩阵,b表示各自门控的偏置项。接下来,依据遗忘门和输出门系数,LSTM会更新当前的长期记忆状态Ct,更新细胞状态的计算过程如式(7)所示。
得到新的长期记忆状态Ct,就可以看输出门了。最终输出的信息ht的更新由两部分决定,第一部分是ot,它由上一时刻的神经元输出ht-1和当前时刻的输入xt,通过激活函数sigmoid得到。第二部分由长期记忆状态Ct和tanh激活函数组成,如式所示:
ot=sigmoid(Wo×ht-1+Uo×xt+bo) (8)
ht=ot×tanh(Ct) (9)
建立LSTM时间序列水质预测模型具体流程如图2所示,主要步骤如下:
(1)对数据集进行异常值、空缺值和归一化等预处理操作;
(2)选择单一站点数据作为数据集,依据滑动窗口的大小,构造训练集D;
(3)建立LSTM水质时间序列预测模型,初始化模型参数;
(4)用训练集D对预测模型进行训练,使用梯度下降法进行反向传播并更新模型参数,直至满足预测精度要求;
建立RBF空间关联水质预测模型具体流程如图3所示,空间预测模型确定空间数据集后主要步骤和时间序列预测模型基本相同,RBF网络的建立需要确定中心向量ci,宽度σi以及隐含层到输出层的权重wik。其中RBF的中心的选取对网络性能是至关重要,中心太近,会产生近似线性相关,中心太远,产生的网络会过大。本方法采用K-均值聚类算法是进行中心点选择。这种算法需要先选出初始点,不同的初始点,分类结果不同,每类得到的神经元中心也不同。具体步骤如下:
(1):任意选取在样本集中的R个样本作初始聚类中心。
(2):计算此时每个中心与剩余样本的距离记为d。如果样本与第R类的中心距离最短即min{d},则称属于R类。
(3):每当有一个新样本加入该类,则取该类中样本的均值作为新的中心。
(4):当满足中心不在变化或者变化程度小于给定限额的条件时,停止聚类。
若不满足上述条件,则重新进行(2)。
径向基函数采用高斯函数,表达如式(10)所示:
式中,||x-ci||是向量x-ci的欧式范数,表示输入向量x与隐含层神经元中心c之间的距离,其表达式如下:
Ri(x)是一种中心点径向对称衰减局部分布的非负非线性函数。Ri(x)能在ci取得唯一的最大值,并会随||x-ci||增大迅速减小到零。σi是高斯函数的围绕隐含层神经元中心的宽度。
本方法采用线性回归法计算RBF神经网络中的权重,如下式所示。
其中β是权重,y是样本的真实值,yNN是训练时RBF神经网络的输出值。
宽度σi的选取遵循使得所有RBF网络的神经单元的接受域之和覆盖整个训练样本空间的原则。本方法利用固定法确定宽度,当RBF网络的中心确定后,宽度为max{d}表示为样本与中心距离最大的值,m为隐含层神经元数。RBF网络的最终的输出结果,是隐含层径向基函数值的线性加权和,即表示为:
本方法利用了Stack的集成思想,将两个单一模型的预测结果作为模型树的训练与测试数据。模型树的构建主要分为三个步骤:建树、剪枝和回归。
步骤1:将时间、空间维度预测结果作为两个新的特征,构建新的数据集;
步骤2:构建模型树模型,将标准差减少值SDR(standard deviation reduction)作为节点的分裂属性,表示如式(14)所示:
其中,T表示到达该节点的样本集合,|T|表示数据集中样本总数量,Ti表示第i个子树上样本集合,sd表示标准差。本文采用的模型树为二叉树,i取值为1和2。
步骤3:训练模型树模型,将步骤1中所得新数据集依据分裂属性分裂,直至没有更多特征生成,形成叶子节点。对每个子集分别建立线性回归方程,线性回归方程如式(15)所示。
y=w0+w1x1+w2x2+…+wNxN (15)
其中,x1,x2,…,xN是属性值,w1,w2,…,wN表示属性权重。
步骤4:模型树建树完成后,利用后剪枝方法进行剪枝。计算每个子集回归方程预测的均方误差;比较每个节点与其子节点均方误差大小,若子节点均方误差比母节点的均方误差小,则保留该子树,否则将该节点转变成叶子节点。
步骤5:输入水质历史N天观测值序列,得到总磷、总氮参数第N+1天的预测值。N取值为[10,15]。
Claims (6)
1.一种基于长短时记忆网络和径向基函数神经网络的水质时空关联预测方法,其特征在于:
(1)收集目标流域较长时间内的数据作为历史数据,存入数据库;
(2)对历史数据集进行预处理,分别构建时间、空间数据集;对水质参数进行正态分布检验,得到水质参数数据均不服从正态分布;对水质数据采用箱型图法进行异常值识别,取异常值前后相邻两个时刻的平均值代替;采用min-max标准化方法进行归一化处理;
(3)特征选择;利用灰色关联分析法分别获得LSTM模型和RBF模型的输入参数;
(4)利用时间维度特征选择结果和预测目标总氮构建时间维度数据集,训练基于LSTM的水质时间序列预测模型;
(5)将深度自动编码器的中间层输出作为水质预测空间维度RBF模型的输入,建立基于RBF的水质空间相关预测模型;
(6)将分别获得的时间、空间维度总磷、总氮预测结果作为两个新的特征,以时间戳为键值进行融合,利用模型树得到总磷、总氮水质时空融合模型参数预测结果。
2.根据权利要求1所述的方法,其特征在于,步骤(2)中空间数据集;历史数据集中包含水质自动监测站的经度、纬度、海拔高程、距离数据;空间数据集选择的流程如下所示:
步骤1:利用经度、纬度数据绘制水质自动站分布图;
步骤2:选择目标预测站点;以目标预测站点为中心作圆,圆的半径为监测站点4h水流平均流速数据乘以监测时间间隔4h;比较落在圆域内的各水质自动站的海拔高程数据;其中海拔高程小的站点位于下游,海拔高程大的站点位于上游;
步骤3:根据步骤2的计算结果,确定具有上下游关系的站点,并将具有上下游关系的水质自动站的水质数据分别保存到不同数据集中,构成空间数据集。
3.根据权利要求1所述的方法,其特征在于,步骤(3)对时间、空间预测模型进行特征选择;对于时间维度水质预测模型,利用灰色关联分析法分别分析水温、电导率、浊度、酸碱值、总磷、溶解氧、高锰酸钾指数、氨氮、总氮与总磷、总氮的相关性,选择与总磷、总氮正相关的特征作为输入;对于空间维度预测模型,提取出各个站点中与总磷、总氮浓度正相关的参数构建输入特征,再利用深度自编码网络进行特征降维;其中,深度自编码网络中间层的输出作为水质预测空间维度RBF模型的输入;中间层密码获得步骤如下:
步骤1:将特征选择后的空间数据集作为编码器的输入,得到中间层输出;
步骤2:然后将密码传入解码器得到输出,此时的输出是输入的重构;
步骤3:利用均方误差表示损失函数,使输入输出之间的平均重构误差最小化。
4.根据权利要求1所述的方法,其特征在于,步骤(4)所述总磷、总氮时间维度预测模型,一种基于LSTM的时间维度水质预测方法流程如下所示:
步骤1:利用灰色关联分析法分别分析水温、电导率、浊度、酸碱值、总磷、溶解氧、高锰酸钾指数、氨氮、总氮与总磷、总氮的相关性;选择与总磷、总氮正相关的参数作为时间维度水质预测模型的输入;其中,总磷浓度的变化与水温、氨氮、总氮呈正相关;总氮浓度的变化与pH、溶解氧、氨氮、总磷正相关;选取与总磷、总氮正相关的特征构建新的数据集;
步骤2:通过灰色关联分析法获得的新数据集,将滑动窗口设置为N天,其中N取值范围为[10,15],依据滑动窗口大小切分时间序列数据集,构造训练样本;
步骤3:构建LSTM模型,模型共三层,一层LSTM层叠加dropout,加两层全连接层;经过多次实验,将dropout值设为0.1;初始化模型参数;
步骤4:训练预测模型,采用adam算法更新模型参数,优化LSTM神经网络;
步骤5:预测:得到总磷、总氮浓度预测值,若LSTM预测结果R2大于0.7,直接输出总磷、总氮预测值,否则重新调参继续训练LSTM模型。
5.根据权利要求1所述的方法,其特征在于,步骤(5)所述总磷、总氮空间维度预测模型,一种基于RBF神经网络的水质空间关联预测方法步骤如下所示:
步骤1:将深度自编码网络中间层输出密码作为新的空间数据集,依据滑动窗口大小切分数据集,构造训练集;
步骤2:构建RBF模型,包含一个隐含层;初始化模型参数;
步骤3:训练预测模型,利用K-means聚类方法选择基函数中心向量,采用线性回归法计算RBF神经网络中的隐含层与输出层之间的权重;
步骤4:预测;得到目标参数预测结果,若RBF预测结果的预测精度R2大于0.7,直接输出目标参数预测值,否则,调整模型参数进行步骤3。
6.根据权利要求1所述的方法,其特征在于,步骤(6)所述的一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法,利用模型树对时间、空间预测结果进行时空融合的流程:
步骤1:将时间、空间维度预测结果作为两个新的特征,构建新的数据集;
步骤2:构建模型树模型,将标准差减少值SDR作为节点的分裂属性,表示如式(1):
其中,T表示到达该节点样本集合,|T|表示样本集中的样本总量,Ti表示第i个子树上的样本集,sd表示标准差;本文采用的模型树为二叉树,i取值为1和2;
步骤3:训练模型树模型,将步骤1中所得新数据集依据分裂属性分裂,直至没有更多特征生成,形成叶子节点;对每个子集分别建立线性回归方程,线性回归方程如式(2)所示;
y=w0+w1x1+w2x2+...+wNxN (2)
其中,x1,x2,…,xN指的是属性值,w1,w2,…,wN表示属性的权重;
步骤4:模型树建树完成后,利用后剪枝方法进行剪枝;计算每个子集回归方程预测的均方误差;比较每个节点与其子节点均方误差大小,若子节点均方误差比母节点的均方误差小,则保留该子树,否则将该节点转变成叶子节点;
步骤5:输入水质历史前N天的观测值序列,得到总磷、总氮参数第N+1天的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110761199.XA CN113435124A (zh) | 2021-06-29 | 2021-06-29 | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110761199.XA CN113435124A (zh) | 2021-06-29 | 2021-06-29 | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113435124A true CN113435124A (zh) | 2021-09-24 |
Family
ID=77759099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110761199.XA Pending CN113435124A (zh) | 2021-06-29 | 2021-06-29 | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435124A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417740A (zh) * | 2022-03-30 | 2022-04-29 | 青岛杰瑞工控技术有限公司 | 一种深海养殖态势感知方法 |
CN114578011A (zh) * | 2022-03-07 | 2022-06-03 | 上海蓝长科技集团有限公司 | 一种基于多传感器多源数据融合的水质监测方法 |
CN115422264A (zh) * | 2022-11-02 | 2022-12-02 | 苏州浪潮智能科技有限公司 | 一种时序数据处理方法、装置、设备及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070713A (zh) * | 2019-04-15 | 2019-07-30 | 浙江工业大学 | 一种基于双向嵌套lstm神经网络的交通流预测方法 |
CN111222677A (zh) * | 2019-10-22 | 2020-06-02 | 浙江运达风电股份有限公司 | 一种基于长短期记忆时间神经网络的风速预测方法及系统 |
-
2021
- 2021-06-29 CN CN202110761199.XA patent/CN113435124A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110070713A (zh) * | 2019-04-15 | 2019-07-30 | 浙江工业大学 | 一种基于双向嵌套lstm神经网络的交通流预测方法 |
CN111222677A (zh) * | 2019-10-22 | 2020-06-02 | 浙江运达风电股份有限公司 | 一种基于长短期记忆时间神经网络的风速预测方法及系统 |
Non-Patent Citations (4)
Title |
---|
HUIQING ZHANG等: "Research on water quality prediction method based on AE-LSTM", IEEE, pages 602 - 606 * |
周朝勉等: "基于CNN-LSTM的水质预测模型研究", 水电能源科学, vol. 39, no. 3, pages 20 - 23 * |
田子陶等: "融合时序数据和面板数据的LSTM-RBF城区面积预测模型", 测绘与空间地理信息, vol. 43, no. 5, pages 116 - 120 * |
金克美: "基于LSTM-RBF的水质时空关联预测方法研究", 国家工程技术数字图书馆, pages 1 - 78 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114578011A (zh) * | 2022-03-07 | 2022-06-03 | 上海蓝长科技集团有限公司 | 一种基于多传感器多源数据融合的水质监测方法 |
CN114417740A (zh) * | 2022-03-30 | 2022-04-29 | 青岛杰瑞工控技术有限公司 | 一种深海养殖态势感知方法 |
CN115422264A (zh) * | 2022-11-02 | 2022-12-02 | 苏州浪潮智能科技有限公司 | 一种时序数据处理方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832814B (zh) | 一种基于图注意力机制的空气污染物浓度预测方法 | |
CN110647900B (zh) | 基于深度神经网络的安全态势智能预测方法、装置及系统 | |
CN106650767B (zh) | 基于聚类分析和实时校正的洪水预报方法 | |
CN113435124A (zh) | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 | |
CN109886496B (zh) | 一种基于气象信息的农产量预测方法 | |
CN111507046B (zh) | 一种电动闸阀剩余使用寿命预测方法及系统 | |
CN111738520A (zh) | 一种融合孤立森林与长短期记忆网络的系统负载预测方法 | |
Kuang et al. | An enhanced extreme learning machine for dissolved oxygen prediction in wireless sensor networks | |
CN112307410A (zh) | 基于船载ctd测量数据的海水温盐信息时序预测方法 | |
Syeed et al. | Flood prediction using machine learning models | |
Zhang | Decision Trees for Objective House Price Prediction | |
CN114841412A (zh) | 一种海参生长水质中酸碱度的预测方法 | |
Samin-Al-Wasee et al. | Time-series forecasting of ethereum price using long short-term memory (lstm) networks | |
Liu et al. | Short-term water demand forecasting using data-centric machine learning approaches | |
Lubkov et al. | Method for reconstructing the monthly mean water transparencies for the northwestern part of the Black Sea as an example | |
CN115660221B (zh) | 基于混合神经网络的油气藏经济可采储量评估方法及系统 | |
Zhao | The water potability prediction based on active support vector machine and artificial neural network | |
CN115905818A (zh) | 一种基于数据挖掘的滑坡预警方法 | |
CN114757433B (zh) | 一种饮用水源抗生素抗性相对风险快速识别方法 | |
CN115689014A (zh) | 基于双向长短时记忆神经网络和时间注意力机制的水质指标预测方法 | |
CN113792919B (zh) | 一种基于迁移学习深度学习相结合的风电功率预测方法 | |
Rojo-Garibaldi et al. | Nonlinear analysis of the occurrence of hurricanes in the Gulf of Mexico and the Caribbean Sea | |
CN115829150A (zh) | 一种积水预测系统 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN114648095A (zh) | 一种基于深度学习的空气质量浓度反演方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |