CN114267422A - 地表水质参数预测方法、系统、计算机设备及存储介质 - Google Patents

地表水质参数预测方法、系统、计算机设备及存储介质 Download PDF

Info

Publication number
CN114267422A
CN114267422A CN202111602879.3A CN202111602879A CN114267422A CN 114267422 A CN114267422 A CN 114267422A CN 202111602879 A CN202111602879 A CN 202111602879A CN 114267422 A CN114267422 A CN 114267422A
Authority
CN
China
Prior art keywords
layer
water quality
quality parameter
neural network
short term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111602879.3A
Other languages
English (en)
Other versions
CN114267422B (zh
Inventor
刘昊
胡文柯
庄晓杰
刘倩
刘承照
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PowerChina Zhongnan Engineering Corp Ltd
Original Assignee
PowerChina Zhongnan Engineering Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PowerChina Zhongnan Engineering Corp Ltd filed Critical PowerChina Zhongnan Engineering Corp Ltd
Priority to CN202111602879.3A priority Critical patent/CN114267422B/zh
Publication of CN114267422A publication Critical patent/CN114267422A/zh
Application granted granted Critical
Publication of CN114267422B publication Critical patent/CN114267422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开的一种地表水质参数预测方法与系统,包括获取N个站点在T时期内的水质参数检测结果,计算出各水质参数之间的皮尔逊相关系数,选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本,将样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据
Figure DDA0003432512980000011
构造N个站点间的K近邻图,构建长短期记忆图卷积神经网络,以每M条样本数据和邻接矩阵A作为输入对长短期记忆图卷积神经网络进行训练,利用训练后的网络进行水质参数预测。本发明能高效准确地从多个站点的历史数据及其相互间的空间关系中捕捉水质参数的传播变化规律,并对未来时间段的水质参数进行准确预测。

Description

地表水质参数预测方法、系统、计算机设备及存储介质
技术领域
本发明属于水环境检测技术领域,尤其涉及一种基于改进长短期记忆图卷积神经网络的地表水质参数预测方法、系统、计算机设备及存储介质。
背景技术
随着工业的快速发展,水体中污染物超标事件时有发生,造成了较严重的水环境污染问题。水环境监测与预报是环境科学研究的重要内容,即通过相关检测方法得到现有水质参数值,并进行水质参数变化规律的研究与预测。
近年来,随着人工智能技术的发展,尤其是长短期记忆神经网络(LSTM)等深度学习方法在水质预警领域已逐渐兴起。但,目前基于长短期记忆神经网络的方法主要通过单个检测站的历史水质数据进行预测分析,例如申请公开号为CN111369078A,名称为一种基于长短期记忆神经网络的供水水质预测方法的专利文献,考虑到LSTM强大的对序列数据处理的能力,将Golay滤波与LSTM结合应用,在精度上取得了提升;申请公开号为CN111915097A,名称为基于改进遗传算法优化LSTM神经网络的水质预测方法的专利文献,将LSTM结合遗传算法进行参数优化,也取得较好的效果。但是,上述方法均无法顾及各检测站间水质参数的相互关联影响,多个站点间的空间关联性结合较差,导致预测精度较低,算法的鲁棒性较差。
发明内容
本发明的目的在于提供一种地表水质参数预测方法、系统、计算机设备及存储介质,以解决现有技术在水质参数预测时未考虑站点间空间关联性,导致预测精度低,鲁棒性差的问题。
本发明是通过如下的技术方案来解决上述技术问题的:一种地表水质参数预测方法,包括以下步骤:
获取待预测地表水域内N个站点在T时期内的水质参数检测结果,设检测周期为t0
根据所述水质参数检测结果计算出各水质参数之间的皮尔逊相关系数;
选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本;
将所述样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据Xt N,将所述样本中所有样本数据按照检测时间的先后顺序排序,样本中有T/t0条样本数据;
对于每个站点,取与其距离最近的K个站点作为近邻站点,构造N个站点间的K近邻图G=(N,E,A),其中,E表示站点之间链路的集合,A表示K近邻图G的邻接矩阵;
构建长短期记忆图卷积神经网络,所述长短期记忆图卷积神经网络包括输入层、拼接层、隐含层、输出层以及全连接层;所述输入层包括第一双层图卷积层、第二双层图卷积层和第三双层图卷积层,所述拼接层包括第一拼接层、第二拼接层以及第三拼接层,所述隐含层包括第一隐含层、第二隐含层以及第三隐含层;所述第一双层图卷积层、第一拼接层以及第一隐含层依次连接,所述第二双层图卷积层、第二拼接层以及第二隐含层依次连接,所述第三双层图卷积层、第三拼接层以及第三隐含层依次连接;所述第二隐含层的输出端与所述第三拼接层的输入端连接;所述第一隐含层、第三隐含层与所述输出层连接,所述输出层与所述全连接层连接;
以所述样本中连续的每M条样本数据和所述邻接矩阵A作为输入对所述长短期记忆图卷积神经网络进行训练,得到最终的长短期记忆图卷积神经网络;其中M≥2;
将N个站点在前M个检测时刻的m个水质参数检测结果输入到最终的长短期记忆图卷积神经网络中,得到第M+1个检测时刻m个水质参数的预测值。
本发明中,对长短期记忆神经网络进行改进,将两层图卷积绑定得到双层图卷积层,并在每个双层图卷积层后增加非线性激活函数,使网络能够表达站点间多阶非线性空间拓扑关系,相较于传统LSTM,改进的长短期记忆图卷积神经网络在保持原有的模型拟合效果的同时简化了模型参数,保证了预测精度,且能表达复杂的空间关联关系;本发明能够高效准确地从多个水质检测站点的历史数据及其相互间的空间关系中捕捉水质参数的传播变化规律,并对未来时间段的水质参数情况进行准确预测,大幅提高了水质参数的预测精度。
进一步地,所述皮尔逊相关系数的计算公式为:
Figure BDA0003432512960000021
其中,xi为某个水质参数的第i个检测结果,yi为某个水质参数的第j个检测结果,p(x,y)为xi和yi对应两个不同的水质参数的皮尔逊相关系数,μx为xi对应水质参数的样本均值,μy为yi对应水质参数的样本均值,R为xi和yi对应水质参数的样本总数,
Figure BDA0003432512960000022
进一步地,所述设定阈值为0.5。
进一步地,所述长短期记忆图卷积神经网络的具体计算公式为:
Figure BDA0003432512960000023
Figure BDA0003432512960000024
Figure BDA0003432512960000025
Figure BDA0003432512960000031
ht=ut*ht-1+(1-ut)*ct
Yt+1=σ(WYht+bY)
其中,
Figure BDA0003432512960000032
D为度矩阵,D=∑∑aij,aij为邻接矩阵A中的元素,W0、W1均为双层图卷积层的参数矩阵,
Figure BDA0003432512960000033
ut、rt、ct均为网络在当前时刻t的中间输出量,[X,Y]表示两个向量的拼接,Wu、Wr、Wc、WY均表示网络权重参数矩阵,bu、br、bc、bY均表示网络偏置参数,ht-1为网络在上一时刻t-1的输出量,ht为网络在当前时刻t的输出量,Yt+1为网络对下一时刻t+1的预测量。
进一步地,所述长短期记忆图卷积神经网络的具体训练过程为:
步骤1:将所述样本按照比例划分为训练样本和测试样本;
步骤2:将所述训练样本中每M条样本数据和所述邻接矩阵A输入至所述长短期记忆图卷积神经网络中,得到对应的预测量;
步骤3:根据所述步骤2的预测量与对应的M条样本数据计算均方根误差;
步骤4:判断所述均方根误差是否大于设定误差;如果是,则采用梯度下降法更新所述长短期记忆图卷积神经网络中的参数,训练周期加1,转入步骤2;否则,转入步骤5;
步骤5:判断所述训练周期是否大于设定周期,如果是,则得到最终的长短期记忆图卷积神经网络;否则训练周期加1,重复步骤2~4。
进一步地,所述样本按照4:1的比例划分为训练样本和测试样本。
本发明还提供一种地表水质参数预测系统,包括:
数据获取单元,用于获取待预测地表水域内N个站点在T时期内的水质参数检测结果,设检测周期为t0
相关系数计算单元,用于根据所述水质参数检测结果计算出各水质参数之间的皮尔逊相关系数;
筛选单元,用于选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本;
记录及排序单元,用于将所述样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据
Figure BDA0003432512960000034
将所述样本中所有样本数据按照检测时间的先后顺序排序,样本中有T/t0条样本数据;
图构造单元,用于对于每个站点,取与其距离最近的K个站点作为近邻站点,构造N个站点间的K近邻图G=(N,E,A),其中,E表示站点之间链路的集合,A表示K近邻图G的邻接矩阵;
网络构建单元,用于构建长短期记忆图卷积神经网络,所述长短期记忆图卷积神经网络包括输入层、拼接层、隐含层、输出层以及全连接层;所述输入层包括第一双层图卷积层、第二双层图卷积层和第三双层图卷积层,所述拼接层包括第一拼接层、第二拼接层以及第三拼接层,所述隐含层包括第一隐含层、第二隐含层以及第三隐含层;所述第一双层图卷积层、第一拼接层以及第一隐含层依次连接,所述第二双层图卷积层、第二拼接层以及第二隐含层依次连接,所述第三双层图卷积层、第三拼接层以及第三隐含层依次连接;所述第二隐含层的输出端与所述第三拼接层的输入端连接;所述第一隐含层、第三隐含层与所述输出层连接,所述输出层与所述全连接层连接;
训练单元,用于以所述样本中连续的每M条样本数据和所述邻接矩阵A作为输入对所述长短期记忆图卷积神经网络进行训练,得到最终的长短期记忆图卷积神经网络;其中M≥2;
预测单元,用于将N个站点在前M个检测时刻的m个水质参数检测结果输入到最终的长短期记忆图卷积神经网络中,得到第M+1个检测时刻m个水质参数的预测值。
本发明还提供一种计算机设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上所述地表水质参数预测方法的步骤。
本发明还提供一种存储介质,所述介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述地表水质参数预测方法的步骤。
有益效果
与现有技术相比,本发明的优点在于:
本发明所提供的一种地表水质参数预测方法、系统、计算机设备及存储介质,将两层图卷积绑定得到双层图卷积层,并在每个双层图卷积层后增加非线性激活函数,使网络能够表达站点间多阶非线性空间拓扑关系,相较于传统LSTM,改进的长短期记忆图卷积神经网络在保持原有的模型拟合效果的同时简化了模型参数,保证了预测精度,且能表达复杂的空间关联关系;本发明能够高效准确地从多个水质检测站点的历史数据及其相互间的空间关系中捕捉水质参数的传播变化规律,并对未来时间段的水质参数情况进行准确预测,大幅提高了水质参数的预测精度。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中地表水质参数预测方法流程图;
图2是本发明实施例中长短期记忆图卷积神经网络结构示意图;
图3是本发明实施例中长短期记忆图卷积神经网络的正向传播过程示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
如图1所示,本发明实施例所提供的一种地表水质参数预测方法,包括以下步骤:
1、数据获取:获取待预测地表水域内N个站点在T时期内的水质参数检测结果。
在本发明的一个具体实施方式中,获取待预测地表水域内25个站点在一年(365天)内的水质参数检测结果,设检测周期t0为一天,即25个站点每天进行一次水质参数的检测。具体水质参数包括氨氮、总氮、总磷、化学需氧量、ph值、悬浮物。
2、相关系数的计算:根据水质参数检测结果计算出各水质参数之间的皮尔逊相关系数。
部分水质参数与待预测水质参数之间几乎不存在相关性,将其作为样本易导致网络拟合出错误的关联,影响预测精度,因此通过计算皮尔逊相关系数排除不相关的水质参数。
皮尔逊相关系数的计算公式为:
Figure BDA0003432512960000051
其中,xi为某个水质参数的第i个检测结果,yi为某个水质参数的第j个检测结果,p(x,y)为xi和yi对应两个不同的水质参数的皮尔逊相关系数,μx为xi对应水质参数的样本均值,μy为yi对应水质参数的样本均值,R为xi和yi对应水质参数的样本总数,
Figure BDA0003432512960000052
本实施例中,
Figure BDA0003432512960000053
例如,xi为氨氮的第i个检测结果,yi为总氮的第j个检测结果,则p(x,y)为氨氮与总氮的皮尔逊相关系数,μx为9125个氨氮检测结果的样本均值,μy为9125个总氮检测结果的样本均值,由此可以得到任意两个水质参数之间的皮尔逊相关系数,从而可以根据皮尔逊相关系数确定任意两个水质参数之间的相关性。也可以在预测某一种水质参数时,通过皮尔逊相关系数排除其他与该水质参数不相关或相关性弱的水质参数,例如利用本发明方法预测氨氮浓度值,则只需根据公式(1)计算氨氮与其他水质参数之间的皮尔逊相关系数,再根据皮尔逊相关系数排除与氨氮不相关或相关性弱的水质参数。
3、数据筛选:选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本。
在本发明的一个具体实施方式中,设定阈值为0.5,即步骤2计算出的皮尔逊相关系数大于0.5的水质参数对应的所有水质参数检测结果保留,作为样本。例如,氨氮与总氮的皮尔逊相关系数、氨氮与总磷的皮尔逊相关系数以及氨氮与ph值的皮尔逊相关系数均大于0.5,则将25个站点在一年内的氨氮检测结果、总氮检测结果、总磷检测结果以及ph值检测结果作为样本(即m=4),剔除掉不相关或相关性弱的化学需氧量检测结果以及悬浮物检测结果。
4、样本:将样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据
Figure BDA0003432512960000061
将样本中所有样本数据按照检测时间的先后顺序排序,样本中有T/t0条样本数据。
经过步骤3,样本中包含有相关性强的m个水质参数的检测结果,对这些检测结果进行处理,使每条样本数据统一采用张量形式来表示,即有每条样本数据
Figure BDA0003432512960000062
为:
Figure BDA0003432512960000063
其中,
Figure BDA0003432512960000064
表示第j个站点在检测时刻t的第i个水质参数检测结果,
Figure BDA0003432512960000065
表示N个站点在检测时刻t的m个水质参数检测结果。例如
Figure BDA0003432512960000066
表示第1个站点在检测时刻t的氨氮检测结果,
Figure BDA0003432512960000067
表示第1个站点在检测时刻t的总氮检测结果,
Figure BDA0003432512960000068
表示第1个站点在检测时刻t的总磷检测结果,
Figure BDA0003432512960000069
表示第1个站点在检测时刻t的ph值检测结果。样本中有365条样本数据
Figure BDA00034325129600000610
5、构造K近邻图:对于每个站点,取与其距离最近的K个站点作为近邻站点,构造N个站点间的K近邻图G=(N,E,A),其中,E表示站点之间链路的集合(即边的集合),A表示K近邻图G的邻接矩阵。
各站点的水质参数主要是通过地表水(如河流、胡泊等)进行关联,因此需要计算各站点间在地表水上的可达性,本实施例采用GIS最短路径算法计算各站点间在地表水上的最短路径。
虽然站点间都存在空间相关性,而对于单个站点而言,主要受与其距离最近的K个站点的影响。因此对于每个站点,取与其距离最近的K个站点,用边(edge)将其相连,即边表示站点间存在关联,权值为1,最终构造站点间的K近邻图G=(N,E,A)。
本实施例中,N=25,K=3,邻接矩阵A中每个元素aij定义为:
Figure BDA0003432512960000071
其中,i≠j,1表示第i个站点与第j个站点之间存在关联(即为距离最近的K个站点),0表示第i个站点与第j个站点之间不存在关联。
6、构建长短期记忆图卷积神经网络:长短期记忆图卷积神经网络包括输入层、拼接层、隐含层、输出层以及全连接层;输入层包括第一双层图卷积层、第二双层图卷积层和第三双层图卷积层,拼接层包括第一拼接层、第二拼接层以及第三拼接层,隐含层包括第一隐含层、第二隐含层以及第三隐含层;第一双层图卷积层、第一拼接层以及第一隐含层依次连接,第二双层图卷积层、第二拼接层以及第二隐含层依次连接,第三双层图卷积层、第三拼接层以及第三隐含层依次连接;第二隐含层的输出端与所述第三拼接层的输入端连接;第一隐含层、第三隐含层与输出层连接,输出层与全连接层连接,如图2所示。
各站点间的水质参数变化存在关联和耦合,步骤5将站点的空间拓扑关系抽象为K近邻图,对于K近邻图的数据,结合K近邻图的邻接矩阵A以及傅里叶变换构建长短期记忆图卷积神经网络的图卷积层,因为单层的图卷积能捕捉的空间相关性有限,为了捕捉站点间多阶非线性空间拓扑关系,设置图卷积的层数为双层,并对双层图卷积层的计算结果分别运用sigmoid(σ)和ReLu非线性激活函数。双层图卷积层的输入为步骤5的邻接矩阵A以及步骤4的样本,σ和ReLu函数定义如下:
Figure BDA0003432512960000072
Relu(x)=max(0,x) (5)
单层图卷积层的计算表达式为:
Figure BDA0003432512960000081
双层图卷积层的计算表达式为:
Figure BDA0003432512960000082
其中,
Figure BDA0003432512960000083
D为度矩阵,D=∑∑aij,aij为邻接矩阵A中的元素,W0、W1均为双层图卷积层的参数矩阵。双层图卷积层的计算表达式表示两个单层图卷积层计算表示的嵌套,并在每个双层图卷积层后增加非线性激活函数(即在每个双层图卷积层后增加一隐含层),使网络能够表达更复杂的非线性关系。
在定义了双层图卷积层的基础上,构建长短期记忆图卷积神经网络,具体结构如图2所示。长短期记忆图卷积神经网络的正向传播过程如图3所示,GC表示双层图卷积层,网络单元指长短期记忆图卷积神经网络。长短期记忆图卷积神经网络中各层的具体计算公式为:
第一双层图卷积层、第二双层图卷积层和第三双层图卷积层的计算公式均为:
Figure BDA0003432512960000084
第一隐含层的计算公式为:
Figure BDA0003432512960000085
第二隐含层的计算公式为:
Figure BDA0003432512960000086
第三隐含层的计算公式为:
Figure BDA0003432512960000087
输出层的计算公式为:
ht=ut*ht-1+(1-ut)*ct (12)
全连接层的计算公式为:
Yt+1=σ(WYht+bY) (13)
其中,ut、rt、ct均为网络在当前时刻t的中间输出量,[X,Y]表示两个向量的拼接(即拼接层的计算),Wu、Wr、Wc、WY均表示网络权重参数矩阵,bu、br、bc、bY均表示网络偏置参数,ht-1为网络在上一时刻t-1的输出量,ht为网络在当前时刻t的输出量,Yt+1为网络对下一时刻t+1的预测量。网络在接受第一个检测时刻的输入时,初始化h0为0。
网络的时态特征融合:当前时刻t水质参数的浓度不仅与上一时刻水质参数的浓度相关,还与之前一段时间的水质参数浓度相关。传统的长短期记忆神经网络(LSTM)不能融合站点的空间拓扑关系,且网络参数繁多,训练时难以拟合。为此,本发明在长短期记忆神经网络的基础上进行改进,提出长短期记忆图卷积神经网络:在网络中引入单元状态和隐藏状态概念,将网络的单元状态中的输入门和忘记门合并为一个更新门,将网络参数简化的同时,能表达和学习时间序列中长时间和短期的信息;将网络中的多层感知机的连接方式改进为图卷积的连接方式,使其能顾及检测站点间的拓扑关系,更好地表达地表水质参数变化的复杂机理。
7、网络训练:以样本中每M条样本数据和邻接矩阵A作为输入对长短期记忆图卷积神经网络进行训练,得到最终的长短期记忆图卷积神经网络;其中M≥2。
在网络训练时,输入一段时间序列的样本数据,即连续的M条样本数据,记为
Figure BDA0003432512960000091
M≥2为时间序列长度。如图3所示,向长短期记忆图卷积神经网络依次输入M个检测时刻的水质参数
Figure BDA0003432512960000092
例如M=7,将输入
Figure BDA0003432512960000093
至网络中,得到ht-6和对t-5时刻的水质参数预测值Yt-5(例如氨氮预测值Yt-5),再次将
Figure BDA0003432512960000094
和ht-6输入网络,得到ht-5和Yt-4,依次计算得到网络对t-5、t-4、…、t+1时刻的水质参数预测值Yt-5、Yt-4、…、Yt+1
在本发明的一个具体实施方式中,长短期记忆图卷积神经网络的具体训练过程为:
步骤7.1:将样本按照比例划分为训练样本和测试样本;本实施例中,样本按照4:1的比例划分为训练样本和测试样本,即训练样本有292条样本数据,测试样本有73条样本数据。
步骤7.2:将训练样本中每M条样本数据和邻接矩阵A输入至长短期记忆图卷积神经网络中,得到对应的预测量;
步骤7.3:根据步骤7.2的预测量与对应的M条样本数据计算均方根误差RMSE,具体计算公式为:
Figure BDA0003432512960000095
其中,
Figure BDA0003432512960000096
为水质参数的实际检测结果(由样本可获得),Yt-i+1为对应水质参数的预测值。
步骤7.4:判断均方根误差是否大于设定误差;如果是,则采用梯度下降法更新长短期记忆图卷积神经网络中的参数,训练周期加1,转入步骤7.2;否则,转入步骤7.5;
步骤7.5:判断训练周期是否大于设定周期,如果是,则得到最终的长短期记忆图卷积神经网络;否则训练周期加1,重复步骤7.2~7.4。
本实施例中,设定周期为100,设定误差为0.001,学习率为0.001。
8、预测:将N个站点在前M个检测时刻的m个水质参数检测结果输入到最终的长短期记忆图卷积神经网络中,得到第M+1个检测时刻m个水质参数的预测值Yt+1。例如将
Figure BDA0003432512960000101
输入到最终的长短期记忆图卷积神经网络中,即得到t+1时刻网络的预测值Yt+1,即得到
Figure BDA0003432512960000102
相对现有基于长短期记忆神经网络(LSTM)的水质参数值预测方法,本发明可以结合历史水质参数变化规律及检测站点的空间拓扑关系,同时预测一片水域内所有站点的水质参数,提高了水质参数值的预测精度,为提高流域水质污染预测预警和安全处置能力,实现水质安全防控智能决策和管理奠定基础;
相比传统图卷积网络,本发明将两层图卷积绑定,并在每层双层图卷积层后添加非线性激活函数,使得网络能表达检测站点间的多阶非线性空间拓扑关系;相比传统LSTM,本发明将输入门和忘记门合并为更新门,在保持原有模型拟合效果的同时简化了模型参数,同时保证了预测精度,且能表达复杂的空间关联关系;
本发明提出一种结合双层图卷积和长短期记忆神经网络的水质参数预测方法,能够高效准确地从多个水质检测站点的历史数据及其相互间的空间关系中捕捉水质参数浓度的传播变化规律,并对未来时间段的水质参数进行准确预测,大幅提高了水质参数浓度预测的精度,实现了在水质参数预测时兼顾检测站点间空间关系和历史水质参数演化规律。
本发明实施例还提供一种地表水质参数预测系统,包括数据获取单元、相关系数计算单元、筛选单元、记录及排序单元、图构造单元、网络构建单元、训练单元以及预测单元。
数据获取单元,用于获取待预测地表水域内N个站点在T时期内的水质参数检测结果,设检测周期为t0
相关系数计算单元,用于根据所述水质参数检测结果计算出各水质参数之间的皮尔逊相关系数,如式(1)所示。
筛选单元,用于选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本。
记录及排序单元,用于将所述样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据
Figure BDA0003432512960000103
将所述样本中所有样本数据按照检测时间的先后顺序排序,样本中有T/t0条样本数据。
图构造单元,用于对于每个站点,取与其距离最近的K个站点作为近邻站点,构造N个站点间的K近邻图G=(N,E,A),其中,E表示站点之间链路的集合,A表示K近邻图G的邻接矩阵。
网络构建单元,用于构建长短期记忆图卷积神经网络,所述长短期记忆图卷积神经网络包括输入层、拼接层、隐含层、输出层以及全连接层;所述输入层包括第一双层图卷积层、第二双层图卷积层和第三双层图卷积层,所述拼接层包括第一拼接层、第二拼接层以及第三拼接层,所述隐含层包括第一隐含层、第二隐含层以及第三隐含层;所述第一双层图卷积层、第一拼接层以及第一隐含层依次连接,所述第二双层图卷积层、第二拼接层以及第二隐含层依次连接,所述第三双层图卷积层、第三拼接层以及第三隐含层依次连接;所述第二隐含层的输出端与所述第三拼接层的输入端连接;所述第一隐含层、第三隐含层与所述输出层连接,所述输出层与所述全连接层连接,如图2所示。
训练单元,用于以所述样本中每M条样本数据和所述邻接矩阵A作为输入对所述长短期记忆图卷积神经网络进行训练,得到最终的长短期记忆图卷积神经网络;其中M≥2。
预测单元,用于将N个站点在前M个检测时刻的m个水质参数检测结果输入到最终的长短期记忆图卷积神经网络中,得到第M+1个检测时刻m个水质参数的预测值。
本实施例还提出了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述地表水质参数预测方法的步骤。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述计算机设备中的执行过程。例如,所述计算机程序可以被分割成数据获取单元、相关系数计算单元、筛选单元、记录及排序单元、图构造单元、网络构建单元、训练单元以及预测单元,各单元具体功能如上所述。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,地表水质参数预测系统仅仅是设备的示例,并不构成对设备的限定,可以包括比系统更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述地表水质参数预测系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机程序被处理器执行时实现所述地表水质参数预测方法的步骤。
所述地表水质参数预测系统集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所揭露的仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或变型,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种地表水质参数预测方法,其特征在于,包括以下步骤:
获取待预测地表水域内N个站点在T时期内的水质参数检测结果,设检测周期为t0
根据所述水质参数检测结果计算出各水质参数之间的皮尔逊相关系数;
选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本;
将所述样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据
Figure FDA0003432512950000013
将所述样本中所有样本数据按照检测时间的先后顺序排序,样本中有T/t0条样本数据;
对于每个站点,取与其距离最近的K个站点作为近邻站点,构造N个站点间的K近邻图G=(N,E,A),其中,E表示站点之间链路的集合,A表示K近邻图G的邻接矩阵;
构建长短期记忆图卷积神经网络,所述长短期记忆图卷积神经网络包括输入层、拼接层、隐含层、输出层以及全连接层;所述输入层包括第一双层图卷积层、第二双层图卷积层和第三双层图卷积层,所述拼接层包括第一拼接层、第二拼接层以及第三拼接层,所述隐含层包括第一隐含层、第二隐含层以及第三隐含层;所述第一双层图卷积层、第一拼接层以及第一隐含层依次连接,所述第二双层图卷积层、第二拼接层以及第二隐含层依次连接,所述第三双层图卷积层、第三拼接层以及第三隐含层依次连接;所述第二隐含层的输出端与所述第三拼接层的输入端连接;所述第一隐含层、第三隐含层与所述输出层连接,所述输出层与所述全连接层连接;
以所述样本中连续的每M条样本数据和所述邻接矩阵A作为输入对所述长短期记忆图卷积神经网络进行训练,得到最终的长短期记忆图卷积神经网络;其中M≥2;
将N个站点在前M个检测时刻的m个水质参数检测结果输入到最终的长短期记忆图卷积神经网络中,得到第M+1个检测时刻m个水质参数的预测值。
2.如权利要求1所述的地表水质参数预测方法,其特征在于,所述皮尔逊相关系数的计算公式为:
Figure FDA0003432512950000011
其中,xi为某个水质参数的第i个检测结果,yi为某个水质参数的第j个检测结果,p(x,y)为xi和yi对应两个不同的水质参数的皮尔逊相关系数,μx为xi对应水质参数的样本均值,μy为yi对应水质参数的样本均值,R为xi和yi对应水质参数的样本总数,
Figure FDA0003432512950000012
3.如权利要求1所述的地表水质参数预测方法,其特征在于,所述设定阈值为0.5。
4.如权利要求1所述的地表水质参数预测方法,其特征在于,所述长短期记忆图卷积神经网络的具体计算公式为:
Figure FDA0003432512950000021
Figure FDA0003432512950000022
Figure FDA0003432512950000023
Figure FDA0003432512950000024
ht=ut*ht-1+(1-ut)*ct
Yt+1=σ(WYht+bY)
其中,
Figure FDA0003432512950000025
D为度矩阵,D=ΣΣaij,aij为邻接矩阵A中的元素,W0、W1均为双层图卷积层的参数矩阵,
Figure FDA0003432512950000026
ut、rt、ct均为网络在当前时刻t的中间输出量,[X,Y]表示两个向量的拼接,Wu、Wr、Wc、WY均表示网络权重参数矩阵,bu、br、bc、bY均表示网络偏置参数,ht-1为网络在上一时刻t-1的输出量,ht为网络在当前时刻t的输出量,Yt+1为网络对下一时刻t+1的预测量。
5.如权利要求1~4中任一项所述的地表水质参数预测方法,其特征在于,所述长短期记忆图卷积神经网络的具体训练过程为:
步骤1:将所述样本按照比例划分为训练样本和测试样本;
步骤2:将所述训练样本中每M条样本数据和所述邻接矩阵A输入至所述长短期记忆图卷积神经网络中,得到对应的预测量;
步骤3:根据所述步骤2的预测量与对应的M条样本数据计算均方根误差;
步骤4:判断所述均方根误差是否大于设定误差;如果是,则采用梯度下降法更新所述长短期记忆图卷积神经网络中的参数,训练周期加1,转入步骤2;否则,转入步骤5;
步骤5:判断所述训练周期是否大于设定周期,如果是,则得到最终的长短期记忆图卷积神经网络;否则训练周期加1,重复步骤2~4。
6.如权利要求5所述的地表水质参数预测方法,其特征在于,所述样本按照4:1的比例划分为训练样本和测试样本。
7.一种地表水质参数预测系统,其特征在于,包括:
数据获取单元,用于获取待预测地表水域内N个站点在T时期内的水质参数检测结果,设检测周期为t0
相关系数计算单元,用于根据所述水质参数检测结果计算出各水质参数之间的皮尔逊相关系数;
筛选单元,用于选取皮尔逊相关系数大于设定阈值的m个水质参数对应的所有水质参数检测结果作为样本;
记录及排序单元,用于将所述样本中N个站点在检测时刻t的水质参数检测结果作为一条样本数据
Figure FDA0003432512950000031
将所述样本中所有样本数据按照检测时间的先后顺序排序,样本中有T/t0条样本数据;
图构造单元,用于对于每个站点,取与其距离最近的K个站点作为近邻站点,构造N个站点间的K近邻图G=(N,E,A),其中,E表示站点之间链路的集合,A表示K近邻图G的邻接矩阵;
网络构建单元,用于构建长短期记忆图卷积神经网络,所述长短期记忆图卷积神经网络包括输入层、拼接层、隐含层、输出层以及全连接层;所述输入层包括第一双层图卷积层、第二双层图卷积层和第三双层图卷积层,所述拼接层包括第一拼接层、第二拼接层以及第三拼接层,所述隐含层包括第一隐含层、第二隐含层以及第三隐含层;所述第一双层图卷积层、第一拼接层以及第一隐含层依次连接,所述第二双层图卷积层、第二拼接层以及第二隐含层依次连接,所述第三双层图卷积层、第三拼接层以及第三隐含层依次连接;所述第二隐含层的输出端与所述第三拼接层的输入端连接;所述第一隐含层、第三隐含层与所述输出层连接,所述输出层与所述全连接层连接;
训练单元,用于以所述样本中连续的每M条样本数据和所述邻接矩阵A作为输入对所述长短期记忆图卷积神经网络进行训练,得到最终的长短期记忆图卷积神经网络;其中M≥2;
预测单元,用于将N个站点在前M个检测时刻的m个水质参数检测结果输入到最终的长短期记忆图卷积神经网络中,得到第M+1个检测时刻m个水质参数的预测值。
8.一种计算机设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如权利要求1~6中任一项所述地表水质参数预测方法的步骤。
9.一种存储介质,其特征在于,所述介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~6中任一项所述地表水质参数预测方法的步骤。
CN202111602879.3A 2021-12-24 2021-12-24 地表水质参数预测方法、系统、计算机设备及存储介质 Active CN114267422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111602879.3A CN114267422B (zh) 2021-12-24 2021-12-24 地表水质参数预测方法、系统、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111602879.3A CN114267422B (zh) 2021-12-24 2021-12-24 地表水质参数预测方法、系统、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN114267422A true CN114267422A (zh) 2022-04-01
CN114267422B CN114267422B (zh) 2023-01-31

Family

ID=80830143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111602879.3A Active CN114267422B (zh) 2021-12-24 2021-12-24 地表水质参数预测方法、系统、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114267422B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115728463A (zh) * 2022-12-01 2023-03-03 哈尔滨工业大学 一种基于半嵌入式特征选择的可解释性水质预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222677A (zh) * 2019-10-22 2020-06-02 浙江运达风电股份有限公司 一种基于长短期记忆时间神经网络的风速预测方法及系统
CN112418547A (zh) * 2020-12-03 2021-02-26 北京工业大学 一种基于gcn-lstm组合模型的公交车站点客流量预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222677A (zh) * 2019-10-22 2020-06-02 浙江运达风电股份有限公司 一种基于长短期记忆时间神经网络的风速预测方法及系统
CN112418547A (zh) * 2020-12-03 2021-02-26 北京工业大学 一种基于gcn-lstm组合模型的公交车站点客流量预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丁子昂等: "基于CEEMD-Pearson和深度LSTM混合模型的PM_(2.5)浓度预测方法", 《计算机科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115728463A (zh) * 2022-12-01 2023-03-03 哈尔滨工业大学 一种基于半嵌入式特征选择的可解释性水质预测方法

Also Published As

Publication number Publication date
CN114267422B (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN109919358B (zh) 一种基于神经网络时空注意力机制的实时站点流量预测方法
Heddam et al. Extreme learning machines: a new approach for modeling dissolved oxygen (DO) concentration with and without water quality variables as predictors
Alaloul et al. Data processing using artificial neural networks
Wu et al. Evolving RBF neural networks for rainfall prediction using hybrid particle swarm optimization and genetic algorithm
Zhang et al. Applying multi-layer artificial neural network and mutual information to the prediction of trends in dissolved oxygen
CN106022521B (zh) 基于Hadoop架构的分布式BP神经网络的短期负荷预测方法
WO2020176295A1 (en) Artificial neural network compression via iterative hybrid reinforcement learning approach
CN111832810B (zh) 洪水预报模型、信息处理方法、存储介质、计算机设备
Abba et al. Comparative implementation between neuro-emotional genetic algorithm and novel ensemble computing techniques for modelling dissolved oxygen concentration
KR20200052806A (ko) 딥러닝 기반 기후 변화 예측 시스템의 동작 방법
CN111047078B (zh) 交通特征预测方法、系统及存储介质
CN115357554B (zh) 一种图神经网络压缩方法、装置、电子设备及存储介质
Zhu et al. Nasb: Neural architecture search for binary convolutional neural networks
CN111027672A (zh) 一种基于交互式多尺度循环神经网络的时间序列预测方法
Maddu et al. Prediction of land surface temperature of major coastal cities of India using bidirectional LSTM neural networks
CN112784479A (zh) 一种洪水流量预测的方法
CN114267422B (zh) 地表水质参数预测方法、系统、计算机设备及存储介质
Li et al. Parking demand forecasting based on improved complete ensemble empirical mode decomposition and GRU model
Bhalaji Cloud load estimation with deep logarithmic network for workload and time series optimization
CN115080795A (zh) 一种多充电站协同负荷预测方法及装置
CN111141879A (zh) 一种深度学习的空气质量监测方法以及装置、设备
Hussain et al. Application of different artificial neural network for streamflow forecasting
CN114997036A (zh) 基于深度学习的网络拓扑重构方法、装置和设备
Zhang et al. Multi-input multi-output temporal convolutional network for predicting the long-term water quality of ocean ranches
Ghorbani et al. Inter-comparison of an evolutionary programming model of suspended sediment time-series with other local models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant