CN115310532A - 一种基于时空关联混合深度学习模型的流域多点预测预警方法 - Google Patents
一种基于时空关联混合深度学习模型的流域多点预测预警方法 Download PDFInfo
- Publication number
- CN115310532A CN115310532A CN202210935318.3A CN202210935318A CN115310532A CN 115310532 A CN115310532 A CN 115310532A CN 202210935318 A CN202210935318 A CN 202210935318A CN 115310532 A CN115310532 A CN 115310532A
- Authority
- CN
- China
- Prior art keywords
- water level
- data
- matrix
- basin
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013136 deep learning model Methods 0.000 title claims abstract description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 126
- 238000012549 training Methods 0.000 claims abstract description 24
- 230000008859 change Effects 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 239000011159 matrix material Substances 0.000 claims description 89
- 238000012544 monitoring process Methods 0.000 claims description 69
- 238000010586 diagram Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 2
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 230000007787 long-term memory Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01F—MEASURING VOLUME, VOLUME FLOW, MASS FLOW OR LIQUID LEVEL; METERING BY VOLUME
- G01F23/00—Indicating or measuring liquid level or level of fluent solid material, e.g. indicating in terms of volume or indicating by means of an alarm
- G01F23/80—Arrangements for signal processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于时空关联混合深度学习模型的流域多点预测预警方法,根据包括历史与未来水库降雨量和泄洪量的水库方面的信息与流域多点水位数据,挖掘出包含能预测出流域多点水位未来一天或三天变化情况的数据结构特征,并将流域多点特征水位信息数据作为基于LSTM和GCN的流域多点水位时空关联混合模型的输入特征,训练完成后进行一天或多天的流域水位预测,其中输入数据字段包括每个测点时间归一化后的源头水库降雨量、泄洪量和流域多点水位,模型返回这些测点的流域水位预测值。
Description
技术领域
本发明属于智慧水库、流域多点水位预测预警技术领域,尤其涉及一种基于时空关联混合深度学习模型的流域多点预测预警方法。
背景技术
现有的流域水位控制方法主要是基于传感器采集流域多个下游多个点实时水位,依据现有水位,结合实时降雨量与泄洪量水位变化,凭借人工经验或数学公式推导以控制泄洪量来控制和调整下游流域水位。该方式具有一定的延迟性,且对于数据的利用比较片面,忽略了采集的流域多点各项指标,导致耗费巨大资源与采集到的多下游多流域点的数据搁置,同时还需投入资源维护流域环境。在流域多点水位调整过程中,仅能进行实时规整,不能依据流域多点未来水位的变化趋势进行流域多点水位调整,无法针对性地预测出要超过警戒的水位值及其地理位置,从而实现对汛期及其他自然灾害的预防。
现有的流域水位预测模型,围绕着流域水域中多个监测点的水位预测工作进行,传统方法针对流域水位控制只能通过固定的实践经验与数学公式结合实时降雨量与泄洪量水位值来调整源头水库的水量来规整流域水位,只能做到实时规整,无法充分利用源头水库未来降雨和泄洪的数据来根据流域多监测点未来水位的变化趋势进行流域多点水位调整,因此,该技术方案有三个缺点:
1.数学公式的计算方式较为固定。传统的流域多点水位规整方法根据实时采集的源头水库与流域水位数据直接套公式获得对源头水库泄洪量的反馈,会有延时性的缺陷,无法对流域水位未来一天或几天的水位进行预测。
2.很大程度上对实践经验具有依赖性,流域水位在自然灾害发生时升高具有一定的突发性与不可预测性,缺乏客观有效的未来水位预测。
3.对于采集的源头水库与流域水位数据利用率较低,造成数据资源浪费,传统方法无法利用未来降雨量和未来泄洪量的数据,前者可以通过天气预报获得较为精准的估计,后者则是人为可控制的。
发明内容
针对现有技术存在的不足和空白,本发明提出一种基于时空关联混合深度学习模型的流域多点预测预警方法,目标为解决现有技术存在的问题,实现流域内多个监测点水位时间关联特征与地理位置特征的合并,该方法实现了流域多点未来一天或三天水位预测的准确性。
本发明具体采用以下技术方案:
一种基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:根据包括历史与未来水库降雨量和泄洪量的水库方面的信息与流域多点水位数据,挖掘出包含能预测出流域多点水位未来一天或三天变化情况的数据结构特征,并将流域多点特征水位信息数据作为基于LSTM和GCN的流域多点水位时空关联混合模型的输入特征,训练完成后进行一天或多天的流域水位预测,其中输入数据字段包括每个测点时间归一化后的源头水库降雨量、泄洪量和流域多点水位,模型返回这些测点的流域水位预测值。
进一步地,模型的输入数据为流域源头水库的降雨量、泄洪量数据,流域多监测点水位数据包含K个流域监测点水位值数据;并将数据集中的数据进行排序、删除无用特征、缺失值填补和归一化处理,划分为训练集和测试集,分别重塑为3D数据,再对训练集和测试集进行封装。
进一步地,将数据处理成符合模型输入格式:包括源头水库和流域K个监测点的多个监测点的特征被分别处理为F*D形状的矩阵,其中F为特征维度,D为总天数;随后使用一个大小为N的输入滑动窗口,在时间流逝方向进行滑动,滑动步长为1,N即为过去天数,每滑动一个步长形成新的样本特征,作为模型的输入;使用一个大小为1或3的标签滑动窗口在时间流逝方向进行滑动,每滑动一个步长形成新的样本标签,标签值为一天或三天监测点特征的水位值。
进一步地,在地图中,将K个监测点视为图结构中的节点,遍历每个监测点,将其和其欧氏距离最近的监测点相连接,如果该条边已经存在,则遍历下一个监测点,以此构建出邻接矩阵进而计算度矩阵与拉普拉斯矩阵,获得包含地理位置信息与地理空间依赖关系的拓扑结构图,最终输出尺寸为(K,K)的邻接矩阵。
进一步地,所述基于LSTM和GCN的流域多点水位时空关联混合模型进行特征提取的过程包括:
LSTM特征编码:包括三个LSTM层的处理;将经过三个LSTM网络表示学习后得到的特征向量表示按时间维度进行拼接,同时不产生新的维度,最终输出包含每个监测点历史属性的时间关联特征向量;
GCN特征编码:复制地理信息图,将包含地理位置信息与地理空间依赖关系的尺寸为(K,K)的拓扑结构图作为输入,按批次数量值进行复制操作,最终输出尺寸为(B,K,K)的特征向量矩阵,B为batch size大小;并获取拼接后的尺寸为(B,3,F')的特征向量矩阵作为特征矩阵,F'为LSTM网络的输出维度,同时将尺寸为(B,K,K)的地理信息图作为邻接矩阵输入该层,获得包含时间特征信息与地理位置信息的拓扑结构图,一同作为图卷积层的特征矩阵输入,对拓扑结构图进行特征提取,最终输出尺寸为(B,3,F')的特征向量矩阵;经过图卷积之后,重塑获得的特征向量矩阵形状;将特征提取后输出尺寸为(B,3,F')的特征向量矩阵作为重塑的对象,维度设为拼接后的向量矩阵第一维的数值与后二维度的积进行特征向量重塑,将特征变量维度合并,最终输出尺寸为(B,3*F')的向量矩阵;接下来,构建全连接回归预测层:将重塑后尺寸为(B,3*F')的特征向量矩阵作为全连接回归预测层的特征矩阵输入,输出通过全连接神经网络计算流域多点特征预测值,通过设定输出端神经元数量K*Z,最终输出尺寸为(B,K*Z)的预测向量矩阵。
进一步地,所述基于LSTM和GCN的流域多点水位时空关联混合模型的训练过程具体为:
将提取时间特性、空间特性后的特征输入模型,指定输入对应的输出,即明确每个输出对应的一天或多天预测的水位,使用模型进行训练拟合,拟合过程以均方误差MSE作为基于LSTM和GCN的流域多点水位时空关联混合模型的优化目标。
本发明及其优选方案的有益效果包括:
1.提出地理信息图,利用在地图上的地理位置点构建邻接关系矩阵,进而得到图数据结构,使用GCN建模监测点间的地理空间特征,配合LSTM的挖掘每个监测点历史属性的时间关联特征,从而得到对流域多点水位预测更为准确数据特征信息。
2.根据源头水库历史与未来降雨量和泄洪量、流域多监测点水位数据,挖掘出包含着能预测出流域多点水位未来一天或三天变化情况的数据结构特征,得到未来一天或几天的各流域多点水位预测值。不仅有效地利用未来降雨量和未来泄洪量的数据,还解决了现有方法存在延时性,无法对流域水位未来一天或几天的水位进行预测的缺陷。同时提供一种端到端自动预测模型,降低了对经验的依赖,同时有效的提高了鲁棒性、泛化能力及准确率。
附图说明
下面结合附图和具体实施方式对本发明进一步详细的说明:
图1为本发明实施例方案整体执行过程图;
图2为本发明实施例执行任务1时的数据读取过程示意图;
图3为本发明实施例执行任务2时的数据读取过程示意图;
图4为本发明实施例生成拓扑结构图;
图5为本发明实施例邻接矩阵示意图;
图6为本发明实施例LSTM+GCN模型流程图;
图7为本发明实施例第一个LSTM特征编码层示意图;
图8为本发明实施例第二个LSTM特征编码层示意图;
图9为本发明实施例第三个LSTM特征编码层示意图;
图10为本发明实施例GCN网络特征编码示意图;
图11为本发明实施例任务1损失曲线示意图;
图12为本发明实施例任务2损失曲线示意图;
图13为本发明实施例任务1拟合曲线-上游示意图;
图14为本发明实施例任务1拟合曲线-下游示意图;
图15为本发明实施例任务2预测往后一天拟合曲线-上游示意图;
图16为本发明实施例任务2预测往后一天拟合曲线-下游示意图;
图17为本发明实施例任务2预测往后二天拟合曲线-上游示意图;
图18为本发明实施例任务2预测往后二天拟合曲线-下游示意图;
图19为本发明实施例任务2预测往后三天拟合曲线-上游示意图;
图20为本发明实施例任务2预测往后三天拟合曲线-下游示意图;
图21为本发明实施例方法实现流程图。
具体实施方式
为让本专利的特征和优点能更明显易懂,下文特举实施例,作详细说明如下:
本发明提出的技术方案模型整体执行流程图如图1所示,采用长短期记忆网络(LSTM)与图卷积神经网络(GCN)混合模型,其中LSTM的使用旨在挖掘每个监测点历史属性的时间关联特征;GCN的使用旨在建模监测点间的地理空间依赖,从而实现时空信息关联。该模型具有准确度高、运算快的特点,且能考虑到闸门的历史调整因素,针对性地预测出需要超过警戒的水位及其地理位置,以便及时调整泄洪量,实现对汛期的预防。该模型进行流域多点水位预测,可把握流域多点未来一至三天水库水位的变化趋势,以提前调度水库水位来规整流域多点水位。具体实现步骤如下:
步骤1流域水位数据输入
输入数据为流域源头水库的降雨量、泄洪量数据,流域多监测点水位数据包含K个流域监测点水位值数据。将数据集中数据按采集时间进行排序,排序方式为升序。读取原始数据,删除无用特征如时间、前一天流域上游水位。对于存在缺失值的数据,采用缺失值的前一个值对缺失值进行填补,缺失量不多的情况下进行手工方式填补。对数据集中每个监测点的所有变量进行归一化预处理,将数据映射到0和1之间,然后将数据集划分为训练集和测试集,分别重塑为3D数据,再对训练集和测试集进行封装,以备调用;对数据集中每个特征变量数据依次进行最大最小值归一化预处理排序后该数据集为一组值在0到1之间的时间序列,其采集时间设为Ti其中(i=0,1,2,…,N)。具体数据格式如表1所示:
表1流域水位数据结构
最大最小值归一化预处理:
在公式(1)中,X为待归一化数据,X min和X max分别表示待归一化数据中的最大值和最小值,最终将数据映射到0和1之间后,作为特征数据输入模型进行训练;
输入的数据需要执行两个任务:
任务1:以当天源头水库泄洪量和降雨量、流域多点K个监测点水位作为一个时间点(天)的特征,通过过去N天的特征预测未来一天中K个监测点的水位。
任务2:以当天源头水库未来三天泄洪量和降雨量、流域多点K个监测点作为一个时间点的特征,通过过去N个时间点的特征完成对未来三天流域K个监测点的水位的预测。
其中任务1旨在完全通过历史数据进行预测。而实际应用中,未来的降雨量可以通过天气预报获得较为精准的估计,未来的泄洪量是人为控制的,因此引入任务2,通过未来的天气和自定义泄洪量辅助预测,并将任务拓展到多步预测。
进一步地如图2至图3所示,将数据处理成符合模型输入格式:多个监测点(源头水库、流域K个监测点)的特征被分别处理为F*D形状的矩阵,其中F为特征维度(任务1时为K+2,水库特征降雨量和泄洪量,K个监测点特征水位;任务2时为K+6,未来三天水库特征降雨量和泄洪量,K个监测点特征水位),D为总天数。随后使用一个大小为N(默认为8)的输入滑动窗口,在时间流逝方向进行滑动,滑动步长为1,N即为过去天数,每滑动一个步长形成新的样本特征,作为模型的输入;使用一个大小为1(任务1)或3(任务2)的标签滑动窗口在时间流逝方向进行滑动,每滑动一个步长形成新的样本标签,标签值为一天或三天监测点特征的水位值。对于流域水位数据集(包含611组数据)来说:任务1,依次滑动计算603次;对于任务2,依次滑动计算601次;如图4所示。再以7:3的比例将数据集分割为训练集和测试集,其中数据集前70%部分作为训练集,后30%部分作为测试集。
表2流域水位数据集
步骤2构建地理信息图
在地图中,将K个监测点视为图结构中的节点,遍历每个监测点,将其和其欧氏距离最近的监测点相连接,如果该条边已经存在,则遍历下一个监测点,以此构建出邻接矩阵进而计算度矩阵与拉普拉斯矩阵,获得包含地理位置信息与地理空间依赖关系的拓扑结构图,最终输出尺寸为(K,K)的邻接矩阵。
以图4为例,河流流域设有K个监测点(例中K=6),将监测点视为图结构中的节点,将其和其欧氏距离最近的监测点相连接视为图结构的边,遍历计算各个监测点得到其拓扑结构图。邻接矩阵表示各个节点之间的边关系,是K阶方阵(K为监测点数量),当两监测点m,n(,0<m<K,0<n<K)之间有相互连接的边时,K阶方阵的第m行n列和第n行m列的值为1,若无相互连接的边第m行n列和第n行m列值则为0,两两计算所有监测点最终得到尺寸为(6,6)的邻接矩阵,如图5所示。
拓扑结构图表示为G=G(V,E),其中V和E分别是节点和边的集,节点的意义为源头水库与K个流域监测点,而边为两个点之间欧氏距离最短的连线。设vi∈V是一个节点,eij=(vi,vj)∈E表示vi和vj之间的一条边。然后,一个节点v的邻域可以定义为N(v)={u∈V|(v,u)∈E}。故一个地理信息图可以用生成的邻接矩阵A∈RN×N来描述,其中N是节点数,即N=|V|。在无向图中,Aij表示节点vi和vj之间的边连接,在实际应用中,地理信息图所具有节点特征矩阵(也称为属性)X∈RN×c,其中c是一个节点特征向量的维数,就是经过模型处理后的数据集中源头水库与流域水位的数据信息。
步骤3特征提取
模型输入数据通过LSTM编码器、GCN编码器两个主要模块提取特征,主要步骤通过以下流程实现,图6为模型模块流程图。
步骤3.1 LSTM特征编码
获取处理完成的数据,构建第一个LSTM层,输入尺寸为(B,H,F)的特征向量,包含源头水库特征降雨量、泄洪量数据信息,其中,B为batch size大小;H为时间长度;F为源头水库的特征维度,根据具体任务设为2或6。根据输入数据设置LSTM网络层的输入维度,同时给定LSTM网络的输出维度F'。输入数据经过LSTM网络层后,取最后时刻的特征表示作为网络的输出,最终输出尺寸为(B,1,F')的特征向量。
构建第二个LSTM层,输入尺寸为(B,H,0.5*K)的特征向量的流域上游特征水位数据,其中,B为batch size大小;H为时间长度;K为流域多点全部K个点的特征水位,此处假设流域分为上下游两部分流域,假设各部分监测点数量一致,故0.5*K为流域上半部分监测点的特征维度。根据输入数据设置LSTM网络层的输入维度,同时给定LSTM网络的输出维度F'。输入数据经过LSTM网络层后,并取最后时刻的特征表示作为网络的输出,其输出尺寸为(B,1,F')的特征向量;
构建第三个LSTM层,输入尺寸为(B,H,0.5*K)的特征向量的流域下游特征水位数据,其中,B为batch size大小;H为时间长度;K为流域多点全部K个点的特征水位,此处假设流域分为上下游两部分,各部分监测点数量一致,故0.5*K为流域上半部分监测点的特征维度。根据输入数据设置LSTM网络层的输入维度,同时给定LSTM网络的输出维度F'。输入数据经过LSTM网络层后,并取最后时刻的特征表示作为网络的输出,其输出尺寸为(B,1,F')的特征向量。
将经过三个LSTM网络表示学习后得到的特征向量表示按时间维度(第二维度)进行拼接,同时不产生新的维度,最终输出包含每个监测点历史属性的时间关联特征向量,尺寸为(B,3,F')。
步骤3.2 GCN特征编码
复制地理信息图,将包含地理位置信息与地理空间依赖关系的尺寸为(K,K)的拓扑结构图作为输入,按批次数量值进行复制操作,最终输出尺寸为(B,K,K)的特征向量矩阵。并获取拼接后的尺寸为(B,3,F')的特征向量矩阵作为特征矩阵,同时将尺寸为(B,K,K)的地理信息图作为邻接矩阵输入该层,获得包含时间特征信息与地理位置信息的拓扑结构图,一同作为图卷积层的特征矩阵输入,对拓扑结构图进行特征提取,最终输出尺寸为(B,3,F')的特征向量矩阵,如图10所示。
经过图卷积之后,重塑获得的特征向量矩阵形状。即将特征提取后输出尺寸为(B,3,F')的特征向量矩阵作为重塑的对象,维度设为拼接后的向量矩阵第一维的数值与后二维度的积进行特征向量重塑,将特征变量维度合并,最终输出尺寸为(B,3*F')的向量矩阵。
接下来,构建全连接回归预测层。将重塑后尺寸为(B,3*F')的特征向量矩阵作为全连接回归预测层的特征矩阵输入,根据具体的任务1或2预测天数Z输出为1或3通过全连接神经网络计算流域多点特征预测值,通过设定输出端神经元数量K*Z,最终输出尺寸为(B,K*Z)的预测向量矩阵,当执行任务1时输出最终特征向量尺寸为(B,K),当执行任务2时输出最终特征向量尺寸为(B,K*3)。
全连接层计算公式如下:
在公式(2)中,Dj为第j个输出,f(x)为激活函数,Wji为第j个输出的第i个输入权值参数,εj为第j个输出的偏置参数,n为输入的总数。
重塑特征向量矩阵,获取全连接回归预测层输出的尺寸为(B,K*Z)的特征向量预测矩阵作为重塑特征向量矩阵的输入,维度设为拼接后的向量矩阵第一维的数值、任务所需预测天数与流域多点特征,将特征矩阵向量按原本形式重塑,最终输出尺寸为(B,Z,K)的预测向量矩阵,当执行任务1时输出尺寸为(B,1,K)的特征向量,当执行任务2时输出尺寸为(B,3,K)的特征向量,最终得到基于LSTM和GCN的流域多点水位时空关联混合模型。
output=reshape(x') (3)
其中x'∈RB*(K*Z),output∈RB*Z*K。当执行任务1时,Z=1,执行任务2时,Z=3。
步骤4模型训练
将提取时间特性、空间特性后的特征输入模型,指定输入对应的输出,即明确每个输出对应的一天或多天预测的水位,使用LSTM+GCN模型进行训练拟合,拟合过程如下:
以均方误差(MSE)作为基于LSTM和GCN的流域多点水位时空关联混合模型的优化目标,在迭代过程中MSE值越来越小,表示模型性能逐步提升。模型损失曲线反映了模型对数据集的拟合情况与迭代损失过程,图11至图12是使用基于LSTM和GCN的流域多点水位时空关联混合模型对流域水位数据集进行300次迭代训练和进行测试的MSE结果展示,train_MSE和test_MSE,可见其损失越来越小,即MSE越来越接近于0,说明基于LSTM和GCN的流域多点水位时空关联混合模型预测的未来一天或几天的水位值越贴近真实情况,精度越高。
使用基于LSTM和GCN的流域多点水位时空关联混合模型对流域水位数据集进行未来一天或几天流域多点水位预测,预测结果拟合如图13至图20所示.
使用该模型对流域水位数据集进行未来多天流域多点水位进行预测。图13至图20所显示的评价指标与拟合曲线可知,即使是预测往后三天的流域水位,基于LSTM和GCN的流域多点水位时空关联混合模型预测较为准确,能够达到较为可观的结果。
对于拟合曲线的整体来说,最高点具体数值拟合不好的原因为GCN网络在训练时需要知道整个图的结构信息,包括待预测的节点,比如在预测流域水位未来三天的预测值时需要未来三天源头水库的降雨量和泄洪量数据,虽然未来的降雨量可以通过天气预报获得估计,而未来的泄洪量是人为控制的,但是现实中天气预报较难做到精准预估降雨量的具体数值,尤其面临突发恶劣天气。此外,数据集中一些降雨量过多的天气出现频率较低和一些极端天气在采集数据的日期内未出现过导致供模型训练的样本数较少,无法学习到这样特殊天气的特征。每一个LSTM编码器的cell里面有4个全连接层(MLP),若LSTM的时间跨度大,并且网络又较深,计算量会随之增大,容易造成梯度消失问题。
该方法采用的评价指标包括MAE(平均绝对误差)、MSE(均方误差)、MAPE(平均绝对百分比误差)三种,其定义如下:
在公式(4)至(6)中,其中yi和ti分别表示第i个样本的预测值和真实标签,n表示测试集总样本数。
使用MAE(平均绝对误差)、MSE(均方误差)、MAPE(平均绝对百分比误差),模型在流域水位数据集上评估任务1、2结果如表3所示:
表3模型指标评估结果
评价项目 | 指标 |
MAE_1 | 0.3658 |
MSE_1 | 0.3633 |
MAPE_1 | 0.4065 |
MAE_2 | 0.6249 |
MSE_2 | 0.9537 |
MAPE_2 | 0.7606 |
使用基于LSTM和GCN的流域多点水位时空关联混合模型对流域水位数据集进行未来一天或几天的水位预测,MAE、MSE是回归模型的两个常用评价指标,该值越接近于0说明模型拟合的越好。MSE=0.3633该值越接近于0说明模型拟合的越好。MAE=0.3658,该值说明进行n(n=1,2,3,...)次预测,模型产生的误差稳定在0.3658米左右。MAPE表示在经过n次预测后,预测值相对于真实标签平均偏移了0.4065%,表示模型有较好的预测效果。最后得到流域多监测点水位预测模型,将其储存在云端或本地以备后续部署。
步骤5模型利用
读取步骤4中储存在云端或本地的基于LSTM和GCN的流域多点水位时空关联混合模型进行一天或多天的流域水位预测,其中输入数据字段包括每个测点时间归一化后的源头水库降雨量、泄洪量和流域多点水位,模型将返回这些测点的流域水位预测值。
综上所述,可以得到,本发明的主要设计点包括:
1.构建地理信息图,在地图中将K个监测点视为图结构中的节点,遍历每个监测点,将其和其欧氏距离最近的监测点相连接,如果该条边已经存在,则遍历下一个监测点,以此构建出邻接矩阵进而计算度矩阵与拉普拉斯矩阵,获得包含地理位置信息与地理空间依赖关系的拓扑结构图,最终输出尺寸为(K,K)的邻接矩阵。
G=G(V,E),其中V和E分别是节点和边的集,节点的意义为源头水库与K个流域监测点,而边为两个点之间欧氏距离最短的连线。设vi∈V是一个节点,eij=(vi,vj)∈E表示vi和vj之间的一条边。然后,一个节点v的邻域可以定义为N(v)={u∈V|(v,u)∈E}。故一个地理信息图可以用生成的邻接矩阵A∈RN×N来描述,其中N是节点数,即N=|V|。在无向图中,Aij表示节点vi和vj之间的边连接,在实际应用中,地理信息图所具有节点特征矩阵(也称为属性)X∈RN×c,其中c是一个节点特征向量的维数,就是经过模型处理后的数据集中源头水库与流域水位的数据信息。
2.提出了一种能预测流域多点未来一天或三天水位数据的基于LSTM和GCN的流域多点水位时空关联混合模型,具体实现方式如图21所示。
3.本方法根据历史与未来水库降雨量、泄洪量等水库方面的信息与流域多点水位数据,挖掘出包含着能预测出流域多点水位未来一天或三天变化情况的数据结构特征,并重点将流域多点特征水位信息纳入模型进行训练,同时进行多次评估,有效的提高了泛化能力及准确率。同时,将以上数据作为基于LSTM和GCN的流域多点水位时空关联混合模型的输入特征,训练完成后该模型在使用过程中受外部环境影响较小,具有一定的鲁棒性。该模型为长短期记忆网络(LSTM)与图卷积神经网络(GCN)混合模型,其中LSTM的使用旨在挖掘每个监测点历史属性的时间关联特征;GCN的使用旨在建模监测点间的地理空间依赖。该模型具有准确度高、运算快的特点,且能考虑到闸门的历史调整因素,针对性地预测出需要超过警戒的水位及其地理位置,以便及时调整泄洪量,实现对汛期的预防。而且,本方法使用LSTM与GCN混合深度学习模型架构,即在LSTM输出的包含时间关联信息的向量矩阵集合进一步结合了GCN挖掘的地理位置信息,该架构能有效的提取向量矩阵中的时间信息特征与空间结构特征,从而得到对流域多点水位预测更为准确数据信息,同时提高了模型的流域多点水位预测准确率。
其他有助于理解本发明方案的相关材料:
1、LSTM工作机制如下:
LSTM引入了三个门限:输入门i<t>、遗忘门f<t>、输出门o<t>;引入了表征长期记忆的细胞态c<t>、引入了等待存入长期记忆的候选态C<t>,三个门限都是当前时刻的输入特征x<t>和上个时刻的短期记忆a<t-1>的函数,分别表示为:
输入门:i<t>=σ(Wi[a<t-1>,x<t>]+bi),决定了多少比例的信息会存入当前细胞态;
其中Wi是权重矩阵,bi为偏置参数。
遗忘门:f<t>=σ(Wf[a<t-1>,x<t>]+bf),将细胞态中的信息选择性的遗忘;
其中Wf是权重矩阵,bf为偏置参数。
输出门:o<t>=σ(Wo[a<t-1>,x<t>]+bo),将细胞态中的信息选择性的输出;
其中Wo是权重矩阵,bo为偏置参数。
候选态:C<t>=tanh(WC[a<t-1>,x<t>]+bc),表示归纳出的待存入细胞态的新知识;
其中Wc是权重矩阵,bc为偏置参数。
细胞态:c<t>=i<t>*C<t>+f<t>*c<t-1>,表示长期记忆;
记忆体:a<t>=o<t>*tanhc<t>,表示短期记忆;
2、GCN工作机制:
假设有一个图G(A,X),A为邻接矩阵,X为节点特征,(In为单位矩阵,对角矩阵D可由邻接矩阵得到),L为对称归一化图拉普拉斯矩阵用以描述图原始的拓扑特征。基于此有谱图卷积:gθ*Gx=UgθUTx,(其中gθ=diag(θ),*G为算子,U为拉普拉斯特征向量,UTx为在图上的傅里叶变换),其原理是将特征投影到谱域卷积,卷积后再傅里叶逆变换回原来空间。一个图谱卷积形式的图卷积层可以被定义为:
在公式(7),L为当前的卷积层数,W和b分别为可训练的权重矩阵和偏置向量。
本专利不局限于上述最佳实施方式,任何人在本专利的启示下都可以得出其它各种形式的基于时空关联混合深度学习模型的流域多点预测预警方法,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本专利的涵盖范围。
Claims (6)
1.一种基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:根据包括历史与未来水库降雨量和泄洪量的水库方面的信息与流域多点水位数据,挖掘出包含能预测出流域多点水位未来一天或三天变化情况的数据结构特征,并将流域多点特征水位信息数据作为基于LSTM和GCN的流域多点水位时空关联混合模型的输入特征,训练完成后进行一天或多天的流域水位预测,其中输入数据字段包括每个测点时间归一化后的源头水库降雨量、泄洪量和流域多点水位,模型返回这些测点的流域水位预测值。
2.根据权利要求1所述的基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:模型的输入数据为流域源头水库的降雨量、泄洪量数据,流域多监测点水位数据包含K个流域监测点水位值数据;并将数据集中的数据进行排序、删除无用特征、缺失值填补和归一化处理,划分为训练集和测试集,分别重塑为3D数据,再对训练集和测试集进行封装。
3.根据权利要求2所述的基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:将数据处理成符合模型输入格式:包括源头水库和流域K个监测点的多个监测点的特征被分别处理为F*D形状的矩阵,其中F为特征维度,D为总天数;随后使用一个大小为N的输入滑动窗口,在时间流逝方向进行滑动,滑动步长为1,N即为过去天数,每滑动一个步长形成新的样本特征,作为模型的输入;使用一个大小为1或3的标签滑动窗口在时间流逝方向进行滑动,每滑动一个步长形成新的样本标签,标签值为一天或三天监测点特征的水位值。
4.根据权利要求3所述的基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:在地图中,将K个监测点视为图结构中的节点,遍历每个监测点,将其和其欧氏距离最近的监测点相连接,如果该条边已经存在,则遍历下一个监测点,以此构建出邻接矩阵进而计算度矩阵与拉普拉斯矩阵,获得包含地理位置信息与地理空间依赖关系的拓扑结构图,最终输出尺寸为(K, K)的邻接矩阵。
5.根据权利要求4所述的基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:所述基于LSTM和GCN的流域多点水位时空关联混合模型进行特征提取的过程包括:
LSTM特征编码:包括三个LSTM层的处理;将经过三个LSTM网络表示学习后得到的特征向量表示按时间维度进行拼接,同时不产生新的维度,最终输出包含每个监测点历史属性的时间关联特征向量;
GCN特征编码:复制地理信息图,将包含地理位置信息与地理空间依赖关系的尺寸为(K,K)的拓扑结构图作为输入,按批次数量值进行复制操作,最终输出尺寸为(B,K,K)的特征向量矩阵,B为batch size大小;并获取拼接后的尺寸为(B,3,F')的特征向量矩阵作为特征矩阵,F'为LSTM网络的输出维度,同时将尺寸为(B,K,K)的地理信息图作为邻接矩阵输入该层,获得包含时间特征信息与地理位置信息的拓扑结构图,一同作为图卷积层的特征矩阵输入,对拓扑结构图进行特征提取,最终输出尺寸为(B,3,F')的特征向量矩阵;经过图卷积之后,重塑获得的特征向量矩阵形状;将特征提取后输出尺寸为(B,3,F')的特征向量矩阵作为重塑的对象,维度设为拼接后的向量矩阵第一维的数值与后二维度的积进行特征向量重塑,将特征变量维度合并,最终输出尺寸为(B,3*F')的向量矩阵;
接下来,构建全连接回归预测层:将重塑后尺寸为(B,3*F')的特征向量矩阵作为全连接回归预测层的特征矩阵输入,输出通过全连接神经网络计算流域多点特征预测值,通过设定输出端神经元数量K*Z,最终输出尺寸为(B,K*Z)的预测向量矩阵。
6.根据权利要求4所述的基于时空关联混合深度学习模型的流域多点预测预警方法,其特征在于:所述基于LSTM和GCN的流域多点水位时空关联混合模型的训练过程具体为:
将提取时间特性、空间特性后的特征输入模型,指定输入对应的输出,即明确每个输出对应的一天或多天预测的水位,使用模型进行训练拟合,拟合过程以均方误差MSE作为基于LSTM和GCN的流域多点水位时空关联混合模型的优化目标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210935318.3A CN115310532A (zh) | 2022-08-04 | 2022-08-04 | 一种基于时空关联混合深度学习模型的流域多点预测预警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210935318.3A CN115310532A (zh) | 2022-08-04 | 2022-08-04 | 一种基于时空关联混合深度学习模型的流域多点预测预警方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115310532A true CN115310532A (zh) | 2022-11-08 |
Family
ID=83859246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210935318.3A Pending CN115310532A (zh) | 2022-08-04 | 2022-08-04 | 一种基于时空关联混合深度学习模型的流域多点预测预警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115310532A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115828757A (zh) * | 2022-12-12 | 2023-03-21 | 福建中锐汉鼎数字科技有限公司 | 一种流域水位预测的泄洪量滞后特征构造及选择方法 |
CN115860272A (zh) * | 2023-02-22 | 2023-03-28 | 山东捷讯通信技术有限公司 | 基于深度学习的水库多时间点智能水位预测方法及系统 |
CN115879646A (zh) * | 2023-02-15 | 2023-03-31 | 山东捷讯通信技术有限公司 | 一种水库水位预测方法、装置、介质及设备 |
-
2022
- 2022-08-04 CN CN202210935318.3A patent/CN115310532A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115828757A (zh) * | 2022-12-12 | 2023-03-21 | 福建中锐汉鼎数字科技有限公司 | 一种流域水位预测的泄洪量滞后特征构造及选择方法 |
CN115828757B (zh) * | 2022-12-12 | 2024-02-23 | 福建中锐汉鼎数字科技有限公司 | 一种流域水位预测的泄洪量滞后特征构造及选择方法 |
CN115879646A (zh) * | 2023-02-15 | 2023-03-31 | 山东捷讯通信技术有限公司 | 一种水库水位预测方法、装置、介质及设备 |
CN115879646B (zh) * | 2023-02-15 | 2023-11-07 | 山东捷讯通信技术有限公司 | 一种水库水位预测方法、装置、介质及设备 |
CN115860272A (zh) * | 2023-02-22 | 2023-03-28 | 山东捷讯通信技术有限公司 | 基于深度学习的水库多时间点智能水位预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
CN115310532A (zh) | 一种基于时空关联混合深度学习模型的流域多点预测预警方法 | |
CN106650767B (zh) | 基于聚类分析和实时校正的洪水预报方法 | |
CN115688579B (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
Kaya et al. | Groundwater level prediction using artificial neural network and M5 tree models | |
Chen et al. | Groundwater level prediction using SOM-RBFN multisite model | |
CN113705877A (zh) | 基于深度学习模型的实时月径流预报方法 | |
CN113255986A (zh) | 一种基于气象信息和深度学习算法的多步日径流预报方法 | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN112329990A (zh) | 一种基于lstm-bp神经网络的用户用电负荷预测方法 | |
CN115310536A (zh) | 基于神经网络和gcn深度学习模型的水库水位预测预警方法 | |
CN117035201B (zh) | 平原河网水工程集群多目标调度规则制定方法及系统 | |
Massaoudi et al. | Performance evaluation of deep recurrent neural networks architectures: Application to PV power forecasting | |
CN105678417A (zh) | 一种施工隧道撑子面涌水量预测方法及装置 | |
CN112307410A (zh) | 基于船载ctd测量数据的海水温盐信息时序预测方法 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN116989749A (zh) | 基于人工智能水文模型的流域洪水预测方法 | |
CN114372631A (zh) | 一种基于小样本学习和lstm的缺资料地区径流预测方法 | |
CN112668711B (zh) | 基于深度学习的洪水流量预测方法、装置和电子设备 | |
CN112784479A (zh) | 一种洪水流量预测的方法 | |
Nizar et al. | Forecasting of temperature by using LSTM and bidirectional LSTM approach: case study in Semarang, Indonesia | |
Velasco et al. | Performance analysis of multilayer perceptron neural network models in week-ahead rainfall forecasting | |
Oluwatobi et al. | Modeling and simulation of river discharge using artificial neural networks | |
CN115330050A (zh) | 一种基于混合模型的建筑物负荷预测方法 | |
Yu et al. | A Deep Learning-Based Multi-model Ensemble Method for Hydrological Forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |