CN112819219A - 一种基于自注意力机制的时序网络的洪水流量预测方法 - Google Patents
一种基于自注意力机制的时序网络的洪水流量预测方法 Download PDFInfo
- Publication number
- CN112819219A CN112819219A CN202110110897.3A CN202110110897A CN112819219A CN 112819219 A CN112819219 A CN 112819219A CN 202110110897 A CN202110110897 A CN 202110110897A CN 112819219 A CN112819219 A CN 112819219A
- Authority
- CN
- China
- Prior art keywords
- flood
- time
- network
- prediction
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于自注意力机制的时序网络的洪水流量预测方法,属于洪水流量预测技术领域。该方法包括以下步骤:1,预处理历史洪水数据,包括洪水流量以及相关洪水特征因子;2,使用时间卷积网络和长短期记忆网络并行构建洪水预测模型;3,设置洪水预测模型相关超参数;4,将历史洪水数据用于洪水预测模型进行训练并保存最终模型;5,将训练后的模型应用于洪水预测中,并根据相应指标评估结果。本发明的预测方法具有较好的鲁棒性,对比传统的长短期记忆网络预测方法有着更高的准确率,可以有效完成对中小河流域的洪水流量预测。
Description
技术领域
本发明涉及一种基于自注意力机制的时序网络的洪水流量预测方法,属于洪水流量预测技术领域。
背景技术
洪水是一种自然界里常见的、分布广泛的灾害之一,它常给现代社会造成各种巨大的破坏,其所带来的经济损失难以估量,严重危害了人民群众的生命以及财产安全。由于洪水本身机理构成复杂,具有强度大难预报等特点。因此在过去的几十年里研究洪水流量预测问题一直是一个热点。
常见的洪水预测模型一般来说分为两类,水文模型和数据驱动模型两类。传统的水文模型通过物理过程来解释复杂的水文过程。但这种模型往往对于内部的参数十分的敏感,并且需要相关的研究人员具备水利专业的相关知识背景,这些客观的条件使得此类方法往往存在着一些局限性。而数据驱动模型则是一种端到端的模型,目前已经有许多成熟的深度学习模型应用于洪水预测当中。
发明内容
为了有效捕获洪水序列中的有效因子并且提高对洪水有效因子的权重关注,本发明提出了一种基于自注意力机制的时序网络的洪水流量预测方法。
本发明为解决其技术问题采用如下技术方案:
一种基于自注意力机制与时序网络的洪水流量预测方法,包括以下步骤:
步骤1,预处理历史洪水数据,包括洪水流量以及相关洪水特征因子;
步骤2,使用时间卷积网络和长短期记忆网络并行构建洪水预测模型;
步骤3,设置洪水预测模型相关超参数;
步骤4,将历史洪水数据用于洪水预测模型进行训练并保存最终模型;
步骤5,将训练后的模型应用于洪水预测中,并根据相应指标评估结果。
所述步骤1具体过程如下:
步骤11,将提取的历史洪水相关数据进行数据清洗,去除无法用于正常训练的脏数据;
步骤12,将数据集分为训练集以及测试集;
所述步骤2具体过程如下:
步骤21,通过时间卷积模块增大感受野,使用长短期记忆网络捕获时序依赖;
步骤22,时间卷积网络得到输入序列后进行卷积计算,得到序列的隐藏状态;
步骤23,将时间卷积网络计算后的结果使用自注意力机制,计算出时间卷积网络提取到的一个加权之后的特征向量特征Sa,其计算公式为:其中Q,K,V分别为通过线性层转换时间卷积网络的隐藏层输出得到的三个向量,dk为使计算结果归一化的一个常量,softmax()为将输出值转换为范围在0到1之间并且和为1的激活函数;
步骤24,通过长短期记忆网络的隐藏层得到输出sl;
步骤25,将特征st,sl拼接后通过一维卷积网络计算出预测结果。
所述步骤22具体过程如下:
对于序列X=(x1,x2,…,xt),我们定义一组卷积函数F=(f1,f2,…,ft),在xt时刻上的时间卷积公式为其中:d为时间卷积网络中动态的膨胀因子,fk为当前的卷积函数,为全部的卷积函数,X为长度为t的时间序列,xt为t时刻的样本,xt-(K-k)d为当前进行卷积计算的时间点。
所述步骤23具体过程如下:
(1)由时间卷积网络的输出h通过三个不同的线性层得到q,k,v三个向量;
(2)为每个向量计算一份注意力权重分数score,其计算公式为score=q·k,其中:q为当前的查询向量,k为当前的值向量,·表示q和k两个向量的内积操作;
所述步骤4具体过程如下:
步骤41,将标准化的训练集交给洪水预测模型训练,对洪水流量进行预测;
步骤43,使用反向传播方式最小化损失函数,进行模型迭代。
所述步骤5具体过程如下:
本发明的有益效果如下:
(1)本发明通过并行网络的方式将时间卷积网络与长短期记忆网络结合起来,从而保证了可以更为有效的提取洪水序列的相关特征。通过特征融合的方式将时间卷积网络与长短期记忆网络的输出进行结合,从而做到多范围的特征提取。
(2)本发明在时间卷积网络的基础上结合了自注意力机制,使得原有模型可以进一步关注那些对洪水流量影响较大的特征因子,给予了影响较大的特征因子以更高的权重,从而提高了洪水流量的预测精度。
附图说明
图1为本发明流程图。
图2为待预测的洪水真实流量。
图3为洪水预测流量以及真实流量的对照图。
具体实施方式
下面结合附图对本发明做进一步的详细说明。
如图1所示,本发明一种基于自注意力机制的时序网络的洪水流量预测方法,包括以下步骤:
步骤1,预处理历史洪水数据,包括洪水流量以及相关洪水特征因子;
步骤2,使用时间卷积网络和长短期记忆网络并行构建洪水预测模型。模型选择时间卷积网络和长短期记忆网络来并行提取特征。其中时间卷积网络可对输入序列进行卷积计算,得到序列的隐藏状态。将时间卷积网络计算后的结果使用自注意力机制,计算出时间卷积网络提取到的一个加权之后的特征向量特征Sa,其计算公式为:其中Q,K,V分别为通过线性层转换时间卷积网络的隐藏层输出得到的三个向量,dk为使计算结果归一化的一个常量,softmax()表示将输出值转换为范围在0到1之间并且和为1的激活函数。自注意力机制的具体计算流程如下:
(1)由时间卷积网络的输出h通过三个不同的线性层得到q,k,v三个向量;
(2)为每个向量计算一份注意力权重分数score,其计算公式为score=q·k,其中:q为当前的查询向量,k为当前的值向量,·表示q和k两个向量的内积操作;
通过长短期记忆网络的隐藏层得到输出sl,将特征st,sl拼接后通过一维卷积网络计算出预测结果;
步骤3包括如下步骤:
设置网络模型的相关参数,其中包括输入维度in_dim、时间步长time_steps、输出维度out_dim、批处理大小batch_size、迭代次数epochs、学习率learning_rate、优化器Adam;
步骤4包括如下步骤:
首先将标准化的训练集交给洪水预测模型训练,通过反向传播方式训练模型;
最后使用反向传播方式最小化损失函数,进行模型迭代;
步骤5包括如下步骤:
首先将确定要测试的洪水序列,并标注出预测真值y,如图2所示。
其次将相应特征输出到完成训练的模型中进行计算;
最后输出模型的预测结果并与真值进行比较,如图3所示。
Claims (7)
1.一种基于自注意力机制的时序网络的洪水流量预测方法,其特征在于:包括以下步骤:
步骤1,预处理历史洪水数据,包括洪水流量以及相关洪水特征因子;
步骤2,使用时间卷积网络和长短期记忆网络并行构建洪水预测模型;
步骤3,设置洪水预测模型相关参数;
步骤4,将历史洪水数据用于洪水预测模型进行训练并保存最终模型;
步骤5,将训练后的模型应用于洪水预测中,并根据相应指标评估结果。
3.根据权利要求1所述的一种基于自注意力机制的时序网络的洪水流量预测方法,其特征在于:所述步骤2具体过程如下:
步骤21,通过时间卷积模块增大感受野,使用长短期记忆网络捕获时序依赖;
步骤22,时间卷积网络得到输入序列后进行卷积计算,得到序列的隐藏状态;
步骤23,将时间卷积网络计算后的结果使用自注意力机制,计算出时间卷积网络提取到的一个加权之后的特征向量特征Sa,其计算公式为:其中Q,K,V分别为通过线性层转换时间卷积网络的隐藏层输出得到的三个向量,dk为使计算结果归一化的一个常量,softmax()为将输出值转换为范围在0到1之间并且和为1的激活函数;
步骤24,通过长短期记忆网络的隐藏层得到输出sl;
步骤25,将特征st,sl拼接后通过一维卷积网络计算出预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110110897.3A CN112819219A (zh) | 2021-01-26 | 2021-01-26 | 一种基于自注意力机制的时序网络的洪水流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110110897.3A CN112819219A (zh) | 2021-01-26 | 2021-01-26 | 一种基于自注意力机制的时序网络的洪水流量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112819219A true CN112819219A (zh) | 2021-05-18 |
Family
ID=75859561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110110897.3A Pending CN112819219A (zh) | 2021-01-26 | 2021-01-26 | 一种基于自注意力机制的时序网络的洪水流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819219A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343591A (zh) * | 2021-07-16 | 2021-09-03 | 浙江大学 | 基于自注意力网络的产品关键零件寿命端到端预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583565A (zh) * | 2018-11-07 | 2019-04-05 | 河海大学 | 基于注意力模型长短时记忆网络的洪水预测方法 |
US20190212470A1 (en) * | 2016-09-29 | 2019-07-11 | Mitsubishi Electric Corporation | Flood prediction system, prediction method, and program recording medium |
CN110163419A (zh) * | 2019-04-28 | 2019-08-23 | 河海大学 | 一种中小河流流域洪水预报的方法 |
CN111079998A (zh) * | 2019-12-03 | 2020-04-28 | 华东师范大学 | 基于长短时序相关性注意力机制模型的流量预测方法 |
-
2021
- 2021-01-26 CN CN202110110897.3A patent/CN112819219A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190212470A1 (en) * | 2016-09-29 | 2019-07-11 | Mitsubishi Electric Corporation | Flood prediction system, prediction method, and program recording medium |
CN109583565A (zh) * | 2018-11-07 | 2019-04-05 | 河海大学 | 基于注意力模型长短时记忆网络的洪水预测方法 |
CN110163419A (zh) * | 2019-04-28 | 2019-08-23 | 河海大学 | 一种中小河流流域洪水预报的方法 |
CN111079998A (zh) * | 2019-12-03 | 2020-04-28 | 华东师范大学 | 基于长短时序相关性注意力机制模型的流量预测方法 |
Non-Patent Citations (2)
Title |
---|
XI CHEN: "The importance of short lag-time in the runoff forecasting model based on long short-term memory", 《JOURNAL OF HYDROLOGY》 * |
YUKAI DING: "Interpretable spatio-temporal attention LSTM model for flood forecasting", 《NEUROCOMPUTING》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343591A (zh) * | 2021-07-16 | 2021-09-03 | 浙江大学 | 基于自注意力网络的产品关键零件寿命端到端预测方法 |
CN113343591B (zh) * | 2021-07-16 | 2022-05-03 | 浙江大学 | 基于自注意力网络的产品关键零件寿命端到端预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949945B (zh) | 一种改进双向长短期记忆网络的风电功率超短期预测方法 | |
CN109902801A (zh) | 一种基于变分推理贝叶斯神经网络的洪水集合预报方法 | |
CN108022001A (zh) | 基于pca和分位数回归森林的短期负荷概率密度预测方法 | |
CN111160659B (zh) | 一种考虑温度模糊化的电力负荷预测方法 | |
CN112396234A (zh) | 一种基于时域卷积神经网络的用户侧负荷概率预测方法 | |
CN110363349A (zh) | 一种基于ascs的lstm神经网络水文预测方法及系统 | |
CN106971237A (zh) | 一种基于细菌觅食优化算法的中长期径流预报方法 | |
CN114912077B (zh) | 一种融合随机搜索与混合分解误差订正的海浪预报方法 | |
CN112396152A (zh) | 一种基于cs-lstm的洪水预报方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN115115125A (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN113516271A (zh) | 一种基于时空神经网络的风电集群功率日前预测方法 | |
CN115146700A (zh) | 一种基于Transformer序列到序列模型的径流预测方法 | |
CN116842337A (zh) | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 | |
CN110163419B (zh) | 一种中小河流流域洪水预报的方法 | |
CN115964932A (zh) | 基于EMD-BiLSTM-Attention机制变压器数字孪生模型的气体预测方法 | |
CN113537469A (zh) | 一种基于LSTM网络和Attention机制的城市需水预测方法 | |
CN116822920A (zh) | 一种基于循环神经网络的流程预测方法 | |
CN112819219A (zh) | 一种基于自注意力机制的时序网络的洪水流量预测方法 | |
Sun | Real estate evaluation model based on genetic algorithm optimized neural network | |
CN112836876B (zh) | 一种基于深度学习的配电网线路负荷预测方法 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN116842358A (zh) | 一种基于多尺度卷积和自适应特征融合的软测量建模方法 | |
CN114819382B (zh) | 一种基于lstm的光伏功率预测方法 | |
CN115330085A (zh) | 基于深度神经网络且无未来信息泄露的风速预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210518 |
|
RJ01 | Rejection of invention patent application after publication |