CN115146700B - 一种基于Transformer序列到序列模型的径流预测方法 - Google Patents
一种基于Transformer序列到序列模型的径流预测方法 Download PDFInfo
- Publication number
- CN115146700B CN115146700B CN202210558117.6A CN202210558117A CN115146700B CN 115146700 B CN115146700 B CN 115146700B CN 202210558117 A CN202210558117 A CN 202210558117A CN 115146700 B CN115146700 B CN 115146700B
- Authority
- CN
- China
- Prior art keywords
- sequence
- data
- output
- layer
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims abstract description 5
- 230000009466 transformation Effects 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C13/00—Surveying specially adapted to open water, e.g. sea, lake, river or canal
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/14—Rainfall or precipitation gauges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Hydrology & Water Resources (AREA)
- Environmental & Geological Engineering (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Ecology (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Biodiversity & Conservation Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Environmental Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Atmospheric Sciences (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种基于Transformer序列到序列模型的径流预测方法,首先准备好数据集,读入数据并进行预处理,得到可用的序列数据;其次将经过预处理的数据集划分成训练集、验证集、测试集三个互斥的子集;然后构建Transformer序列到序列模型;接着定义损失函数和优化器,并训练模型;最后对训练完成的模型进行测试。数据集上的实验结果表明,相对于已有的基于数据驱动的序列到序列模型比较,本发明获得的径流预测结果具有较高的预测精度。
Description
技术领域
本发明属于机器学习技术领域,具体涉及一种径流预测方法。
背景技术
降雨-径流建模是水文科学中非常重要的一项任务,它利用降雨量等气象数据和静态属性来预测径流值,由于流域水文特征、流域边界条件、人类活动、降雨的时空分布等复杂因素的影响,导致了异常复杂的水文过程。径流预测模型有许多方法,主要可以分为包括物理模型和数据驱动模型,物理模型基于实际的物理过程但受限于简化的假设,难以模拟非线性的水文过程。近年来,基于数据驱动的径流预测方法受到了广泛的关注,特别地,基于长短时记忆网络(LSTM)等改进版循环神经网络(RNN)展现了多步超前预测的良好性能,能够胜任很多序列到序列建模任务。然而,无论何种改进版的循环神经网络都无法从根本上解决梯度消失的问题,从而无法真正捕获与生成长时间序列;此外,由于循环神经网络自身结构具有关于顺序性和时间局部性的偏置假设,因此难以胜任超大规模数据集上的任务。
发明内容
为了克服现有技术的不足,本发明提供了一种基于Transformer序列到序列模型的径流预测方法,首先准备好数据集,读入数据并进行预处理,得到可用的序列数据;其次将经过预处理的数据集划分成训练集、验证集、测试集三个互斥的子集;然后构建Transformer序列到序列模型;接着定义损失函数和优化器,并训练模型;最后对训练完成的模型进行测试。数据集上的实验结果表明,相对于已有的基于数据驱动的序列到序列模型比较,本发明获得的径流预测结果具有较高的预测精度。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:准备数据集并进行预处理;
收集研究流域内的气象数据以及水文站点的径流数据,构成原始数据集;然后对原始数据集进行预处理,预处理过程包括空值处理、数据选择、标准化和数据序列化;
步骤2:将预处理过的数据集划分出训练集、验证集、测试集三个互斥的集合;
步骤3:构建Transformer序列到序列模型;
Transformer序列到序列模型的架构包括:输入变换层、位置编码层、编码器、解码器、输出变换层和输出选择操作,具体步骤如下:
步骤3-1:输入变换层对输入数据的维度进行变换,统一数据维度;
步骤3-2:位置编码层向输入数据注入位置信息;
步骤3-3:编码器由多个编码器层前后串接而成,每个编码器层包含两个子层:多头自注意力和全连接层,每个子层之后都需要接入残差连接和层归一化;
编码器的输入序列为:
(x1,x2,…,xpast_len+pred_len)
其中past_len表示已知的序列长度,pred_len表示预测的序列长度;
步骤3-4:解码器由多个解码器层前后串接而成,每个解码器层包含三个子层:多头自注意力、多头交叉注意力和全连接层,每个子层之后都接入残差连接和层归一化;
解码器的输入序列为:
(y1,y2,…,ypast_len,01,02,…,0pred_len)
其中past_len表示已知的序列长度,pred_len表示预测的序列长度,01,02,…表示使用0进行填充,一共有pred_len个位置需要填充0;
步骤3-5:多头自注意力和多头交叉注意力;
计算:
Q=WQI1
K=WKI2
V=WVI3
其中,WQ、WK、WV是可学习参数矩阵,softmax表示进行Softmax操作,当输入I2和I3相同并且与输入I1不同时,Attn(Q,K,V)称为交叉注意力;当三个输入I1,I2,I3都相同时,Attn(Q,K,V)称为自注意力;Q表示I1经过参数为WQ的线性变换得到的结果,K表示I2经过参数为WK的线性变换后得到的结果,V表示I3经过参数为WV的线性变换后得到的结果;
多头注意力计算公式如下:
MultiHeadAttn(Q,K,V)=Concat(head1,…,headh)WO
其中,Wi Q,WO是可学习参数矩阵,h表示头数,i的取值范围从1到h;head1,…,headh表示头;
当输入I2和I3相同并且与I1不同时,MultiHeadAttn(Q,K,V)称为多头交叉注意力;当三个输入I1,I2,I3都相同时,MultiHeadAttn(Q,K,V)称为多头自注意力;
步骤3-6:残差连接计算公式如下:
o=x+Sublayer(x)
其中,x表示子层的输入,Sublayer(x)表示子层的输出,o表示最终输出;
步骤3-7:层归一化,对最后的输出维度进行标准化;
步骤3-8:输出变换层对解码器的输出维度进行变换,使输出符合最终的输出维度;
将解码器的输出序列(o1,o2,…,opast_len+pred_len)放入全连接层,得到输出变换层的输出序列
步骤3-9:输出选择操作是对输出变换层的输出序列进行选择的过程,将该序列进行切割,/>被舍弃掉,只保留的部分作为最终的输出;
步骤4:将训练集的气象数据输入输入变换层得到变换后的数据,再通过位置编码层后,送入编码器处理得到编码器输出;
将训练集的径流数据经过输入变换层得到变换后的数据,再通过位置编码层后,与编码器输出一起送入解码器处理得到解码器输出;然后,输出变换层对解码器输出进行维度变换,使其符合最终输出的维度;最后,通过输出选择操作对输出变换层的输出序列进行选择;
步骤5:定义损失函数和优化器,并训练模型;
训练时的损失函数采取平滑NSE损失函数,其计算公式如下:
其中,N是小批量样本数量,Dn是第n个样本的预测天数,是第d天的预测值,yd是第d天的径流真实值,Sb是该样本对应站点所有数据径流真实值的标准差,∈表示常数;
模型进行多次迭代训练,在每次迭代完成后,使用测试集数据评估模型的性能,并且使用纳什效率系数NSE作为指标,NSE计算公式如下:
其中,是第n个样本径流真实值的均值;
步骤6:测试模型;
使用测试集对训练完成后的模型进行测试,得到预测结果,并根据真实数据对预测结果进行评估。
优选地,所述对原始数据集预处理的标准化公式为:其中x表示原始数据,/>表示样本均值,S表示样本标准差,z表示标准化之后的数据。
优选地,所述对原始数据集预处理的数据序列化是使用滑动窗口的方式,滑动窗口进行序列化的公式如下:
其中,zi表示序列化之后的第i个序列,xi表示原始数据集的第i个特征,n表示原始数据集大小,l表示滑动窗口的大小。
本发明的有益效果如下:
本发明利用深度学习算法进行多步超前径流预测,减少了对水文物理机制的依赖性,有效扩大了模型的适用范围。针对现有模型预测精度不足的问题,提出了一种基于Transformer序列到序列模型的径流预测方法。首先,充分利用了Transformer的弱归纳偏置性,证明其能够胜任超大规模气象-水文数据集上的任务,Transformer所具有的注意力机制能够选择重要位置上的特征,抑制无关位置上的特征;其次,Transformer的整体架构设计以及残差连接和层归一化的使用,能够从根本上解决梯度消失的问题,从而具有真正捕获与生成长时间序列的潜力。因此,模型能够在超大规模气象-水文数据集上进行更优的多步超前径流预测。
附图说明
图1是本发明方法的流程图。
图2是本发明方法多头注意力的计算示意图。
图3是本发明方法Transformer模型的结构示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
一种基于Transformer序列到序列模型的径流预测方法,包括如下步骤:
步骤1:准备数据集并进行预处理;
收集研究流域内的气象数据以及水文站点的径流数据,构成原始数据集;然后对原始数据集进行预处理,预处理过程包括空值处理、数据选择、标准化和数据序列化;
步骤2:将预处理过的数据集按照年份划分出训练集、验证集、测试集三个互斥的集合;
步骤3:构建Transformer序列到序列模型;
Transformer序列到序列模型的架构包括:输入变换层、位置编码层、编码器、解码器、输出变换层和输出选择操作,具体步骤如下:
步骤3-1:输入变换层对输入数据的维度进行变换,统一数据维度,便于后续处理;
步骤3-2:位置编码层向输入数据注入位置信息;
步骤3-3:编码器由多个编码器层前后串接而成,每个编码器层包含两个子层:多头自注意力和全连接层,每个子层之后都需要接入残差连接和层归一化;
编码器的输入序列为:
(x1,x2,…,xpast_len+pred_len)
其中past_len表示已知的序列长度,pred_len表示预测的序列长度;
步骤3-4:解码器由多个解码器层前后串接而成,每个解码器层包含三个子层:多头自注意力、多头交叉注意力和全连接层,每个子层之后都接入残差连接和层归一化;
解码器的输入序列为:
(y1,y2,…,ypast_len,01,02,…,0pred_len)
其中past_len表示已知的序列长度,pred_len表示预测的序列长度,01,02,…表示使用0进行填充,一共有pred_len个位置需要填充0;
步骤3-5:多头自注意力和多头交叉注意力,其特征在于它们都是多头注意力的特殊情况,多头注意力又是注意力的特殊情况。注意力机制是一种加权和机制将不同的权重赋给不同的位置,它将赋予更重要的位置更大的权重;
计算:
Q=WQI1
K=WKI2
V=WVI3
其中,WQ、WK、WV是可学习参数矩阵,softmax表示进行Softmax操作,当输入I2和I3相同并且与输入I1不同时,Attn(Q,K,V)称为交叉注意力;当三个输入I1,I2,I3都相同时,Attn(Q,K,V)称为自注意力;
多头注意力的计算,当多次并行地对输入应用注意力,并将结果进行拼接与变换时,就得到多头注意力计算公式如下:
MultiHeadAttn(Q,K,V)=Concat(head1,…,headh)WO
其中,Wi Q,WO是可学习参数矩阵,h表示头数,i的取值范围从1到h;head1,…,headh表示头;
当输入I2和I3相同并且与I1不同时,MultiHeadAttn(Q,K,V)称为多头交叉注意力;当三个输入I1,I2,I3都相同时,MultiHeadAttn(Q,K,V)称为多头自注意力;
步骤3-6:残差连接,其特征在于用于防止梯度消失与网络退化,计算公式如下:
o=x+Sublayer(x)
其中,x表示子层的输入,Sublayer(x)表示子层的输出,o表示最终输出;
步骤3-7:层归一化,对最后的输出维度进行标准化,有利于训练的收敛;
步骤3-8:输出变换层对解码器的输出维度进行变换,使输出符合最终的输出维度;
将解码器的输出序列(o1,o2,…,opast_len+pred_len)放入全连接层,得到输出变换层的输出序列
步骤3-9:输出选择操作是对输出变换层的输出序列进行选择的过程,将该序列进行切割,/>被舍弃掉,只保留的部分作为最终的输出;
步骤4:将训练集的气象数据输入输入变换层得到变换后的数据,再通过位置编码层后,送入编码器处理得到编码器输出;
将训练集的径流数据经过输入变换层得到变换后的数据,再通过位置编码层后,与编码器输出一起送入解码器处理得到解码器输出;然后,输出变换层对解码器输出进行维度变换,使其符合最终输出的维度;最后,通过输出选择操作对输出变换层的输出序列进行选择;
步骤5:定义损失函数和优化器,并训练模型;
训练时的损失函数采取平滑NSE损失函数,其计算公式如下:
其中,N是小批量样本数量,Dn是第n个样本的预测天数,是第d天的预测值,yd是第d天的径流真实值,Sb是该样本对应站点所有数据径流真实值的标准差,∈表示一个极小的数,其目的是为了避免除以0。;
模型进行多次迭代训练,在每次迭代完成后,使用测试集数据评估模型的性能,并且使用纳什效率系数NSE作为指标,NSE计算公式如下:
其中,是第n个样本径流真实值的均值;
步骤6:测试模型;
使用测试集对训练完成后的模型进行测试,得到预测结果,并根据真实数据对预测结果进行评估。
优选地,所述对原始数据集预处理的标准化公式为:其中x表示原始数据,/>表示样本均值,S表示样本标准差,z表示标准化之后的数据。
优选地,所述对原始数据集预处理的数据序列化是使用滑动窗口的方式,滑动窗口进行序列化的公式如下:
其中,zi表示序列化之后的第i个序列,xi表示原始数据集的第i个特征,n表示原始数据集大小,l表示滑动窗口的大小。
Claims (3)
1.一种基于Transformer序列到序列模型的径流预测方法,其特征在于,包括如下步骤:
步骤1:准备数据集并进行预处理;
收集研究流域内的气象数据以及水文站点的径流数据,构成原始数据集;然后对原始数据集进行预处理,预处理过程包括空值处理、数据选择、标准化和数据序列化;
步骤2:将预处理过的数据集划分出训练集、验证集、测试集三个互斥的集合;
步骤3:构建Transformer序列到序列模型;
Transformer序列到序列模型的架构包括:输入变换层、位置编码层、编码器、解码器、输出变换层和输出选择操作,具体步骤如下:
步骤3-1:输入变换层对输入数据的维度进行变换,统一数据维度;
步骤3-2:位置编码层向输入数据注入位置信息;
步骤3-3:编码器由多个编码器层前后串接而成,每个编码器层包含两个子层:多头自注意力和全连接层,每个子层之后都需要接入残差连接和层归一化;
编码器的输入序列为:
(x1,x2,…,xpast_len+pred_len)
其中past_len表示已知的序列长度,pred_len表示预测的序列长度;
步骤3-4:解码器由多个解码器层前后串接而成,每个解码器层包含三个子层:多头自注意力、多头交叉注意力和全连接层,每个子层之后都接入残差连接和层归一化;
解码器的输入序列为:
(y1,y2,…,ypast_len,01,02,…,0pred_len)
其中past_len表示已知的序列长度,pred_len表示预测的序列长度,01,02,…表示使用0进行填充,一共有pred_len个位置需要填充0;
步骤3-5:多头自注意力和多头交叉注意力;
计算:
Q=WQI1
K=WKI2
V=WVI3
其中,WQ、WK、WV是可学习参数矩阵,softmax表示进行Softmax操作,当输入I2和I3相同并且与输入I1不同时,Attn(Q,K,V)称为交叉注意力;当三个输入I1,I2,I3都相同时,Attn(Q,K,V)称为自注意力;Q表示I1经过参数为WQ的线性变换得到的结果,K表示I2经过参数为WK的线性变换后得到的结果,V表示I3经过参数为WV的线性变换后得到的结果;
多头注意力计算公式如下:
headi=Attn(QWi Q,KWi K,VWi V)
MultiHeadAttn(Q,K,V)=Concat(head1,…,headh)WO
其中,Wi Q,Wi K,Wi V,WO是可学习参数矩阵,h表示头数,i的取值范围从1到h;head1,…,headh表示头;
当输入I2和I3相同并且与I1不同时,MultiHeadAttn(Q,K,V)称为多头交叉注意力;当三个输入I1,I2,I3都相同时,MultiHeadAttn(Q,K,V)称为多头自注意力;
步骤3-6:残差连接计算公式如下:
o=x+Sublayer(x)
其中,x表示子层的输入,Sublayer(x)表示子层的输出,o表示最终输出;
步骤3-7:层归一化,对最后的输出维度进行标准化;
步骤3-8:输出变换层对解码器的输出维度进行变换,使输出符合最终的输出维度;
将解码器的输出序列(o1,o2,…,opast_len+pred_len)放入全连接层,得到输出变换层的输出序列
步骤3-9:输出选择操作是对输出变换层的输出序列进行选择的过程,将该序列进行切割,/>被舍弃掉,只保留的部分作为最终的输出;
步骤4:将训练集的气象数据输入输入变换层得到变换后的数据,再通过位置编码层后,送入编码器处理得到编码器输出;
将训练集的径流数据经过输入变换层得到变换后的数据,再通过位置编码层后,与编码器输出一起送入解码器处理得到解码器输出;然后,输出变换层对解码器输出进行维度变换,使其符合最终输出的维度;最后,通过输出选择操作对输出变换层的输出序列进行选择;
步骤5:定义损失函数和优化器,并训练模型;
训练时的损失函数采取平滑NSE损失函数,其计算公式如下:
其中,N是小批量样本数量,Dn是第n个样本的预测天数,是第d天的预测值,yd是第d天的径流真实值,Sb是该样本对应站点所有数据径流真实值的标准差,∈表示常数;
模型进行多次迭代训练,在每次迭代完成后,使用测试集数据评估模型的性能,并且使用纳什效率系数NSE作为指标,NSE计算公式如下:
其中,是第n个样本径流真实值的均值;
步骤6:测试模型;
使用测试集对训练完成后的模型进行测试,得到预测结果,并根据真实数据对预测结果进行评估。
2.根据权利要求1所述的一种基于Transformer序列到序列模型的径流预测方法,其特征在于,所述对原始数据集预处理的标准化公式为:其中x表示原始数据,/>表示样本均值,S表示样本标准差,z表示标准化之后的数据。
3.根据权利要求1所述的一种基于Transformer序列到序列模型的径流预测方法,其特征在于,所述对原始数据集预处理的数据序列化是使用滑动窗口的方式,滑动窗口进行序列化的公式如下:
z1=(x1,x2,…,xl)
z2=(x2,x3,…,xl+1)
zn-l+1=(xn-l+1,xn-l+2,…,xn)
其中,zi表示序列化之后的第i个序列,xi表示原始数据集的第i个特征,n表示原始数据集大小,l表示滑动窗口的大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210558117.6A CN115146700B (zh) | 2022-05-21 | 2022-05-21 | 一种基于Transformer序列到序列模型的径流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210558117.6A CN115146700B (zh) | 2022-05-21 | 2022-05-21 | 一种基于Transformer序列到序列模型的径流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115146700A CN115146700A (zh) | 2022-10-04 |
CN115146700B true CN115146700B (zh) | 2024-03-12 |
Family
ID=83407157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210558117.6A Active CN115146700B (zh) | 2022-05-21 | 2022-05-21 | 一种基于Transformer序列到序列模型的径流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146700B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562416B (zh) * | 2023-03-01 | 2024-04-12 | 福建中锐汉鼎数字科技有限公司 | 基于变模态与延时特征Transformer模型的水库水位预测方法 |
CN117828308A (zh) * | 2024-03-04 | 2024-04-05 | 山东捷瑞数字科技股份有限公司 | 基于局部分段的时间序列预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080032A (zh) * | 2019-12-30 | 2020-04-28 | 成都数之联科技有限公司 | 一种基于Transformer结构的负荷预测方法 |
CN111860785A (zh) * | 2020-07-24 | 2020-10-30 | 中山大学 | 基于注意力机制循环神经网络的时间序列预测方法及系统 |
WO2021077974A1 (zh) * | 2019-10-24 | 2021-04-29 | 西北工业大学 | 一种个性化对话内容生成方法 |
CN112949902A (zh) * | 2021-01-25 | 2021-06-11 | 西北工业大学 | 一种基于lstm多状态向量序列到序列模型的径流预测方法 |
-
2022
- 2022-05-21 CN CN202210558117.6A patent/CN115146700B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021077974A1 (zh) * | 2019-10-24 | 2021-04-29 | 西北工业大学 | 一种个性化对话内容生成方法 |
CN111080032A (zh) * | 2019-12-30 | 2020-04-28 | 成都数之联科技有限公司 | 一种基于Transformer结构的负荷预测方法 |
CN111860785A (zh) * | 2020-07-24 | 2020-10-30 | 中山大学 | 基于注意力机制循环神经网络的时间序列预测方法及系统 |
CN112949902A (zh) * | 2021-01-25 | 2021-06-11 | 西北工业大学 | 一种基于lstm多状态向量序列到序列模型的径流预测方法 |
Non-Patent Citations (1)
Title |
---|
郭佳 ; 余永斌 ; 杨晨阳 ; .基于全注意力机制的多步网络流量预测.信号处理.2019,(05),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN115146700A (zh) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115146700B (zh) | 一种基于Transformer序列到序列模型的径流预测方法 | |
CN108900346B (zh) | 基于lstm网络的无线网络流量预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN113988449B (zh) | 基于Transformer模型的风电功率预测方法 | |
CN114611792A (zh) | 一种基于混合CNN-Transformer模型的大气臭氧浓度预测方法 | |
CN115758212A (zh) | 一种基于并行网络和迁移学习的机械设备故障诊断方法 | |
CN113687433B (zh) | 一种基于Bi-LSTM的大地电磁信号去噪方法及系统 | |
CN112434891A (zh) | 基于wcnn-alstm的太阳辐照度时间序列的预测方法 | |
CN113420868A (zh) | 一种基于深度强化学习的旅行商问题求解方法及求解系统 | |
CN113177666A (zh) | 一种基于非侵入式注意力预处理过程与BiLSTM模型的预测方法 | |
CN115840893A (zh) | 一种多变量时间序列预测方法及装置 | |
CN115169742A (zh) | 一种短期风力发电功率预测方法 | |
CN116843012A (zh) | 一种融合个性化上下文和时域动态特征的时序预测方法 | |
CN117033989A (zh) | 一种基于Transformer的油井异常判定方法 | |
CN116843057A (zh) | 基于LSTM-ViT的风电功率超短期预测方法 | |
CN117273188A (zh) | 一种具有增量学习能力的太阳能光伏发电功率预测方法 | |
CN116050571A (zh) | 基于Transformer稀疏注意力机制的水质预测方法 | |
CN115510748A (zh) | 基于变分模态分解和cnn-gru的滑坡位移预测方法 | |
CN114881338A (zh) | 基于最大互信息系数与深度学习的配电网线损预测方法 | |
CN114764575A (zh) | 基于深度学习和时序注意力机制的多模态数据分类方法 | |
CN113537573A (zh) | 基于双重时空特征提取的风电功率运行趋势预测方法 | |
CN114792026A (zh) | 一种航空发动机设备的剩余寿命预测方法及系统 | |
CN117610696A (zh) | 一种利用不同属性跨数据集的径流预测方法 | |
CN112380041B (zh) | 一种基于xgboost的指控通信装备故障预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |