CN113919587A - 基于神经网络的地质灾害的预测方法及系统 - Google Patents

基于神经网络的地质灾害的预测方法及系统 Download PDF

Info

Publication number
CN113919587A
CN113919587A CN202111295159.7A CN202111295159A CN113919587A CN 113919587 A CN113919587 A CN 113919587A CN 202111295159 A CN202111295159 A CN 202111295159A CN 113919587 A CN113919587 A CN 113919587A
Authority
CN
China
Prior art keywords
time
prediction
attention
representing
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111295159.7A
Other languages
English (en)
Inventor
罗杰
胡军
李军义
卞海波
刘泽昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongda Testing Hunan Co Ltd
Original Assignee
Zhongda Testing Hunan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongda Testing Hunan Co Ltd filed Critical Zhongda Testing Hunan Co Ltd
Priority to CN202111295159.7A priority Critical patent/CN113919587A/zh
Publication of CN113919587A publication Critical patent/CN113919587A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及地质灾害预警领域,公开一种基于神经网络的地质灾害的预测方法及系统,以提高对突变的捕捉能力并提升预测结果的先见性和可靠性。方法包括:构建预测模型;以编码器获取至少两类与地质灾害相关联的非预测时间序列数据,根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重;然后根据注意力权重及当前时刻的各个非预测时间序列数据得出输出到T‑LSTM中的多元特征向量并学习突变信息;在解码器中,通过设定的时间注意机制从编码器中选择相关的隐藏状态以间接捕捉突变信息,然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。

Description

基于神经网络的地质灾害的预测方法及系统
技术领域
本发明涉及地质灾害预警技术领域,尤其涉及一种基于神经网络的地质灾害的预测方法及系统。
背景技术
时间序列数据是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内,依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测问题的核心就是从数据中挖掘出这种规律,并利用其对将来数据做出估计。将时间序列预测技术应用于地质信息数据中,能够预测地质可能出现的突变情况,进而综合研判发生地质灾害的可能性,对可能发生的地质灾害进行预报预警。
早期的地质灾害分析预测大多仅仅是单因素、定性的研究,定性分析也逐渐成为工程实践中所经常采用的方法。伴随着计算机技术以及现代化数值分析方法的飞速发展,该研究开始从具有局限性的定性现象分析向定量甚至是半定量的过程发展。定量分析方法主要是由力学原理及算法对地质进行稳定性分析,可分为确定性和非确定性两类。
由于地质灾害的复杂性、影响因素的多样性和自身变量的随机性,通过非线性的分析方法来研究地质相关随机变量,进而分析其稳定性,这种称为非确定性方法。主要包括可靠性评价法、灰色系统分析法、模糊综合分析法和神经网络方法等。
目前地质灾害预测大致可分为三个阶段:
(1)自然现象-经验方程预测阶段
早在20世纪60、70年代,学者已经开始对地质灾害进行预测研究,但仅仅是依靠地质的宏观变形迹象如:岩土崩塌、地面裂缝,甚至是动物各种异常行为等。直到日本学者斋藤提出经验方程曲线,进一步的建立了滑坡蠕变破坏三阶段理论并最终成功的应用于1970年日本高汤山滑坡预测,至此地质灾害预测研究工作真正开始起步。
(2)统计分析预测阶段
进入20世纪80、90年代,快速发展的数学现代理论中的一些新的方法如概率论、数理统计、模糊理论和灰色系统理论等,都被应用到地质灾害预测,并取得了不错的进展。此外,还有黄金分割法、Verhulst反函数模型、卡尔曼滤波法等也被学者应用于相关地质灾害的预测预报。
(3)非线性及综合预测阶段
20世纪90年代以后,许多的专家学者将非线性、系统科学和人工智能等理论或方法应用于建立地质灾害相关时间序列预测预报模型。时间序列反应现象的发展变化规律,是按时间顺序得到的一系列观测值,其分析的基本思想是根据有限的记录建立反映时间序列动态依存关系的数学模型,进而利用该模型对未来的行为进行预测。
由于所处环境条件、自身结构特征的差异,地质灾害的变形演化规律具有极强的个性特征,先前的预测模型不可能适用于所有地质灾害的预测预报,往往仅能适用于某一类地质灾害的预测预报。
地质灾害因其地质条件区域性强、环境条件影响大、时空效应和环境效应强等特点,预测具有很强的随机性和不确定性,预测难度较大。与此同时,以往基于单一元素的预测模型无法综合多方面灾害产生因素进行地质灾害预测,导致预测精度较低。
发明内容
本发明主要目的在于公开一种基于神经网络的地质灾害的预测方法及系统,以通过提高多因素预测模型对突变的捕捉能力来提升预测结果的先见性和可靠性。
为达上述目的,本发明公开一种基于神经网络的地质灾害的预测方法,包括:
构建预测模型,所述预测模型包括:以T-LSTM网络与基于同一时间阶段的影响注意机制相结合的编码器、以及以标准LSTM网络与基于长时间依赖的时间注意机制相结合的解码器;
以所述编码器获取至少两类与地质灾害相关联的非预测时间序列数据,根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重;然后根据所述注意力权重及当前时刻的各个非预测时间序列数据得出输出到所述T-LSTM中的多元特征向量以通过下述公式学习突变信息:
Figure BDA0003336290300000021
Figure BDA0003336290300000022
Figure BDA0003336290300000023
Figure BDA0003336290300000024
trt i=1-tanh(ft i)
Figure BDA0003336290300000025
Figure BDA0003336290300000026
其中,Wa、Ua和ba代表学习参数,a∈{i,f,o,g},tanh代表双曲正切函数,sigmoid代表激活函数,
Figure BDA0003336290300000031
代表Hadamard乘积运算,
Figure BDA0003336290300000032
表示列向量乘以行向量运算,
Figure BDA0003336290300000033
表示求和运算;
Figure BDA0003336290300000034
表示t-1时刻的隐藏状态,
Figure BDA0003336290300000035
表示t-1时刻的单元状态,
Figure BDA0003336290300000036
表示t时刻的特征向量,
Figure BDA0003336290300000037
表示t时刻的单元状态;
Figure BDA0003336290300000038
表示t时刻的隐藏状态;
在所述解码器中,通过设定的时间注意机制从所述编码器中选择相关的隐藏状态以间接捕捉突变信息;然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。
优选地,本发明根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重具体包括:
Figure BDA0003336290300000039
Figure BDA00033362903000000310
Figure BDA00033362903000000311
Figure BDA00033362903000000312
其中,
Figure BDA00033362903000000313
是级联所述T-LSTM网络中t-1时刻的隐藏状态和单元状态的操作,Ws、Us、bs、Vs分别为学习参数,
Figure BDA00033362903000000314
为Softmax函数得到的第i个非预测时间序列数据的最终注意力得分,
Figure BDA00033362903000000315
为输出到所述T-LSTM网络中的多元特征向量。
优选地,本发明在所述解码器中所设定的时间注意力机制中,通过计算所述标准LTSM网络中上一时刻输出的预测目标序列与所述编码器中各隐藏状态之间的相关性来确定各隐藏状态的时间注意力得分。
为达上述目的,本发明还公开一种基于神经网络的地质灾害的预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的相应步骤。
本发明具有以下有益效果:
在基于多因素的编码器-解码器预测模型中,利用转换机制改变遗忘门和输入门输出的取值范围,从而加强数据突变信息之间的依赖性,并将突变信息捕捉能力正向传导到输出门。通过并行地多重转换将数据流压缩到变化最显著的范围,减少了突变信息的过饱和区间,从根本上解决了标准LSTM在过饱和区间内很难学习到突变信息的问题;从而实现了通过提高多因素预测模型对突变的捕捉能力来提升预测结果的先见性和可靠性的技术效果。
下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例中的增强突变信息捕获能力的T-LSTM网络的内部结构图。
图2是本发明实施例中的Sigmoid激活函数和tanh双曲正切变换函数图像减少了突变信息的过饱和区间的对比示意图。
图3是本发明实施例编码器采用T-LSTM网络增强突变信息捕获能力后基于训练集所得预测结果相比于标准LSTM网络所得预测结果分别与真实值进行对比的试验效果图。
图4是本发明实施例编码器采用T-LSTM网络增强突变信息捕获能力后基于测试集所得预测结果相比于标准LSTM网络所得预测结果分别与真实值进行对比的试验效果图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
实施例1
本实施例公开一种基于神经网络的地质灾害的预测方法,包括以下步骤:
步骤S1、构建预测模型,所述预测模型包括:以T-LSTM网络与基于同一时间阶段的影响注意机制相结合的编码器、以及以标准LSTM网络与基于长时间依赖的时间注意机制相结合的解码器。
由于过大或过小的时间粒度不利于深度学习模型进行训练及时间序列预测,优选地,在该步骤之前,先执行数据预处理。可选地,该预处理包括但不限于:对原始数据集进行插值处理。例如:通过插值取1小时内数据平均值的方法,将数据集的时间步长转换为1小时。值得注意的是,在对数据集进行插值操作时,基于平滑处理会产生一些虚拟数据,从而导致信息数据的真实性降低,因此不仅以进行相应的平滑处理。
步骤S2、以所述编码器获取至少两类与地质灾害相关联的非预测时间序列数据,根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重;然后根据所述注意力权重及当前时刻的各个非预测时间序列数据得出输出到所述T-LSTM中的多元特征向量学习突变信息。
本实施例中,T-LSTM是具有附加转换机制的标准LSTM的变体。在不丢失记忆单元和隐藏状态更新信息的前提下,通过非线性函数变换来调整遗忘门输出值的数值范围,从而达到完全学习突变信息的目的。T-LSTM和标准LSTM最大的区别在于遗忘门计算结果的后续处理操作。为了能让模型能够更好的捕捉时空数据的序列信息中依赖关系,通过利用一种非线性的转换函数来调整各个门控的输出值的范围,进而实现对短期突变信息的捕捉和学习。在该步骤中,如图1所示,具体通过下述公式学习突变信息:
Figure BDA0003336290300000051
Figure BDA0003336290300000052
Figure BDA0003336290300000053
Figure BDA0003336290300000054
trt i=1-tanh(ft i)(公式5)
Figure BDA0003336290300000055
Figure BDA0003336290300000056
其中,Wa、Ua和ba代表学习参数,a∈{i,f,o,g},tanh代表双曲正切函数,sigmoid代表激活函数,
Figure BDA0003336290300000057
代表Hadamard乘积运算,
Figure BDA0003336290300000058
表示列向量乘以行向量运算,
Figure BDA0003336290300000059
表示求和运算;
Figure BDA00033362903000000510
表示t-1时刻的隐藏状态,
Figure BDA00033362903000000511
表示t-1时刻的单元状态,
Figure BDA00033362903000000512
表示t时刻的特征向量,
Figure BDA00033362903000000513
表示t时刻的单元状态;
Figure BDA00033362903000000514
表示t时刻的隐藏状态。
参照图1,公式(2)对应遗忘门,决定从单元状态中舍弃哪些信息。公式(1)和公式(4)对应输入门,确定需要在单元状态中保存哪些新信息。公式(5)对应有效捕捉突变,遗忘门后的数据流产生的输出值服从以下规则,接近0的值被视为完全丢弃,接近1的值全部通过。显然,遗忘门在保存时间前后数据中的信息方面起着至关重要的作用,由于突变信息跨越多个时间步长,为遗忘门设计合适的输出规则是解决获取突变信息问题的关键操作。遗忘门的输出值范围是[0,1],通过公式(5)的转换机制映射到[0.25,1.0]的区间。通过转换机制,接近1的原始值降低到0.25,而接近0的原始输出值变为接近1。值得注意的是,位于中间附近的原始值被集中压缩到0.5。将数据的数值范围压缩到变化最明显的区间,更有利于捕捉数据之间的相关性,尤其是对于突变的信息。利用转换机制改变遗忘门输出的取值范围,从而加强数据突变信息之间的依赖性。所提出的转换机制将遗忘门后的数据流压缩到变化最显著的范围,在一定程度上避免了激活函数的过饱和区间。这样,减少了突变信息的过饱和区间,解决了标准LSTM在过饱和区间内很难学习到突变信息的问题。
同理,公式(6)也能将数据的数值范围压缩到变化最明显的区间,更有利于捕捉数据之间的相关性,尤其是对于突变的信息。进一步促进了数据流压缩到变化最显著的范围和减少了突变信息的过饱和区间,深层解决了标准LSTM在过饱和区间内很难学习到突变信息的问题。
具体的,在公式(6)中,对应有效捕捉突变的单元状态更新,旧的单元状态
Figure BDA0003336290300000061
更新到新的单元状态
Figure BDA0003336290300000062
公式6中使输入门的输出通过一个S型函数(即sigmoid激活函数)来改变输入门的输出范围,而不是通过一个双曲正切函数tanh来改变输入门的输出范围。如图2显示了tanh函数和sigmoid函数取值范围的变化过程。可以看到相比于tanh函数输入门的输出从[0,1]压缩到[0,0.75],采用的S型激活函数可以将输出从[0,1]压缩到[0.5,0.75]附近。很显然它将数据值的范围压缩到最明显的间隔(即约0.5附近),进而可以更好地捕获短期突变数据之间的依赖关系。
公式(3)和公式(7)对应输出门,确定输出值。
在该步骤中,优选地,根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重具体包括:
Figure BDA0003336290300000063
Figure BDA0003336290300000064
Figure BDA0003336290300000065
Figure BDA0003336290300000066
其中,
Figure BDA0003336290300000067
是级联所述T-LSTM网络中t-1时刻的隐藏状态和单元状态的操作,Ws、Us、bs、Vs分别为学习参数,
Figure BDA0003336290300000068
为Softmax函数得到的第i个非预测时间序列数据的最终注意力得分,
Figure BDA0003336290300000069
为输出到所述T-LSTM网络中的多元特征向量。
步骤S3、在所述解码器中,通过设定的时间注意机制从所述编码器中选择相关的隐藏状态以间接捕捉突变信息;然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。
本实施例中,在所述解码器中所设定的时间注意力机制中,优选的,可通过计算所述标准LTSM网络中上一时刻输出的预测目标序列(所谓“非预测目标序列”即指编码器-解码器模型的输入序列,如与地质灾害相关的各类传感器所采集的水平位移、深度位移、沉降、倾斜、裂缝或应力应变等数据序列;“预测目标序列”即指编码器-解码器模型对应预测结果的输出序列)与所述编码器中各隐藏状态之间的相关性来确定各隐藏状态的时间注意力得分。可选地,确定该时间注意力得分也可参照本领域技术人员所熟知的现有技术,不做赘述。
在基于本实施例在编码器中采用上述增强突变捕捉能力的T-LSTM网络相比于标准LSTM网络,根据同一训练集和测试集所得预测结果的对比数据分别参照图3及图4。如图3和图4所示,其中,true所对应的颜色的线条表示为真实值的分布情况,LSTM所对应的颜色的线条表示为标准LSTM模型预测值的分布情况,T-LSTM所对应的颜色的线条表示为T-LSTM模型预测值的分布情况;通过对比可发现本实施例所得预测结果更接近真实值。
实施例2
与上述方法实施例相对应的,本实施例公开一种基于神经网络的地质灾害的预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法实施例中相对应的步骤。
综上,本发明上述两实施例所分别公开的基于神经网络的地质灾害预测方法及系统,至少具有以下有益效果:
在基于多因素的编码器-解码器预测模型中,利用转换机制改变遗忘门和输入门输出的取值范围,从而加强数据突变信息之间的依赖性,并将突变信息捕捉能力正向传导到输出门。通过并行地多重转换将数据流压缩到变化最显著的范围,减少了突变信息的过饱和区间,从根本上解决了标准LSTM在过饱和区间内很难学习到突变信息的问题;从而实现了通过提高多因素预测模型对突变的捕捉能力来提升预测结果的先见性和可靠性的技术效果。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于神经网络的地质灾害的预测方法,其特征在于,包括:
构建预测模型,所述预测模型包括:以T-LSTM网络与基于同一时间阶段的影响注意机制相结合的编码器、以及以标准LSTM网络与基于长时间依赖的时间注意机制相结合的解码器;
以所述编码器获取至少两类与地质灾害相关联的非预测时间序列数据,根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重;然后根据所述注意力权重及当前时刻的各个非预测时间序列数据得出输出到所述T-LSTM中的多元特征向量以通过下述公式学习突变信息:
Figure FDA0003336290290000011
Figure FDA0003336290290000012
Figure FDA0003336290290000013
Figure FDA0003336290290000014
Figure FDA0003336290290000015
Figure FDA0003336290290000016
Figure FDA0003336290290000017
其中,Wa、Ua和ba代表学习参数,a∈{i,f,o,g},tanh代表双曲正切函数,sigmoid代表激活函数,
Figure FDA0003336290290000018
代表Hadamard乘积运算,
Figure FDA0003336290290000019
表示列向量乘以行向量运算,
Figure FDA00033362902900000110
表示求和运算;
Figure FDA00033362902900000111
表示t-1时刻的隐藏状态,
Figure FDA00033362902900000112
表示t-1时刻的单元状态,
Figure FDA00033362902900000113
表示t时刻的特征向量,
Figure FDA00033362902900000114
表示t时刻的单元状态;
Figure FDA00033362902900000115
表示t时刻的隐藏状态;
在所述解码器中,通过设定的时间注意机制从所述编码器中选择相关的隐藏状态以间接捕捉突变信息;然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重具体包括:
Figure FDA00033362902900000116
Figure FDA00033362902900000117
Figure FDA00033362902900000118
Figure FDA00033362902900000119
其中,
Figure FDA00033362902900000120
是级联所述T-LSTM网络中t-1时刻的隐藏状态和单元状态的操作,Ws、Us、bs、Vs分别为学习参数,
Figure FDA0003336290290000021
为Softmax函数得到的第i个非预测时间序列数据的最终注意力得分,
Figure FDA0003336290290000022
为输出到所述T-LSTM网络中的多元特征向量。
3.根据权利要求1或2所述的方法,其特征在于,在所述解码器中所设定的时间注意力机制中,通过计算所述标准LTSM网络中上一时刻输出的预测目标序列与所述编码器中各隐藏状态之间的相关性来确定各隐藏状态的时间注意力得分。
4.一种基于神经网络的地质灾害的预测系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至3中任一所述方法的步骤。
CN202111295159.7A 2021-11-03 2021-11-03 基于神经网络的地质灾害的预测方法及系统 Pending CN113919587A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111295159.7A CN113919587A (zh) 2021-11-03 2021-11-03 基于神经网络的地质灾害的预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111295159.7A CN113919587A (zh) 2021-11-03 2021-11-03 基于神经网络的地质灾害的预测方法及系统

Publications (1)

Publication Number Publication Date
CN113919587A true CN113919587A (zh) 2022-01-11

Family

ID=79244961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111295159.7A Pending CN113919587A (zh) 2021-11-03 2021-11-03 基于神经网络的地质灾害的预测方法及系统

Country Status (1)

Country Link
CN (1) CN113919587A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081706A (zh) * 2022-06-16 2022-09-20 中国安能集团第三工程局有限公司 基于双向lstm网络的黄土塌陷预测方法及装置
CN118194396A (zh) * 2024-03-15 2024-06-14 北京航空航天大学 一种机器学习与蠕变规律融合的长期沉降预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180129931A1 (en) * 2016-11-04 2018-05-10 Salesforce.Com, Inc. Quasi-recurrent neural network based encoder-decoder model
CN109886496A (zh) * 2019-02-27 2019-06-14 中南大学 一种基于气象信息的农产量预测方法
CN109902862A (zh) * 2019-02-13 2019-06-18 北京航空航天大学 一种融合时间注意力机制的时间序列预测系统
CN110619430A (zh) * 2019-09-03 2019-12-27 大连理工大学 一种用于交通预测的时空注意力机制方法
CN111563624A (zh) * 2020-05-06 2020-08-21 北京工业大学 一种基于LSTM与Attention相结合的绿色能源预测方法
CN112580848A (zh) * 2020-11-04 2021-03-30 北京航空航天大学 一种基于pt-lstm的时间序列预测系统与方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180129931A1 (en) * 2016-11-04 2018-05-10 Salesforce.Com, Inc. Quasi-recurrent neural network based encoder-decoder model
US20210103816A1 (en) * 2016-11-04 2021-04-08 Salesforce.Com, Inc. Quasi-recurrent neural network based encoder-decoder model
CN109902862A (zh) * 2019-02-13 2019-06-18 北京航空航天大学 一种融合时间注意力机制的时间序列预测系统
CN109886496A (zh) * 2019-02-27 2019-06-14 中南大学 一种基于气象信息的农产量预测方法
CN110619430A (zh) * 2019-09-03 2019-12-27 大连理工大学 一种用于交通预测的时空注意力机制方法
CN111563624A (zh) * 2020-05-06 2020-08-21 北京工业大学 一种基于LSTM与Attention相结合的绿色能源预测方法
CN112580848A (zh) * 2020-11-04 2021-03-30 北京航空航天大学 一种基于pt-lstm的时间序列预测系统与方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AN NGUYEN等: "Time Matters:Time-Aware LSTMs for predictive Business Process Monitoring", 《HTTPS://DOI.ORG/10.48550/ARXIV.2010.00889》, 5 November 2020 (2020-11-05), pages 1 - 12 *
INCI M. BAYTAS等: "Patient Subtyping via Time-Aware LSTM Networks", 《KDD "17: PROCEEDINGS OF THE 23RD ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》, 4 August 2017 (2017-08-04), pages 65 - 74, XP058784748, DOI: 10.1145/3097983.3097997 *
JUN HU等: "Multistage attention network for multivariate time series prediction", 《NEUROCOMPUTING》, 4 December 2019 (2019-12-04), pages 122 - 137, XP086041711, DOI: 10.1016/j.neucom.2019.11.060 *
JUN HU等: "Transformation-gated LSTM: efficient capture of short-term mutation dependencies for multivariate time series prediction tasks", 《2019 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS》, 30 September 2019 (2019-09-30), pages 1 - 8 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081706A (zh) * 2022-06-16 2022-09-20 中国安能集团第三工程局有限公司 基于双向lstm网络的黄土塌陷预测方法及装置
CN115081706B (zh) * 2022-06-16 2023-04-28 中国安能集团第三工程局有限公司 基于双向lstm网络的黄土塌陷预测方法及装置
CN118194396A (zh) * 2024-03-15 2024-06-14 北京航空航天大学 一种机器学习与蠕变规律融合的长期沉降预测方法

Similar Documents

Publication Publication Date Title
CN107578124B (zh) 基于多层改进gru神经网络的短期电力负荷预测方法
CN113673775B (zh) 基于cnn-lstm及深度学习的时空组合预测方法
CN112785066B (zh) 基于卷积-递归神经网络的全球野火次季节时空预测方法
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN111652425B (zh) 一种基于粗糙集和长短期记忆网络的河流水质预测方法
CN113919587A (zh) 基于神经网络的地质灾害的预测方法及系统
CN113807951A (zh) 一种基于深度学习的交易数据趋势预测方法和系统
CN114091361B (zh) 基于气象事件的transformer模型构建方法
Tariq et al. Employing deep learning and time series analysis to tackle the accuracy and robustness of the forecasting problem
CN114004338A (zh) 基于神经网络的混合时间周期模式多变量时序预测方法
Pełka et al. Pattern-based long short-term memory for mid-term electrical load forecasting
CN117612025B (zh) 基于扩散模型的遥感图像屋顶识别方法
CN109447331A (zh) 基于stacking算法的山火风险预测方法
CN114065996A (zh) 基于变分自编码学习的交通流预测方法
CN114117355A (zh) 一种抗时变性模型的优化方法、系统、设备及可读存储介质
CN116542429A (zh) 一种融合时空特征的油藏生产指标机器学习预测方法
CN118210933B (zh) 一种基于数字孪生的气象数据可视化实现方法及系统
CN118212107B (zh) 一种海岸带生态安全评估系统及方法
Wang et al. An adapted LSTM-DRRNet approach for predicting floor acceleration response spectrum
CN114118630B (zh) 一种基于气象事件的需求量预测方法和系统
CN117009752A (zh) 一种基于poa-vmd-ssa-kelm模型的用电需求预测方法
CN111325384B (zh) 一种结合统计特征和卷积神经网络模型的ndvi预测方法
CN114492171A (zh) 基于多任务深度学习神经网络的太阳风速度预测方法
CN112232557A (zh) 基于长短期记忆网络的转辙机健康度短期预测方法
CN118940021B (zh) 基于过程和数据双驱动的近岸风暴潮和台风浪预报方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220111