CN113919587A

CN113919587A - 基于神经网络的地质灾害的预测方法及系统

Info

Publication number: CN113919587A
Application number: CN202111295159.7A
Authority: CN
Inventors: 罗杰; 胡军; 李军义; 卞海波; 刘泽昊
Original assignee: Zhongda Testing Hunan Co Ltd
Current assignee: Zhongda Testing Hunan Co Ltd
Priority date: 2021-11-03
Filing date: 2021-11-03
Publication date: 2022-01-11

Abstract

本发明涉及地质灾害预警领域，公开一种基于神经网络的地质灾害的预测方法及系统，以提高对突变的捕捉能力并提升预测结果的先见性和可靠性。方法包括：构建预测模型；以编码器获取至少两类与地质灾害相关联的非预测时间序列数据，根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重；然后根据注意力权重及当前时刻的各个非预测时间序列数据得出输出到T‑LSTM中的多元特征向量并学习突变信息；在解码器中，通过设定的时间注意机制从编码器中选择相关的隐藏状态以间接捕捉突变信息，然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。

Description

基于神经网络的地质灾害的预测方法及系统

技术领域

本发明涉及地质灾害预警技术领域，尤其涉及一种基于神经网络的地质灾害的预测方法及系统。

背景技术

时间序列数据是按照时间排序的一组随机变量，它通常是在相等间隔的时间段内，依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势，而时间序列预测问题的核心就是从数据中挖掘出这种规律，并利用其对将来数据做出估计。将时间序列预测技术应用于地质信息数据中，能够预测地质可能出现的突变情况，进而综合研判发生地质灾害的可能性，对可能发生的地质灾害进行预报预警。

早期的地质灾害分析预测大多仅仅是单因素、定性的研究，定性分析也逐渐成为工程实践中所经常采用的方法。伴随着计算机技术以及现代化数值分析方法的飞速发展，该研究开始从具有局限性的定性现象分析向定量甚至是半定量的过程发展。定量分析方法主要是由力学原理及算法对地质进行稳定性分析，可分为确定性和非确定性两类。

由于地质灾害的复杂性、影响因素的多样性和自身变量的随机性，通过非线性的分析方法来研究地质相关随机变量，进而分析其稳定性，这种称为非确定性方法。主要包括可靠性评价法、灰色系统分析法、模糊综合分析法和神经网络方法等。

目前地质灾害预测大致可分为三个阶段：

(1)自然现象-经验方程预测阶段

早在20世纪60、70年代，学者已经开始对地质灾害进行预测研究，但仅仅是依靠地质的宏观变形迹象如：岩土崩塌、地面裂缝，甚至是动物各种异常行为等。直到日本学者斋藤提出经验方程曲线，进一步的建立了滑坡蠕变破坏三阶段理论并最终成功的应用于1970年日本高汤山滑坡预测，至此地质灾害预测研究工作真正开始起步。

(2)统计分析预测阶段

进入20世纪80、90年代，快速发展的数学现代理论中的一些新的方法如概率论、数理统计、模糊理论和灰色系统理论等，都被应用到地质灾害预测，并取得了不错的进展。此外，还有黄金分割法、Verhulst反函数模型、卡尔曼滤波法等也被学者应用于相关地质灾害的预测预报。

(3)非线性及综合预测阶段

20世纪90年代以后，许多的专家学者将非线性、系统科学和人工智能等理论或方法应用于建立地质灾害相关时间序列预测预报模型。时间序列反应现象的发展变化规律，是按时间顺序得到的一系列观测值，其分析的基本思想是根据有限的记录建立反映时间序列动态依存关系的数学模型，进而利用该模型对未来的行为进行预测。

由于所处环境条件、自身结构特征的差异，地质灾害的变形演化规律具有极强的个性特征，先前的预测模型不可能适用于所有地质灾害的预测预报，往往仅能适用于某一类地质灾害的预测预报。

地质灾害因其地质条件区域性强、环境条件影响大、时空效应和环境效应强等特点，预测具有很强的随机性和不确定性，预测难度较大。与此同时，以往基于单一元素的预测模型无法综合多方面灾害产生因素进行地质灾害预测，导致预测精度较低。

发明内容

本发明主要目的在于公开一种基于神经网络的地质灾害的预测方法及系统，以通过提高多因素预测模型对突变的捕捉能力来提升预测结果的先见性和可靠性。

为达上述目的，本发明公开一种基于神经网络的地质灾害的预测方法，包括：

构建预测模型，所述预测模型包括：以T-LSTM网络与基于同一时间阶段的影响注意机制相结合的编码器、以及以标准LSTM网络与基于长时间依赖的时间注意机制相结合的解码器；

以所述编码器获取至少两类与地质灾害相关联的非预测时间序列数据，根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重；然后根据所述注意力权重及当前时刻的各个非预测时间序列数据得出输出到所述T-LSTM中的多元特征向量以通过下述公式学习突变信息：

tr_t ⁱ＝1-tanh(f_t ⁱ)

其中，W_a、U_a和b_a代表学习参数，a∈{i,f,o,g}，tanh代表双曲正切函数，sigmoid代表激活函数，

代表Hadamard乘积运算，

表示列向量乘以行向量运算，

表示求和运算；

表示t-1时刻的隐藏状态，

表示t-1时刻的单元状态，

表示t时刻的特征向量，

表示t时刻的单元状态；

表示t时刻的隐藏状态；

在所述解码器中，通过设定的时间注意机制从所述编码器中选择相关的隐藏状态以间接捕捉突变信息；然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。

优选地，本发明根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重具体包括：

其中，

是级联所述T-LSTM网络中t-1时刻的隐藏状态和单元状态的操作，W_s、U_s、b_s、V_s分别为学习参数，

为Softmax函数得到的第i个非预测时间序列数据的最终注意力得分，

为输出到所述T-LSTM网络中的多元特征向量。

优选地，本发明在所述解码器中所设定的时间注意力机制中，通过计算所述标准LTSM网络中上一时刻输出的预测目标序列与所述编码器中各隐藏状态之间的相关性来确定各隐藏状态的时间注意力得分。

为达上述目的，本发明还公开一种基于神经网络的地质灾害的预测系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的相应步骤。

本发明具有以下有益效果：

在基于多因素的编码器-解码器预测模型中，利用转换机制改变遗忘门和输入门输出的取值范围，从而加强数据突变信息之间的依赖性，并将突变信息捕捉能力正向传导到输出门。通过并行地多重转换将数据流压缩到变化最显著的范围，减少了突变信息的过饱和区间，从根本上解决了标准LSTM在过饱和区间内很难学习到突变信息的问题；从而实现了通过提高多因素预测模型对突变的捕捉能力来提升预测结果的先见性和可靠性的技术效果。

下面将参照附图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例中的增强突变信息捕获能力的T-LSTM网络的内部结构图。

图2是本发明实施例中的Sigmoid激活函数和tanh双曲正切变换函数图像减少了突变信息的过饱和区间的对比示意图。

图3是本发明实施例编码器采用T-LSTM网络增强突变信息捕获能力后基于训练集所得预测结果相比于标准LSTM网络所得预测结果分别与真实值进行对比的试验效果图。

图4是本发明实施例编码器采用T-LSTM网络增强突变信息捕获能力后基于测试集所得预测结果相比于标准LSTM网络所得预测结果分别与真实值进行对比的试验效果图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

实施例1

本实施例公开一种基于神经网络的地质灾害的预测方法，包括以下步骤：

步骤S1、构建预测模型，所述预测模型包括：以T-LSTM网络与基于同一时间阶段的影响注意机制相结合的编码器、以及以标准LSTM网络与基于长时间依赖的时间注意机制相结合的解码器。

由于过大或过小的时间粒度不利于深度学习模型进行训练及时间序列预测，优选地，在该步骤之前，先执行数据预处理。可选地，该预处理包括但不限于：对原始数据集进行插值处理。例如：通过插值取1小时内数据平均值的方法，将数据集的时间步长转换为1小时。值得注意的是，在对数据集进行插值操作时，基于平滑处理会产生一些虚拟数据，从而导致信息数据的真实性降低，因此不仅以进行相应的平滑处理。

步骤S2、以所述编码器获取至少两类与地质灾害相关联的非预测时间序列数据，根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重；然后根据所述注意力权重及当前时刻的各个非预测时间序列数据得出输出到所述T-LSTM中的多元特征向量学习突变信息。

本实施例中，T-LSTM是具有附加转换机制的标准LSTM的变体。在不丢失记忆单元和隐藏状态更新信息的前提下，通过非线性函数变换来调整遗忘门输出值的数值范围，从而达到完全学习突变信息的目的。T-LSTM和标准LSTM最大的区别在于遗忘门计算结果的后续处理操作。为了能让模型能够更好的捕捉时空数据的序列信息中依赖关系，通过利用一种非线性的转换函数来调整各个门控的输出值的范围，进而实现对短期突变信息的捕捉和学习。在该步骤中，如图1所示，具体通过下述公式学习突变信息：

tr_t ⁱ＝1-tanh(f_t ⁱ)(公式5)

代表Hadamard乘积运算，

表示列向量乘以行向量运算，

表示求和运算；

表示t-1时刻的隐藏状态，

表示t-1时刻的单元状态，

表示t时刻的特征向量，

表示t时刻的单元状态；

表示t时刻的隐藏状态。

参照图1，公式(2)对应遗忘门，决定从单元状态中舍弃哪些信息。公式(1)和公式(4)对应输入门，确定需要在单元状态中保存哪些新信息。公式(5)对应有效捕捉突变，遗忘门后的数据流产生的输出值服从以下规则，接近0的值被视为完全丢弃，接近1的值全部通过。显然，遗忘门在保存时间前后数据中的信息方面起着至关重要的作用，由于突变信息跨越多个时间步长，为遗忘门设计合适的输出规则是解决获取突变信息问题的关键操作。遗忘门的输出值范围是[0，1]，通过公式(5)的转换机制映射到[0.25，1.0]的区间。通过转换机制，接近1的原始值降低到0.25，而接近0的原始输出值变为接近1。值得注意的是，位于中间附近的原始值被集中压缩到0.5。将数据的数值范围压缩到变化最明显的区间，更有利于捕捉数据之间的相关性，尤其是对于突变的信息。利用转换机制改变遗忘门输出的取值范围，从而加强数据突变信息之间的依赖性。所提出的转换机制将遗忘门后的数据流压缩到变化最显著的范围，在一定程度上避免了激活函数的过饱和区间。这样，减少了突变信息的过饱和区间，解决了标准LSTM在过饱和区间内很难学习到突变信息的问题。

同理，公式(6)也能将数据的数值范围压缩到变化最明显的区间，更有利于捕捉数据之间的相关性，尤其是对于突变的信息。进一步促进了数据流压缩到变化最显著的范围和减少了突变信息的过饱和区间，深层解决了标准LSTM在过饱和区间内很难学习到突变信息的问题。

具体的，在公式(6)中，对应有效捕捉突变的单元状态更新，旧的单元状态

更新到新的单元状态

公式6中使输入门的输出通过一个S型函数(即sigmoid激活函数)来改变输入门的输出范围，而不是通过一个双曲正切函数tanh来改变输入门的输出范围。如图2显示了tanh函数和sigmoid函数取值范围的变化过程。可以看到相比于tanh函数输入门的输出从[0，1]压缩到[0，0.75]，采用的S型激活函数可以将输出从[0，1]压缩到[0.5，0.75]附近。很显然它将数据值的范围压缩到最明显的间隔(即约0.5附近)，进而可以更好地捕获短期突变数据之间的依赖关系。

公式(3)和公式(7)对应输出门，确定输出值。

在该步骤中，优选地，根据所设定的影响注意力机制、上一时刻的隐藏状态信息及上一时刻的单元状态信息确定当前时刻关联的各个非预测时间序列数据的注意力权重具体包括：

其中，

为输出到所述T-LSTM网络中的多元特征向量。

步骤S3、在所述解码器中，通过设定的时间注意机制从所述编码器中选择相关的隐藏状态以间接捕捉突变信息；然后基于标准LSTM网络以根据所捕捉的突变信息生成当前时刻的预测结果。

本实施例中，在所述解码器中所设定的时间注意力机制中，优选的，可通过计算所述标准LTSM网络中上一时刻输出的预测目标序列(所谓“非预测目标序列”即指编码器-解码器模型的输入序列，如与地质灾害相关的各类传感器所采集的水平位移、深度位移、沉降、倾斜、裂缝或应力应变等数据序列；“预测目标序列”即指编码器-解码器模型对应预测结果的输出序列)与所述编码器中各隐藏状态之间的相关性来确定各隐藏状态的时间注意力得分。可选地，确定该时间注意力得分也可参照本领域技术人员所熟知的现有技术，不做赘述。

在基于本实施例在编码器中采用上述增强突变捕捉能力的T-LSTM网络相比于标准LSTM网络，根据同一训练集和测试集所得预测结果的对比数据分别参照图3及图4。如图3和图4所示，其中，true所对应的颜色的线条表示为真实值的分布情况，LSTM所对应的颜色的线条表示为标准LSTM模型预测值的分布情况，T-LSTM所对应的颜色的线条表示为T-LSTM模型预测值的分布情况；通过对比可发现本实施例所得预测结果更接近真实值。

实施例2

与上述方法实施例相对应的，本实施例公开一种基于神经网络的地质灾害的预测系统，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法实施例中相对应的步骤。

综上，本发明上述两实施例所分别公开的基于神经网络的地质灾害预测方法及系统，至少具有以下有益效果：

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。