CN116227365A - 一种基于改进vmd-tcn的滑坡位移预测方法 - Google Patents
一种基于改进vmd-tcn的滑坡位移预测方法 Download PDFInfo
- Publication number
- CN116227365A CN116227365A CN202310504048.5A CN202310504048A CN116227365A CN 116227365 A CN116227365 A CN 116227365A CN 202310504048 A CN202310504048 A CN 202310504048A CN 116227365 A CN116227365 A CN 116227365A
- Authority
- CN
- China
- Prior art keywords
- layer
- displacement
- landslide
- output
- influence factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01B—MEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
- G01B21/00—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
- G01B21/02—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring length, width, or thickness
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Geometry (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
- Pit Excavations, Shoring, Fill Or Stabilisation Of Slopes (AREA)
Abstract
本发明公开了一种基于改进VMD‑TCN的滑坡位移预测方法,属于滑坡位移预测领域,包括以下步骤:采集待预测区域内一段时间内的滑坡数据,包括历史累积位移数据和影响该区域滑坡的多个影响因子序列;用VMD方法分解历史累积位移数据得到趋势项位移和周期项位移;确定预测的时间节点T3,对T3的趋势项位移进行预测;选出与周期项位移最相关的几个影响因子序列,与周期项位移构成影响因子向量,构建周期项位移预测网络,用影响因子向量训练得到周期项位移预测模型并对T3的周期项位移进行预测,最后T3得到滑坡位移预测值。本发明能克服现有预测模型训练时间长、梯度消失或梯度爆炸等问题,能提高滑坡位移预测的精度。
Description
技术领域
本发明涉及滑坡位移预测领域,尤其涉及一种基于改进VMD-TCN的滑坡位移预测方法。
背景技术
山体滑坡是一种普遍存在的全球性灾害,是一种危害极大的地质灾害。滑坡灾害的发生不仅对人民群众生命和财产构成了重大威胁,同时也给生态环境、经济发展等方面造成了极大的影响。滑坡时间的预报是一世界性难题,滑坡位移预测对于减少滑坡的经济损失和人员伤亡有重要的意义。因此,建立有效、准确的滑坡位移预测模型,提高滑坡位移预测模型的性能,对于降低滑坡带来的损失有着重要的意义。
滑坡位移预测模型通常分为两大类:基于物理的模型和数据驱动的模型。基于物理的模型通常要涉及物理机制,需要提供山体滑坡的清晰物理解释。然而,这些模型通常需要对滑坡中涉及的材料进行大量昂贵的岩土工程表征,因此基于物理模型的泛化能力有限。基于物理的模型还需要对各种物理参数进行调整和优化,例如摩擦系数、凝聚力等。这些参数往往难以准确测量或估计,因此也会影响模型的准确性和可靠性。同时,基于物理的模型往往需要大量的人力和时间投入,建立和维护成本高,难以适应大规模的滑坡监测和预测需求。
数据驱动模型包括人工神经网络,决策树,支持向量机以及随机森林等。这些研究表明,数据驱动模型并不需要建立复杂的物理过程,从而提供令人满意的预测。但由于这些传统的模型对于高维度和大规模数据的处理能力较弱,因此在处理这些类型的数据时可能会遇到困难。并且传统的模型的结构相对较为简单,难以处理更加复杂的数据模式和关系。
近年来,基于时间序列和深度学习的混合预测模型,因其在滑坡位移预测中预测精度和泛化能力相比于传统的数据驱动模型更强而备受关注。例如,循环神经网络RNN及其变体,包括长短期记忆网络LSTM和门控循环单元GRU。GRU和LSTM相比于传统模型,它们能够捕捉长期依赖关系,可以处理变长序列数据。但循环神经网络模型训练时间长,在反向传播算法中,存在梯度消失或梯度爆炸的问题,这会导致模型训练的困难和不稳定。
滑坡位移预测作为滑坡监测预警的重要组成部分,对滑坡灾害的防治具有重要意义。随着深度学习的不断发展,Bai等人在2018年提出的时间卷积网络,英文temporalconvolutional network,简称TCN。在广泛的序列建模任务中,TCN不仅比循环架构的神经网络如RNN及其变体更精确,而且更快速、更清晰。TCN的有效性已经在多个领域得到证实,但目前尚未发现将TCN应用在滑坡位移预测中的研究,如何正确地应用这一方法仍是一个挑战。
目前,关于滑坡位移的分解,常用的方法有MA,EMD、VMD等。
MA英文Moving Average,中文为移动平均,EMD英文empiricalmodedecomposition,中文经验模态分解, VMD英文variational mode decomposition,中文变分模态分解。
VMD是一种自适应、完全非递归的模态变分和信号处理的方法。它将一个实值输入信号分解成多个具有特定稀疏特性的本征模态函数(intrinsic mode function,IMF)分量,具有可提前确定模态分量个数的优点。相比于EMD方法存的端点效应和模态分量混叠的问题,VMD对非平稳、非线性信号具有良好的处理效果。
发明内容
本发明的目的就在于提供一种解决因现有集中技术所用的循环神经网络模型存在训练时间长、梯度消失或梯度爆炸等问题导致模型存在难以训练和不稳定等问题的,能提高滑坡位移预测的精度的一种基于改进VMD-TCN的滑坡位移预测方法。
为了实现上述目的,本发明采用的技术方案是这样的:一种基于改进VMD-TCN的滑坡位移预测方法,包括以下步骤;
(1)采集待预测区域内一滑坡变形监测点在时间T1~T2时间段内的滑坡数据,所述滑坡数据包括该滑坡变形监测点的历史累积位移数据和影响该区域滑坡的多个影响因子序列;
(2)用VMD方法对历史累积位移数据进行分解,得到趋势项位移和周期项位移;
(3)确定预测的时间节点T3,用Holt线性趋势预测对趋势项位移进行预测,得到时间节点T3的趋势项位移预测值;
(4)将影响因子序列分别与周期项位移进行相关性分析,获得相关性高的前N个影响因子序列,与周期项位移构成N+1维的影响因子向量,N=2~4;
(5)训练得到周期项位移预测模型,包括步骤(51)~(53);
(51)构建一周期项位移预测网络;
所述周期项位移预测网络包括依次连接的Q层改进TCN块、一自注意力模块、一平均最大池化层和一全连接层,Q≥3;
所述改进TCN块为包括依次连接的第一空洞因果卷积层、第一权重规范化层、第一激活函数层、第一丢弃层、第二空洞因果卷积层、第二权重规范化层、第二激活函数层、第二丢弃层,还包括多头注意力层、1×1卷积层、求和单元和第三激活函数层;
上一级的输出、第一丢弃层和第二丢弃层的输出均连接多头注意力层,其中上一级的输出作为查询向量、第一丢弃层的输出作为键向量、第二丢弃层的输出作为值向量,并行送入多头注意力层中,多头注意力层的输出经1×1卷积层后再与第二丢弃层的输出一起送入求和单元中求和,再经第三激活函数层进行非线性变换后得到该改进TCN块的输出;
(52)计算预测时间差△T=T2-T3,预设滑动窗口的大小S和步长,S>△T,用滑动窗口在影响因子向量上进行M次采样,每次采样得到一长度为S的子向量,依次标记为第1个到第M个;
(53)对第i个子向量,其最后一列元素对应的时间为ti,影响因子向量中ti+△T时刻的周期项位移为第i个子向量的期望输出,依次用子向量训练周期项位移预测网络,得到周期项位移预测模型,其中i=1~M;
(6)根据时间节点T3,用滑动窗口对(T2-△T)~T2时间段的影响因子向量采样得到一待测子向量,输入周期项位移预测模型得到输出,即为时间节点T3的周期项位移预测值;
(7)将时间节点T3处的周期项位移预测值和趋势项位移预测值相加,得到滑坡位移预测值。
作为优选:所述步骤(1)中,所述影响因子序列包括但不限于库水位、降雨量、滑坡前一段时间内的位移、土壤水分含量、土壤强度、矿物质类型;所述步骤(1)还包括对历史累积位移数据和影响因子分别预处理,所述预处理包括去除异常数据和噪声滤波。
作为优选:步骤(4)中相关性分析包括但不限于Pearson相关性分析、Spearman相关性分析、Kendall相关性分析和主成分分析;
步骤(4)还包括对影响因子向量进行Z-score标准化处理。
作为优选:所述步骤(4)中,获得相关性高的前N个影响因子序列,具体为,将影响因子序列按相关性从高到低排序,获取前N个的影响因子序列。
作为优选:改进TCN块中,
所述第一空洞因果卷积层、第二空洞因果卷积层用于提取输入其中数据的卷积特征;
所述第一权重规范化层和第二权重规范化层,分别用于对第一空洞因果卷积层和第二空洞因果卷积层的输出进行规范化处理;
所述第一激活函数层和第二激活函数层,分别用于对第一权重规范化层和第二权重规范化层的输出进行非线性变换;
所述第一丢弃层和第二丢弃层,分别用于随机将第一激活函数层和第二激活函数层部分输出的权重设置为0;
所述多头注意力层,用于将输入按时间序列拆分为多个头,每个头分别计算注意力输出一向量,再按时间序列将向量拼接得到多头注意力层的输出。
作为优选:所述第一权重规范化层和第二权重规范化层,为批归一化层、组归一化层或实例归一化层;
所述第一激活函数层、第二激活函数层、第三激活函数层的激活函数为ReLU、ELU、或LeakyReLU;
所述第一丢弃层、第二丢弃层为随机丢弃层或自适应丢弃层。
本发明所述改进TCN块中,第一空洞因果卷积层、第二空洞因果卷积层的因果性保证了模型不会利用未来信息;第一权重规范化层和第二权重规范化层能增强模型的泛化能力;第一激活函数层和第二激活函数层能增强模型的表达能力;第一丢弃层和第二丢弃层能随机丢弃部分特征,避免过拟合;多头注意力层采用多头注意力机制,能以不同的程度关注输入序列的不同部分,进而提取关键特征。
自注意力模块采用自注意力机制对输入序列的不同部分进行不同程度的关注,以更好地捕捉序列中的重要信息。
平均最大池化层,目的是对输入的数据进行降维。具体来说,池化层将输入特征图分为不重叠的子区域,并对每个子区域计算平均值或最大值。这样做可以保留其中的重要特征,减少计算量,并防止过拟合。
本网络的最后为全连接层,改层作为神经网络的输出层使用,用于将前一层的所有节点与当前层的所有节点连接起来。这样做可以将前一层的特征组合成更高层次的特征,从而更好地进行预测。
与现有技术相比,本发明的优点在于:
(1)关于改进TCN块:因果卷积层是指输入数据只依赖于过去的值,不依赖于未来的值,这样可以保证模型对于未来的预测不会受到未来信息的影响。空洞因果卷积是在因果卷积的基础上,通过在卷积核中跳过一些位置来引入空洞,从而扩大感受野,进一步提高模型的性能。在改进TCN块中引入多头注意力,用以不同的程度关注输入序列的不同部分,进而提取关键特征;本发明中,改进TCN块具有不同的层次,不同层次的改进TCN块具有不同的作用:较浅层的改进TCN块用于提取输入序列的低级别特征,局部时间模式和趋势;较深层的改进TCN块用于提取更高级别的特征,长期时间依赖关系和序列整体模式。通过堆叠多个改进TCN块,以得到更深层次的时间序列表示,提高模型的预测准确度和鲁棒性。
(2)关于多头注意力层:多头注意力技术用在空洞因果卷积操作的不同阶段,以及输入序列的不同部分进行不同程度的关注,以更好地捕捉序列中的重要信息。通过将多头注意力结合到改进的TCN块中,可以更好地利用时间序列中的信息。改进的TCN块的输出为一个完整的输出向量,并没有分段。
(3)关于自注意力模块:自注意力技术可以帮助模型更好地学习时间序列中不同时间点之间的关系。自注意力会将当前时间点的特征向量与其它时间点的特征向量进行比较,并根据它们的相似度来计算当前时间点的输出。这种方法可以帮助模型更好地理解时间序列中不同时间点之间的相关性,从而提高预测精度。
(4)本发明的多头注意力机制和自注意力机制相互融合,用多头注意力层更好地捕捉时间序列中的重要信息,再利用自注意力机制模块进一步提取时间序列中的重要信息,从而可以更好地利用时序数据中的信息,捕捉周期性特征,提高模型对时间序列的建模能力和预测精度,本发明将改进TCN块、多头注意力机制、自注意力机制进行了有机融合,不仅有效解决现有技术所有神经网络模型存在训练时间长、梯度消失或梯度爆炸等问题,且模型容易训练并相对稳定。
附图说明
图1为本发明流程图;
图2为本发明中的网络结构图;
图3为现有技术中TCN残差块的网络结构图;
图4为本发明中改进TCN块的网络结构图;
图5为实施例2中经步骤(2)得到的趋势项位移和周期项位移示意图;
图6为实施例2中滑坡变形监测点2007年-2012年的滑坡数据图;
图7为本发明滑坡位移预测结果图;
图8为采用MA方法得到的趋势项位移和周期项位移示意图。
实施方式
下面将结合附图对本发明作进一步说明。
实施例1:参见图1到图4,一种基于改进VMD-TCN的滑坡位移预测方法,包括以下步骤;
(1)采集待预测区域内一滑坡变形监测点在时间T1~T2时间段内的滑坡数据,所述滑坡数据包括该滑坡变形监测点的历史累积位移数据和影响该区域滑坡的多个影响因子序列;
(2)用VMD方法对历史累积位移数据进行分解,得到趋势项位移和周期项位移;
(3)确定预测的时间节点T3,用Holt线性趋势预测对趋势项位移进行预测,得到时间节点T3的趋势项位移预测值;
(4)将影响因子序列分别与周期项位移进行相关性分析,获得相关性高的前N个影响因子序列,与周期项位移构成N+1维的影响因子向量,N=2~4;
(5)训练得到周期项位移预测模型,包括步骤(51)~(53);
(51)构建一周期项位移预测网络;
所述周期项位移预测网络包括依次连接的Q层改进TCN块、一自注意力模块、一平均最大池化层和一全连接层,Q≥3;
所述改进TCN块为包括依次连接的第一空洞因果卷积层、第一权重规范化层、第一激活函数层、第一丢弃层、第二空洞因果卷积层、第二权重规范化层、第二激活函数层、第二丢弃层,还包括多头注意力层、1×1卷积层、求和单元和第三激活函数层;
上一级的输出、第一丢弃层和第二丢弃层的输出均连接多头注意力层,其中上一级的输出作为查询向量、第一丢弃层的输出作为键向量、第二丢弃层的输出作为值向量,并行送入多头注意力层中,多头注意力层的输出经1×1卷积层后再与第二丢弃层的输出一起送入求和单元中求和,再经第三激活函数层进行非线性变换后得到该改进TCN块的输出;
其中,所述第一空洞因果卷积层、第二空洞因果卷积层用于提取输入其中数据的卷积特征;所述第一权重规范化层和第二权重规范化层,分别用于对第一空洞因果卷积层和第二空洞因果卷积层的输出进行规范化处理;所述第一激活函数层和第二激活函数层,分别用于对第一权重规范化层和第二权重规范化层的输出进行非线性变换;所述第一丢弃层和第二丢弃层,分别用于随机将第一激活函数层和第二激活函数层部分输出的权重设置为0;所述多头注意力层,用于将输入按时间序列拆分为多个头,每个头分别计算注意力输出一向量,再按时间序列将向量拼接得到多头注意力层的输出;
(52)计算预测时间差△T=T2-T3,预设滑动窗口的大小S和步长,S>△T,用滑动窗口在影响因子向量上进行M次采样,每次采样得到一长度为S的子向量,依次标记为第1个到第M个;
(53)对第i个子向量,其最后一列元素对应的时间为ti,影响因子向量中ti+△T时刻的周期项位移为第i个子向量的期望输出,依次用子向量训练周期项位移预测网络,得到周期项位移预测模型,其中i=1~M;
(6)根据时间节点T3,用滑动窗口对(T2-△T)~T2时间段的影响因子向量采样得到一待测子向量,输入周期项位移预测模型得到输出,即为时间节点T3的周期项位移预测值;
(7)将时间节点T3处的周期项位移预测值和趋势项位移预测值相加,得到滑坡位移预测值。
所述步骤(1)中,所述影响因子序列包括但不限于库水位、降雨量、滑坡前一段时间内的位移、土壤水分含量、土壤强度、矿物质类型;所述步骤(1)还包括对历史累积位移数据和影响因子分别预处理,所述预处理包括去除异常数据和噪声滤波。
步骤(4)中相关性分析包括但不限于Pearson相关性分析、Spearman相关性分析、Kendall相关性分析和主成分分析,只要能区分出相关性即可。
步骤(4)还包括对影响因子向量进行Z-score标准化处理。
所述步骤(4)中,获得相关性高的前N个影响因子序列,具体为,将影响因子序列按相关性从高到低排序,获取前N个的影响因子序列。
所述第一权重规范化层和第二权重规范化层,为批归一化层、组归一化层或实例归一化层,所述第一激活函数层、第二激活函数层、第三激活函数层的激活函数为ReLU、ELU、或LeakyReLU,所述第一丢弃层、第二丢弃层为随机丢弃层或自适应丢弃层,且丢弃比例能根据实际需要进行设置。
关于影响因子:
(1)本发明引入了影响因子,对于提高滑坡位移预测的精度和可靠度具有重要意义。滑坡本质上是一个受岩土体条件控制,并受多种影响因子如降雨、库水位波动、地震等影响而发展、演化的非线性耗散动力系统。未来时段内滑坡影响因子的动态变化对滑坡位移的演化趋势起着决定性的作用。
(2)影响滑坡位移的因素有以下几个:
地质因素:包括土层的稳定性、土壤的质地、地形的形态和坡度等。土层的稳定性取决于土层的强度、厚度、水分含量和含矿物质的类型等因素,土壤的质地影响土壤的密实程度,地形的形态和坡度影响滑坡的形成和发展。
水文因素:包括地下水位、降雨和水文循环等。地下水位对土壤的饱和度和土壤的强度有重要影响,降雨会增加土壤的重量和水分含量,使土壤更容易发生滑坡。水文循环的变化也会影响土壤的水分含量和土壤的强度。
人为因素:包括开采、建筑和抽水等活动。开采会改变地下水位和土层的稳定性,建筑会改变地形和土壤的饱和度,抽水会导致地下水位下降,增加土壤的饱和度和土壤的强度减小。
自然因素:包括地震、风暴和火灾等。地震会造成土壤的震动和土层的破裂,增加滑坡的风险;风暴会引起降雨和风力,加重土壤的负荷,火灾会烧毁植被和有机质,导致土壤的侵蚀和侵蚀。
这些因素会相互作用,导致滑坡的发生和发展。
(3)滑坡位移的影响因子可以通过多种方法进行监测,以下是一些常见的影响因子:
地表位移:可以使用全站仪、GNSS、INSAR等技术监测地表位移,了解滑坡的变形情况,及时发现和预警滑坡的危险性。
土壤含水量和渗透压:通过土壤含水量和渗透压的监测,可以了解土壤的稳定性和饱和度,及时预测和判断滑坡的风险。
地下水位:地下水位对于滑坡的形成和发展有着重要的影响,通过监测地下水位的变化,可以及时发现地下水位上升或下降,提前预警滑坡的风险。
降雨量:降雨是导致滑坡的主要因素之一,通过监测降雨量,可以判断降雨的强度和持续时间,预测滑坡的发生和发展。
坡面应力和应变:通过在滑坡上安装应力计和应变计等设备,可以监测滑坡的应力和应变变化,了解滑坡的变形状态和稳定性。
声波监测:利用声波技术对滑坡进行监测,可以了解滑坡的位移和形态变化,预测滑坡的发生和发展。
通过对这些监测因子的实时监测和分析,可以更好地了解滑坡的形成和发展过程,及时预警和采取措施。
在利用本发明方法对待预测区域进行滑坡位移预测的时候,可以根据实际情况,对影响因子进行选取,认为选择N个影响因子序列,再分别与周期项位移进行相关性分析,选相关性最高的前M个,例如,待测区域为水库周边时,库水位的变化可以影响周围土体的饱和度和应力状态,从而影响滑坡的稳定性,因此,经过相关性分析,我们选出M=2个影响因子分别是库水位、降雨量。但根据实际的待测区域不同,影响因子会有区别,具体可通过相关性分析来获得。
为了更好的看到本发明改进TCN块与现有技术中TCN残差块的区别,我们给出了现有技术中TCN残差块的网络结构图如图3所示。从图3中可以看出,TCN残差块的输入是x,代表输入时间序列数据,时间序列数据x,一方面被送到一个由两层空洞因果卷积构成的函数F(x)中,另一方面,通过一个1×1卷积层得到x',然后将F(x)与x'相加,这个过程被称为残差连接;最后,残差连接得到的结果,通过一个激活函数进行处理,以生成最终输出。该最终输出可以被送到下一个残差块或其他网络层中。
实施例2:参见图1到图7,我们在实施例1的基础上,设计一具体的实验流程如下:
关于骤(1):待预测区域的的滑坡数据,我们选用公开滑坡数据集国家冰川冻土沙漠科学数据中心2007-2012年长江三峡库区秭归县八字门滑坡变形监测的数据,滑坡位移数据选取ZG110、ZG111、ZG112三个监测点,选取2007年1月~2012年12月的GPS位移监测数据。其中,T1为2007年1月、T2为2012年12月。其中,选取2007年1月至2011年12月的监测数据作为训练数据集,利用2012年1月至2012年12月的数据对模型进行检验。
关于步骤(2)(3),同实施例1步骤(2)(3)。
关于步骤(4),本发明通过相关性分析并选N=2,得到与周期项位移相关性最高的2个影响因子序列分别是库水位序列、降雨量序列,其概况如图7所示。
关于步骤(51),构建一周期项位移预测网络,同实施例1步骤(51),本实施例中Q=4,我们采用4层改进TCN块,但Q值可根据实际情况自行设置。
关于步骤(52),已知T1为2007年1月、T2为2012年12月,时间跨度为6年,我们需要预测的时间节点T3为2013年1月,那么时间差△T=T2-T3=1个月,本实施例中,我们通过滑动窗口的在影响因子向量上采样来得到子向量来制作训练集。具体地,本实施例中,我们设置滑动窗口大小S=12个月,步长为1个月,这样每次滑动1个月,得到1个训练样本,也就是子向量,这样,2007年1月到2007年12月对应在影响因子向量的这段数据,构成第一个子向量,2007年2月到2008年1月对应在影响因子向量的数据,构成第2个子向量,以此类推,我们可以得到大量的训练样本,从而增加训练集的数据量,提高模型的泛化能力。
关于步骤(53),以第1个子向量为例,它最后一列元素对应的时间为2007年12月,△T为1个月,所以影响因子向量在2008年1月时的周期项位移,为第1个子向量的期望输出。对第2个子向量,它最后一列元素对应的时间为2008年1月,△T为1个月,所以影响因子向量在2008年2月时的周期项位移,为第2个子向量的期望输出。简单来说,训练周期项位移预测网络时,以2007年1月到2007年12月的数据作为输入特征,用来预测2008年1月的数据,以2007年2月到2008年1月的数据作为输入特征,用来预测2008年2月的数据,以此类推。滑动窗口的大小和步进的值不固定,可以根据实际情况进行设置。子向量和期望输出的关系可参见下表1:
表1:子向量及其对应期望输出关系表
关于步骤(53)的训练,我们还是以第1个子向量为例,当输入时间段为2007年1月到2007年12月的第1个子向量时,会对2008年1月的的周期项位移输出一个预测值y,而2008年1月实际的周期项位移为真实值y^,训练时,以y^为期望输出,通过比较预测值y和真实值y^之间的误差来评估模型的预测效果,并调整误差来调整模型中的参数,以优化模型的预测能力。这个过程被称为反向传播算法,通过梯度下降方法来更新模型参数,使得预测值与真实值之间的误差最小化。在经过多次迭代训练后,可以得到最终的模型,以便进行滑坡位移预测。这一步里面,用2007年1月至2011年12月的数据来训练,用2012年1月至2012年12月的数据对模型进行检验。其中,关于多头注意力层通常接受的是维度为(batch_size,sequence_length,input_dim) 的输入向量,其中batch_size表示批次大小,sequence_length表示时间步长,input_dim表示每个时间步的输入特征数。本文中,输入特征数为P,时间步长为12,因此输入向量,也就是查询向量、键向量和值向量的维度均为(batch_size,12,P)。丢弃层是将部分特征的权重设置为0,而不是将特征本身删除。这样做的目的是为了防止过拟合,减少某些特征的过度依赖,提高模型的泛化能力。因此,经过丢弃层之后,每个输入向量的长度仍然是相同的。
在多头注意力层中,输入向量会被拆分成H个头,每个头对应一个查询向量、一个键向量和一个值向量。对于每个头,查询向量、键向量和值向量之间的注意力权重通过点积注意力机制计算得出,然后将值向量按照注意力权重加权平均得到该头的输出向量,最后将所有头拼接在一起,形成维度为 (batch_size,12,P) 的输出向量。
关于步骤(6),基于步骤(53)训练好的模型,我们只需要输入2012年全年的影响因子向量,就可以得到2013年1月的周期项位移预测值;
关于步骤(7),将2013年1月的周期项位移预测值和趋势项位移预测值相加,得到2013年1月的滑坡位移预测值。
实施例3:参见图1到图8,在实施例2的基础上,我们用四种现有的预测模型、与本发明预测模型的结果进行不对。
四种现有的预测模型分别为MA-GRU模型、MA-TCN模型、VMD-GRU模型、VMD-TCN模型和本发明模型。其中,MA-GRU模型指步骤(2)用MA方法对历史累积位移数据进行分解,周期项位移预测采用GRU网络;MA-TCN模型指步骤(2)用MA方法对历史累积位移数据进行分解,周期项位移预测采用TCN网络;VMD-GRU模型指步骤(2)用VMD方法对历史累积位移数据进行分解,周期项位移预测采用GRU网络;VMD-TCN模型指步骤(2)用VMD方法对历史累积位移数据进行分解,周期项位移预测采用TCN网络。
五个模型评估对比如下表2:
表2 滑坡位移预测模型评估
实验结果表明,在相同的训练数据集下,基于改进TCN块的预测模型相较于其他网络模型表现更加优异,能够更准确地预测滑坡位移的变化。此外,通过应用VMD方法分解得到的趋势项和周期项,能够显著提高滑坡预测的精度,而移动平均方法则表现较一般。综合而言,采用本发明方法能够达到更高的预测精度。在预测结果方面,与滑坡位移监测值相比,预测值的误差相对较小,表明所提出的方法在滑坡位移预测中具有较强的实用性和可靠性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于改进VMD-TCN的滑坡位移预测方法,其特征在于:包括以下步骤;
(1)采集待预测区域内一滑坡变形监测点在时间T1~T2时间段内的滑坡数据,所述滑坡数据包括该滑坡变形监测点的历史累积位移数据和影响该区域滑坡的多个影响因子序列;
(2)用VMD方法对历史累积位移数据进行分解,得到趋势项位移和周期项位移;
(3)确定预测的时间节点T3,用Holt线性趋势预测对趋势项位移进行预测,得到时间节点T3的趋势项位移预测值;
(4)将影响因子序列分别与周期项位移进行相关性分析,获得相关性高的前N个影响因子序列,与周期项位移构成N+1维的影响因子向量,N=2~4;
(5)训练得到周期项位移预测模型,包括步骤(51)~(53);
(51)构建一周期项位移预测网络;
所述周期项位移预测网络包括依次连接的Q层改进TCN块、一自注意力模块、一平均最大池化层和一全连接层,Q≥3;
所述改进TCN块为包括依次连接的第一空洞因果卷积层、第一权重规范化层、第一激活函数层、第一丢弃层、第二空洞因果卷积层、第二权重规范化层、第二激活函数层、第二丢弃层,还包括多头注意力层、1×1卷积层、求和单元和第三激活函数层;
上一级的输出、第一丢弃层和第二丢弃层的输出均连接多头注意力层,其中上一级的输出作为查询向量、第一丢弃层的输出作为键向量、第二丢弃层的输出作为值向量,并行送入多头注意力层中,多头注意力层的输出经1×1卷积层后再与第二丢弃层的输出一起送入求和单元中求和,再经第三激活函数层进行非线性变换后得到该改进TCN块的输出;
(52)计算预测时间差△T=T2-T3,预设滑动窗口的大小S和步长,S>△T,用滑动窗口在影响因子向量上进行M次采样,每次采样得到一长度为S的子向量,依次标记为第1个到第M个;
(53)对第i个子向量,其最后一列元素对应的时间为ti,影响因子向量中ti+△T时刻的周期项位移为第i个子向量的期望输出,依次用子向量训练周期项位移预测网络,得到周期项位移预测模型,其中i=1~M;
(6)根据时间节点T3,用滑动窗口对(T2-△T)~T2时间段的影响因子向量采样得到一待测子向量,输入周期项位移预测模型得到输出,即为时间节点T3的周期项位移预测值;
(7)将时间节点T3处的周期项位移预测值和趋势项位移预测值相加,得到滑坡位移预测值。
2.根据权利要求1所述的一种基于改进VMD-TCN的滑坡位移预测方法,其特征在于:所述步骤(1)中,所述影响因子序列包括但不限于库水位、降雨量、滑坡前一段时间内的位移、土壤水分含量、土壤强度、矿物质类型;所述步骤(1)还包括对历史累积位移数据和影响因子分别预处理,所述预处理包括去除异常数据和噪声滤波。
3.根据权利要求1所述的一种基于改进VMD-TCN的滑坡位移预测方法,其特征在于:步骤(4)中相关性分析包括但不限于Pearson相关性分析、Spearman相关性分析、Kendall相关性分析和主成分分析;
步骤(4)还包括对影响因子向量进行Z-score标准化处理。
4.根据权利要求1所述的一种基于改进VMD-TCN的滑坡位移预测方法,其特征在于:所述步骤(4)中,获得相关性高的前N个影响因子序列,具体为,将影响因子序列按相关性从高到低排序,获取前N个的影响因子序列。
5.根据权利要求1所述的一种基于改进VMD-TCN的滑坡位移预测方法,其特征在于:改进TCN块中,
所述第一空洞因果卷积层、第二空洞因果卷积层用于提取输入其中数据的卷积特征;
所述第一权重规范化层和第二权重规范化层,分别用于对第一空洞因果卷积层和第二空洞因果卷积层的输出进行规范化处理;
所述第一激活函数层和第二激活函数层,分别用于对第一权重规范化层和第二权重规范化层的输出进行非线性变换;
所述第一丢弃层和第二丢弃层,分别用于随机将第一激活函数层和第二激活函数层部分输出的权重设置为0;
所述多头注意力层,用于将输入按时间序列拆分为多个头,每个头分别计算注意力输出一向量,再按时间序列将向量拼接得到多头注意力层的输出。
6.根据权利要求1所述的一种基于改进VMD-TCN的滑坡位移预测方法,其特征在于:所述第一权重规范化层和第二权重规范化层,为批归一化层、组归一化层或实例归一化层;
所述第一激活函数层、第二激活函数层、第三激活函数层的激活函数为ReLU、ELU、或LeakyReLU;
所述第一丢弃层、第二丢弃层为随机丢弃层或自适应丢弃层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310504048.5A CN116227365B (zh) | 2023-05-06 | 2023-05-06 | 一种基于改进vmd-tcn的滑坡位移预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310504048.5A CN116227365B (zh) | 2023-05-06 | 2023-05-06 | 一种基于改进vmd-tcn的滑坡位移预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116227365A true CN116227365A (zh) | 2023-06-06 |
CN116227365B CN116227365B (zh) | 2023-07-07 |
Family
ID=86569815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310504048.5A Active CN116227365B (zh) | 2023-05-06 | 2023-05-06 | 一种基于改进vmd-tcn的滑坡位移预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116227365B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117037427A (zh) * | 2023-08-23 | 2023-11-10 | 旺苍县地质环境监测站 | 一种地质灾害联网监测预警系统 |
CN117592000A (zh) * | 2024-01-16 | 2024-02-23 | 四川省华地建设工程有限责任公司 | 一种滑坡深部位移监测方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627066A (zh) * | 2021-08-03 | 2021-11-09 | 成都理工大学 | 一种水库库岸滑坡的位移预测方法 |
CN114611948A (zh) * | 2022-03-16 | 2022-06-10 | 中国地质调查局水文地质环境地质调查中心 | 基于波动项、趋势项分解的滑坡位移预测方法 |
CN114819372A (zh) * | 2022-05-09 | 2022-07-29 | 广东工业大学 | 一种基于神经网络的电力消费概率预测方法 |
CN114883003A (zh) * | 2022-06-08 | 2022-08-09 | 中南大学 | 基于卷积神经网络的icu住院时长和死亡风险预测方法 |
CN115063710A (zh) * | 2022-05-12 | 2022-09-16 | 吉林省吉林祥云信息技术有限公司 | 一种基于双分支注意力机制tcn的时序分析方法 |
CN115510748A (zh) * | 2022-09-28 | 2022-12-23 | 成都理工大学 | 基于变分模态分解和cnn-gru的滑坡位移预测方法 |
CN115545321A (zh) * | 2022-10-14 | 2022-12-30 | 云南中烟工业有限责任公司 | 一种制丝车间工艺质量在线预测方法 |
CN115585767A (zh) * | 2022-09-05 | 2023-01-10 | 中国地质环境监测院(自然资源部地质灾害技术指导中心) | 基于多源监测数据异常形变挖掘的滑坡预警规则生成方法 |
CN115694985A (zh) * | 2022-10-31 | 2023-02-03 | 北京工业大学 | 基于tmb的混合网络流量攻击预测方法 |
CN115859620A (zh) * | 2022-12-02 | 2023-03-28 | 电子科技大学长三角研究院(湖州) | 一种基于多头注意力机制和图神经网络的径流重建方法 |
-
2023
- 2023-05-06 CN CN202310504048.5A patent/CN116227365B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627066A (zh) * | 2021-08-03 | 2021-11-09 | 成都理工大学 | 一种水库库岸滑坡的位移预测方法 |
CN114611948A (zh) * | 2022-03-16 | 2022-06-10 | 中国地质调查局水文地质环境地质调查中心 | 基于波动项、趋势项分解的滑坡位移预测方法 |
CN114819372A (zh) * | 2022-05-09 | 2022-07-29 | 广东工业大学 | 一种基于神经网络的电力消费概率预测方法 |
CN115063710A (zh) * | 2022-05-12 | 2022-09-16 | 吉林省吉林祥云信息技术有限公司 | 一种基于双分支注意力机制tcn的时序分析方法 |
CN114883003A (zh) * | 2022-06-08 | 2022-08-09 | 中南大学 | 基于卷积神经网络的icu住院时长和死亡风险预测方法 |
CN115585767A (zh) * | 2022-09-05 | 2023-01-10 | 中国地质环境监测院(自然资源部地质灾害技术指导中心) | 基于多源监测数据异常形变挖掘的滑坡预警规则生成方法 |
CN115510748A (zh) * | 2022-09-28 | 2022-12-23 | 成都理工大学 | 基于变分模态分解和cnn-gru的滑坡位移预测方法 |
CN115545321A (zh) * | 2022-10-14 | 2022-12-30 | 云南中烟工业有限责任公司 | 一种制丝车间工艺质量在线预测方法 |
CN115694985A (zh) * | 2022-10-31 | 2023-02-03 | 北京工业大学 | 基于tmb的混合网络流量攻击预测方法 |
CN115859620A (zh) * | 2022-12-02 | 2023-03-28 | 电子科技大学长三角研究院(湖州) | 一种基于多头注意力机制和图神经网络的径流重建方法 |
Non-Patent Citations (3)
Title |
---|
CHUNYING XU等: "Landslide displacement prediction based on Variational Mode Decomposition and Temporal Convolutional Network", 《RESEARCHSQUARE》, pages 1 - 20 * |
江文金等: "基于时间序列与时间卷积网络的滑坡位移预测", 《成都理工大学计算机与网络安全学院(牛津布鲁克斯学院)》, vol. 23, no. 9, pages 3672 - 3679 * |
陈保家等: "基于注意力TCN的滚动轴承剩余使用寿命预测方法", 《电子测量技术》, vol. 44, no. 24, pages 153 - 160 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117037427A (zh) * | 2023-08-23 | 2023-11-10 | 旺苍县地质环境监测站 | 一种地质灾害联网监测预警系统 |
CN117037427B (zh) * | 2023-08-23 | 2024-02-20 | 旺苍县地质环境监测站 | 一种地质灾害联网监测预警系统 |
CN117592000A (zh) * | 2024-01-16 | 2024-02-23 | 四川省华地建设工程有限责任公司 | 一种滑坡深部位移监测方法及系统 |
CN117592000B (zh) * | 2024-01-16 | 2024-04-05 | 四川省华地建设工程有限责任公司 | 一种滑坡深部位移监测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116227365B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116227365B (zh) | 一种基于改进vmd-tcn的滑坡位移预测方法 | |
Yin et al. | Real-time prediction of rockburst intensity using an integrated CNN-Adam-BO algorithm based on microseismic data and its engineering application | |
CN115758212B (zh) | 一种基于并行网络和迁移学习的机械设备故障诊断方法 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
Cai et al. | Anomaly detection of earthquake precursor data using long short-term memory networks | |
CN108256172A (zh) | 一种顶管下穿既有箱涵过程中险情预警预报方法 | |
CN117314218B (zh) | 一种基于大数据分析的煤矿水害实时预警方法 | |
CN115423263A (zh) | 一种基于Prophet-LSTM的边坡风险预警及滑动体积预测方法 | |
CN114548482A (zh) | 一种基于蠕变型滑坡动能变化率临滑预警方法 | |
CN115545272A (zh) | 冲击地压矿井微震频次和能量长短期智能预测预警方法 | |
CN116384554A (zh) | 机械钻速预测方法、装置、电子设备及计算机存储介质 | |
CN116383722A (zh) | 一种基于门控循环单元神经网络的压裂措施过程监控方法 | |
CN117272232A (zh) | 数据融合的隧道监测方法、装置、计算机设备及存储介质 | |
CN115544891A (zh) | 一种承压原始导高带高度的预测方法及系统 | |
Saxena et al. | Comparative Analysis Of AI Regression And Classification Models For Predicting House Damages İn Nepal: Proposed Architectures And Techniques | |
CN114692963A (zh) | 一种基于长短期记忆神经网络的滑坡位移预测方法 | |
Ardana et al. | Groundwater level forecasting using multiple linear regression and artificial neural network approaches | |
CN103898890A (zh) | 一种基于bp神经网络的双桥静力触探数据的土层量化分层方法 | |
Tao et al. | A structural monitoring data processing model based on signal musicalization | |
Liu et al. | Prediction of dam horizontal displacement based on CNN-LSTM and attention mechanism | |
Yao et al. | Extreme motion prediction and early-warning assessment of semisubmersible platform based on deep learning method | |
CN111026790A (zh) | 一种基于数据挖掘的结构安全评估及预报方法 | |
CN113139681B (zh) | 一种基于时间序列数据的神经网络冲击地压预测方法 | |
Turarbek et al. | 2-d deep convolutional neural network for predicting the intensity of seismic events | |
CN113808370A (zh) | 一种面向滑坡的多指标耦合监测预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |