CN112200363A

CN112200363A - 一种滑坡的预测方法、装置、设备和存储介质

Info

Publication number: CN112200363A
Application number: CN202011066225.9A
Authority: CN
Inventors: 滕佳颖; 吴展开; 沈小珍; 郑增荣; 商琪; 江子君; 宋杰; 胡辉
Original assignee: Hangzhou Ruhr Technology Co Ltd
Current assignee: Hangzhou Ruhr Technology Co Ltd
Priority date: 2020-09-30
Filing date: 2020-09-30
Publication date: 2021-01-08

Abstract

本发明实施例公开了一种滑坡的预测方法、装置、设备和存储介质，获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量，以达到根据每天的多个维度的地理环境数据，得到精准的降雨量的目的，并且，将降雨量和滑坡影响因子输入至自步分类学习模型，自步分类学习模型可以均衡比例不平衡的正负数据集，以当前天的数据为基准进行具体栅格的滑坡发生概率，大幅度降低了计算资源的浪费，提高了滑坡预测的效率。

Description

一种滑坡的预测方法、装置、设备和存储介质

技术领域

本发明实施例涉及滑坡监测技术领域，尤其涉及一种滑坡的预测方法、装置、设备和存储介质。

背景技术

山体滑坡是最常见的灾难性自然灾害之一，其具有分布范围广、发生频次高、多发性、区域性和严重性等特点，因滑坡每年会造成大量的人员伤亡和重大的环境和基础设施损失。对滑坡的易发性进行评估具有重要意义。

现有的滑坡易发性预测根据其所依据的理论基础的差异，可以分为确定性方法和非确定性方法。确定性方法主要是基于专家经验和知识的定向分析和基于滑坡过程或者物理学模型的进行分析的方法，预测准确度较差。近年来随着计算机技术和3S技术的高速发展，非确定性方法得到了广泛的应用，主要包括模糊逻辑法、层次分析法、决策树等。但是通过上述方法处理的滑坡因子的时间精度差，尤其是通过整体插值法、克里金插值法、反距离权重法等传统方法预测降雨量，降雨量的预测精度差，影响山体滑坡的预测结果。

发明内容

本发明提供了一种降雨量预测方法、装置、设备和存储介质，实现提高降雨量预测结果的精度，进一步提高山体滑坡的预测精度。

第一方面，本发明实施例提供了一种滑坡的预测方法，该方法包括：包括：

获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，其中，所述地理环境数据包括地理位置数据、大气数据、地形数据和下垫面数据；

基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量；

分别将所述滑坡影响因子和所述降雨量输入至滑坡预测模型，基于所述滑坡预测模型确定当前天的各栅格滑坡的发生概率；

其中，所述滑坡预测模型为自步分类学习模型，所述滑坡预测模型基于历史滑坡数据、历史非滑坡数据迭代调整自步因子和下采样比例确定，所述自步因子根据所述历史非滑坡数据的分箱个数和迭代次数确定，所述下采样比例根据每个分箱的自步因子和所有分箱的自步因子确定。

第二方面，本发明实施例还提供了一种滑坡的预测装置，该装置包括：包括：

数据获取模块，用于获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，其中，所述地理环境数据包括地理位置数据、大气数据、地形数据和下垫面数据；

降雨预测模块，用于基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量；

滑坡预测模块，用于分别将所述滑坡影响因子和所述降雨量输入至滑坡预测模型，基于所述滑坡预测模型确定各栅格滑坡的发生概率；

第三方面，本发明实施例还提供了一种滑坡的预测设备，该设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明任意实施例提供的滑坡的预测方法。

第四方面，本发明实施例还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行本发明任意实施例提供的滑坡的预测方法。

本申请提供的技术方案，获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量，以达到根据每天的多个维度的地理环境数据，得到精准的降雨量的目的，并且，将降雨量和滑坡影响因子输入至自步分类学习模型，自步分类学习模型可以均衡比例不平衡的正负数据集，以当前天的数据为基准进行具体栅格的滑坡发生概率，大幅度降低计算资源的浪费，有利于提高滑坡预测的效率。

附图说明

图1是本发明实施例一中的一种滑坡的预测方法的流程图；

图2是本发明实施例二中的一种滑坡的预测方法的流程图；

图3是本发明实施例三中的一种滑坡的预测方法的流程图；

图4是本发明实施例四中的一种滑坡的预测方法的流程图；

图5是本发明实施例五中的一种滑坡的预测装置的结构示意图；

图6是本发明实施例六中的一种滑坡的预测设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一提供的一种滑坡的预测方法的流程图，本实施例可适用于对滑坡易发性进行评估的情况，该方法可以由滑坡的预测装置来执行，如图1所示，该方法包括如下步骤：

S110、获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子。

其中，目标区域通常是发生过滑坡的区域，也可以是指定的任意一个区域。所述地理环境数据包括地理位置数据、大气数据、地形数据和下垫面数据。所述大气数据包括风向信息、风带信息和气压带信息中的至少一项；所述地形数据包括坡度信息、坡向信息和山脉走向信息中的至少一项；所述下垫面数据包括植被覆盖度信息、水域距离和城市雨岛信息中的至少一项。栅格数据就是将空间分割成有规律的网格，每一个网格成为一个栅格或单元，并在各个单元上赋予相应的属性值来表示实体的一种数据形式。上述滑坡影响因子即为栅格数据。所述滑坡影响因子包括动态因子和静态因子，其中，所述动态因子至少包括土壤湿度，所述静态因子包括高程、坡度、坡向、平面曲率、剖面曲率、地形湿度指数、水流强度指数、沉积运输指数、地形粗糙度指数、与断层距离、与河流距离、与道路距离、岩性、土地利用、植被覆盖率中的至少一项。设定时间段可以是一天、三天、一周、一个月或者其他时间段。栅格大小可以是50×50m、30×30m或者其他大小，具体的可以根据目标区域的尺寸确定栅格的尺寸。

具体的，可以在目标区域设置多个监测点，以实时获取各个监测点的滑坡影响因子。进一步结合预设部门收集的数据，形成该目标区域的各个栅格的设定时间段内每天的滑坡影响因子。

S120、基于降雨插值模型，根据地理环境数据确定目标区域的降雨量。

其中，所述降雨插值模型可以是一种反向传播模型(BP，back propagationneural network)，基于误差反向传播算法的由非线性变换单元组成的多层前馈型网络，BP一般由输入层、隐含层和输出层组成，每层中又包括N个神经元，同层神经元之间互相独立，每层之间神经元的输出经过特定的激励函数后，只会影响下层神经元的输入。

具体地，降雨插值模型的训练方法为：获取初始模型，确定所述初始模型的初始权值矩阵和初始阈值，并计算所述初始模型的适应度；将历史时间段内的样本地理环境信息输入至所述初始模型，确定预测降雨量，根据所述预测降雨量和所述历史时间段的实测降雨量，并基于遗传算法迭代调整所述初始模型的初始权值矩阵和初始阈值；基于迭代调整后的权值矩阵和阈值，调整所述初始模型并计算调整后的模型的适应度，直至重新计算的适应度达到期望值，将达到所述期望值的适应度对应的模型作为所述降雨插值模型。

具体地，所述初始权值可以包括输入层与隐含层之间的连接权值和隐含层与输出层之间的连接权值；初始阈值可以包括隐含层的阈值和输出层的阈值。初始模型的适应度的计算公式为：

其中，n是样本个数，y(i)是初始模型的第i个样本的实际输出，t(i)是初始模型的第i个样本的期望输出。具体地，将历史时间段内的样本地理环境信息输入至初始模型后，得到预测降雨量，计算预测降雨量和实测降雨量之间的均方根误差，如果均方根误差大于预设误差阈值，迭代调整初始模型的权值编码和阈值编码，并基于调整后的权值编码和阈值编码确定调整后的权值矩阵和阈值，直至均方根误差不小于预设误差阈值，则说明初始模型调整至稳定状态，并采用上述适应度计算公式计算调整后的模型的适应度，如果重新计算的适应度达到期望值，将达到期望值的适应度对应的模型作为所述降雨插值模型。

可选地，采用二进制编码、实数编码或者格雷码编码方式对权值和阈值进行编码，并根据权值编码和阈值编码确定调整后的权值矩阵和阈值。可选地，还可以通过计算预测降雨量和实测降雨量之间的平均误差、平均绝对误差或线性相关系数，并根据所述平均误差、所述平均绝对误差或所述线性相关系数迭代调整初始模型的权值编码和阈值编码，直至平均误差、平均绝对误差或线性相关系数不小于预设误差阈值，说明初始模型调整至稳定状态，并进一步计算调整后模型的适应度以及确定降雨插值模型。

需要说明的是，历史时间段内的样本地理环境数据是多维度的，在训练降雨插值模型时，多维度的样本地理环境数据可以提高降雨插值模型的精度和鲁棒性，因而，在获取每天的地理环境数据后，基于降雨插值模型预测可以提高降雨量的预测精度，有利于提高滑坡预测的预测精度。

可选地，在所述基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量之前，所述方法还包括：对所述地理环境数据进行预处理，其中，所述预处理包括坐标统一处理、栅格统一处理以及离散化处理中的至少一项。

由于滑坡影响因子的来源不同，会导致各个滑坡影响因子的坐标或者栅格大小不统一，因此，在获取地理环境数据之后，需要对地理环境数据进行坐标统一处理和栅格统一处理。当然，也可以根据地理环境数据的具体情况进行其他数据预处理，如数据校正、异常值去除、非栅格数据栅格化以及离散化处理等。具体的，坐标统一处理主要用于将滑坡影响因子的坐标系进行统一化，如以西安80坐标系作为滑坡影响因子的坐标系，当然也可以采用其他坐标系作为滑坡影响因子的坐标系。

S130、分别将滑坡影响因子和降雨量输入至滑坡预测模型，基于滑坡预测模型确定当前天的各栅格滑坡的发生概率。

可以理解的是，任意区域发生滑坡的天数一般小于未发生滑坡的天数，导致正负样本的比例不平衡，即历史非滑坡数据和历史滑坡数据的比例不平衡。在训练滑坡预测模型时，选择自步分类学习模型作为滑坡预测模型，所述自步分类学习模型可以均衡比例不平衡的正负样本，以得到较好的鲁棒性和较强的包容的滑坡预测模型，因此，利用训练好的滑坡预测模型进行滑坡预测时，可以得到准确性较高的滑坡预测结果。

上述步骤是将降雨插值模型和自步分类学习模型结合预测各栅格滑坡的发生概率，通过根据每天的多个维度的地理环境数据，可以得到精准的降雨量，进而将降雨量和滑坡影响因子输入至自步分类学习模型，自步分类学习模型可以均衡比例不平衡的正负数据集，以当前天的数据为基准进行具体栅格的滑坡发生概率，大幅度降低计算资源的浪费，有利于提高滑坡预测的效率。

本实施例提供的技术方案，获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量，以达到根据每天的多个维度的地理环境数据，得到精准的降雨量的目的，并且，将降雨量和滑坡影响因子输入至自步分类学习模型，自步分类学习模型可以均衡比例不平衡的正负数据集，以当前天的数据为基准进行具体栅格的滑坡发生概率，大幅度降低了计算资源的浪费，提高了滑坡预测的效率。

实施例二

图2为本发明实施例二提供的一种滑坡的预测方法的流程图，本实施例是对上一实施例中的滑坡预测模型的训练过程进行细化，在该方法实施例中未详尽描述的部分请参考上述实施例。具体参见图2所示，该方法可以包括如下步骤：

S210、获取初始预测模型，并分别提取历史滑坡数据和历史非滑坡数据的特征，以及分别确定历史滑坡数据和历史非滑坡数据对应的标签。

其中，所述历史滑坡特征可以是历史滑坡栅格中滑坡影响因子的平均值、极大值或者极小值，历史非滑坡特征是历史非滑坡栅格中滑坡影响因子的平均值、极大值或者极小值。例如，将历史滑坡栅格的历史降雨量的平均值和土壤湿度的平均值作为历史滑坡特征，将历史非滑坡栅格的历史降雨量的平均值和土壤湿度的平均值作为历史非滑坡特征。其中，所述标签指的是历史滑坡数据和历史非滑坡数据的编号，例如，历史滑坡数据的标签是1，历史非滑坡数据的标签是0。

S220、基于历史滑坡特征、历史非滑坡特征、历史滑坡标签和历史非滑坡标签确定初始预测模型的初始分类硬度，根据初始分类硬度确定历史非滑坡数据的分箱个数，基于分箱个数确定初始预测模型的各分箱的自步因子。

其中，分类硬度指的是初始预测模型在单个样本上的损失函数，分类硬度可以与分箱个数呈正相关。例如，如果分类硬度较大，确定较多的分箱个数，如果分类硬度较小，确定较少的分箱个数，且各分箱的分类硬度不同。其中，所述自步因子可以用来降低样本数量过多的分箱的下采样比例，所述自步因子通过将分箱个数、分箱标签数的相反数以及迭代次数之和加1得到，每个分箱的下采样比例为每个分箱的自步因子与所有分箱的自步因子的比值。

具体地，自步分类学习模型的分类硬度的计算公式为：

H_x＝H(x，y，F)

其中，x为样本的特征，即x包括历史滑坡特征和历史非滑坡特征，y为样本的标签，即y包括历史滑坡标签和历史非滑坡标签，F为自步分类学习模型。

具体地，各分箱内的历史非滑坡数据的计算公式为：

其中，H(·)指的是H(x，y，F)，k为分箱个数，l为分箱的编号。

具体地，自步因子的计算公式为：

α_l＝k+1-l+i，其中，i为迭代次数。

具体地，下采样比例为：

其中，∑_mα_m为所有分箱的自步因子，m＝1，…k。

S230、基于自步因子确定每个分箱的下采样比例，并基于下采样比例确定各分箱内的下采样的历史非滑坡数据。

S240、将下采样的历史非滑坡数据和历史滑坡数据输入至初始预测模型，基于初始预测模型输出的滑坡概率和历史滑坡概率确定初始预测模型的损失函数，基于损失函数在单个样本上的训练分类硬度，迭代调整自步因子和每个分箱的下采样比例。

S250、根据迭代调整的自步因子和每个分箱的下采样比例调整初始预测模型，直至损失函数达到设定阈值，得到滑坡预测模型。

具体地解释S230-S250，对初始预测模型进行训练时，将初始预测模型分成多个基分类器，确定初始预测模型的训练集D以及模型参数，训练集D包括多数类样本(历史非滑坡数据D1)和少数类样本(历史滑坡数据D2)，模型参数包括硬度函数H(x，y，F)、基分类器f，基分类器个数n，分箱个数k，每个分箱内的历史非滑坡数据分别为B₁，B₂，…，B_k，每个分箱内的自步因子α_l＝k+1-l+i，将每个分箱内的自步因子α_l与所有分箱的自步因子α_m确定每个分箱的下采样比例

基于下采样比例

确定每个分箱内的下采样的历史非滑坡数据

基于每个箱子的下采样的历史非滑坡数据

和历史滑坡数据D2对初始预测模型的多个基分类器进行训练，进一步基于初始预测模型输出的滑坡概率和历史滑坡概率迭代调整每个箱子的自步因子和下采样比例，直至初始预测模型的损失函数达到设定阈值，得到多个目标分类器，将由多个目标分类器构成的模型作为滑坡预测模型。需要说明的是，自步分类学习模型进行学习时，硬度低的分箱的下采样数量始终高于硬度高的下采样数量，这样可以均衡每个分箱对分类硬度的贡献，使得下采样后每个分箱中的分类硬度总和一致，以实现在提高边界样本重要性的同时，降低噪声对学习过程的影响。

示例性地，初始预测模型的分箱个数k＝10，在第一次迭代中每个分箱的自步因子分别为：11，10，9，8，7，6，5，4，3，2；在第二次迭代中每个分箱的自步因子分别为：12，11，10，9，8，7，6，5，4，3；第三次迭代中每个分箱的自步因子分别为：13，12，11，10，9，8，7，6，5，4；…最后一次迭代中每个分箱的自步因子分别为：20，19，18，17，16，15，14，13，12，11。因此，第一次迭代中每个分箱的下采样比例为：

第二次迭代中每个分箱的下采样比例为：

第三次迭代中每个分箱的下采样比例为：

…最后一次迭代中每个分箱的下采样比例为：

由此可见，随着迭代次数的增加，每个分箱的采样比例逐渐变化均匀而不会变化太快，也就是说，每个分箱由硬度低的下采样数量多到最后每个分箱的下采样数量逐渐均衡，并且，在每个箱子的下采样比例均匀变化的同时，还可以保证硬度小的分箱的下采样数量始终高于硬度大的分箱的下采样数量，使训练完成的自步分类学习模型的基分类器之间多样化、鲁棒性高，对正负比例不平衡的样本的包容性强，进而可以提高滑坡预测的精度和可靠性。

S260、获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子。

其中，所述地理环境数据包括地理位置数据、大气数据、地形数据和下垫面数据。

S270、基于降雨插值模型，根据地理环境数据确定目标区域的降雨量。

S280、分别将滑坡影响因子和降雨量输入至滑坡预测模型，基于滑坡预测模型确定当前天的各栅格滑坡的发生概率。

可以理解的是，训练完成的自步分类学习模型的基分类器之间多样化、鲁棒性高，对正负比例不平衡的样本的包容性强，进而可以提高滑坡预测的精度和可靠性，在获取目标区域的各个栅格的设定时间段内每天的滑坡影响因子和降雨量后，基于训练好的自步分类学习模型(即滑坡预测模型)，可以得到准确性高的各栅格滑坡的发生概率。

本实施例提供的技术方案，选择自步分类学习模型，根据历史非滑坡数据的分箱个数和迭代次数确定自步分类学习模型的自步因子，根据每个分箱的自步因子和所有分箱的自步因子确定下采样比例，因此，在基于历史滑坡数据、历史非滑坡数据迭代调整自步因子和下采样比例时，随着迭代次数的增加，每个分箱的采样比例由硬度低的下采样数量多到最后每个分箱内的下采样数量逐渐变化均匀，并且，在每个箱子的下采样比例均匀变化的同时，还可以保证硬度小的分箱的下采样数量始终高于硬度大的分箱的下采样数量，得到多样化、鲁棒性高且包容性强的滑坡预测模型，因此，在获取目标区域的各个栅格的设定时间段内每天的滑坡影响因子后，基于滑坡预测模型可以提高滑坡预测的精度和可靠性，实现提高滑坡预测的准确性的效果。

实施例三

图3为本发明实施例三提供的一种滑坡的预测方法的流程图，本实施例是对上一实施例的进一步细化。可选地，所述分别将所述滑坡影响因子和所述降雨量输入至滑坡预测模型，基于所述滑坡预测模型确定各栅格滑坡的发生概率，包括：基于第一预设模型，根据所述降雨量和所述滑坡影响因子确定每天滑坡的发生概率；如果当天滑坡的发生概率大于预设概率阈值，基于第二预设模型，根据当前天的降雨量和所述滑坡影响因子预测各个栅格滑坡的发生概率。在该方法实施例中未详尽描述的部分请参考上述实施例。具体参见图3所示，该方法可以包括如下步骤：

S310、获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子。

S320、基于降雨插值模型，根据地理环境数据确定目标区域的降雨量。

S330、基于第一预设模型，根据降雨量和滑坡影响因子确定每天滑坡的发生概率。

可选地，第一预设模型为自步分类学习模型，第一预设模型可以基于历史滑坡数据、历史非滑坡数据迭代调整自步因子和下采样比例确定，所述自步因子根据所述历史非滑坡数据的分箱个数和迭代次数确定，所述下采样比例根据每个分箱的自步因子和所有分箱的自步因子确定。所述第一预设模型的训练过程与前述实施例所述的滑坡预测模型的训练过程相同。

可选地，基于第一预设模型，根据所述降雨量和所述滑坡影响因子确定每天滑坡的发生概率的方法包括：根据每天的各个栅格的降雨量和滑坡影响因子确定目标动态因子的构造特征，其中，所述构造特征包括各个栅格的每个目标动态因子的总和、平均值、最大值、最小值、极差、四分位数和雨量时间，并根据每天的所述目标构造特征和静态因子得到所述第一预设模型的第一特征矩阵；将所述第一特征矩阵输入所述第一预设模型中，以根据所述第一预设模型确定每天滑坡的发生概率。

由于第一预设模型是基于历史滑坡数据、历史非滑坡数据迭代调整自步因子和下采样比例确定的自步分类学习模型，可以提高每天滑坡的发生概率的精度，并对动态因子进行特征构建，增加了动态因子在模型预测中的作用，进一步提高的第一预设模型的预测精度。

S340、如果当天滑坡的发生概率大于预设概率阈值，基于第二预设模型，根据当前天的降雨量和滑坡影响因子预测各个栅格滑坡的发生概率。

其中，预设概率阈值可以是0.5、0.6或者其他值，当然预设概率阈值也可以采用分数或者百分数进行表示。当滑坡的发生概率大于该预设概率阈值时，表示当前天滑坡的易发性较高。通过设置预设概率阈值对滑坡影响因子进行筛选，只有当前天滑坡的发生概率大于预设概率阈值时，才将当前天的数据传输至第二预设模型进行进一步预测，大大减少了模型输入的数据量，提高了处理效率，同时，提高了预测的精度。

与前述实施例同理，第二预设模型为自步分类学习模型，第二预设模型可以基于历史滑坡数据、历史非滑坡数据迭代调整自步因子和下采样比例确定，所述自步因子根据所述历史非滑坡数据的分箱个数和迭代次数确定，所述下采样比例根据每个分箱的自步因子和所有分箱的自步因子确定。所述第二预设模型的训练过程与前述实施例所述的滑坡与模型的训练过程相同。

可选地，所述基于第二预设模型，基于第二预设模型，根据当前天的降雨量和所述滑坡影响因子确定所述目标区域的滑坡预测概率包括：对所述当前天对应的各个栅格的降雨量和滑坡影响因子进行特征提取，以生成所述第二预设模型的第二特征矩阵；对所述第二特征矩阵进行归一化处理；将归一化处理后的所述第二特征矩阵输入所述第二预设模型中，以根据所述第二预设模型确定当前天的各个栅格滑坡的发生概率。所述当前天可以是一个或者多个，可以根据第一预设模型的输出结果确定。

具体的，可以基于max-min归一化算法对第二特征矩阵的各个特征进行归一化处理。当然也可以选取其他归一化算法进行归一化处理。本发明实施例对第一特征矩阵和第二特征矩阵归一化算法不进行限定。进一步地，将归一化后的第二特征矩阵输入至第二预设模型中，输出当前天的各个栅格滑坡的发生概率。

本发明实施例的技术方案，获取滑坡影响因子和降雨量，以天为单位进行预测，充分考虑了滑坡影响因子中动态因子和降雨量的时序信息，提高了预测精度；第一预设模型和第二预设模型均为多样化、鲁棒性高且包容性强的滑坡预测模型，通过设置两个预设模型，分两阶段进行滑坡预测，第一阶段预测当前天发生滑坡的概率是否大于设定值，若是，则进行第二阶段滑坡预测，以当前天的数据为基准进行具体栅格的滑坡发生概率，大幅度降低了计算资源的浪费，提高了滑坡预测的精度、效率和可靠性；通过对动态因子特征构建，增加了动态因子在模型预测中的作用，进一步提高了模型预测的精度；通过特征筛选和归一化处理，进一步提高了模型预测的效率。

实施例四

图4为本发明实施例四提供的一种滑坡的预测方法的流程图。本实施例用于对滑坡预测的整个流程进行解析。在该方法实施例中未详尽描述的部分请参考上述实施例。具体参见图4所示，该方法可以包括如下步骤：

S410、获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子。

可选地，在获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子之前，还可以获取目标区域的遥感影像信息和地形信息，基于功能区分类模型，根据所述遥感影像信息和所述地形信息，确定目标区域的各功能区，并根据各功能区对应的标签筛选目标功能区。

其中，所述遥感影像信息指的是卫星影像，可以通过Landsat(陆地卫星)系列的地表反射率产品获取，所述遥感影像信息可以反映目标区域的各栅格的地物类型，例如，草地类型、林地类型、水稻类型以及建筑物类型；所述地形信息可以从目标区域的数字高程模型(Digital Elevation Model，简称DEM)获取，所述地形信息反映了目标区域的某个栅格和周围栅格的栅格信息的最大变化程度。所述地形信息可以包括高程信息、坡度信息以及曲率信息等，所述高程信息可以反映目标区域的某个栅格的地形特征高程点、重要地理目标附近的高程点或者分布范围上的关键高程点，所述坡度信息可以反映目标区域的某个栅格的陡缓的程度，所述曲率信息可以反映目标区域的某个栅格的凹凸情况。

可选地，确定所述目标区的各功能区的方法包括：对所述遥感影像信息进行预处理，其中，所述预处理包括大气校正、辐射校正以及边缘检测处理中的至少一种；分别对预处理后的遥感影像信息和地形信息进行特征提取，并将遥感影像特征和地形特征输入至所述功能区分类模型，确定所述目标区域的各功能区，其中，所述遥感影像特征包括所述遥感影像信息的均值、极大值以及极小值，所述地形信息包括高程信息、坡度信息以及曲率信息，所述地形特征分别包括所述高程信息、坡度信息以及曲率信息的均值、极大值以及极小值。

所述功能区分类模型为随机森林模型，所述功能区分类模型的训练方法，包括：获取初始森林模型；将历史时间段内的各功能区的样本遥感影像信息、样本地形信息输入至所述初始森林模型，确定各功能区的预测标签和预测标签的概率；基于所述预测标签、所述预测标签的概率和各功能区的样本标签，对所述初始森林模型的参数进行调整，直至所述预测标签与所述样本标签一致，且所述预测标签概率达到设定阈值，得到所述功能区分类模型。其中，所述概率指的是初始森林模型的输出的预测标签的可能性，通过迭代调整初始森林模型的参数，如果预测标签与所述样本标签一致，且预测标签概率达到设定阈值，则预测标签是样本标签的可能性较大，将该迭代次数下的初始森林模型作为功能区分类模型。所述设定阈值可以是一个较大值，例如设定阈值取值为0.9。可选地，在将所述样本遥感影像信息输入至初始森林模型之前，还可以对样本遥感影像信息进行预处理，例如，对样本遥感影像信息进行大气校正、辐射校正、边缘检测、假彩色合成处理等，以提高样本遥感信息的功能区分类模型的训练精度。

可以理解的是，功能区分类模型输出的各功能区包括目标区域的所有功能区，包括城镇建筑、城市绿地、水体、农田、裸土、山林等功能区，各功能区的滑坡发生概率不同。例如，城镇建筑和城镇绿地发生滑坡的概率极小，水体和山林发生滑坡的概率较大。需要说明的是，通过将各功能区对应的历史预测概率与历史概率阈值比较，筛选出目标功能区，对目标功能区进行针对性的滑坡预测，可以减小计算量，有利于提高目标区域的滑坡预测效率。

若通过前述方法确定目标区域的各功能区，并根据各功能区对应的标签筛选目标功能区，则S410可以替换为：获取目标功能区的各个设定时间段内每天的地理环境数据和滑坡影响因子。

为了提高滑坡影响因子在目标功能区的表征效果，在确定目标功能区之后，还可确定目标功能区的栅格的目标尺寸。可选地，可以通过两种方法确定目标尺寸。可选地，确定目标尺寸划分的第一种方法为对目标功能区对应的栅格进行均匀划分。所述目标尺寸的均匀划分方法，包括：获取目标功能区的滑坡信息；基于所述滑坡信息确定所述目标区域的每个栅格的目标尺寸，其中，所述滑坡信息包括滑坡位置和滑坡面积；其中，所述基于所述滑坡信息确定所述目标区域的每个栅格的目标尺寸，包括：确定所述目标区域的每个栅格的初始尺寸和初始栅格数，以及根据所述滑坡信息确定滑坡栅格数和非滑坡栅格数，其中，所述滑坡栅格数是发生滑坡的栅格数量，所述非滑坡栅格数是未发生滑坡的栅格数量；如果所述滑坡栅格数与非滑坡栅格数的比值处于所述设定平衡区间内，将所述初始尺寸作为所述目标尺寸；如果所述滑坡栅格数与非滑坡栅格数的比值未处于所述设定平衡区间内，调节所述目标区域的每个栅格的尺寸，重新确定滑坡栅格数、非滑坡栅格数和当前栅格数；如果重新确定的滑坡栅格数与非滑坡栅格数的比值处于所述设定平衡区间内，且所述当前栅格数与所述初始栅格数的比值小于设定阈值，将调节后的每个栅格的尺寸作为所述目标尺寸。

其中，基于所述滑坡信息确定所述目标区域的每个栅格的目标尺寸，包括：获取所述目标区域的各雨量站的降雨数据、所述目标区域的每个栅格的初始尺寸和初始栅格数，以及根据所述滑坡信息确定滑坡栅格数和非滑坡栅格数，其中，所述滑坡栅格数是发生滑坡的栅格数量，所述非滑坡栅格数是未发生滑坡的栅格数量；根据特定数量的雨量站的降雨数据计算任一当前栅格对应的雨量站的降雨预测值，基于所述降雨预测值与当前栅格对应的雨量站的实测雨量值计算降雨误差；如果所述降雨误差小于设定误差阈值，且所述滑坡栅格数与所述非滑坡栅格数的比值处于设定平衡区间内，将所述初始尺寸作为所述目标尺寸；如果所述降雨误差大于设定误差阈值，调节所述目标区域的每个栅格的尺寸，根据调节后的所述任一栅格对应的雨量站的降雨预测值与实测雨量值重新计算降雨误差；如果重新计算的降雨误差小于所述设定误差阈值，且重新确定的滑坡栅格数与重新确定的非滑坡栅格数的比值处于设定平衡区间内，且当前栅格数与所述初始栅格数的比值小于设定阈值，将调节后的栅格的尺寸作为所述目标尺寸。

本实施例通过上述方式确定滑坡栅格数和非滑坡栅格数，以根据实际的滑坡信息和降雨量确定栅格的目标尺寸，进而使滑坡影响因子在目标尺寸下表征效果最好，有利于提高滑坡发生概率的预测准确度。

可选地，确定目标尺寸的第二种方法为对目标功能区对应的栅格进行不均匀划分。所述目标尺寸的栅格的不均匀划分方法，包括：获取目标区域的第一栅格尺寸和第二栅格尺寸，分别在所述第一栅格尺寸下和所述第二栅格尺寸下获取所述目标区域的滑坡影响因子，其中，所述第二栅格尺寸大于所述第一栅格尺寸；分别基于所述第一栅格尺寸下的滑坡影响因子和第二栅格尺寸下的滑坡影响因子的分布特征，确定所述第二栅格尺寸是否为期望栅格尺寸，其中，所述期望栅格尺寸小于所述第二栅格尺寸且大于或等于所述第一栅格尺寸；如果否，基于特定尺度因子，迭代调整所述第二栅格尺寸；如果当前迭代次数对应的当前栅格尺寸为所述期望栅格尺寸，将所述期望栅格尺寸对应的各栅格的每天的滑坡影响因子输入至滑坡预测模型，基于所述滑坡预测模型确定各栅格滑坡的发生概率。

其中，所述分别基于所述第一栅格尺寸下的滑坡影响因子和第二栅格尺寸下的滑坡影响因子的分布特征，确定所述第二栅格尺寸是否为期望栅格尺寸，包括：基于所述第一栅格尺寸下的滑坡影响因子的分布特征，对所述第二栅格尺寸下的滑坡影响因子的分布特征进行显著性检验；如果所述第二栅格尺寸下的滑坡影像因子通过显著性检验，确定所述第二栅格尺寸为所述期望栅格尺寸，否则，所述第二栅格尺寸不是所述期望栅格尺寸。所述分别基于所述第一栅格尺寸下的滑坡影响因子和第二栅格尺寸下的滑坡影响因子的分布特征，确定所述第二栅格尺寸是否为期望栅格尺寸，包括：基于所述第一栅格尺寸下的滑坡影响因子的分布特征计算第一特征数据，基于所述第二栅格尺寸下的滑坡影响因子的分布特征计算第二特征数据；其中，所述第一特征数据和所述第二特征数据包括方差、均值中的至少一个；将所述第一特征数据与所述第二特征数据之间的差值与设定阈值比较；如果所述差值小于所述设定阈值，确定所述第二栅格尺寸为所述期望栅格尺寸，否则，所述第二栅格尺寸不是所述期望栅格尺寸。

其中，所述基于特定尺度因子，迭代调整所述第二栅格尺寸，得到当前迭代次数下的当前栅格尺寸，包括：按照所述特定尺度因子迭代缩小所述第二栅格尺寸，得到所述当前迭代次数下的当前栅格尺寸。

通过对目标尺寸的栅格进行不均匀划分，使滑坡影响因子在划分后的栅格尺寸下同时兼顾保留丰富的特征信息并精简数据的冗余度的优势；在后续预测滑坡概率时，根据不同栅格尺寸对应的栅格内的滑坡影响因子，以天为单位将滑坡影响因子输入至滑坡预测模型中，预测滑坡发生概率，提高了滑坡预测的准确度。

本实施例中，目标尺寸可以是将初始尺寸进行多次调节后得到的，可以将将目标尺寸作为第一栅格尺寸。为了提高滑坡预测的准确性，还可以对第一栅格尺寸进行重采样，结合重采样的栅格尺寸的特征信息进行滑坡预测。具体方法包括：获取目标区域的第一栅格尺寸，并确定第一栅格尺寸重采样后的第二栅格尺寸，所述第二栅格尺寸大于所述第一栅格尺寸，根据第一栅格尺寸将第二栅格尺寸对应的初始栅格划分成多个栅格，并基于第一栅格尺寸提取第二栅格尺寸的栅格下的滑坡影响因子的特征信息，将特征信息和滑坡影响因子输入至第一预设模型以及第二预设模型进行滑坡预测。其中，特征信息的提取方法为：获取当前栅格的八邻域栅格内的滑坡影响因子的特征值；根据所述八邻域栅格内的特征值，确定所述当前栅格的特征信息。

本实施例通过将特征信息和滑坡影响因子结合确定各栅格滑坡的发生概率，可以增加滑坡影响因子的数据量，根据特征信息可以更准确的确定各栅格滑坡的发生概率，提高了滑坡预测的准确性。

S420、基于降雨插值模型，根据地理环境数据确定目标区域的降雨量。

S430、基于第一预设模型，根据降雨量和滑坡影响因子确定每天滑坡的发生概率。

S440、如果当天滑坡的发生概率大于预设概率阈值，基于第二预设模型，根据当前天的降雨量和滑坡影响因子预测各个栅格滑坡的发生概率。

可选地，确定当前天的各个栅格滑坡的发生概率之后，还可以将所述当前天的各个栅格的发生概率与所述目标区域的预警阈值进行比较，基于得到的各个栅格的发生概率对应的预警等级确定所述目标区域的滑坡的发生等级，其中，所述预警阈值根据各区域栅格滑坡的第一系数和第二系数确定。

其中，所述第一系数和第二系数的确定方法包括：获取各区域栅格滑坡的设定时间段内的已发生滑坡的历史概率；基于所述历史概率的分布特征确定第一已确定概率区间和第二已确定概率区间；分别计算所述第一已确定概率区间和所述第二已确定概率区间内的同一风险等级的概率阈值与对应系数的乘积之和，得到中间已确定概率；如果所述中间已确定概率未达到设定评价指标，迭代调整各风险等级的概率阈值的对应系数，直至所述中间已确定概率达到所述设定评价指标，根据达到所述设定评价指标的对应系数确定第一系数和第二系数。

其中，确定所述预警阈值的方法，包括：基于所述各个栅格滑坡的发生概率的分布特征确定第一预测概率区间和第二预测概率区间；计算所述第一预测概率区间内各风险等级与所述第一系数的第一乘积，以及计算所述第二预测概率区间内各风险等级与所述第二系数的第二乘积，将所述第一乘积与所述第二乘积的和作为各风险等级的预警阈值。

其中，所述基于所述历史概率的分布特征确定所述第一已确定概率区间和所述第二已确定概率区间，包括：确定所述历史概率和所述历史概率对应的次数；根据所述历史概率和各所述历史概率对应的滑坡发生次数，确定所述历史概率的密集度分布特征和断点分布特征；基于所述密集度分布特征确定所述第一已确定概率区间，并基于所述断点分布特征确定所述第二已确定概率区间。

可以理解的是，上述方式基于各区域栅格滑坡的设定时间段内的已发生滑坡的历史概率，根据历史概率的分布特征确定第一已确定概率区间和第二已确定概率区间，根据第一已确定概率区间、第二已确定概率区间内的各风险等级的概率阈值以及设定评价指标确定各区域的第一系数和第二系数，当获取不同区域的发生概率后，可以根据不同区域对应的第一系数、第二系数和发生概率灵活确定不同区域的预警阈值，有利于后续根据各区域对应的预警阈值准确确定该区域的风险等级。

其中，所述基于得到的各个栅格的发生概率对应的预警等级确定所述目标区域的滑坡的发生等级，包括：筛选大于所述预警阈值中的第一等级的目标等级；计算所述目标等级对应的栅格的平均等级；基于所述平均等级、设定系数、目标等级对应的栅格数与目标区域内所有栅格数的比值，确定所述目标区域的滑坡的发生等级。

其中，目标区域的滑坡的发生等级的计算公式为：

其中，α为设定系数，通过对目标区域的滑坡的历史发生等级进行贝叶斯计算得到，

为目标区域的栅格的平均等级，p为目标等级对应的栅格数与目标区域内所有栅格数的比值。

实施例五

图5为本发明实施例五提供的一种滑坡的预测装置的结果示意图，如图5所述，该滑坡的预测装置包括：数据获取模块510、降雨预测模块520和滑坡预测模块530。

其中，数据获取模块510，用于获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，其中，所述地理环境信息包括地理位置数据、大气数据、地形数据和下垫面数据；

降雨预测模块520，用于基于降雨插值模型，根据所述地理环境数据确定所述目标区域的降雨量；

滑坡预测模块530，用于分别将所述滑坡影响因子和所述降雨量输入至滑坡预测模型，基于所述滑坡预测模型确定各栅格滑坡的发生概率；

可选地，所述地理位置数据包括经纬度信息和高程信息；所述大气数据包括风向信息、风带信息和气压带信息中的至少一项；所述地形数据包括坡度信息、坡向信息和山脉走向信息中的至少一项；所述下垫面数据包括植被覆盖度信息、水域距离和城市雨岛信息中的至少一项。

可选地，该装置还包括：降雨插值模型训练模块；其中，降雨插值模型训练模块，用于获取初始降雨模型，确定所述初始模型的初始权值矩阵和初始阈值，并计算所述初始降雨模型的适应度；

将历史时间段内的样本地理环境信息输入至所述初始降雨模型，确定预测降雨量，根据所述预测降雨量和所述历史时间段的实测降雨量，并基于遗传算法迭代调整所述初始模型的初始权值矩阵和初始阈值；

基于迭代调整后的权值矩阵和阈值，调整所述初始降雨模型并计算调整后的模型的适应度，直至重新计算的适应度达到期望值，将达到所述期望值的适应度对应的模型作为所述降雨插值模型。

可选地，降雨插值模型训练模块还用于，计算所述预测降雨量和所述实测降雨量之间的均方根误差；

如果所述均方根误差大于预设误差阈值，迭代调整所述初始模型的权值编码和阈值编码，并基于调整后的权值编码和阈值编码确定调整后的权值矩阵和阈值，直至所述均方根误差不小于所述预设误差阈值。

可选地，该装置还包括：滑坡预测模型的训练模块；其中，滑坡预测模型的训练模块，用于获取初始预测模型，并分别提取所述历史滑坡数据和历史非滑坡数据的特征，以及分别确定所述历史滑坡数据和历史非滑坡数据对应的标签；

基于历史滑坡特征、历史非滑坡特征、历史滑坡标签和历史非滑坡标签确定所述初始预测模型的初始分类硬度，根据所述初始分类硬度确定所述历史非滑坡数据的分箱个数，基于所述分箱个数确定所述初始预测模型的各分箱的自步因子；

基于所述自步因子确定每个分箱的下采样比例，并基于所述下采样比例确定各分箱内的下采样的历史非滑坡数据；

将所述下采样的历史非滑坡数据和所述历史滑坡数据输入至所述初始预测模型，基于所述初始预测模型输出的滑坡概率和历史滑坡概率确定所述初始预测模型的损失函数，基于所述损失函数在单个样本上的训练分类硬度，迭代调整自步因子和每个分箱的下采样比例；

根据迭代调整的所述自步因子和所述每个分箱的下采样比例调整所述初始预测模型，直至损失函数达到设定阈值，得到所述滑坡预测模型。

可选地，每个分箱的下采样比例为每个分箱的自步因子与所有分箱的自步因子的比值，所述自步因子通过将分箱个数、分箱标签数的相反数以及迭代次数之和加1得到。

可选地，滑坡预测模块530还用于，基于第一预设模型，根据所述降雨量和所述滑坡影响因子确定每天滑坡的发生概率；

如果当天滑坡的发生概率大于预设概率阈值，基于第二预设模型，根据当前天的降雨量和所述滑坡影响因子确定所述目标区域的滑坡预测概率。

本发明实施例所提供的滑坡的预测装置可执行本发明任意实施例所提供的滑坡的预测方法，具备执行方法相应的功能模块和有益效果。

实施例六

图6为本发明实施例六提供的一种滑坡的预测设备的结构示意图，如图6所示，该设备包括处理器610、存储器620、输入装置630和输出装置640；设备处理器610的数量可以是一个或多个，图6中以一个处理器610为例；设备中的处理器610、存储器620、输入装置630和输出装置640可以通过总线或其他方式连接，图6中以通过总线连接为例。

存储器620作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的滑坡的预测方法对应的程序指令/模块(例如，滑坡的预测装置中的数据获取模块510、降雨预测模块520和滑坡预测模块530)。处理器610通过运行存储在存储器620中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的滑坡的预测方法。

存储器620可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器620可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器620可进一步包括相对于处理器610远程设置的存储器，这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置630可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。

实施例七

发明实施例七还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种滑坡的预测方法，该方法包括：

获取目标区域的各个设定时间段内每天的地理环境数据和滑坡影响因子，其中，所述地理环境信息包括地理位置数据、大气数据、地形数据和下垫面数据；

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的滑坡的预测方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述用滑坡的预测装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种滑坡的预测方法，其特征在于，包括：

2.根据权利要求1所述的预测方法，其特征在于，所述地理位置数据包括经纬度信息和高程信息；所述大气数据包括风向信息、风带信息和气压带信息中的至少一项；所述地形数据包括坡度信息、坡向信息和山脉走向信息中的至少一项；所述下垫面数据包括植被覆盖度信息、水域距离和城市雨岛信息中的至少一项。

3.根据权利要求1所述的预测方法，其特征在于，所述降雨插值模型为反向传播模型，所述降雨插值模型的训练方法，包括：

获取初始降雨模型，确定所述初始模型的初始权值矩阵和初始阈值，并计算所述初始降雨模型的适应度；

4.根据权利要求3所述的预测方法，其特征在于，所述根据所述预测降雨量和所述历史时间段的实测降雨量，并基于遗传算法迭代调整所述初始模型的初始权值矩阵和初始阈值，包括：

计算所述预测降雨量和所述实测降雨量之间的均方根误差；

5.根据权利要求1所述的预测方法，其特征在于，所述滑坡预测模型的训练方法，包括：

获取初始预测模型，并分别提取所述历史滑坡数据和历史非滑坡数据的特征，以及分别确定所述历史滑坡数据和历史非滑坡数据对应的标签；

6.根据权利要求1所述的预测方法，其特征在于，每个分箱的下采样比例为每个分箱的自步因子与所有分箱的自步因子的比值，所述自步因子通过将分箱个数、分箱标签数的相反数以及迭代次数之和加1得到。

7.根据权利要求1所述的预测方法，其特征在于，所述分别将所述滑坡影响因子和所述降雨量输入至滑坡预测模型，基于所述滑坡预测模型确定各栅格滑坡的发生概率，包括：

基于第一预设模型，根据所述降雨量和所述滑坡影响因子确定每天滑坡的发生概率；

如果当天滑坡的发生概率大于预设概率阈值，基于第二预设模型，根据当前天的降雨量和所述滑坡影响因子预测各个栅格滑坡的发生概率。

8.一种滑坡的预测装置，其特征在于，包括：

9.一种滑坡的预测设备，其特征在于，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的滑坡的预测方法。

10.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的滑坡的预测方法。