CN113256019A

CN113256019A - 一种基于无监督表征学习的地质灾害隐患敏感性预测方法

Info

Publication number: CN113256019A
Application number: CN202110658121.5A
Authority: CN
Inventors: 谢潇; 陈力; 张叶廷; 伍庭晨; 孔琪
Original assignee: Zhejiang Zhonghaida Space Information Technology Co ltd
Current assignee: Zhejiang Zhonghaida Space Information Technology Co ltd
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2021-08-13

Abstract

本发明涉及一种基于无监督表征学习的地质灾害隐患敏感性预测方法，包括以下步骤：步骤1，训练区数据特征提取；步骤2，无监督表征学习机制构建；步骤3，地灾敏感性分析模型训练；步骤4，地灾敏感性预测评估。本发明的模型生成部分由两个玻尔兹曼机（RBMs）和一个去噪自动编码机（DAE）堆叠而成，并由逐层贪婪预训练方法初始化。然后，提出一种基于对抗机制的迁移学习策略提高孕灾环境知识的可迁移性。基于以上两个表征学习过程，最后应用元学习思想训练一种适于小样本学习的通用中间模型。同时，模型的元训练过程时保证了小样本学习模型的预测精度，实现了区域局部的精准快速预测，并提升了模型对新任务场景的泛化性。

Description

一种基于无监督表征学习的地质灾害隐患敏感性预测方法

技术领域

本发明属于地理空间数据处理技术领域，特别涉及一种基于无监督表征学习的地质灾害隐患敏感性预测方法。

背景技术

我国地灾危害涵盖范围广，孕灾环境复杂，潜在隐患威胁着国家重大建设项目实施安全，精准评估广域范围滑坡易滑性，变“被动救灾避灾”为“主动防灾减灾”是国家重大项目全生命周期建设亟需克服的难题！滑坡敏感图(LSM)等方法评估了研究区域每一个位置上发生地灾的可能性高低，对风险识别和防控具有重要借鉴意义。近十年，数据驱动方法在地灾敏感性分析方面逐渐崭露头角，但在面对复杂广域滑坡场景任务时，仍面临数据获取不全、质量差、标记不准确、孕灾环境知识可迁移性差等问题。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种基于无监督表征学习的地质灾害隐患敏感性预测方法。

为了实现上述发明的目的，本发明采用以下技术方案：

一种基于无监督表征学习的地质灾害隐患敏感性预测方法，包括以下步骤：

步骤1，训练区数据特征提取：执行训练区原始地灾数据预处理，提取致灾因子，构成未标记样本向量；

步骤2，无监督表征学习机制构建：以未标记样本向量代入受限玻尔兹曼机并在深度玻尔兹曼机中进行训练，将训练完成的转换结果输入去噪的自动编码器，通过部分破坏输入数据，重构数据的学习表示，构建可迁移特征学习模块；

步骤3，地灾敏感性分析模型训练：耦合可迁移特征学习模块与回归模块构建模型并输入部分标记数据训练，对不可见数据进行微调和适应，输出地灾敏感性预测模型；

步骤4，地灾敏感性预测评估：将测评区域栅格化，采集样本向量，将交叉熵定义为判别模型的目标函数，该函数测量训练标签与模型分布之间的接近度，并将输入向量转置到softmax分类器函数中输出预测地灾敏感性图谱，最终获得测评区地灾敏感性预测结果。

作为优选方案：所述步骤1中包括以下子步骤：

步骤1.1，训练区原始地灾数据预处理：

步骤1.1.1，原始数据的矢量化和其他资料数据的录入：将不同比例尺的地质图、地形图数据矢量化；对野外勘察报告、典型地质灾害监测报告文件资料中对研究区内的地质灾害体基本信息进行数据提取和综合分析，并最终将结果录入到研究区地质灾害分布文件中；

步骤1.1.2，GIS软件的选择和数据导入：在准备完成GIS软件分析所需的多源数据后，选择ArcGIS软件作为最终的多源数据整合GIS平台；

步骤1.1.3，建立统一坐标系：多源数据的原始数据的坐标系统并不统一，选择西安80坐标系作为标准坐标系，并在ArcGIS软件环境下，对所有数据赋以西安80坐标系，使坐标系统得到统一；

步骤1.1.4，数据校正和配准：对导入到ArcGIS软件中的多源数据进行数据校正和拼接，以消除由于数据形变和位置偏移所造成的数据错误，并以经过相关遥感图像处理软件进行遥感数据预处理操作的遥感影像为本底数据，进行多源数据的校正与配准，保证多源数据中同名点的空间位置一致性；

步骤1.1.5，数据格式转换：多源数据在GIS平台上的最终数据格式采用栅格数据，将经过上述步骤处理的多源数据矢量数据利用ArcGIS软件提供的数据转换功能转换为栅格数据，并选择一种格式作为数据组织的标准格式；

步骤1.1.6，多源数据叠加选择：在完成了多源数据格式转换和重采样工作之后，选择相应的多源数据集合，实现多源数据叠加，为后续多尺度下地质灾害隐患提取模型的建立提供数据支持；

步骤1.2，提取致灾因子，由致灾因子构成未标记样本向量：收集点位清单，包括已发生和可能发生地灾的地点，对于每个危险位置，要考虑可能导致地灾发生的因素，这些因素包括敏感性等级、土地利用、地层、数字高程模型、坡向、坡度、曲率、归一化植被指数、砂分布、粘土分布、泥沙分布、植被、土壤侵蚀、地形湿度指数、河流功率指数以及到排水的距离和到道路的距离。

作为优选方案：所述步骤2中，无监督表征学习机制构建包括以下子步骤：

步骤2.1，多层RBM训练：受限玻尔兹曼机是一种由两层结构组成的随机神经网络，m和n为可见层和隐含层单元数；v表示输入可见单位的状态向量，h表示推断隐藏单位的状态向量；a，b分别表示可见单元和隐藏单元的偏差；w表示权重矩阵，并引入了一个基于能量的模式来描述状态v，h的联合概率分布，如下所示：

下式给出训练目标，它的目的是最大化给定样本集

：

模型参数数值迭代采用梯度上升法，如下：

式中，

表示学习率；显然，关键是计算log概率除以

的偏导数，对于集合中的每个样本，其导数为下式：

其中包含两个期望，一个称为模型期望，另一个称为依赖数据的期望，上式表示单样本

的导数，集合S的导数如下式累积和展开：

其中

表示

的jth节点状态；

步骤2.2，DAE训练包括以下子步骤：

步骤2.2.1，输入经过深度玻尔兹曼机训练后的样本特征状态向量x，通过部分破坏输入数据得到x’，促使训练模型成为抗噪声的；

步骤2.2.2，将x’映射到一个隐藏层y，隐层特征维度一般低于原始特征维度，降维的同时学习更稠密更有意义的表示；

步骤2.2.3，将隐藏层y解码重构为z，以最小化重构误差为目标进行模型训练，最终获得具有对抗性的样本特征。

作为优选方案：所述步骤3中，地灾敏感性分析模型训练包括以下子步骤：

步骤3.1，回归预测：回归预测部分为预测概率的全连接层，将上述经过表征学习后高度抽象化的特征进行整合，然后进行归一化，对各种分类情况输出一个概率；

步骤3.2，特征迁移：输入测评区地灾数据进行可迁移的特征学习，将交叉熵定义为回归预测的目标函数，通过测评区部分标记样本对不可见模型参数进行微调和适应。

作为优选方案：所述步骤4中，地灾敏感性预测评估包括以下内容：将测评区域栅格化，通过属性采集方法生成样本向量，并将向量输入到步骤3训练的模型中，最终获得测评区地灾敏感性预测结果。

本发明设计了一种无监督模块堆叠的表征学习方法。模型生成部分由两个玻尔兹曼机（RBMs）和一个去噪自动编码机（DAE）堆叠而成，并由逐层贪婪预训练方法初始化。然后，提出一种基于对抗机制的迁移学习策略提高孕灾环境知识的可迁移性。基于以上两个表征学习过程，最后应用元学习思想训练一种适于小样本学习的通用中间模型。同时，模型的元训练过程时保证了小样本学习模型的预测精度，实现了区域局部的精准快速预测，并提升了模型对新任务场景的泛化性。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的限定。

图1为本发明方法原理示意图；

图2为本发明方法步骤流程图；

图3为本发明方法的测评区地灾敏感性预测结果示意图。

具体实施方式

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、部件和/或它们的组合。

下面结合附图与实施例对本发明作进一步说明：

如图1和图2所示的一种基于无监督表征学习的地质灾害隐患敏感性预测方法，包括以下步骤：

步骤1，训练区数据特征提取：执行训练区原始地灾数据预处理，提取致灾因子，构成未标记样本向量；所述步骤1中包括以下子步骤：

步骤1.1，训练区原始地灾数据预处理：

步骤1.1.1，原始数据的矢量化和其他资料数据的录入：在地质灾害隐患识别中，需要用到不同比例尺的地质图、地形图等的矢量化数据，涉及到这些收集到的图件资料的矢量化工作；同时，地质灾害体的基本信息来源广泛但是较为分散，需要从野外勘察报告、典型地质灾害监测报告等多种文件资料中对研究区内的地质灾害体基本信息进行数据提取和综合分析，并最终将结果录入到研究区地质灾害分布文件中。

步骤1.1.2，GIS软件的选择和数据导入：在准备完成GIS软件分析所需的多源数据后，选择ArcGIS软件作为最终的多源数据整合GIS平台。

步骤1.1.3，建立统一坐标系：多源数据的原始数据的坐标系统并不统一，选择西安80坐标系作为标准坐标系，并在ArcGIS软件环境下，对所有数据（栅格数据与矢量数据）赋以西安80坐标系，使坐标系统得到统一。

步骤1.1.4，数据校正和配准：对导入到ArcGIS软件中的多源数据进行数据校正和拼接，以消除由于数据形变和位置偏移所造成的数据错误，并以经过相关遥感图像处理软件进行遥感数据预处理操作的遥感影像为本底数据，进行多源数据的校正与配准，保证多源数据中同名点的空间位置一致性。

步骤1.1.5，数据格式转换：多源数据在GIS平台上的最终数据格式采用栅格数据。将经过上述步骤处理的多源数据矢量数据利用ArcGIS软件提供的数据转换功能（ToRaster）转换为栅格数据，并选择一种格式作为数据组织的标准格式。例如以Landsat-8遥感卫星OLI传感器获取的影像数据为参照数据，对其余所有的栅格数据进行栅格重采样操作（Resample），从而可以得到栅格大小统一、位置对应的不同数据层。

步骤1.1.6，多源数据叠加选择：在完成了多源数据格式转换和重采样工作之后，选择相应的多源数据集合，实现多源数据叠加，为后续多尺度下地质灾害隐患提取模型的建立提供数据支持。

步骤1.2，提取致灾因子，由致灾因子构成未标记样本向量：收集点位清单，包括已发生和可能发生地灾的地点，对于每个危险位置，要考虑可能导致地灾发生的因素，这些因素对地灾发生的影响用主题信息表示。它们包括敏感性等级、土地利用、地层、数字高程模型（DEM）、坡向、坡度、曲率、归一化植被指数（Normalized Difference Vegetation Index，NDVI）、砂分布、粘土分布、泥沙分布、植被、土壤侵蚀、地形湿度指数（TopographicHumidity Index，TWI）、河流功率指数（SPI）、到排水的距离和到道路的距离等相关内容。

步骤2，无监督表征学习机制构建：以未标记样本向量代入受限玻尔兹曼机（Restricted Boltzmann Machine，RBM），并在deepBM（深度玻尔兹曼机）中进行训练，将训练完成的转换结果输入去噪的自动编码器（Denoising Autoencoder，DAE），通过部分破坏输入数据，重构数据的学习表示，构建可迁移特征学习模块；所述步骤2中，无监督表征学习机制构建包括以下子步骤：

步骤2.1，多层RBM训练：受限玻尔兹曼机（Restricted Boltzmann Machine，RBM）是一种由两层结构组成的随机神经网络。m和n为可见层和隐含层单元数；v表示输入可见单位的状态向量，h表示推断隐藏单位的状态向量；a，b分别表示可见单元和隐藏单元的偏差，w表示权重矩阵。并引入了一个基于能量的模式来描述状态v，h的联合概率分布，如下所示：

下式给出训练目标，它的目的是最大化给定样本集

：

模型参数数值迭代采用梯度上升法，如下：

式中，

表示学习率；显然，关键是计算log概率除以

的偏导数，对于集合中的每个样本，其导数为下式：

的导数，集合S的导数如下式累积和展开：

其中

表示

的jth节点状态；

步骤2.2，DAE训练包括以下子步骤：

步骤3，地灾敏感性分析模型训练：耦合可迁移特征学习模块与回归模块构建模型并输入部分标记数据训练，对不可见数据进行微调和适应，输出地灾敏感性预测模型；所述步骤3中，地灾敏感性分析模型训练包括以下子步骤：

步骤3.1，回归预测：回归预测部分为预测概率的全连接层（FC），其作用是将上述经过表征学习后高度抽象化的特征进行整合，然后进行归一化，对各种分类情况输出一个概率；

步骤4，地灾敏感性预测评估：将测评区域栅格化，采集样本向量，将交叉熵定义为判别模型的目标函数，该函数测量训练标签与模型分布之间的接近度，并将输入向量转置到softmax分类器函数中输出预测地灾敏感性图谱，最终获得测评区地灾敏感性预测结果。所述步骤4中，地灾敏感性预测包括以下内容：将测评区域栅格化，通过属性采集方法生成样本向量，并将向量输入到步骤3训练的模型中，最终获得测评区地灾敏感性预测结果，如图3所示。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。