CN114036841A - 基于半监督支持向量机模型的滑坡易发性预测方法及系统 - Google Patents
基于半监督支持向量机模型的滑坡易发性预测方法及系统 Download PDFInfo
- Publication number
- CN114036841A CN114036841A CN202111323835.7A CN202111323835A CN114036841A CN 114036841 A CN114036841 A CN 114036841A CN 202111323835 A CN202111323835 A CN 202111323835A CN 114036841 A CN114036841 A CN 114036841A
- Authority
- CN
- China
- Prior art keywords
- landslide
- support vector
- vector machine
- training
- susceptibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 136
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012549 training Methods 0.000 claims abstract description 110
- 238000012360 testing method Methods 0.000 claims abstract description 98
- 238000011160 research Methods 0.000 claims abstract description 82
- 238000011156 evaluation Methods 0.000 claims abstract description 56
- 239000002689 soil Substances 0.000 claims description 21
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000000638 solvent extraction Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000003190 augmentative effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 21
- 238000010801 machine learning Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 18
- 238000011161 development Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 239000011435 rock Substances 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000013106 supervised machine learning method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Geometry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Pit Excavations, Shoring, Fill Or Stabilisation Of Slopes (AREA)
Abstract
本发明涉及一种基于半监督支持向量机模型的滑坡易发性预测方法及系统。所述方法包括:获取研究区域的评价因子和已知滑坡样本;计算各评价因子的确定性系数值;根据确定性系数值对研究区域进行易发性分区,分为五类滑坡易发性级别;选取非滑坡样本与已知滑坡样本共同构成第一训练测试数据集对支持向量机模型进行训练测试;采用训练测试好的支持向量机模型预测得到研究区域的初始滑坡易发性值,从而确定扩充后的滑坡样本和二次选取的非滑坡样本对支持向量机模型进行训练测试,进而生成半监督支持向量机模型对研究区域进行滑坡易发性预测。本发明方法简化了滑坡样本数据采集过程,提高了滑坡易发性预测的精度。
Description
技术领域
本发明涉及地质灾害预测技术领域,特别是涉及一种基于半监督支持向量机模型的滑坡易发性预测方法及系统。
背景技术
特殊的地形地貌、极端气候等因素导致滑坡灾害频繁发生,往往对当地的居民安全、建筑设施和环境等造成严重损失。采用合适的评价模型或方法计算滑坡灾害发生的可能性,然后开展滑坡易发性评价,识别出极易发生滑坡的区域,减少滑坡的不利影响,对于防灾减灾具有重要的指导意义。因此有必要加强区域滑坡易发性预测研究以指导滑坡高发地区的防灾减灾工作。
机器学习是一门多学科交叉专业,包括了概率论知识、统计学知识、近似理论知识和算法复杂理论知识,以计算机为工具并致力于真实、实时地模拟人类学习行为,并将现有知识结构重新组织来提高学习效率。
机器学习有下面几种定义:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验来优化计算机程序的性能标准。
目前机器学习被广泛用于滑坡易发性预测,其主要是利用滑坡和非滑坡样本及其评价因子等数据开展模型训练和测试,以此实现易发性的计算。机器学习被认为具有比数理统计模型更好的非线性预测能力,其能预测出更加准确的滑坡易发性。按照是否利用了已知样本数据作为模型输出变量,可将机器学习模型分为无监督和全监督机器学习两大类。
虽然监督和无监督机器学习预测滑坡易发性取得了一系列的成果,但仍存在一些不足。一方面,无监督机器学习虽然在训练和测试过程中不需要已知滑坡和非滑坡样本作为模型输出变量,但是由于缺乏滑坡和非滑坡等先验知识的引导,导致无监督机器学习的建模准确性难以得到保证。另一方面,基于全监督机器学习的滑坡易发性预测建模也存在一些不足,其主要表现为:1)野外调查并获取滑坡样本数据的难度较大、费用较高,在大尺度研究区内一般难以获得较全的滑坡样本;2)建模过程中在整个研究区内随机选取非滑坡样本的方式给全监督机器学习的训练和测试过程带来大量误差,降低了滑坡易发性预测的精度。
发明内容
本发明的目的是提供一种基于半监督支持向量机模型的滑坡易发性预测方法及系统,以简化滑坡样本数据采集过程,提高滑坡易发性预测的精度。
为实现上述目的,本发明提供了如下方案:
一种基于半监督支持向量机模型的滑坡易发性预测方法,包括:
获取研究区域的评价因子和已知滑坡样本;所述评价因子包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型;
计算各所述评价因子的确定性系数值;
根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别;所述五类滑坡易发性级别包括极低易发区、低易发区、中等易发区、高易发区和极高易发区;
在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集;
根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型;
采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值;
根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集;
根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型;
采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。
可选地,所述计算各所述评价因子的确定性系数值,具体包括:
将各所述评价因子的确定性系数值CF归一化至[0,1]之间。
可选地,所述根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型,具体包括:
将所述第一训练测试数据集按照7:3的比例随机划分为训练集和测试集;
采用所述训练集对所述支持向量机模型进行训练,采用所述测试集对所述支持向量机模型进行测试,生成所述训练测试好的支持向量机模型。
可选地,所述根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,具体包括:
将所述初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;
利用自然间断点分级法,根据所述初始滑坡易发性图确定所述研究区域的极高易发区和极低易发区;
获取所述研究区域的遥感影像;
根据所述遥感影像分析区域滑坡遥感解译标志;
根据所述滑坡遥感解译标志解译出所述极高易发区内的滑坡隐患点作为扩充滑坡样本;所述扩充滑坡样本与所述已知滑坡样本共同构成所述扩充后的滑坡样本;
从所述极低易发区中随机选取与所述扩充后的滑坡样本等比例的栅格单元,作为所述二次选取的非滑坡样本。
一种基于半监督支持向量机模型的滑坡易发性预测系统,包括:
数据获取模块,用于获取研究区域的评价因子和已知滑坡样本;所述评价因子包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型;
系数计算模块,用于计算各所述评价因子的确定性系数值;
区域划分模块,用于根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别;所述五类滑坡易发性级别包括极低易发区、低易发区、中等易发区、高易发区和极高易发区;
数据集构成模块,用于在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集;
第一模型训练模块,用于根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型;
第一模型预测模块,用于采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值;
数据集扩充模块,用于根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集;
第二模型训练模块,用于根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型;
第二模型预测模块,用于采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。
可选地,所述系数计算模块具体包括:
归一化单元,用于将各所述评价因子的确定性系数值CF归一化至[0,1]之间。
可选地,所述第一模型训练模块具体包括:
数据集划分单元,用于将所述第一训练测试数据集按照7:3的比例随机划分为训练集和测试集;
模型训练单元,用于采用所述训练集对所述支持向量机模型进行训练,采用所述测试集对所述支持向量机模型进行测试,生成所述训练测试好的支持向量机模型。
可选地,所述数据集扩充模块具体包括:
初始滑坡易发性图生成单元,用于将所述初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;
自然间断点分级单元,用于利用自然间断点分级法,根据所述初始滑坡易发性图确定所述研究区域的极高易发区和极低易发区;
遥感影像获取单元,用于获取所述研究区域的遥感影像;
遥感解译标志分析单元,用于根据所述遥感影像分析区域滑坡遥感解译标志;
扩充滑坡样本解译单元,用于根据所述滑坡遥感解译标志解译出所述极高易发区内的滑坡隐患点作为扩充滑坡样本;所述扩充滑坡样本与所述已知滑坡样本共同构成所述扩充后的滑坡样本;
非滑坡样本选取单元,用于从所述极低易发区中随机选取与所述扩充后的滑坡样本等比例的栅格单元,作为所述二次选取的非滑坡样本。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种基于半监督支持向量机模型的滑坡易发性预测方法及系统,所述方法包括:获取研究区域的评价因子和已知滑坡样本;所述评价因子包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型;计算各所述评价因子的确定性系数值;根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别;所述五类滑坡易发性级别包括极低易发区、低易发区、中等易发区、高易发区和极高易发区;在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集;根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型;采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值;根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集;根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型;采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。本发明方法简化了滑坡样本数据采集过程,在支持向量机模型的基础上进一步提高了滑坡易发性预测建模性能,提高了滑坡易发性预测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于半监督支持向量机模型的滑坡易发性预测方法的流程图;
图2为本发明一种基于半监督支持向量机模型的滑坡易发性预测方法的原理示意图;
图3为本发明一种基于半监督支持向量机模型的滑坡易发性预测系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于半监督支持向量机模型的滑坡易发性预测方法及系统,以简化滑坡样本数据采集过程、提高滑坡易发性预测的精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
SVM(SupportVectorMachine,支持向量机)是将输入的数据映射在一个高维的空间,然后在此高维空间上进行线性分类的一种分类器。支持向量机是一种灵活且易于使用的机器学习算法,使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀疏性和稳健性的分类器。
支持向量机是一种二分类模型,它是建立在统计学原理基础上发展起来的一种分类预测模型,被各领域广泛使用。支持向量机在解决小样本、高维度、非线性问题方面比其他学习方法更合理、更有效。其基本原理就是找出一个最优超平面,使得这个最优超平面既能将两类样本点正确划分开,又能使得离超平面距离最近的样本点到该平面的几何间隔最大化。
另外,常见的支持向量机模型分为线性支持向量机与非线性支持向量机。在线性可分的情况下,通过求解一个约束条件下的极值问题,然后转化成它的对偶问题,就会得到简化的不等式约束极值问题,最终得到最优分类函数。而在实际分类问题中,分类问题往往是非线性的问题,即理想的分类面是非线性的。对非线性问题,可以通过非线性变换,将非线性问题转化为某个高维空间中的线性问题,在变换后的高维空间中求其最优分类面。支持向量机通过引入核函数巧妙地解决了低维输入空间向高维特征空间映射的问题。常用的核函数主要有:线性核函数、多项式核函数、RBF径向基函数及Sigmoid核函数等。SVM中有2个参数(c和g)对其性能有重要的影响。c是惩罚系数,是对误差的宽容度,c越大,越不能容忍。
前人使用支持向量机模型时,多默认采用径向基核函数(RBF),未考虑不同核函数下的评价模型对研究区评价结果预测精度的影响。因此,本发明采用不同核函数下的支持向量机模型开展研究区域易发性评价分析以提高精度,通过不断对比,最终确定最佳核函数下的评价模型。
支持向量机分类效果与核函数的选择有关。低维空间向量集通常难于划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题。也就是说,只要选用适当的核函数,就可以得到高维空间的分类函数。构建支持向量机的关键步骤是如何选择最优的核函数。
支持向量机最重要的优点之一就是支持向量机是一种有坚实理论基础的新颖的小样本学习方法,它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”,大大简化了通常的分类和回归等问题。
本发明基于确定性系数和半监督支持向量机模型耦合,提出了一种改进的区域滑坡易发性预测方法。本发明主要利用Matlab来对滑坡易发性进行预测建模,主要通过支持向量机模型中的准确率平均减少值和不纯度平均减少值来获取各评价因子重要性。
图1为本发明一种基于半监督支持向量机模型的滑坡易发性预测方法的流程图;图2为本发明一种基于半监督支持向量机模型的滑坡易发性预测方法的原理示意图。如图1和图2所示,本发明本发明一种基于半监督支持向量机模型的滑坡易发性预测方法包括:
步骤101:获取研究区域的评价因子和已知滑坡样本。
滑坡易发性指的是区域滑坡发生的空间概率,通过过去滑坡发生的类似的基础环境条件,来预测将来滑坡事件可能发生的空间位置。选择研究区域的影响因子(即评价因子)对准确可靠的滑坡易发性预测非常重要。
本发明根据研究区域的基础地质资料,基于ArcGIS平台与遥感影像目视解译来获取研究区域的地形地貌、水文环境、地层岩性和地表覆被四大类控制因素,细分为11类评价因子,包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型。
通过Matlab和ArcGIS平台管理并空间分析研究区域内的滑坡编录及相关影响因子,筛选出已知滑坡样本。所述影响因子为高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型这11类数据中的至少一种。
滑坡编录数据质量对一个研究区域易发性预测性能具有非常重要的影响。滑坡的编录有利于了解滑坡的位置、运动类型、触发次数、规模大小及与之相关的地质环境发育状况等信息。
在滑坡易发性预测过程中,应该依据研究区域的滑坡发育特征和影响因素以及研究区域的自然地理特征来选择具有代表性的高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型等影响因子来进行易发性预测。
步骤102:计算各所述评价因子的确定性系数值。
确定性系数是一种高效的定量分析法,确定性系数值计算公式为:
其中,PPa为地质灾害在评价因子a类中发生的概率,应用时为评价因子a类中存在的地质灾害个数与因子a类的面积的比值。PPs为地质灾害在整个研究区域发生的先验概率,即为整个研究区域的地质灾害的个数与研究区面积的比值。确定性系数值CF的变化区间为[-1,1],正值代表地质灾害发生的确定性高,较易发生地质灾害;负值代表地质灾害发生的确定性较低,不易发生地质灾害;当计算结果接近0表示该因子在分类中不能确定是否容易发生地质灾害。
此外,还需要在SPSS23软件中通过相关性分析计算各影响因子间的相关系数。在SPSS23软件中选择Pearson相关系数并检验显著性相关。首先看显著性,若小于0.05,则表示不同两个影响因子之间有线性关系。然后看相关系数,若相关系数的绝对值大于0.8是极强相关,0.6-0.8是强相关,0.4-0.6是中等程度相关,0.2-0.4是弱相关,小于0.2是不相关。若结果表明各影响因子间相关性不大,即表明各影响因子均可用作模型的输入变量。
因此,所述步骤102具体包括:
将各所述评价因子的确定性系数值CF归一化至[0,1]之间。
步骤103:根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别。
在ArcGIS软件中将已知的滑坡点(已知滑坡样本)导入,利用确定性系数值对研究区域进行易发性分区,分为五类滑坡易发性级别,包括:1-极低易发区、2-低易发区、3-中等易发区、4-高易发区和5-极高易发区。
步骤104:在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集。
在研究区域的非滑坡区(即:1-极低易发区和2-低易发区)中随机选择与已知滑坡点等比例的非滑坡点作为非滑坡样本。该非滑坡样本与已知滑坡样本共同组成模型的训练测试数据集。
具体地,在ArcGIS软件中将已知的滑坡编录的面文件转为栅格单元,同时在研究区域的非滑坡区中随机选择等比例的非滑坡栅格单元,共同组成模型的训练测试数据集,并进一步将其随机划分为两个部分:70%的数据集用于训练,剩下的30%用于测试。
在支持向量机模型训练测试过程中,将正样本已知的滑坡栅格单元用1表示,将负样本随机选择的非滑坡栅格单元用0表示。支持向量机模型的输出变量是各栅格单元位于0-1之间的概率值,且这些0-1概率值分布即反映了区域滑坡易发性的分布规律。
用训练测试好的支持向量机模型预测得到的整个研究区域的初始滑坡易发值,然后采用ArcGIS软件中中自然间断点分级法并结合滑坡易发性分布规律将研究区域划分为五类滑坡易发性级别:1-极低易发区.2-低易发区、3-中等易发区、4-高易发区和5-极高易发区。
步骤105:根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型。
在组成模型的训练测试数据集后,进一步将其随机划分为两个部分:70%的数据集用于训练,剩下的30%用于测试。
在支持向量机模型训练测试过程中,将正样本(即已知滑坡样本)的已知滑坡点用1表示,将负样本(即非滑坡样本)随机选择的非滑坡点用0表示。支持向量机模型的输出变量是各栅格单元位于0-1之间的概率值(称为滑坡易发性值),且这些0-1概率值分布即反映了区域滑坡易发性的分布规律。
因此,所述步骤105具体包括:
将所述第一训练测试数据集按照7:3的比例随机划分为训练集和测试集;
采用所述训练集对所述支持向量机模型进行训练,采用所述测试集对所述支持向量机模型进行测试,生成所述训练测试好的支持向量机模型。
步骤106:采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值。
基于评价因子的CF值、已知滑坡点和随机选择的非滑坡点,采用训练测试好的支持向量机模型预测得到整个研究区域的初始滑坡易发性值,然后采用ArcGIS软件中的自然间断点分级法,并结合滑坡易发性分布规律,将研究区域划分为五类滑坡易发性级别:1-极低易发区、2-低易发区、3-中等易发区、4-高易发区和5-极高易发区。
步骤107:根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集。
将自所述步骤106得到的初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;在得到初始易发性图后,进一步提取出研究区域的5-极高易发区;再通过对研究区域历史滑坡形态和色调等特征的分析来建立区域滑坡遥感解译标志;最后根据滑坡遥感解译标志解译出5-极高易发区内的滑坡隐患点。
具体地,在得到初始易发性图后,进一步利用自然间断点分级法得到研究区域的五类滑坡易发性等级,包括:1-极低易发区.2-低易发区、3-中等易发区、4-高易发区和5-极高易发区。此步骤107主要用到其中的1-极低易发区和5-极高易发区。所述的采用自然间断点分级法在0-1之间分为5个等级并不是等距分类,而是基于数据中固有的自然分类,然后对分类间隔加以识别。
将高分辨率遥感影像与初始滑坡易发性图相叠加,从初始极高滑坡易发区中通过利用影像上滑坡体的形状、尺寸、色调及结构特征与野外勘察结果建立的遥感解译标志和人工目视的方式,在ArcGIS中圈出发生滑坡概率极高的区域;然后随机在该区域选择栅格单元作为“潜在滑坡”,用来扩充已知滑坡样本;经扩充后的滑坡样本与步骤101中的已知滑坡样本,共同构成扩充后的滑坡样本。并且从1-极低易发区中随机选取与扩充后的滑坡样本等比例的栅格单元作为二次选取的非滑坡样本。
具体地,在获取研究区域的遥感影像后,利用影像上滑坡体的形状、尺寸、色调及结构特征与野外勘察结果,分析区域滑坡遥感解译标志;然后根据滑坡遥感解译标志解译出5-极高易发区内的滑坡隐患点作为扩充滑坡样本,并且与已知滑坡样本共同构成扩充后的滑坡样本,标记为1;将准确选取的非滑坡样本标记为0。最后同样将扩充后的滑坡和非滑坡栅格数据随机划分为训练(70%)和测试样本(30%),以便再次用于支持向量机模型的训练和测试等建模过程。
因此,所述步骤107具体包括:
将所述初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;
利用自然间断点分级法,根据所述初始滑坡易发性图确定所述研究区域的极高易发区和极低易发区;
获取所述研究区域的遥感影像;
根据所述遥感影像分析区域滑坡遥感解译标志;
根据所述滑坡遥感解译标志解译出所述极高易发区内的滑坡隐患点作为扩充滑坡样本;所述扩充滑坡样本与所述已知滑坡样本共同构成所述扩充后的滑坡样本;
从所述极低易发区中随机选取与所述扩充后的滑坡样本等比例的栅格单元,作为所述二次选取的非滑坡样本。
步骤108:根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型。
将在步骤107的基础上得到的扩充后的滑坡样本标记为1,将二次选取的非滑坡样本标记为0,再次导入支持向量机模型中,按照7:3的比例划分训练测试集进行训练测试,即构建成功了半监督支持向量机模型并进行最终的滑坡易发性预测。
步骤109:采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。
将第二次训练测试好的半监督支持向量机模型用于研究区域的滑坡易发性预测。为了方便模型对比,半监督支持向量机模型也将预测的滑坡易发性值导入ArcGIS软件,按自然间断点分级法分为5个等级:1-极低易发区、2-低易发区、3-中等易发区、4-高易发区和5-极高易发区。
现有的全监督机器学习方法随机选取非滑坡栅格单元作为模型训练和测试用的输入变量,这些不确定的非滑坡样本导致模型训练和测试过程中存在大量的误差以至于降低了全监督机器学习的建模精度。而本发明提供的半监督机器学习方法一方面在建模过程中从极低易发区选择了可信度非常高的“非滑坡样本”,减少了训练和测试数据集的误差并提高了建模精度;另一方面,通过筛选极高概率的“潜在滑坡”来扩充已知滑坡编录数量,简化了已知滑坡样本的采集过程,也可使得半监督机器学习的训练测试样本具有更广泛的代表性,从而使得训练好的模型能更准确的反映出滑坡与影响因子之间的非线性函数关系。综上分析可知,本发明提出的半监督机器学习很好地利用并扩充了现有的滑坡标签样本来指导滑坡-非滑坡分类过程,相较无监督机器学习和全监督机器学习进一步提高了滑坡易发性预测建模性能和滑坡易发性预测精度。
下面采用一个具体实施例说明本发明基于半监督支持向量机模型的滑坡易发性预测方法的具体实施过程。
具体实施时,以云南省怒江州为例,依据该区域滑坡发育特征和影响因素以及该区域的自然地理特征、还有滑坡与其影响因子间确定性系数值的计算结果并考虑相关影响因子获取的难易程度,选择了上述11种影响因子。
其中,坡度是影响斜坡体稳定的关键因素,坡度较大的区域,发生滑坡的可能性增大,而地势平坦、坡度较小的区域,发生地质灾害的概率较小。
坡向:阳坡和阴坡受到太阳的辐射强度不同,对植被的生长情况、植被类型、降雨量和土壤湿度等均会造成一定的影响。
高程:虽然高程不能直接对滑坡发生产生影响,但是高程不同,会导致降雨、温度、土壤类型、植被类型以及人类活动强度等众多因素均不相同。
距水系距离:本发明通过获取该区域内栅格单元距水系距离和改进的归一化差异水体指数来表征水文环境对滑坡发育的影响。地表水系是导致地质灾害发育的重要因素,首先表现在河流切割和侵蚀两岸边坡,导致河流两岸的临空面积增加,另外水流会增加土壤的含水率,使岩土体重量增加且有所软化,降低斜坡体的稳定性,增大地质灾害发生的概率。
岩性:不同的岩土体岩性不同,其结构特征、物理化学性质以及抗侵蚀和抗风化能力等均有所不同,则地质灾害发生的概率也不同。
断裂构造:断裂带在形成过程中会对岩土体进行切割,破坏岩层的完整性和连续性,进而影响坡体的稳定性,破碎的岩体和松散的堆积物,十分容易导致地质灾害的发生。
距道路距离:交通网越来越完善,桥梁和隧道的建设也越来越多,工程建设活动中的开挖边坡和爆破山体会扰动岩土体,破坏边坡的稳定性,岩石变得松散易碎,从而引发地质灾害。
土地利用类型:不同的土地利用方式对地质灾害的影响不同,不合理的利用方式会破坏自然环境,加剧地质灾害的发生。
降雨量通常被认为是地质灾害易发性评价最具有代表的评价因子。
土壤类型可以分为砂质土、黏质土、壤土三类,不同的土壤类型对地质灾害的影响不同。
此外,本发明主要采用归一化植被指数来表征地表植被覆盖因子,归一化植被指数能够表征地表植被的密度情况且高覆盖率植被能够抑制滑坡的发育。
具体实施时,利用ArcGIS软件将所有影响因子转化为栅格格式,遥感影像和控制因素的分辨率均为30m。
根据公式获取各影响因子的确定性系数值。其中CF的变化区间为[-1,1],正值代表地质灾害发生的确定性高,较易发生地质灾害;负值代表地质灾害发生的确定性较低,不易发生地质灾害;当计算结果接近0表示该因子在分类中不能确定是否容易发生地质灾害。
在进行易发性预测建模之前,需要确定各影响因子之间的独立性以避免信息重合。利用SPSS23软件的相关性分析计算各影响因子间的共线性问题,结果表明各影响因子间相关性不大,均可用作机器学习的输入变量。
具体实施时,首先将所选11个影响因子的CF值归一化至[0,1]之间,再将其作为支持向量机模型的输入变量,同时这些影响因子也是半监督支持向量机模型的输入变量。在ArcGIS中将怒江州已发生的561处滑坡的面文件转为栅格单元,总计得到6255个滑坡栅格单元。同时将已标记的6255个滑坡栅格和在怒江州非滑坡区中随机选择的6255个非滑坡栅格单元组成模型训练测试数据集,并进一步将其随机划分为两个部分:70%的数据集用于训练,剩下的30%用于测试。
在支持向量机模型训练测试过程中将已知滑坡棚格和随机选取的非滑坡栅格的易发性标签分别设定为1和0。
具体实施时主要利用Matlab软件来对滑坡易发性进行预测建模。然后通过支持向量机模型中的准确率平均减少值和不纯度平均减少值来获取各影响因子重要性,并综合得出较重要的影响因子为高程、植被覆盖度、岩性、距道路距离等。
然后将训练好的支持向量机模型预测得到的整个怒江州的初始滑坡易发性值导入ArcGIS软件中转为栅格文件,采用自然间断点分级法并结合滑坡易发性分布规律将怒江州划分为五类滑坡易发性级别:1-极低易发区(19.82%)、2-低易发区(28.00%)、3-中等易发区(26.29%)、4-高易发区(18.22%)和5-极高易发区(7.67%)。
对于半监督支持向量机的建模过程中,首先在5-极高易发区通过高分遥感影像解译确定出1251个极高概率的“潜在滑坡”栅格单元,这些栅格占已知滑坡栅格的20%,可有效提高滑坡栅格数量且避免滑坡栅格数量太多导致可信度下降;再将这1251个潜在滑坡栅格用于扩充已知的6255个滑坡栅格,共同组成7506个已知滑坡栅格单元并将其标签设为1。然后在初始滑坡易发性值的1-极低易发区中随机选取7506个“极高概率”的非滑坡栅格单元并设其标签为0。最后同样将扩充后的滑坡和非滑坡栅格数据随机划分为训练(70%)和测试样本(30%),以便再次用于支持向量机模型的训练和测试等建模过程。
第二次训练测试的支持向量机模型同样利用Matlab软件,通过影响因子的特征数量自动筛选来获取支持向量机的最佳参数。另外为了方便模型对比,半监督支持向量机模型模型也将预测的滑坡易发性按自然间断点分级法分为5个等级:1-极低易发区(17.12%)、2-低易发区(27.24%)、3-中等易发区(26.02%)、4-高易发区(19.60%)和5-极高易发区(10.03%)。
最后,采用受试者工作特征曲线(Receiver Operation Characteristic Curves,ROC)下的面积AUC(Area Under ROC)值分别评价两个模型的精度。支持向量机模型和确定性系数与支持向量机模型耦合的AUC值分别为0.892和0.925,表明模型耦合大幅度提高了机器学习的易发性预测精度。进一步表明本发明方法通过扩充已知滑坡样本和准确有效地筛选出非滑坡样本能大幅度提高机器学习模型的易发性预测精度。
本发明还提供一种基于半监督支持向量机模型的滑坡易发性预测系统,如图3所示,所述系统包括:
数据获取模块301,用于获取研究区域的评价因子和已知滑坡样本;所述评价因子包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型;
系数计算模块302,用于计算各所述评价因子的确定性系数值;
区域划分模块303,用于根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别;所述五类滑坡易发性级别包括极低易发区、低易发区、中等易发区、高易发区和极高易发区;
数据集构成模块304,用于在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集;
第一模型训练模块305,用于根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型;
第一模型预测模块306,用于采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值;
数据集扩充模块307,用于根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集;
第二模型训练模块308,用于根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型;
第二模型预测模块309,用于采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。
其中,所述系数计算模块302具体包括:
归一化单元,用于将各所述评价因子的确定性系数值CF归一化至[0,1]之间。
所述第一模型训练模块305具体包括:
数据集划分单元,用于将所述第一训练测试数据集按照7:3的比例随机划分为训练集和测试集;
模型训练单元,用于采用所述训练集对所述支持向量机模型进行训练,采用所述测试集对所述支持向量机模型进行测试,生成所述训练测试好的支持向量机模型。
所述数据集扩充模块307具体包括:
初始滑坡易发性图生成单元,用于将所述初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;
自然间断点分级单元,用于利用自然间断点分级法,根据所述初始滑坡易发性图确定所述研究区域的极高易发区和极低易发区;
遥感影像获取单元,用于获取所述研究区域的遥感影像;
遥感解译标志分析单元,用于根据所述遥感影像分析区域滑坡遥感解译标志;
扩充滑坡样本解译单元,用于根据所述滑坡遥感解译标志解译出所述极高易发区内的滑坡隐患点作为扩充滑坡样本;所述扩充滑坡样本与所述已知滑坡样本共同构成所述扩充后的滑坡样本;
非滑坡样本选取单元,用于从所述极低易发区中随机选取与所述扩充后的滑坡样本等比例的栅格单元,作为所述二次选取的非滑坡样本。
本发明一种基于半监督支持向量机模型的滑坡易发性预测方法及系统,基于确定性系数和支持向量机模型耦合,包括:空间分析研究区域内的滑坡编录及相关影响因子,筛选出已知滑坡样本;基于确定性系数模型和相关性分析,确定最能表征滑坡发育特征的影响因子,建立支持向量机模型;基于影响因子的CF值、已知滑坡栅格单元和随机选择的非滑坡栅格单元,对支持向量机模型,根据五类滑坡易发性等级进行输出,预测出初始滑坡易发性值;扩充已知滑坡样本;从极低易发区中随机选取栅格单元作为非滑坡样本;建立支持向量机模型并进行预测。本发明方法及系统简化了滑坡样本数据采集过程,在支持向量机模型的基础上进一步提高了滑坡易发性预测建模性能,提高了滑坡易发性预测的准确性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种基于半监督支持向量机模型的滑坡易发性预测方法,其特征在于,包括:
获取研究区域的评价因子和已知滑坡样本;所述评价因子包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型;
计算各所述评价因子的确定性系数值;
根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别;所述五类滑坡易发性级别包括极低易发区、低易发区、中等易发区、高易发区和极高易发区;
在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集;
根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型;
采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值;
根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集;
根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型;
采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型,具体包括:
将所述第一训练测试数据集按照7:3的比例随机划分为训练集和测试集;
采用所述训练集对所述支持向量机模型进行训练,采用所述测试集对所述支持向量机模型进行测试,生成所述训练测试好的支持向量机模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,具体包括:
将所述初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;
利用自然间断点分级法,根据所述初始滑坡易发性图确定所述研究区域的极高易发区和极低易发区;
获取所述研究区域的遥感影像;
根据所述遥感影像分析区域滑坡遥感解译标志;
根据所述滑坡遥感解译标志解译出所述极高易发区内的滑坡隐患点作为扩充滑坡样本;所述扩充滑坡样本与所述已知滑坡样本共同构成所述扩充后的滑坡样本;
从所述极低易发区中随机选取与所述扩充后的滑坡样本等比例的栅格单元,作为所述二次选取的非滑坡样本。
5.一种基于半监督支持向量机模型的滑坡易发性预测系统,其特征在于,包括:
数据获取模块,用于获取研究区域的评价因子和已知滑坡样本;所述评价因子包括高程、坡度、坡向、岩性、断裂构造、距道路距离、距水系距离、植被覆盖、降雨量、土地利用类型和土壤类型;
系数计算模块,用于计算各所述评价因子的确定性系数值;
区域划分模块,用于根据所述确定性系数值对所述研究区域进行易发性分区,将所述研究区域划分为五类滑坡易发性级别;所述五类滑坡易发性级别包括极低易发区、低易发区、中等易发区、高易发区和极高易发区;
数据集构成模块,用于在所述极低易发区和所述低易发区中随机选取与所述已知滑坡样本等比例的非滑坡样本,与所述已知滑坡样本共同构成第一训练测试数据集;
第一模型训练模块,用于根据所述第一训练测试数据集对支持向量机模型进行训练测试,生成训练测试好的支持向量机模型;
第一模型预测模块,用于采用所述训练测试好的支持向量机模型预测得到所述研究区域的初始滑坡易发性值;
数据集扩充模块,用于根据所述初始滑坡易发性值确定扩充后的滑坡样本和二次选取的非滑坡样本,共同构成第二训练测试数据集;
第二模型训练模块,用于根据所述第二训练测试数据集对支持向量机模型进行训练测试,生成半监督支持向量机模型;
第二模型预测模块,用于采用所述半监督支持向量机模型对所述研究区域进行滑坡易发性预测。
7.根据权利要求5所述的系统,其特征在于,所述第一模型训练模块具体包括:
数据集划分单元,用于将所述第一训练测试数据集按照7:3的比例随机划分为训练集和测试集;
模型训练单元,用于采用所述训练集对所述支持向量机模型进行训练,采用所述测试集对所述支持向量机模型进行测试,生成所述训练测试好的支持向量机模型。
8.根据权利要求5所述的系统,其特征在于,所述数据集扩充模块具体包括:
初始滑坡易发性图生成单元,用于将所述初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图;
自然间断点分级单元,用于利用自然间断点分级法,根据所述初始滑坡易发性图确定所述研究区域的极高易发区和极低易发区;
遥感影像获取单元,用于获取所述研究区域的遥感影像;
遥感解译标志分析单元,用于根据所述遥感影像分析区域滑坡遥感解译标志;
扩充滑坡样本解译单元,用于根据所述滑坡遥感解译标志解译出所述极高易发区内的滑坡隐患点作为扩充滑坡样本;所述扩充滑坡样本与所述已知滑坡样本共同构成所述扩充后的滑坡样本;
非滑坡样本选取单元,用于从所述极低易发区中随机选取与所述扩充后的滑坡样本等比例的栅格单元,作为所述二次选取的非滑坡样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111323835.7A CN114036841A (zh) | 2021-11-10 | 2021-11-10 | 基于半监督支持向量机模型的滑坡易发性预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111323835.7A CN114036841A (zh) | 2021-11-10 | 2021-11-10 | 基于半监督支持向量机模型的滑坡易发性预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114036841A true CN114036841A (zh) | 2022-02-11 |
Family
ID=80143727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111323835.7A Pending CN114036841A (zh) | 2021-11-10 | 2021-11-10 | 基于半监督支持向量机模型的滑坡易发性预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114036841A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115576028A (zh) * | 2022-12-01 | 2023-01-06 | 武汉盛华伟业科技股份有限公司 | 基于支持向量机的地质特征层预测方法及系统 |
CN115688404A (zh) * | 2022-10-24 | 2023-02-03 | 中国科学院空天信息创新研究院 | 基于svm-rf模型的降雨型滑坡预警方法 |
CN116151483A (zh) * | 2023-04-14 | 2023-05-23 | 山东理工大学 | 一种区域级降雨滑坡概率性预测方法及预测终端 |
CN116881652A (zh) * | 2023-06-26 | 2023-10-13 | 成都理工大学 | 基于优选负样本和随机森林模型的滑坡易发性评价方法 |
CN117131761A (zh) * | 2023-07-28 | 2023-11-28 | 成都理工大学 | 水库首次蓄水期的库岸滑坡预测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358327A (zh) * | 2017-07-21 | 2017-11-17 | 重庆大学 | 基于无人机遥感影像的滑坡易发性评定方法 |
CN107577913A (zh) * | 2017-08-31 | 2018-01-12 | 成都九十度工业产品设计有限公司 | 一种区域滑坡灾害易发性评估装置 |
CN111310898A (zh) * | 2020-02-14 | 2020-06-19 | 中国地质大学(武汉) | 一种基于rnn的滑坡灾害易发性预测方法 |
CN111797571A (zh) * | 2020-07-02 | 2020-10-20 | 杭州鲁尔物联科技有限公司 | 滑坡易发性评价方法、装置、设备和存储介质 |
CN111858803A (zh) * | 2020-07-06 | 2020-10-30 | 东华理工大学 | 一种滑坡地灾风险区划图生成方法 |
CN111898315A (zh) * | 2020-07-27 | 2020-11-06 | 中国科学院空天信息创新研究院 | 基于分形—机器学习混合模型的滑坡易发性评估方法 |
CN112700104A (zh) * | 2020-12-25 | 2021-04-23 | 中南大学 | 一种基于多模态分类的震区滑坡易发性评价方法 |
CN112966722A (zh) * | 2021-02-07 | 2021-06-15 | 南昌大学 | 基于半监督随机森林模型的区域滑坡易发性预测方法 |
CN113343563A (zh) * | 2021-05-27 | 2021-09-03 | 中交第二公路勘察设计研究院有限公司 | 基于样本自动选择与地表形变速率的滑坡易发性评价方法 |
-
2021
- 2021-11-10 CN CN202111323835.7A patent/CN114036841A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358327A (zh) * | 2017-07-21 | 2017-11-17 | 重庆大学 | 基于无人机遥感影像的滑坡易发性评定方法 |
CN107577913A (zh) * | 2017-08-31 | 2018-01-12 | 成都九十度工业产品设计有限公司 | 一种区域滑坡灾害易发性评估装置 |
CN111310898A (zh) * | 2020-02-14 | 2020-06-19 | 中国地质大学(武汉) | 一种基于rnn的滑坡灾害易发性预测方法 |
CN111797571A (zh) * | 2020-07-02 | 2020-10-20 | 杭州鲁尔物联科技有限公司 | 滑坡易发性评价方法、装置、设备和存储介质 |
CN111858803A (zh) * | 2020-07-06 | 2020-10-30 | 东华理工大学 | 一种滑坡地灾风险区划图生成方法 |
CN111898315A (zh) * | 2020-07-27 | 2020-11-06 | 中国科学院空天信息创新研究院 | 基于分形—机器学习混合模型的滑坡易发性评估方法 |
CN112700104A (zh) * | 2020-12-25 | 2021-04-23 | 中南大学 | 一种基于多模态分类的震区滑坡易发性评价方法 |
CN112966722A (zh) * | 2021-02-07 | 2021-06-15 | 南昌大学 | 基于半监督随机森林模型的区域滑坡易发性预测方法 |
CN113343563A (zh) * | 2021-05-27 | 2021-09-03 | 中交第二公路勘察设计研究院有限公司 | 基于样本自动选择与地表形变速率的滑坡易发性评价方法 |
Non-Patent Citations (15)
Title |
---|
乔德京等: "加权确定性系数模型的滑坡易发性评价", 《西安科技大学学报》 * |
于宪煜等: "基于RS-SVM模型的滑坡易发性评价因子选择方法研究", 《地理与地理信息科学》 * |
刘月等: "基于ROC曲线与确定性系数法集成模型的三峡库区奉节县滑坡易发性评价", 《安全与环境工程》 * |
安凯强等: "信息量支持下SVM模型滑坡灾害易发性评价", 《长江科学院院报》 * |
文海家等: "基于大数据挖掘的山区公路沿线滑坡易发性小区划", 《自然灾害学报》 * |
朱玲: "基于不确定数据的半监督动态K-均值算法在滑坡危险性预测上的应用", 《山东农业大学学报(自然科学版)》 * |
李利峰等: "基于SVM-LR融合模型的滑坡灾害易发性评价――以山阳县为例", 《科学技术与工程》 * |
李利峰等: "基于人工神经网络的区域滑坡预测研究", 《气象与环境科学》 * |
李宁等: "基于GIS和信息量法的川藏铁路雅江县段滑坡易发性评价", 《资源信息与工程》 * |
王念秦等: "基于支持向量机模型的滑坡危险性评价", 《科学技术与工程》 * |
许冲等: "基于不同核函数的2010年玉树地震滑坡空间预测模型研究", 《地球物理学报》 * |
贾娟: "粗糙集与支持向量机耦合模型滑坡易发性评价--以筠连县为例", 《中国优秀硕士学位论文全文数据库 (基础科学辑)》 * |
赵冬梅等: "基于maxEnt模型的哈尼梯田核心区滑坡易发性评价", 《水土保持研究》 * |
邱维蓉等: "几种聚类优化的机器学习方法在灵台县滑坡易发性评价中的应用", 《西北地质》 * |
陈怡等: "震后地质灾害易发性评价――以映秀震区为例", 《科学技术与工程》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115688404A (zh) * | 2022-10-24 | 2023-02-03 | 中国科学院空天信息创新研究院 | 基于svm-rf模型的降雨型滑坡预警方法 |
CN115576028A (zh) * | 2022-12-01 | 2023-01-06 | 武汉盛华伟业科技股份有限公司 | 基于支持向量机的地质特征层预测方法及系统 |
CN115576028B (zh) * | 2022-12-01 | 2023-03-14 | 武汉盛华伟业科技股份有限公司 | 基于支持向量机的地质特征层预测方法及系统 |
CN116151483A (zh) * | 2023-04-14 | 2023-05-23 | 山东理工大学 | 一种区域级降雨滑坡概率性预测方法及预测终端 |
CN116881652A (zh) * | 2023-06-26 | 2023-10-13 | 成都理工大学 | 基于优选负样本和随机森林模型的滑坡易发性评价方法 |
CN116881652B (zh) * | 2023-06-26 | 2024-04-05 | 成都理工大学 | 基于优选负样本和随机森林模型的滑坡易发性评价方法 |
CN117131761A (zh) * | 2023-07-28 | 2023-11-28 | 成都理工大学 | 水库首次蓄水期的库岸滑坡预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dou et al. | Assessment of advanced random forest and decision tree algorithms for modeling rainfall-induced landslide susceptibility in the Izu-Oshima Volcanic Island, Japan | |
CN114036841A (zh) | 基于半监督支持向量机模型的滑坡易发性预测方法及系统 | |
He et al. | Application of kernel-based Fisher discriminant analysis to map landslide susceptibility in the Qinggan River delta, Three Gorges, China | |
Song et al. | Susceptibility assessment of earthquake-induced landslides using Bayesian network: A case study in Beichuan, China | |
Conforti et al. | Evaluation of prediction capability of the artificial neural networks for mapping landslide susceptibility in the Turbolo River catchment (northern Calabria, Italy) | |
Kavzoglu et al. | Advanced hyperparameter optimization for improved spatial prediction of shallow landslides using extreme gradient boosting (XGBoost) | |
Loche et al. | Landslide susceptibility maps of Italy: Lesson learnt from dealing with multiple landslide types and the uneven spatial distribution of the national inventory | |
Li et al. | GIS‐based landslide susceptibility mapping using information, frequency ratio, and artificial neural network methods in Qinghai Province, northwestern China | |
Song et al. | Potential of ensemble learning to improve tree-based classifiers for landslide susceptibility mapping | |
CN112966722A (zh) | 基于半监督随机森林模型的区域滑坡易发性预测方法 | |
Wei et al. | A hybrid framework integrating physical model and convolutional neural network for regional landslide susceptibility mapping | |
Alqadhi et al. | Selecting optimal conditioning parameters for landslide susceptibility: an experimental research on Aqabat Al-Sulbat, Saudi Arabia | |
Wang et al. | Rainfall‐induced landslide hazard assessment using artificial neural networks | |
Fanos et al. | A spatial ensemble model for rockfall source identification from high resolution LiDAR data and GIS | |
Zhao et al. | A comparative study of different neural network models for landslide susceptibility mapping | |
Zhang et al. | Application of artificial intelligence in geotechnical and geohazard investigations | |
Zhao et al. | Mapping landslide sensitivity based on machine learning: A case study in Ankang City, Shaanxi Province, China | |
Chen et al. | An attribution deep learning interpretation model for landslide susceptibility mapping in the Three Gorges Reservoir Area | |
CN113191642B (zh) | 一种基于最优组合策略的区域滑坡敏感性分析方法 | |
Ma et al. | Landslide susceptibility assessment using the certainty factor and deep neural network | |
Guo et al. | A python system for regional landslide susceptibility assessment by integrating machine learning models and its application | |
Süzen | Data driven landslide hazard assessment using geographical information systems and remote sensing | |
Chen et al. | The application of the genetic adaptive neural network in landslide disaster assessment | |
Wei et al. | Improving pixel-based regional landslide susceptibility mapping | |
Yu et al. | Enhancing landslide susceptibility mapping incorporating landslide typology via stacking ensemble machine learning in Three Gorges Reservoir, China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220211 |