CN116933947A - 一种基于软投票集成分类器的滑坡易发性预测方法 - Google Patents
一种基于软投票集成分类器的滑坡易发性预测方法 Download PDFInfo
- Publication number
- CN116933947A CN116933947A CN202311025012.5A CN202311025012A CN116933947A CN 116933947 A CN116933947 A CN 116933947A CN 202311025012 A CN202311025012 A CN 202311025012A CN 116933947 A CN116933947 A CN 116933947A
- Authority
- CN
- China
- Prior art keywords
- landslide
- model
- voting
- method based
- prediction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000003066 decision tree Methods 0.000 claims abstract description 17
- 238000007637 random forest analysis Methods 0.000 claims abstract description 15
- 238000007477 logistic regression Methods 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 3
- 238000012360 testing method Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 238000003064 k means clustering Methods 0.000 claims description 16
- 238000011160 research Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 6
- 238000012876 topography Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000001965 increasing effect Effects 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 6
- 230000007613 environmental effect Effects 0.000 abstract description 2
- 230000006698 induction Effects 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 21
- 230000001419 dependent effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000011158 quantitative evaluation Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于软投票集成分类器的滑坡易发性预测方法,通过采集滑坡点与非滑坡点的数据特征,结合环境因素,筛选滑坡诱发因子,利用软投票分类器与逻辑回归、决策树、随机森林、Adaboost、K均值聚类五种传统机器学习方法相结合,进行滑坡易发性预测。创新性地提出一种基于机器学习的滑坡易发性集合预测模型。利用软投票分类器对基础模型进行权值训练,进行概率预测,输出滑坡易发性预测结果。通过集成基础模型,赋予基础模型不同权值,提高模型预测精度。本发明可以有效的遍历基模型权值,提高基础模型的预测精度。
Description
技术领域
本发明涉及一种地质灾害风险分析方法,尤其涉及一种基于软投票集成分类器的滑坡易发性预测方法。
背景技术
随着遥感、地理信息系统为代表的技术手段的发展,我国对于地质灾害的研究进展有大幅度提升,机器学习与深度学习等人工智能方法成为当前学者们的研究热点。滑坡易发性评价一般分为定性评价与定量评价,定量评价方法又可分为传统的统计量评价法与机器学习评价法。定量评价方法中,可以分为几大类,包括统计方法、专家经验法、数据挖掘方法。目前应用较广泛的包括信息量模型、多元线性回归模型、聚类模型、半监督多层感知器、监督学习模型。对于统计模型,需要大量数据的支撑,以及其他的经验指标,通常,不足的数据或者较低质量的数据会造成最终结果准确性较低。对于线性模型,依赖于众多自变量与因变量之间的关系分析,当自变量之间存在高度相关性,会导致模型过拟合。对于监督学习模型,则需要大量的数据支撑,进行模型训练。
发明内容
发明目的:针对以上问题,本发明提出一种基于软投票集成分类器的滑坡易发性预测方法,能够提高基础机器学习模型在滑坡易发性预测上的预测精度。
技术方案:本发明所采用的技术方案是一种基于软投票集成分类器的滑坡易发性预测方法,包括:
历史滑坡灾害点作为滑坡样本,根据历史滑坡灾害点坐标,在滑坡灾害点的缓冲区之外随机选取与滑坡点数量相同的样本点,作为非滑坡样本;根据研究区域的地貌数据、遥感数据和气象数据,筛选诱发滑坡灾害发生的影响因子并获取各影响因子属性值;其中,筛选的诱发滑坡灾害发生的影响因子包括:高程、坡度、坡向、地形起伏度、距水系距离、距断层距离、距道路距离、植被覆盖度(NDVI)和年均降雨量。
对影响因子属性值数据进行预处理,并利用研究区域矢量图对预处理后的影响因子属性值进行范围裁切;获取同一样本点的各影响因子属性值,得到样本对应影响因子属性值的样本数据库,按比例将样本数据库分为训练集与测试集。其中,所述预处理包括错误数据删除、空白数据填充、统一空间坐标体系以及统一数据格式。
利用训练集对滑坡易发性预测模型进行训练,利用测试集对滑坡易发性预测模型进行测试,对测试结果进行精度评价,根据评价指标得到训练完成后的最优模型;所述精度评价是通过计算准确率进行模型精确度比较。
所述滑坡易发性预测模型,模型架构为软投票集成分类器,通过若干基模型赋予权值系数后经软投票集成分类器输出。所述基模型包括:逻辑回归模型、决策树模型、随机森林模型、自适应增强模型和K均值聚类模型。所述滑坡易发性预测模型为:
ACC_Voting=Voting(w1*LR,w2*DT,w3*RF,w4*AdaBoost,w5*KNN)
其中ACC_Voting是模型预测精度值,w1,w2,w3,w4,w5分别为逻辑回归模型、决策树模型、随机森林模型、自适应增强模型和K均值聚类模型的权值系数。
所述自适应增强模型,其原理是通过将一系列弱学习算法反复学习,得到一系列弱分类器,组合成一个强分类器,自适应增强模型采取加权多数表决方法,加大误差小的弱分类器权值,削弱误差大的弱分类权值,提高分类精确度。
所述K均值聚类模型,是基于样本集合划分的聚类算法,将训练样本划分为k个子集,构成k个类;定义每个类的中心,将样本逐个指派到与其最近的中心类中,得到聚类结果;然后更新类均值,作为新中心值,迭代直到收敛为止。
本发明提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述基于软投票集成分类器的滑坡易发性预测方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于软投票集成分类器的滑坡易发性预测方法。
有益效果:相比于现有技术,本发明具有以下优点:本发明提供的基于Voting软投票集成滑坡易发性预测模型,通过数据整合,数据预处理、属性值获取、基模型训练、集成模型遍历、确立最优集成模型,预测得到研究区滑坡易发性指数、生成研究区滑坡易发性图。本发明有效的改善基模型分类器对滑坡易发性指数预测的单一性,提高了滑坡易发性指数预测的精度。
附图说明
图1是本发明所述的基于软投票集成分类器的滑坡易发性预测方法流程图;
图2是经本发明所述的基于软投票集成分类器的滑坡易发性预测方法计算出的滑坡易发性制图;
图3是5种基模型与集成模型LSEFM的ROC曲线对比图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
本发明所述的基于软投票集成分类器的滑坡易发性预测方法,流程图如图1所示,包括以下方面:
一、数据处理。
获取研究区的历史滑坡灾害点数据,通过googel影像目视解译,获取滑坡灾害点的经纬度坐标,获取研究区的地形、地貌、地质、降雨数据,利用ArcGIS软件处理30km分辨率DEM数据,得到研究区的高程、坡度、坡向、地形起伏度数据,并赋予滑坡样本与非滑坡样本属性值。
利用ENVI软件处理Landsat8OIL影像数据,计算研究区NDVI,并赋予所有样本NDVI属性值;获取路网、断层、水系等数据,利用ArcGIS计算所有样本的距道路距离、距断层距离、距水系距离;将所选因子属性数据重采样为300m空间分辨率栅格影像。
最终,得到高程、坡度、坡向、地形起伏度、距水系距离、距断层距离、距道路距离、植被覆盖度(NDVI)、年均降雨量9个对滑坡灾害的发生产生影响的变量作为影响因子,构建研究区滑坡易发性影响因子指标体系。滑坡影响因子根据研究区地形、地貌、降雨、人类活动等特征选取,优选上述9个滑坡影响因子。
本实施例中,将研究区共划分为916472个像素大小为300m×300m的基础单元;获取每一个栅格单元对应影响因子图层属性值,构建栅格属性数据库;在滑坡点数据之外,以1km范围建立滑坡灾害缓冲区,在滑坡样本缓冲区之外,随机选取与滑坡样本数量相同的样本点,作为监督学习模型的非滑坡样本。对原始影响因子属性数据进行预处理后,获取滑坡点与非滑坡点的影响因子属性数据;预处理包括统一空间坐标体系以及统一数据格式,错误数据删除,空白数据填充。
二、构建滑坡易发性预测模型。
Voting投票算法是一种以少数服从多数为原则的集成学习模型,Voting投票算法分为硬投票(Hard_Voting)与软投票(Soft_Voting),通过将不同的模型预测结果统计分析,选取出现次数最多的预测结果,作为模型最终的结果。Voting投票模型可以通过集成基础分类器,降低模型整体的方差,提高模型的鲁棒性。基于五个基模型:逻辑回归模型、决策树模型、随机森林模型、自适应增强模型和K均值聚类模型,构建软投票集成模型。具体的,在python中搭建Voting集成模型,分别赋予5种基础分类器权重系数w1,w2,w3,w4,w5。建立循环模型,将系数范围设置在(0,1)之间,精度为0.1。
以权值系数为自变量,Voting软投票模型预测结果为因变量,构建基于单一模型的多维模型:
ACC_Voting=Voting(w1*LR,w2*DT,w3*RF,w4*AdaBoost,w5*KNN)
式中,ACC_Voting为模型的输出结果,w1,w2,w3,w4,w5分别为LR,DT,RF,AadBoost,KNN的权值系数,通过训练不同的权值系数,得到不同的精度值,将最优ACC值的权值系数组合作为该模型的权值系数。
其中,逻辑回归模型(LR)是指因变量为二值分类变量的回归分析,是在一个因变量和多个自变量之间形成多元回归关系,从而预测某一区域某一事件的发生概率。设P为某事发生的概率,取值范围为[0,1],其公式为:
式中,x1,x2,...,xn分别为影响因变量结果概率的因子;β1,β2,...,βn为逻辑回归系数,是常数项。
决策树模型(Decision Tree,DT)是由根节点、内部结点和叶子节点构成,叶子节点对应分类结果,其它节点对应分类规则。根节点根据分类标准,将训练数据集分割为2个子集,其他每个内部节点接收来自上一层的数据集并继续划分为2个子集,直到在叶子节点获得分类结果。
随机森林模型(Random Forest,RF)是决策树的一种集成方法,主要是通过多颗决策树中每棵树的投票结果来获取最优的分类结果。
自适应增强模型(AdaBoost,adapative boost)算法是最具代表性的一种提升方法,其原理是通过将一系列弱学习算法反复学习,得到一系列弱分类器,组合成一个强分类器。AdaBoost采取加权多数表决方法,加大误差小的弱分类器权值,削弱误差大的弱分类权值,提高分类精确度。
k均值聚类(K-mean,KNN)是基于样本集合划分的聚类算法,将训练样本划分为k个子集,构成k个类。定义每个类的中心,将样本逐个指派到与其最近的中心类中,得到聚类结果。然后更新类均值,作为新中心值,重复此过程,直到收敛为止。
本发明未对以上模型算法的架构进行改进。
三、训练滑坡易发性预测模型
搭建样本数据库,将所有样本与影响因子的属性值融合处理,得到样本对应影响因子属性值的样本数据库,利用样本数据库对滑坡易发性预测模型进行训练。
其中,将滑坡点与非滑坡点的影响因子属性数据作为模型输入自变量;滑坡点记作为“1”,非滑坡点记作“0”,“1”和“0”作为模型因变量。将滑坡点与非滑坡点的因子属性数据以7∶3构建训练样本与检验样本。
将五个基模型的权值系数从0~1以0.1系数递增方式开始遍历。对各特征通道进行权值遍历,以0.1为系数精度,权值范围取(0,1),通过训练,得到精确度最高的权值系数,构建集成模型。本实施例中,系数w1,w2,w3,w4,w5分别在(0,1)范围内开始遍历,以0.1作为权值最小精度,构建ACC多维模型。单一模型分别从0到0.9遍历10次,最小权值为0,最大为0.9,一共遍历105次。通过训练,得到精确度最高的权值系数,构建集成模型。得到ACC_Voting值最高的各项系数,构建Voting多维模型。当LR、DT、RF、AB、KNN权值系数分别为0.1,0.1,0.7,0.3,0.2时,Voting软投票算法ACC值最高,达到0.8287。
评价指标为模型训练的预测精度,可以选用常规的方差公式计算精度。
由此确定训练得到预测精度最优的系数分别为0.1,0.1,0.7,0.3,0.2。搭建Voting集成模型为:
LSEFM=Voting(0.1*LR,0.1*DT,0.7*RF,0.3*AdaBoost,0.2*KNN)
四、预测与评价
将检验样本自变量输入到上述训练好的模型中,得到集成模型对检验样本的预测结果。利用预测结果计算Accuracy、Sensitivity、ROC下曲线面积AUC值,评估比较模型预测精度。
利用检验样本对模型进行检验,将检验样本的环境属性值分别输入到5种基模型以及LSEFM模型中,通过模型训练得到检验样本预测值,将预测值与检验样本真实值进行比较。利用准确率、敏感度、ROC下曲线面积AUC值对模型进行精度评价。精度指标评价如表1。其中,5种基模型的精度是将训练样本分别输入到逻辑回归、决策树、随机森林、Adaboost、K均值聚类模型中进行训练,通过检验样本分别得出不同模型下的预测精度。
表1比较6种模型在滑坡易发性预测的性能
在python中,利用搭建的LSEFM模型对研究区916472个样本点进行滑坡易发值预测,输出每一个样本点的滑坡易发性预测值,完成研究区易发性预测。易发性预测值在0~1之间,预测值越接近1,说明越容易发生滑坡,越接近0,说明越不易发生滑坡。利用自然断点法将所有样本的滑坡易发性预测值分为5个等级,分别为低易发区、较低易发区、中易发区、较高易发区、高易发区。本发明所述的基于软投票集成分类器的滑坡易发性预测方法计算出的滑坡易发性制图如图2所示。
使用训练完成后的最优集成模型对所有栅格窗口进行预测,生成待预测区域的易发性图,完成基于机器学习集成的滑坡易发性预测。图3是5种基模型与集成模型LSEFM的ROC曲线对比图,从图上可以看到各个模型的AUC值存在着明显的差异,各模型AUC值从小到大依次是Logit<DT<Ada<KNN<RF<Voting,其中AUC值最小的模型为Logit,AUC值为0.761,AUC值最大的模型为集成后的Voting模型,其AUC值达0.869,集成后的模型精度指标最高,预测性能最好。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的基于软投票集成分类器的滑坡易发性预测方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于软投票集成分类器的滑坡易发性预测方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
Claims (10)
1.一种基于软投票集成分类器的滑坡易发性预测方法,其特征在于,包括:
历史滑坡灾害点作为滑坡样本,根据历史滑坡灾害点坐标,在滑坡灾害点的缓冲区之外随机选取与滑坡点数量相同的样本点,作为非滑坡样本;根据研究区域的地貌数据、遥感数据和气象数据,筛选诱发滑坡灾害发生的影响因子并获取各影响因子属性值;
对影响因子属性值数据进行预处理,并利用研究区域矢量图对预处理后的影响因子属性值进行范围裁切;获取同一样本点的各影响因子属性值,得到样本对应影响因子属性值的样本数据库,按比例将样本数据库分为训练集与测试集;
利用训练集对滑坡易发性预测模型进行训练,利用测试集对滑坡易发性预测模型进行测试,对测试结果进行精度评价,根据评价指标得到训练完成后的最优模型;
所述滑坡易发性预测模型,模型架构为软投票集成分类器,通过若干基模型赋予权值系数后经软投票集成分类器输出。
2.根据权利要求1所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于:筛选的诱发滑坡灾害发生的影响因子包括:高程、坡度、坡向、地形起伏度、距水系距离、距断层距离、距道路距离、植被覆盖度(NDVI)和年均降雨量。
3.根据权利要求1所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于,所述基模型包括:逻辑回归模型、决策树模型、随机森林模型、自适应增强模型和K均值聚类模型。
4.根据权利要求3所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于:所述滑坡易发性预测模型为:
ACC_Voting=Voting(w1*LR,w2*DT,w3*RF,w4*AdaBoost,w5*KNN)
其中ACC_Voting是模型预测精度值,w1,w2,w3,w4,w5分别为逻辑回归模型、决策树模型、随机森林模型、自适应增强模型和K均值聚类模型的权值系数。
5.根据权利要求4所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于:所述自适应增强模型,其原理是通过将一系列弱学习算法反复学习,得到一系列弱分类器,组合成一个强分类器,自适应增强模型采取加权多数表决方法,加大误差小的弱分类器权值,削弱误差大的弱分类权值,提高分类精确度。
6.根据权利要求4所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于:所述K均值聚类模型,是基于样本集合划分的聚类算法,将训练样本划分为k个子集,构成k个类;定义每个类的中心,将样本逐个指派到与其最近的中心类中,得到聚类结果;然后更新类均值,作为新中心值,迭代直到收敛为止。
7.根据权利要求1所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于:所述预处理包括错误数据删除、空白数据填充、统一空间坐标体系以及统一数据格式。
8.根据权利要求1所述的基于软投票集成分类器的滑坡易发性预测方法,其特征在于:所述精度评价是通过计算准确率进行模型精确度比较。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述基于软投票集成分类器的滑坡易发性预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的基于软投票集成分类器的滑坡易发性预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311025012.5A CN116933947A (zh) | 2023-08-15 | 2023-08-15 | 一种基于软投票集成分类器的滑坡易发性预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311025012.5A CN116933947A (zh) | 2023-08-15 | 2023-08-15 | 一种基于软投票集成分类器的滑坡易发性预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116933947A true CN116933947A (zh) | 2023-10-24 |
Family
ID=88379127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311025012.5A Pending CN116933947A (zh) | 2023-08-15 | 2023-08-15 | 一种基于软投票集成分类器的滑坡易发性预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933947A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117851919A (zh) * | 2024-03-06 | 2024-04-09 | 成都理工大学 | 一种基于集成学习的滑坡误报识别方法 |
-
2023
- 2023-08-15 CN CN202311025012.5A patent/CN116933947A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117851919A (zh) * | 2024-03-06 | 2024-04-09 | 成都理工大学 | 一种基于集成学习的滑坡误报识别方法 |
CN117851919B (zh) * | 2024-03-06 | 2024-05-03 | 成都理工大学 | 一种基于集成学习的滑坡误报识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113780395B (zh) | 海量高维ais轨迹数据聚类方法 | |
CN111815037B (zh) | 一种基于注意力机制的可解释性短临极端降雨预测方法 | |
CN116108758B (zh) | 滑坡易发性评价方法 | |
CN112733800B (zh) | 基于卷积神经网络的遥感图像道路信息提取方法和装置 | |
CN114037844A (zh) | 基于滤波器特征图的全局秩感知神经网络模型压缩方法 | |
CN112785450B (zh) | 一种土壤环境质量分区方法及系统 | |
CN105913450A (zh) | 基于神经网络图像处理的轮胎橡胶炭黑分散度评价方法及系统 | |
CN105427309A (zh) | 面向对象高空间分辨率遥感信息提取的多尺度分层处理方法 | |
CN112950780B (zh) | 一种基于遥感影像的网络地图智能生成方法及系统 | |
CN108985327A (zh) | 一种基于因子分析的地形匹配区自组织优化分类方法 | |
CN117593597B (zh) | 一种地形图像自动分类方法及系统 | |
CN116933947A (zh) | 一种基于软投票集成分类器的滑坡易发性预测方法 | |
Ayhan et al. | Analysis of image classification methods for remote sensing | |
KR20200052398A (ko) | 머신 러닝 기법을 이용한 산사태 취약성 지도 작성 방법 및 장치 | |
CN117197174A (zh) | 基于遥感数据的水体信息提取方法、装置、设备及介质 | |
CN113591608A (zh) | 一种基于深度学习的高分辨率遥感影像不透水面提取方法 | |
CN117725493A (zh) | 基于改进型Stacking融合模型的滑坡危险性结果评价方法 | |
CN115660221B (zh) | 基于混合神经网络的油气藏经济可采储量评估方法及系统 | |
CN116188834B (zh) | 基于自适应训练模型的全切片图像分类方法及装置 | |
CN115953584A (zh) | 一种具有可学习稀疏性的端到端目标检测方法及系统 | |
CN113723281A (zh) | 基于局部自适应尺度集成学习的高分辨率影像分类方法 | |
CN104463205B (zh) | 基于混沌深度小波网络的数据分类方法 | |
CN118585961B (zh) | 基于全球地理信息编码PlusCode和Transformer的航迹预测方法及系统 | |
CN118298252B (zh) | 一种基于图表征学习的城市建筑群功能分类方法及设备 | |
CN118097313B (zh) | 基于频域主动学习的高光谱图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |