CN117390555A - 一种实现泥石流灾害风险多维分类预测方法 - Google Patents
一种实现泥石流灾害风险多维分类预测方法 Download PDFInfo
- Publication number
- CN117390555A CN117390555A CN202311414102.3A CN202311414102A CN117390555A CN 117390555 A CN117390555 A CN 117390555A CN 202311414102 A CN202311414102 A CN 202311414102A CN 117390555 A CN117390555 A CN 117390555A
- Authority
- CN
- China
- Prior art keywords
- debris flow
- term
- disaster
- data
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000007774 longterm Effects 0.000 claims abstract description 55
- 238000012544 monitoring process Methods 0.000 claims abstract description 50
- 239000011435 rock Substances 0.000 claims abstract description 34
- 238000012706 support-vector machine Methods 0.000 claims abstract description 24
- 238000013058 risk prediction model Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 43
- 230000006870 function Effects 0.000 claims description 34
- 239000002689 soil Substances 0.000 claims description 17
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 230000007704 transition Effects 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 2
- 230000001186 cumulative effect Effects 0.000 claims description 2
- 238000003066 decision tree Methods 0.000 claims description 2
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000012876 topography Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 230000003203 everyday effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 241000132092 Aster Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011439 discrete element method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000003570 air Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/05—Geographic models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Remote Sensing (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Graphics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Astronomy & Astrophysics (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种实现泥石流灾害风险多维分类预测方法,所述方法包括:泥石流隐患监测区圈定;监测区域数字高程模型下载;泥石流隐患区域流域形态分类;采集泥石流隐患区灾害影响因素数据;泥石流风险多维分类预测模型学习,基于获取的不同类型泥石流灾害样本数据,分别使用AdaBoost算法结合累计降雨量等影响因素学习基于AdaBoost的短期泥石流灾害预测模型;使用支持向量机结合地表形变量等影响因素学习基于SVM的长期泥石流灾害风险预测模型,并使用数据集验证预测模型,获得沟谷型泥石流长短期预测模型、山坡型泥石流长短期预测模型;泥石流风险多维分类预测与结果呈现。本申请所提供的方案能够提高泥石流灾害的预测精度。
Description
技术领域
本发明涉及泥石流灾害风险预测领域,尤其是涉及一种实现泥石流灾害风险多维分类的预测方法。
背景技术
泥石流是一种由大量的土壤、岩石碎块、水和空气混合而成的流体,其灾害多发生在山区或丘陵地带。泥石流通常在陡峭的山坡或沟壑中形成,其速度可高达每小时数十公里,具有强大的冲击力和破坏力,可以摧毁房屋、道路、桥梁和农田,造成人员伤亡和财产损失。
我国是一个多山的国家,山地面积约占全国总面积的1/3。山地一般高差大、坡度陡、土层薄。如果把山地、丘陵连同比较崎岖的高原合称为山区,那么我国山区面积约占全国总面积的2/3。不少山区仍有公路或铁路穿过,也有居民生活。在雨季,一些山区时常出现泥石流灾害,给当地带来较为严重的生命与财产损失。因此,做好泥石流灾害风险预测有着非常重要的意义。
泥石流灾害按发生流域形态分为沟谷型泥石流和山坡型泥石流。目前对沟谷型泥石流灾害风险预测研究较多,而对于山坡型泥石流灾害预测研究较少。在人口密集的山地区域开展泥石流灾害风险预测中,大都采用多种传感器实时获取的监测参数数据,并对采集数据进行分析处理,从而实现风险预测。这类方法能够满足实时风险预测要求,但需要投入较多监测设备,其成本较高。对于广阔的山地区域,普遍采用传感器设备监测方法,其经济成本不可承受。
除传感器设备实时监测泥石流灾害风险方法外,也可采用基于专家经验的人工现场勘探和目视方法,这类方法成本相对较低,但预测风险准确率受限于勘测人员经验,而且效率太低。
此外,在泥石流灾害风险预测模型方面,传统方法通常是采用单一的预测模型,没有完全考虑到短期预测和长期预测的区别与特点,难以满足人们对泥石流灾害风险的长短期预测要求,所以对于泥石流灾害风险预测模型选取还需持续改进。
发明内容
针对目前泥石流灾害风险预测存在的局限问题,本发明将在泥石流灾害风险分类、泥石流长短期预测等方面,提出一种适用于复杂山区的泥石流灾害风险长短期分类预测方法。具体技术方案如下:
步骤1,泥石流隐患监测区圈定,在卫星地图上圈定泥石流隐患监测区范围,通过地图工具获得隐患监测区域东南西北四个方向上的经纬度,通过经纬度范围框出泥石流隐患监测区范围;
步骤2,监测区域数字高程模型下载,针对圈定的泥石流隐患监测区,从专业网站系统下载监测区域的数字高程模型DEM数据;
步骤3,泥石流隐患区域流域形态分类,针对下载后的监测区DEM数据,按泥石流灾害监测区域实际大小裁剪后重新保存为新的DEM文件,使用分类算法进行分类处理,确定该监测区域是沟谷型泥石流灾害隐患区,还是山坡型泥石流灾害隐患区;
步骤4,采集泥石流隐患区灾害影响因素数据,从国家自然资源部网站每天发布的地质灾害灾情报告中获取泥石流灾害点信息,并通过地图网站将灾害点信息转化为具体的经纬度坐标;从专业网站系统分别获取对应区域的降雨量、土壤含水量、高程、坡度、地层岩性、植被覆盖数、计算获得地表形变量数据;
步骤5,泥石流风险多维分类预测模型学习,基于获取的不同类型泥石流灾害样本数据,分别使用AdaBoost算法结合短期影响因素学习基于AdaBoost的短期泥石流灾害预测模型;使用支持向量机结合长期影响因素学习基于SVM的长期泥石流灾害风险预测模型,并使用数据集验证预测模型,最后,从四个维度获得基于SVM的长期沟谷型泥石流灾害风险预测模型、基于AdaBoost的短期沟谷型泥石流灾害风险预测模型、基于SVM的长期山坡型泥石流灾害风险预测模型和基于AdaBoost的短期山坡型泥石流灾害风险预测模型。
步骤6,泥石流风险多维分类预测与结果呈现,针对监测区流域分类结果,分别选取对应的预测模型处理监测数据,实现该监测区泥石流灾害风险长短期预测处理,并将预测结果数据进行可视化展示。
本发明实施例的技术方案至少可以带来以下有益效果:
1)复杂山区的泥石流灾害不同于其它地区的泥石流灾害。对于铁路、桥梁、公路等重要位置,或者人口居住的城镇,可以通过安装精密传感器的方法辅助进行泥石流灾害风险预测。通过精密传感器能采集到更加精准的监测数据,在同样预测模型下能获得更好的泥石流灾害风险预测效果。而复杂山区的地质条件、地形地貌复杂,监测人员通常难以到达;传统的泥石流灾害分类需要专业人员现场勘探,不适合复杂山区的实际情况。本发明按照泥石流灾害隐患区域流域形态将隐患区分为沟谷型泥石流灾害隐患区和山坡型泥石流灾害隐患区,然后采用相应的预测模型对监测区进行泥石流风险预测;本发明提出了泥石流隐患区流域形态分类方法。使用分类模型对泥石流隐患区域的DEM文件进行二分类,按照隐患区域流域形态将隐患区域划分为沟谷型泥石流灾害隐患区和山坡型泥石流灾害隐患区。解决勘测人员难以实施复杂山区现场勘探与人工分类问题。
2)现有泥石流风险预测方法并没有考虑短期预测和长期预测的实际应用需求。长短期预测在各方面均存在一定的区别,使用单一模型预测并不合理。本发明针对泥石流灾害长短期预测问题,提出的对沟谷型泥石流和山坡型泥石流分别构建长期预测模型和短期预测模型,实现三日内的泥石流预测与四到七日内的泥石流分类预测;本发明提出了一种支持向量机和AdaBoost算法相结合的泥石流长短期分类预测方法。在流域形态分类结果的基础上,按预测时间将其分类为三日内的短期预测与四到七日的长期预测。使用基于AdaBoost的短期预测模型预测1到3日的泥石流风险情况,使用基于SVM的长期预测模型预测4到7日的泥石流风险情况。本发明解决了传统单一模型对于长短期预测精度不足问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明实施例提供的一种实现泥石流灾害风险多维分类预测方法的流程图;
图2为本发明实施例提供的DEM下载流程图;
图3为沟谷型泥石流流域示意图;
图4为山坡型泥石流流域示意图;
图5为本发明实施例提供的泥石流灾害多维分类预测模型学习流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了保证泥石流灾害的预测精度,本发明实施例提供了一种实现泥石流灾害风险多维分类预测方法。如图1所示,该方法包括如下步骤。
步骤1,泥石流隐患监测区圈定,在卫星地图上圈定泥石流隐患监测区范围,通过地图工具获得隐患监测区域经纬度范围,通过经纬度范围框出泥石流隐患监测区范围。
具体的,获得经纬度范围时,通过地图工具在东西方向上获取泥石流隐患监测区的经度范围,在南北方向上获取泥石流隐患监测区的纬度范围。
步骤2,监测区域数字高程模型下载,针对圈定的泥石流隐患监测区,从专业网站系统下载监测区域的数字高程模型(DEM)数据。
数字高程模型(DEM)实现了地面地形的数字化模拟(即地形表面形态的数字化表达),它是用一组有序数值阵列形式表示地面高程的一种实体地面模型。本发明利用获取的监测区DEM进行监测区流域形态分类处理。
本发明获取30m精度和12.5m精度的DEM。其中,12.5m精度的DEM可以从ALOSPALSAR的卫星图像中提取。但是ALOS PALSAR的卫星图像覆盖范围并不完整,部分地区并没有覆盖到。针对部分没有ALOS PALSAR卫星图像的区域,采用30m精度的DEM进行替代。其DEM下载过程如图2所示:
步骤21,从美国航空航天局(NASA)下属网站EarthData(https://search.asf.alaska.edu)中框选需要研究的监测区域;
步骤22,判断该区域是否有ALOS PALSAR图像数据,若结果为是执行步骤1023,若结果为否执行步骤1025;
步骤23,选择完成覆盖监测区域的图像,具体的,筛选出完整包含该区域的ALOSPALSAR卫星图像。若目标区域过大,一幅卫星图像无法完全覆盖,需要将大区域分成若干个能被单幅图像完全覆盖的小区域进行处理,并以此图像为搜索基准,搜索出该区域图像数据。
步骤24,下载Hi-Res Terrain Corrected文件,具体的,选择该区域的高分辨率地形校正(Hi-Res Terrain Corrected)图像并下载到本地。
步骤25,获取地理空间数据云DEM数据,具体的,从中国科学院计算机网络信息中心下属的地理空间数据云网站(https://www.gscloud.cn/)的公开数据中,选择ASTERGDEM 30M(Advanced Spaceborne Thermal Emission and Reflection RadiometerGlobal Digital Elevation Model,即先进星载热发射和反射辐射仪全球数字高程模型,其全球空间分辨率为30米)分辨率数字高程数据;
步骤26,输入监测区域经纬度;
步骤27,下载对应区域ASTER GDEM 30M分辨率数字高程数据;
步骤28,经步骤1024或步骤1027获得DEM文件。
步骤3,泥石流隐患区域流域形态分类,针对下载后的监测区DEM数据,按泥石流灾害监测区域实际大小裁剪后重新保存为新的DEM文件,使用人工智能的支持向量机算法进行分类处理,确定该监测区域是沟谷型泥石流灾害隐患区,还是山坡型泥石流灾害隐患区。
对于泥石流灾害而言,按泥石流灾害区域流域形态类型可将泥石流灾害分类为沟谷型泥石流灾害和山坡型泥石流灾害。因此,对于泥石流灾害隐患区进行泥石流灾害风险预测时,可以按照泥石流灾害隐患区域流域形态部分将隐患区分为沟谷型泥石流灾害隐患区和山坡型泥石流灾害隐患区,其形态如图3和图4所示。
下载好的DEM文件所覆盖的地理范围通常远远大于泥石流灾害监测区域。如果直接对该DEM进行分析识别处理,则处理的大部分区域并不是监测区域,会严重干扰识别结果。因此需要使用ArcGIS对原始的DEM文件进行裁剪操作,使得裁剪后的DEM文件只包含监测区域。
将下载的原始DEM文件拖入ArcGIS中,按泥石流灾害监测区域实际大小裁剪后重新保存为新的DEM文件。
详细步骤包括:
(1)将DEM文件导入ArcGIS中;
(2)打开ArcGIS的ArcToolbox,找到“数据管理工具”—“栅格”—“栅格处理”—“裁剪”工具;
(3)在“输入栅格”中选择当前DEM文件;
(4)按泥石流灾害监测区域的实际大小,在矩形范围内依次填入经纬度的最大值和最小值;
(5)点击确定,生成裁剪后的DEM数据,并保存。
从国家自然资源部网站每天发布的地质灾害灾情报告中获取历年泥石流灾害点,通过地图网站将灾害点转化为具体的经纬度坐标。根据灾害点坐标,获取灾害点对应的DEM文件,并按上述方法将原始DEM文件裁剪为合适的大小。使用人工目视等方法对泥石流灾害进行分类,打上沟谷型泥石流或山坡型泥石流的标签,分别作为机器学习训练的正负样本。
针对已经裁剪好并标签完毕的DEM文件,通过DEM文件提取监测区平面曲率、剖面曲率、坡度和高程作为数据集,对支持向量机进行训练。
支持向量机的训练过程如下,输入训练集{(Xi,yi)},i=1~N,其中yi=+1或者-1,为正负样本标签,Xi为主要影响因素,包括平面曲率、剖面曲率、坡度和高程;求解如下目标函数最大化,
限制条件:yj=+1或者-1,为正负样本标签;
其中,N表示训练集总数,K(Xi,Xj)表示核函数,C表示大于0的惩罚因子;
在核函数的选取中,选取多项式核函数,即
K(Xi,Xj)=(Xi·Xj+c)d
其中,c为常数项,用于调整核函数的非线性程度,d为多项式的次数,决定了多项式核函数的复杂度;C、c和d需要在学习过程中调参;
当目标函数最大化时,α的所有值构成最优解α*,其中α=(α1,α2,...αN), 而/>代表αi在收敛后的最优解;
使用如下算法计算最优解α*的取值,具体过程为:
选择两个需要更新的参数αi和αj,固定其他αk,k=1~N,k≠i,k≠j,由于约束条件此时约束条件变为
αiyi+αjyj=c
0≤αi≤C
0≤αj≤C
其中由此得出/>使用αi的表达式代替αj,可将目标问题转化为仅一个约束条件的最优化问题,仅有的约束条件是0≤αi≤C;
对于仅有一个约束条件的最优化问题,对αi求偏导数,令导数为0,从而求出变量值αinew,根据αinew求出αjnew;多次迭代直至收敛,计算出每个得到最优解α*,构造分类决策函数f(x):
其中T为转置,sign(·)为迁跃函数:
将打好标签后分类为沟谷型泥石流和山坡型泥石流的DEM,分别作为正负样本,输入到训练模型中进行分类训练。将训练好的分类模型作为泥石流灾害隐患区流域形态分类模型。
最后,将泥石流灾害隐患区裁剪好的DEM输入泥石流灾害隐患区流域形态分类模型,得到泥石流灾害隐患区域流域形态分类结果,即沟谷型泥石流隐患区或山坡型泥石流隐患区。
步骤4,采集泥石流隐患区灾害影响因素数据,从国家自然资源部网站每天发布的地质灾害灾情报告中获取泥石流灾害点信息,并通过地图网站将灾害点信息转化为具体的经纬度坐标。从专业网站系统分别获取对应区域的气象、区域地形地貌、岩层岩性、植被覆盖率等数据,使用哨兵一号数据分析获取对应区域的地表形变量数据。
泥石流灾害主要影响因素选取如下:
泥石流灾害的影响因素有很多,如坡度、高程、地层岩性、地质构造、地表覆盖类型、植被覆盖指数、降雨量、土壤含水量、与水系距离、与建筑物距离、与道路距离、地表形变量等。关于泥石流灾害影响因素挖掘,其他学者已经研究成熟,其权重从高到低的顺序分别是:地层岩性>降雨量>地质构造>坡度>植被覆盖指数>高程>土壤含水量>地表形变量>地表覆盖类型>与水系距离>与建筑物距离>与道路距离。本发明选取地层岩性、降雨量、坡度、植被覆盖数、高程、土壤含水量、地表形变量作为泥石流灾害地质灾害的主要影响因素。
对于长短期预测,本发明选取的影响因素也有所区别。对于短期预测,短期影响因素包括地层岩性、降雨量、坡度、植被覆盖数、高程、土壤含水量,以及累计降雨量。对于长期预测,长期影响因素包括地层岩性、降雨量、坡度、植被覆盖数、高程、土壤含水量,以及地表形变量。长短期预测在影响因素选取上的区别在于短期预测的影响因素包含累计降雨量,而长期预测的影响因素包含地表形变量。其主要原因在于,累计降雨量在三日内对于泥石流灾害的发生影响权重较大,而累计降雨量只有实际数据,并无预测数据。而地表形变量因为数据周为期六天,通过插值预测得到的数据并非实际数据,存在一定误差,对于敏感的短期预测并不适用,因此只将地表形变量用于长期预测。
泥石流灾害影响因素数据获取如下:
从国家自然资源部网站每天发布的地质灾害灾情报告中获取历年泥石流灾害点,通过地图网站将灾害点转化为具体的经纬度坐标。根据灾害点坐标,从各个数据网站获取该点的气象水文、土壤湿度等数据,并汇总成为数据集的正样本。任意选择部分未发生过泥石流灾害的区域,采集相同数据,作为数据集的负样本。对于一个发生过泥石流的区域,需要获取两个不同时间点的数据,分别为灾害发生前1至3天中随机某一天的数据,以及灾害发生前4至7天中随机某一天的数据。对于未发生过泥石流的区域,同样任意选取一个时间点作为对比时间,分别选取对比时间前1至3天中随机某一天的数据,以及对比时间前4至7天中随机某一天的数据。
国家自然资源部网站(https://www.mnr.gov.cn/)每天会发布地质灾害灾情险情报告,编写python脚本采集该网站上近十年的地质灾害灾情报告,并从报告中处理提取出灾害发生时间、地点、灾害类型等数据。筛选出其中的历年泥石流灾害数据,获取泥石流灾害位置、泥石流灾害流域形态。通过经纬度查询定位网站,将灾害点的文字地质信息转化为具体的经纬度。
气象历史数据,从美国国家环境信息中心网站系统获取,其网址为(https://www.ncei.noaa.gov/data/global-forecast-system/access/historical/analysis/)。采集的气象数据包括降雨量、土壤含水量等数据。
区域地形地貌数据,可以从美国航天航空局网站(https://urs.earthdata.nasa.gov/)上获取ASTER GDEM 30M分辨率原始高程数据。编写采集程序将区域的高程数据下载到本地,然后利用Python程序进行数据的解析,并通过坡度坡向算法计算公式进行区域地形地貌的初步分析处理,从中提取、计算得到区域的高程、坡度数据。
区域地层岩性数据,可从国家地质资料馆网站(http://www.ngac.org.cn/DataSpecial/geomap.html)获取。在国家地质图数据专题服务应用中寻找对应经纬度所在的点,基于图例数据,人工采集该区域地质岩性数据。
区域植被覆盖数据,从欧洲中期天气预报中心网站(https://www.ecmwf.int/en/forecasts/datasets/reanalysis-datasets/era5)获取监测区域叶面积指数来表示植被覆盖情况,使用python程序调用该网站数据下载api进行区域叶面积指数的数据采集。
地表形变量数据,从美国航空航天局(NASA)下属网站EarthData下载哨兵一号(Sentinel-1)数据后,通过SBAS-InSAR技术计算得到地表形变量。因为哨兵一号最短周期为6天,所以计算得到的地表形变的数据也是以6天为间隔,无法直接满足预测泥石流灾害的要求,需要对数据进行进一步处理。
首先,使用拉格朗日插值法,将6天为周期的地表形变量数据补为以1天为周期的地表形变量数据。
拉格朗日多项式
补全为间隔1天的地表形变量后,使用支持向量回归(SVR)对地表形变量进行预测,得到未来7天的地表形变量预测值。
步骤5,泥石流风险多维分类预测模型学习,基于获取的不同类型泥石流灾害样本数据,分别使用AdaBoost算法结合短期影响因素学习基于AdaBoost的短期泥石流灾害预测模型。使用支持向量机结合长期影响因素学习基于SVM的长期泥石流灾害风险预测模型,并使用数据集验证预测模型,最后,获得沟谷型泥石流长短期预测模型、山坡型泥石流长短期预测模型。
对于泥石流灾害而言,降雨是一个非常关键的影响因素。目前对于降雨量的预测,通常是时间越近的预测数据准确率越高,时间越久远的预测数据准确度越低。针对降雨预测这一特性,本发明的长短期预测分别采用AdaBoost算法和支持向量机(SVM)算法,对于泥石流地质灾害进行预测。
支持向量机(SVM)和AdaBoost都是常用的机器学习算法,它们在不同的场景下有着各自的优缺点。支持向量机是一种二分类模型,它的目标是找到一个最优超平面,将数据分为两类。支持向量机的优点是在高维空间中表现良好,可以处理非线性分类问题,且泛化能力强。AdaBoost是一种集成学习算法,它通过逐步调整数据集的权重,构建多个弱分类器,最终将它们组合成一个强分类器。AdaBoost的优点是可以提高分类器的准确率,对于噪声数据有一定的鲁棒性。相比于支持向量机,AdaBoost更加敏感,更加适用于降雨预测准确率较高的短期预测。
选取泥石流灾害隐患区后,根据泥石流灾害隐患区域流域形态分类结果,将泥石流隐患区划分为沟谷型泥石流和山坡型泥石流。在此基础上,在根据预测三天内和预测四到七天,将其分成短期预测和长期预测。分别使用沟谷型泥石流和山坡型泥石流中包含地表形变量在内的泥石流影响因素数据训练SVM风险预测模型,分别使用沟谷型泥石流和山坡型泥石流中包含累计降雨量在内的泥石流影响因素数据训练AdaBoost风险预测模型。最终形成基于SVM的长期沟谷型泥石流灾害风险预测模型、基于AdaBoost的短期沟谷型泥石流灾害风险预测模型、基于SVM的长期山坡型泥石流灾害风险预测模型和基于AdaBoost的短期山坡型泥石流灾害风险预测模型,四个模型从四个维度预测泥石流灾害。其流程图如图5所示。
对于长短期的划分,主要源于累计降雨量对于泥石流灾害的影响。根据以往研究,三日以内的累计降雨量对于泥石流灾害影响权重较高,因此本发明将三日以内的泥石流灾害风险预测定位短期预测,四日到七日的泥石流灾害风险预测定位长期预测。
AdaBoost作为集成算法boosting中的代表算法,其核心思想在于纠正弱分类器所犯的错误。在每一个树的学习阶段均使用训练集的全部数据,在迭代过程中通过改变训练样本的权重,然后学习得到多个分类器,最后将这些“弱”分类器进行线性组合,得到最终的分类器模型。训练过程如下:
(1)给定训练样本数据集:S={(x1z1),...,(xizi),...,(xNzN)},其中N为样本的总数,xi表示主要影响因素,包括地层岩性、降雨量、坡度、植被覆盖率、高程、土壤含水量以及累计降雨量,zi表示训练样本的风险标签,其中,zi=1或者-1,分别表示为有风险和无风险。
(2)训练样本集的初始权重分布为:
式中:D1(i)训练样本集的初始权重分布;
W1i为每一个训练样本最开始被赋予相同的权重。
(3)进行m轮迭代,适用决策树作为基分类器,对权重Dm的训练集学习,计算弱分类器Gm(x)。
(4)计算Gm(x)在训练集上的分类误差率em
式中:I(Gm(xi)≠z)取值为0(分类正确)或1(分类错误)。
(5)计算弱分类器Gm(x)的系数am
(6)更新训练数据的权值分布
(7)构建最终分类器
按弱分类器权重am组合各个弱分类器,即
通过符号函数sign的作用,得到一个强分类器为:
长期训练模型采用如下方法训练:
输入训练集{(Xi,yi)},i=1~N,其中yi=+1或者-1,为正负样本标签,Xi为主要影响因素,包括地层岩性、降雨量、坡度、植被覆盖率、高程、土壤含水量以及地表形变量;求解如下目标函数最大化,
限制条件:yj=+1或者-1,为正负样本标签;
其中,N表示训练集总数,K(Xi,Xj)表示核函数,C表示大于0的惩罚因子;
在核函数的选取中,选取高斯核函数,即
其中C和δ需要在学习过程中调参;
当目标函数最大化时,α的所有值构成最优解α*,其中α=(α1,α2,...αN), 而/>代表αi在收敛后的最优解;
使用如下算法计算最优解α*的取值,具体过程为:
选择两个需要更新的参数αi和αj,固定其他αk,k=1~N,k≠i,k≠j,由于约束条件此时约束条件变为
αiyi+αjyj=c
0≤αi≤C
0≤αj≤C
其中由此得出/>使用αi的表达式代替αj,可将目标问题转化为仅一个约束条件的最优化问题,仅有的约束条件是0≤αi≤C;
对于仅有一个约束条件的最优化问题,对αi求偏导数,令导数为0,从而求出变量值根据/>求出/>多次迭代直至收敛,计算出每个/>得到最优解α*,构造分类决策函数f(x):
其中T为转置,sign(·)为迁跃函数:
将数据集中的测试区域按7:3的比例分为训练集和测试集。对于训练集中,每个区域包含两组数据,分别为目标时间(正样本为泥石流发生时间,负样本为对比时间)前1至3天中某一天的数据,以及前4至7天中某一天的数据。再根据区域流域形态分类结果,用训练集中1至3天的数据分别训练沟谷型和山坡型泥石流短期预测模型,用训练集中4至7天的数据分别训练沟谷型和山坡型泥石流长期预测模型。使用测试集数据对训练后的模型进行验证。
将训练完成后的模型作为泥石流灾害多维分类预测模型。
步骤6,泥石流风险多维分类预测与结果呈现,针对监测区流域分类结果,分别选取对应的预测模型处理监测数据,实现该监测区泥石流灾害风险长短期预测处理,并将预测结果数据进行可视化展示。
将泥石流灾害隐患区的数据输入泥石流灾害多维分类预测模型,模型首先会将泥石流灾害隐患区按流域形态分为山坡型泥石流或者沟谷型泥石流,然后再分别使用短期预测模型预测1到3日的泥石流风险情况,使用长期预测模型预测4到7日的泥石流风险情况。最终得到预测结果。
表1泥石流风险多维分类预测结果
为了实证本发明方法的技术效果,我们开展了不同预测模型方法对比实验。该实验方案使用共计367个泥石流测试样例,分别进行流域形态分类对比和长短期分类模型对比。首先对比泥石流隐患区不分类情况下和泥石流隐患区分类情况下,泥石流灾害风险预测结果。在使用相同预测算法的条件下,本发明提出的流域形态分类预测模型相比不分类的流域形态预测模型平均准确率高3.5%。其次将长期泥石流风险预测模型、短期泥石流风险预测模型分别和长短期分类预测模型的风险预测结果进行对比,在相同测试样例下对比长短期预测模型、长期预测模型和短期预测模型,本发明提出长短期预测模型在短期预测方面相比于长期预测模型平均准确率高3.2%,在长期预测方面相比于短期预测模型平均准确率高4.3%。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (7)
1.一种实现泥石流灾害风险多维分类预测方法,其特征在于,所述方法包括:
步骤1,泥石流隐患监测区圈定,在卫星地图上圈定泥石流隐患监测区范围,通过地图工具获得隐患监测区域东南西北四个方向上的经纬度,通过经纬度范围框出泥石流隐患监测区范围;
步骤2,监测区域数字高程模型下载,针对圈定的泥石流隐患监测区,从专业网站系统下载监测区域的数字高程模型数据;
步骤3,泥石流隐患区域流域形态分类,针对下载后的监测区数字高程模型数据,按泥石流灾害监测区域实际大小裁剪后重新保存为新的数字高程模型文件,通过数字高程模型文件提取监测区平面曲率、剖面曲率、坡度和高程作为数据集,使用人工智能的支持向量机算法进行分类处理,确定该监测区域是沟谷型泥石流灾害隐患区,还是山坡型泥石流灾害隐患区;所述分类训练方法处理如下:
输入训练集{(Xi,yi)},i=1~N,其中yi=+1或者-1,为正负样本标签,Xi为主要影响因素,包括平面曲率、剖面曲率、坡度和高程;求解如下目标函数最大化,
限制条件:yj=+1或者-1,为正负样本标签;
其中,N表示训练集总数,K(Xi,Xj)表示核函数,C表示大于0的惩罚因子;
在核函数的选取中,选取多项式核函数,即
K(Xi,Xj)=(Xi·Xj+c)d
其中,c为常数项,用于调整核函数的非线性程度,d为多项式的次数,决定了多项式核函数的复杂度;C、c和d需要在学习过程中调参;
当目标函数最大化时,α的所有值构成最优解α*,其中α=(α1,α2,...αN), 而/>代表αi在收敛后的最优解;
使用如下算法计算最优解α*的取值,具体过程为:
选择两个需要更新的参数αi和αj,固定其他αk,k=1~N,k≠i,k≠j,由于约束条件此时约束条件变为
αiyi+αjyj=c
0≤αi≤C
0≤αj≤C
其中由此得出/>使用αi的表达式代替αj,可将目标问题转化为仅一个约束条件的最优化问题,仅有的约束条件是0≤αi≤C;
对于仅有一个约束条件的最优化问题,对αi求偏导数,令导数为0,从而求出变量值根据/>求出/>多次迭代直至收敛,计算出每个/>得到最优解α*,构造分类决策函数f(x):
其中T为转置,sign(·)为迁跃函数:
步骤4,采集泥石流隐患区灾害影响因素数据,获取泥石流灾害点信息,并通过地图网站将灾害点信息转化为具体的经纬度坐标;从专业网站系统分别获取对应区域的降雨量、土壤含水量、高程、坡度、地层岩性、植被覆盖数、计算获得地表形变量数据;
步骤5,泥石流风险多维分类预测模型学习,基于获取的不同类型泥石流灾害样本数据,分别使用AdaBoost算法结合短期影响因素学习基于AdaBoost的短期泥石流灾害预测模型;使用支持向量机结合长期影响因素学习基于SVM的长期泥石流灾害风险预测模型,并使用数据集验证预测模型,最后,从四个维度获得基于SVM的长期沟谷型泥石流灾害风险预测模型、基于AdaBoost的短期沟谷型泥石流灾害风险预测模型、基于SVM的长期山坡型泥石流灾害风险预测模型和基于AdaBoost的短期山坡型泥石流灾害风险预测模型;
步骤6,泥石流风险多维分类预测与结果呈现,针对监测区流域分类结果,分别选取对应的预测模型处理监测数据,实现该监测区泥石流灾害风险长短期预测处理,并将预测结果数据进行可视化展示。
2.根据权利要求1所述的方法,其特征在于,所述短期影响因素包括地层岩性、降雨量、坡度、植被覆盖数、高程、土壤含水量,以及累计降雨量。
3.根据权利要求1所述的方法,其特征在于,所述长期影响因素包括地层岩性、降雨量、坡度、植被覆盖数、高程、土壤含水量,以及地表形变量。
4.根据权利要求1所述的方法,其特征在于,短期泥石流灾害预测模型采用如下方法训练:
(1)给定训练样本数据集:S={(x1z1),...,(xizi),...,(xNzN)},其中N为样本的总数,xi表示主要影响因素,包括地层岩性、降雨量、坡度、植被覆盖率、高程、土壤含水量以及累计降雨量,zi表示训练样本的风险标签,其中,zi=1或者-1,分别表示为有风险和无风险;
(2)训练样本集的初始权重分布为:
式中:D1(i)训练样本集的初始权重分布;
W1i为每一个训练样本最开始被赋予相同的权重;
(3)进行m轮迭代,适用决策树作为基分类器,对权重Dm的训练集学习,计算弱分类器Gm(x),Gm(x)的输出值{-1,1};
(4)计算Gm(x)在训练集上的分类误差率em
式中:I(Gm(xi)≠zi)取值为0代表分类正确或取值为1代表分类错误;
(5)计算弱分类器Gm(x)的系数am
(6)更新训练数据的权值分布
(7)构建最终分类器
按弱分类器权重am组合各个弱分类器,即
通过符号函数sign的作用,得到一个强分类器为:
5.根据权利要求1所述的方法,其特征在于,长期泥石流灾害预测模型采用如下方法训练:
输入训练集{(Xi,yi)},i=1~N,其中yi=+1或者-1,为正负样本标签,Xi为主要影响因素,包括地层岩性、降雨量、坡度、植被覆盖率、高程、土壤含水量以及地表形变量;求解如下目标函数最大化,
限制条件:yj=+1或者-1,为正负样本标签;
其中,N表示训练集总数,K(Xi,Xj)表示核函数,C表示大于0的惩罚因子;
在核函数的选取中,选取高斯核函数,即
其中C和δ需要在学习过程中调参;
当目标函数最大化时,α的所有值构成最优解α*,其中α=(α1,α2,...αN), 而/>代表αi在收敛后的最优解;
使用如下算法计算最优解α*的取值,具体过程为:
选择两个需要更新的参数αi和αj,固定其他αk,k=1~N,k≠i,k≠j,由于约束条件此时约束条件变为
αiyi+αjyj=c
0≤αi≤C
0≤αj≤C
其中由此得出/>使用αi的表达式代替αj,可将目标问题转化为仅一个约束条件的最优化问题,仅有的约束条件是0≤αi≤C;
对于仅有一个约束条件的最优化问题,对αi求偏导数,令导数为0,从而求出变量值根据/>求出/>多次迭代直至收敛,计算出每个/>得到最优解α*,构造分类决策函数f(x):
其中T为转置,sign(·)为迁跃函数:
6.根据权利要求1所述的方法,其特征在于,短期预测为三日以内的泥石流灾害风险预测。
7.根据权利要求1所述的方法,其特征在于,长期预测为四日到七日的泥石流灾害风险预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311414102.3A CN117390555A (zh) | 2023-10-27 | 2023-10-27 | 一种实现泥石流灾害风险多维分类预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311414102.3A CN117390555A (zh) | 2023-10-27 | 2023-10-27 | 一种实现泥石流灾害风险多维分类预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117390555A true CN117390555A (zh) | 2024-01-12 |
Family
ID=89435581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311414102.3A Pending CN117390555A (zh) | 2023-10-27 | 2023-10-27 | 一种实现泥石流灾害风险多维分类预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117390555A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933578A (zh) * | 2024-03-22 | 2024-04-26 | 四川省地质调查研究院 | 一种泥石流的安全隐患评估方法及系统 |
CN118171087A (zh) * | 2024-05-14 | 2024-06-11 | 四川省华地建设工程有限责任公司 | 一种适用于较陡沟谷型泥石流沟的监测方法及系统 |
-
2023
- 2023-10-27 CN CN202311414102.3A patent/CN117390555A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933578A (zh) * | 2024-03-22 | 2024-04-26 | 四川省地质调查研究院 | 一种泥石流的安全隐患评估方法及系统 |
CN117933578B (zh) * | 2024-03-22 | 2024-06-07 | 四川省地质调查研究院 | 一种泥石流的安全隐患评估方法及系统 |
CN118171087A (zh) * | 2024-05-14 | 2024-06-11 | 四川省华地建设工程有限责任公司 | 一种适用于较陡沟谷型泥石流沟的监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Han et al. | Driving factors of desertification in Qaidam Basin, China: An 18-year analysis using the geographic detector model | |
Mahmoud et al. | Assessment of global precipitation measurement satellite products over Saudi Arabia | |
Shahabi et al. | Remote sensing and GIS-based landslide susceptibility mapping using frequency ratio, logistic regression, and fuzzy logic methods at the central Zab basin, Iran | |
Clerici et al. | A GIS-based automated procedure for landslide susceptibility mapping by the conditional analysis method: the Baganza valley case study (Italian Northern Apennines) | |
Pradhan et al. | Use of geospatial data and fuzzy algebraic operators to landslide-hazard mapping | |
Su et al. | Mapping of rainfall-induced landslide susceptibility in Wencheng, China, using support vector machine | |
NEFESLİOĞLU et al. | Assessment of landslide susceptibility by decision trees in the metropolitan area of Istanbul, Turkey | |
Degerli et al. | Using the remote sensing method to simulate the land change in the year 2030 | |
CN117390555A (zh) | 一种实现泥石流灾害风险多维分类预测方法 | |
Abd et al. | Maximum likelihood for land-use/land-cover mapping and change detection using Landsat satellite images: A case study “South of Johor” | |
CN109782373A (zh) | 一种基于改进的Naive Bayesian-CNN多目标分类算法的沙尘暴预测方法 | |
CN106777585A (zh) | 一种区域浅表滑坡时空分异规律的esda分析法 | |
Abino et al. | Assessing land use and land cover of the Marikina sub-watershed, Philippines | |
Guru et al. | Comparison of probabilistic and expert-based models in landslide susceptibility zonation mapping in part of Nilgiri District, Tamil Nadu, India | |
Gharaylou et al. | Prediction of lightning activity using WRF-ELEC model: Impact of initial and boundary conditions | |
Tran et al. | Improving hydrologic modeling using cloud-free modis flood maps | |
Adlyansah et al. | Analysis of flood hazard zones using overlay method with figused-based scoring based on geographic information systems: Case study in parepare city South Sulawesi province | |
Feser et al. | North Atlantic winter storm activity in modern reanalyses and pressure-based observations | |
Notti et al. | Semi-automatic mapping of shallow landslides using free Sentinel-2 images and Google Earth Engine | |
Soma et al. | The Performance of Land Use Change Causative Factor on Landslide Susceptibility Map in Upper Ujung-Loe Watersheds South Sulawesi, Indonesia | |
Mott et al. | Operational snow-hydrological modeling for Switzerland | |
Zhao et al. | Characterizing spatiotemporal dynamics of land cover with multi-temporal remotely sensed imagery in Beijing during 1978–2010 | |
Jasim et al. | Land transformation assessment using the integration of remote sensing and GIS techniques: a case study of Al-Anbar Province, Iraq | |
Bagwan | An assessment of rainfall-induced land degradation condition using Erosivity Density (ED) and heatmap method for Urmodi River watershed of Maharashtra, India | |
Oyda et al. | Assessing landslide susceptibility in Lake Abya catchment, Rift Valley, Ethiopia: a GIS-based frequency ratio analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |