CN113191582B - 一种基于gis与机器学习的道路山洪易损性评价方法 - Google Patents
一种基于gis与机器学习的道路山洪易损性评价方法 Download PDFInfo
- Publication number
- CN113191582B CN113191582B CN202110274765.4A CN202110274765A CN113191582B CN 113191582 B CN113191582 B CN 113191582B CN 202110274765 A CN202110274765 A CN 202110274765A CN 113191582 B CN113191582 B CN 113191582B
- Authority
- CN
- China
- Prior art keywords
- road
- svm
- vulnerability
- grid
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 53
- 238000010801 machine learning Methods 0.000 title claims abstract description 13
- 238000012706 support-vector machine Methods 0.000 claims abstract description 75
- 230000009467 reduction Effects 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000012360 testing method Methods 0.000 claims abstract description 39
- 238000011160 research Methods 0.000 claims abstract description 24
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 230000007246 mechanism Effects 0.000 claims abstract description 8
- 230000009471 action Effects 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000010606 normalization Methods 0.000 claims description 16
- 238000012544 monitoring process Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000004088 simulation Methods 0.000 claims description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- 238000006424 Flood reaction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 2
- 238000007670 refining Methods 0.000 claims description 2
- 238000009966 trimming Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 13
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000013507 mapping Methods 0.000 abstract 1
- 238000010276 construction Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 101100167365 Caenorhabditis elegans cha-1 gene Proteins 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于GIS与机器学习的道路山洪易损性评价方法,包括步骤:S1、选择格网单元作为基本评价单元,由研究区域的大小确定格网单元的大小;格网单元的长宽不超过5km;S2、通过山洪灾害对道路的作用机理研究和分析,建立道路山洪易损性评价的指标体系;S3、基于支持向量机的道路山洪易损性评价的SVM模型的建立;S4、SVM训练数据集与测试数据集的建立;S5、SVM模型的训练和测试;S6、根据计算道路造价后得到的格网单元内道路的暴露度,与SVM模型输出得到的减灾力,得到单元内道路的易损性评价结果,并进行制图和分析。本发明提供的评价方法计算精确,原理可靠,操作过程易学简便,能够普遍适用于道路山洪易损性评价的需要。
Description
技术领域
本发明涉及山洪灾害风险评估技术领域,尤其是一种基于GIS与机器学习的道路山洪易损性评价方法。
背景技术
道路山洪易损性评价是以道路作为山洪灾害的承灾体,建立评价模型,综合评估道路在山洪灾害下所表现的负面效应,以损失程度或损失价值来衡量。进行道路山洪易损性评价,能够有效识别高易损性的道路段,并针对性地提出弥补措施,有效的减少山洪灾害造成的道路损坏和经济损失。
目前,对于山洪易损性的研究主要聚集在区域上面,比如专利201810157583.7公开的一种基于GIS-神经网络集成的山洪灾害风险区划及预测方法。专利201710352100.4公开的一种县域尺度山洪灾害风险评估方法。在评估山洪风险的过程中进行了易损性评估,但是易损性评估的对象是一个区域的所有承灾体,没有对道路进行针对性的易损性研究。易损性评估的主要方法有专家打分法、层次分析法、高斯-马尔科夫模型、模糊综合评价法等,这些方法大部分具有一定的人为主观性,使得易损性评价的结果也带有主观性和局限性。例如专利202011004876.5公开的一种基于暴雨过程的洪水风险预测方法。
发明内容
本发明针对山洪对道路的作用机理复杂、传统的道路山洪易损性评价模型权重确定环节中人为因素过高的不足和缺陷,提供一种根据道路价值、道路周边设施以及周边城市的救援能力数据等用于道路山洪易损性评价的方法,该方法能够实现大区域尺度下的道路易损性评价。
本发明提供的基于GIS与机器学习的道路山洪易损性评价方法,包括如下步骤:
S1、建立格网,划分研究区的基本评价单元:
由于道路是一种线状实体,在进行区域性的道路山洪易损性评价时,行政区划单元的区域往往过大,一个行政区划单元就包含了大量道路,而小流域等地形单元对道路的划分不均,因此这两种评价单元都不能很好的满足评价需要。格网单元是一种比较通用的基本评价单元。采用格网单元的好处在于可以较均匀地为道路进行分段,统一大小的格网也减少了评价过程中的变量。
根据具体研究区域的范围和大小,确定格网单元的大小,为保证评价结果的精度,格网单元的长宽不超过5km,为了同时保证处理的速度和精度,一般格网单元的总数量最好在1,000,000左右。
确定格网单元大小后,利用ArcGIS10.6的渔网工具,输入格网单元的长和宽,得到整个研究区范围的格网。
利用ArcGIS10.6分析工具-提取分析-裁剪工具,使用研究区域的范围对格网进行修整,裁剪后的格网获得贴合研究区范围的格网,即为道路山洪易损性的评价单元。
S2、通过山洪灾害对道路的作用机理研究和分析,建立道路山洪易损性评价的指标体系。具体包括以下子步骤:
S21、在指标主次明显、分清评价尺度、指标间独立性、可获得性的原则下建立评价指标体系。根据学者的研究,暴露度与易损性呈正相关,减灾力与易损性呈负相关。以暴露度和减灾力两类作为一级指标体系,细化建立二级指标体系,其中,暴露度取决于单元内道路的总造价;减灾力包括:道路及周边设施的抗灾能力、山洪到来前的预警监测能力以及灾后救援响应能力。
S22、在二级指标下进一步划分三级指标,格网单元内道路的总造价取决于道路的类型、道路的长度以及道路的单位里程造价。影响格网减灾力的因素包括:格网内道路及附属设施的抗灾能力,对于山洪灾害的监测预警能力和山洪灾害发生后的救援响应能力。道路及附属设施的抗灾能力取决于:道路自身的种类、道路涵洞的数量、桥梁的数量。道路本身的等级越高,通常抵抗灾害的能力也越强,道路涵洞和桥梁具有山洪到来时泄洪的作用,格网内涵洞和桥梁越多,其抗灾能力越强。监测预警能力包括:监测站、雨量站、气象站、水位站、广播预警站的数量。监测站能够监测其范围内的灾情和路面情况,雨量站、气象站能够对降水进行监测和预报,水位站实时监测其范围内河流水位,广播站能够在灾害发生前和发生后进行灾害预报和灾情播报,这些设施能够反映格网内对于山洪灾害的监测能力以及对道路管理部门和行人提供预警支持。救援响应能力包括:从城市到道路的距离,从医院到道路的距离。从城市和医院到道路的距离越近,对于道路抢修和人员抢救就越为有利。
S23、明确减灾力指标与减灾力的正负相关关系,便于后续建立SVM模型。根据已有的研究,道路本身的抗灾能力、道路周边的涵洞数量、道路周边的桥梁数量、监测站数量、雨量站数量、气象站数量、预警站数量、广播站数量与减灾力呈正相关关系,即道路等级越高,这些抗灾设施和监测预警设施的数量越多,该地区减灾力越高;从城市到道路的距离、从医院到道路的距离与减灾力呈负相关,即距离越远,救援响应能力越弱,减灾力越低。
S24、提取指标体系的各指标,基于ArcGIS10.6,利用分析工具的空间连接工具,通过将格网单元图层与各指标的图层叠加分析,获取各格网单元初始指标的量化值,再将其导出至Excel表中,暴露度指标不做处理,减灾力指标进行归一化处理,以进行后续计算。减灾力指标归一化处理的操作为:使用以下公式在Excel中进行归一化处理,将指标限制在[0,1]的范围内:
式中,x表示归一化之前的指标量化值,xmax表示所有该指标量化值中的最大值,xmin表示所有该指标量化值中的最小值,X表示归一化之后的量化值;SVM输入数据要求所有指标都进行过归一化,并且每一列代表一个指标。
S25、通过查阅文献和相关国家标准,获得不同道路的造价表。在Excel表中,根据道路的长度、类型和单位长度造价,计算各格网内道路的总价值。不同类型的道路、甚至不同地区的相同种类道路的抗灾能力都各不相同。然而有研究表明,造价越高的道路,其抗灾能力一般越强。根据道路的单位里程造价,使用层次分析法为道路本身的抗灾能力这一指标定权,得到不同种类道路的抗灾能力权重,再通过相加计算得到格网内道路的抗灾能力。
S3、建立基于支持向量机的道路山洪易损性评价模型(以下简称SVM模型)。
在道路山洪易损性评价中,暴露度可以根据评价单元内道路的种类、长度和造价精确得出,而减灾力由于因子较多,缺乏定权依据,并且人工定权的主观性较大,故采用SVM来综合减灾力指标,再结合暴露度和减灾力,得到易损性评价结果;
SVM是一个基于统计学习理论的非线性的数学系统,可以用来表示和模拟输入与输出之间复杂的数学关系。由于山洪灾害对道路的作用机制复杂,道路的山洪易损性评价中具有不确定性、区域性、和复杂性等特点,使用SVM可以方便的计算出因子之间的基本关系,因此非常适合用于道路的山洪易损性评价中。
使用R语言建立SVM算法模型,是最便捷、快速的方法。R4.0.4软件拥有已经集成的SVM程序包,名称为“e1071”,可以为SVM的实现提供极大的支持。
S4、SVM训练数据集与测试数据集的建立。由于山洪灾害对道路的作用机制复杂,很难用精确的等式来描述,因此根据各因子与结果之间的相关关系,采用生成随机数的方式建立SVM训练数据集和测试数据集。
S5、SVM模型的训练和测试:具体包括以下子步骤:
步骤S51:使用SVM训练数据集训练SVM模型,即输入训练数据,对比输入值与输出值之间的误差,判断误差值是否符合要求;若误差绝对值和相对误差值均小于0.02,则符合要求,然后使用SVM测试数据集测试SVM模型的精度;若误差绝对值和相对误差值均大于等于0.02,则不符合要求,需要重新改变设置SVM模型建模方式以及核函数等参数,再次使用SVM训练数据集训练SVM模型,即输入训练数据,对比输入值与输出值之间的误差,判断误差值是否符合要求,直至训练数据符合要求;然后使用SVM测试数据集测试SVM模型的精度。
步骤S52:使用SVM测试数据集测试SVM模型的精度的操作是:将测试数据集作为Input数据输入SVM模型中,将测试数据集的仿真值与SVM输出的预测的结果相比较,分析其误差和相对误差是否符合精度要求,若误差绝对值和相对误差值均小于0.02,则精度符合要求;若误差绝对值和相对误差值均大于等于0.02,则精度不符合要求;需要重新改变设置SVM模型建模方式以及核函数等参数,再次使用SVM训练数据集训练SVM模型和使用SVM测试数据集测试SVM模型的精度,直至精度符合要求。
S6、道路山洪灾害易损性结果计算与分析:具体包括以下子步骤:
S61、输入真实的减灾力指标量化值数据,SVM模型将自动输出减灾力指标的评价结果值。
S62、根据格网内道路的种类、长度和单位里程造价,计算格网内道路的暴露度。
S63、根据计算道路造价后得到的格网单元内道路的暴露度,与SVM模型输出得到的减灾力,计算格网单元的易损性;通过以下公式计算格网单元的易损性:
式中,V代表格网单元内道路的易损性,E代表格网单元内道路的暴露度,Re代表此格网单元的减灾力。
S64、通过ArcGIS10.6软件的自然断点分级方法和各种出图工具,对暴露度、减灾力和易损性的评价结果进行分级和制图,从低到高分别为极低、低、中等、高和极高。
S65、暴露度、减灾力和易损性评价结果制图和分析,通过统计分析,得到各区域不同等级易损性的个数、个数百分比、面积等统计表,根据该区域的暴露度和减灾力,可以分析什么因素对易损性的影响较大,以便提出相应的措施。
与现有技术相比,本发明的有益之处在于:
(1)本发明采用格网单元作为基本评价单元,相比较于传统的行政单元或地型单元,格网单元更适用于道路这种实体,并且能够根据研究区域的大小来自由选择评价格网大小,具有一定的灵活性;通过对山洪作用于道路的机理分析构建合适的指标体系,并利用SVM来进行指标综合,避免了利用专家评分法、层次分析法等方法的过程中人为因素和主观因素的影响。
(2)本发明采用机器学习的方法,取代了传统评价方法中人为为指标定权的环节,很好的克服了传统评价方法中主观因素过高的缺点。将道路的易损性评价同机器学习方法相结合,属于多学科交叉的研究内容。近年来,计算机技术、信息技术尤其是GIS技术的快速发展为山洪的易损性评价提供了极大的支持。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1是本发明的评价方法的技术方案路线图。
图2是SVM模型构建和使用流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
以中国水利部防汛抗旱研究中心界定的中国山洪灾害防治区域为研究区,用本方法评价该研究区的道路山洪易损性。
研究区面积大约为6.55×106km2,总人口约9亿人,涵盖30个省份,305个地级市以及2138个行政县。我国把路网建设作为刺激经济增长的重要战略,目前路网建设发达,东南部的路网分布密集,西北部的路网分布相对稀疏。随着我国道路建设进程的加快和道路等级、质量的提高,山洪灾害对道路造成的经济损失逐年增加。因此,为了加强山洪灾害的防治,减少山洪灾害对道路造成的损失,有必要对道路的山洪易损性进行评估。
采用本发明的方法对研究区内的道路进行山洪易损性评价,该方法的技术路线如图1所示。具体步骤如下:
第一步,评价单元的划分。
根据研究区的矢量范围文件,应用ArcGIS10.6的渔网工具,建立长宽都为3km的格网。由此步骤建立的格网的范围是包含整个研究区的矩形,因此还需用ArcGIS10.6-分析工具-提取工具-裁剪,以建立的格网作为输入要素,研究区的矢量范围作为裁剪要素,取得贴合研究区范围的格网评价单元,研究区共划分出1,066,010个格网单元。
第二步,指标体系的建立与提取。
根据山洪对道路的作用机制,遵守指标选取原则,建立评价指标体系。从暴露度和减灾力两个方面考虑指标,形成的指标体系如表1所示。
表1道路山洪灾害易损性评价指标体系
提取以上指标,需要用到的数据包括:不同种类的道路、道路涵洞的分布、桥梁的分布,各种监测预警站点的分布,医院的分布以及主要城市的分布,在本实验中,由于研究的尺度是全国,因此采用行政县作为最小尺度的主要城市,若研究的尺度更小,可以细化到行政村或镇。以上数据都是矢量数据,使用ArcGIS10.6进行处理和提取,不同数据的提取方式不同。
道路数据是线状矢量数据,首先使用ArcGIS10.6-分析工具-叠加分析-标识来“打断”道路,使得原本连续的道路线在格网单元的边界处断开,并给道路标识上格网单元的ID;标识后的道路数据的属性表中自动生成了每一段道路的长度,利用ArcGIS10.6分析工具-统计分析-汇总统计数据,使用格网单元的ID作为案例分组字段,道路长度作为统计字段,统计类型选SUM,就可以得到每个格网单元内道路的长度,分别对不同种类的道路重复上述操作。各种监测预警站点的数据类型为矢量点数据,可直接使用ArcGIS10.6分析工具-叠加分析-空间连接,将格网单元作为目标要素,矢量点图层作为连接要素,即可得到每个格网单元内的站点数量。使用ArcGIS10.6分析工具-邻域分析-生成近邻表来计算格网单元到最近城市和医院的距离。
完成各指标的提取后,导出到Excel表中,根据表2所示的道路单位里程造价表来计算格网单元的道路价值。根据格网单元内是否有某种道路,对其属性进行赋值,有该种道路赋值为1,否则赋值为0,再根据道路的平均造价,构建判别矩阵,使用层次分析法对每种道路的抗灾能力定权,不同道路的抗灾能力由表3所示。对其他减灾力的三级指标进行归一化处理,以便后续作为SVM模型的输入数据。指标归一化是指通过一定的数学方法把数据限定到一段范围区间内,归一化处理一般都使其限制在[0,1]、[0.1,0.9]或[-1,1]之间。使用以下公式在Excel中进行归一化处理,将指标限制在[0,1]的范围内:
其中,x表示归一化之前的指标量化值,xmax表示所有该指标量化值中的最大值,xmin表示所有该指标量化值中的最小值,X表示归一化之后的量化值。SVM输入数据要求所有指标都进行过归一化,并且每一列代表一个指标,本实验中,有10个减灾力的三级指标,故输入数据总共有10列。
表2不同道路的平均造价
道路类型 | 平均造价(万元/公里) |
高速铁路 | 13,000 |
普通铁路 | 2,600 |
高速公路 | 5,000 |
国家级道路 | 3,000 |
省级道路 | 1,500 |
县级道路 | 800 |
乡级道路 | 400 |
表3不同道路的抗灾能力
道路类型 | 抗灾能力等级 | 抗灾能力权重 |
高速铁路 | 9 | 0.3671 |
普通铁路 | 8 | 0.1594 |
高速公路 | 7 | 0.2518 |
国家级道路 | 5 | 0.0976 |
省级道路 | 4 | 0.0604 |
县级道路 | 2 | 0.0371 |
乡级道路 | 1 | 0.0266 |
第三步,SVM模型的建立
Ⅰ:用R语言完成SVM模型的初步建立。
在R4.0.4中提供了SVM()函数的程序包,名称是“e1071”,加载程序包后,根据需求建立SVM模型。
Ⅱ:确定SVM模型的建立方式和选用的核函数。
SVM模型的有两种建立方式,第一种是根据现有的公式建立模型,第二种是根据所拥有的数据模型来建立,这里选择第二种建模方式。选择好了建模方式之后,需要为SVM模型选择核函数,常用的核函数包括线性核函数、多项式核函数、高斯核函数、sigmoid核函数等,在这里选择高斯核函数,其优点是无论大样本还是小样本都有比较好的性能,而且其相对于多项式核函数参数要少。SVM模型的概要参数如下:
svmfit0<-svm(x,y,data=trainingData,type="nu-regression",kernel="radial",cost=10000,gamma=0.00001,scale=TRUE)#构建SVM模型
print(svmfit0#打印SVM模型摘要。
第四步,SVM训练数据集与测试数据集的建立
根据第二步获得的SVM输入数据,建立相应的训练数据。训练数据的每一列都要与输入数据相对应,并在最后新增一列模拟的减灾力值。训练数据由随机数生成,随机数的范围在0-1,按照正负相关关系排序,根据已有的研究,道路本身的等级、道路周边的涵洞数量、道路周边的桥梁数量、监测站数量、雨量站数量、气象站数量、预警站数量、广播站数量与减灾力呈正相关;从城市到道路的距离、从医院到道路的距离与减灾力呈负相关。训练数据集的行数取决于评价单元的总数量,本实验中,选用10000行训练数据。部分训练数据展示在表4中。
表4部分SVM训练数据
按照上述步骤构建了用于训练SVM的训练数据集后,参照上述步骤构建了用于测试SVM的测试数据集,共20个测试样本。
第五步:首先,训练SVM模型:
训练SVM就是SVM模型自我学习的过程,模型会在这个过程中不断调整指标的权值和阈值,直到达到一定精度,是基于SVM进行道路的山洪灾害易损性评估中关键的一个环节。SVM模型训练的精度将直接影响到结果的精度,在建模时计算数据误差和相对误差,来评价训练精度。SVM的训练参数以及误差计算参数如下:
trainingData<-df[trainingRows,]#训练数据
testData<-df[-trainingRows,]#测试数据
yc0=predict(svmfit0,testData[,1:10])#计算预测值
cha1=as.numeric(compareTable[,1]-compareTable[,2])#计算误差
bfb0=abs(cha1)/abs(testData[,11])#计算相对误差
然后,测试SVM模型:
为了判别训练后的SVM模型的适用性,即对未知样本进行预测的能力,需要对SVM模型进行测试,只有在确定建立好的SVM具有足够的适用性的前提下,才能使用SVM来评估道路的山洪易损性。构建了20组样本对SVM进行测试,将测试数据集作为Input数据输入SVM模型中,将测试数据集的仿真值与SVM输出的预测的结果相比较,分析其误差和相对误差是否符合精度要求。测试数据集的误差如表5所示。
表5测试数据集输出及误差表
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
仿真值 | 0.0366 | 0.0411 | 0.0708 | 0.1109 | 0.1407 | 0.1608 | 0.1967 | 0.2407 | 0.2719 | 0.2867 |
预测值 | 0.0367 | 0.0415 | 0.0712 | 0.1092 | 0.1398 | 0.1618 | 0.1970 | 0.2413 | 0.2712 | 0.2866 |
误差绝对值 | 0.0001 | 0.0004 | 0.0004 | 0.0017 | 0.0009 | 0.0010 | 0.0003 | 0.0006 | 0.0007 | 0.0001 |
相对误差 | 0.0035 | 0.0101 | 0.0048 | 0.0148 | 0.0065 | 0.0057 | 0.0016 | 0.0025 | 0.0028 | 0.0006 |
序号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
仿真值 | 0.3302 | 0.3906 | 0.4466 | 0.4895 | 0.5170 | 0.5728 | 0.6417 | 0.7355 | 0.8407 | 0.9528 |
预测值 | 0.3305 | 0.3913 | 0.4463 | 0.4899 | 0.5173 | 0.5722 | 0.6399 | 0.7365 | 0.8385 | 0.9526 |
误差绝对值 | 0.0003 | 0.0007 | 0.0003 | 0.0004 | 0.0003 | 0.0006 | 0.0018 | 0.0010 | 0.0022 | 0.0002 |
相对误差 | 0.0007 | 0.0018 | 0.0005 | 0.0009 | 0.0006 | 0.0010 | 0.0028 | 0.0014 | 0.0027 | 0.0002 |
由表5可知,20组测试数据集的误差绝对值都小于0.02,满足大区域的道路山洪易损性评估的要求,SVM模型的适用性较好,可以用于对研究区的各单元进行道路山洪易损性预测。图2显示了SVM模型构建和使用流程图。
第六步,道路山洪易损性结果计算与分析,具体操作如下:
(1)预测:预测就是将归一化后的格网单元的指标值输入到已经训练和测试好的SVM模型,此时SVM会自动输出预测值。此时输出的预测值即为该格网单元的减灾力,其范围应在0-1之间。
(2)根据格网内道路的种类、长度和单位里程造价,计算格网内道路的暴露度。
(3)根据计算道路造价后得到的格网单元内道路的暴露度,与SVM模型输出得到的减灾力,通过以下公式计算格网单元的易损性:
其中,V代表格网单元内道路的易损性,E代表格网单元内道路的暴露度,Re代表此格网单元的减灾力。
(4)得到格网单元的易损性后,采用自然断点法对暴露度、减灾力和易损性的结果进行等级划分。对于暴露度和易损性来说,当格网内不存在道路时,这两者都为0,所以单独把0分为一级,剩余的值分为五级;对于减灾力来说,不管格网内有无道路,减灾力都存在,所以直接分为五级。分级之后,通过统计分析,得到各级的格网数量,所占面积和所占比例。暴露度、减灾力和易损性的分级标准和各级的分布如表6,表7,表8所示。
表6格网的暴露度分布
表7减灾力分布情况
表8格网的易损性分布情况
由结果可知,处于高和极高易损性区域的格网个数和面积大约占我国总面积的4.65%,在这些地区需要根据格网具体的情况,合理规划道路,降低该地区的暴露度,或者重视道路防护措施建设和预警监测设施建设,来增强该地区的减灾力,起到降低道路的山洪易损性,达到减灾防灾的效果。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (6)
1.一种基于GIS与机器学习的道路山洪易损性评价方法,其特征在于,包括如下步骤:
S1、基于道路是线性结构这一性质,选择格网单元作为基本评价单元,由研究区域的大小确定格网单元的大小;格网单元的长宽不超过5km;
S2、通过山洪灾害对道路的作用机理研究和分析,建立道路山洪易损性评价的指标体系;
具体包括以下子步骤:
S21、在坚持指标主次明显、分清评价尺度、指标间独立性、可获得性的原则下建立评价指标体系,以暴露度和减灾力两类作为一级指标体系,细化建立二级指标体系,其中,暴露度取决于单元内道路的总造价;减灾力包括:道路及周边设施的抗灾能力、山洪到来前的预警监测能力以及灾后救援响应能力;
S22、在二级指标下进一步划分三级指标,格网单元内道路的总造价取决于道路的类型、道路的长度以及道路的单位里程造价;影响格网减灾力的因素包括:格网内道路及附属设施的抗灾能力,对于山洪灾害的监测预警能力和山洪灾害发生后的救援响应能力;道路及附属设施的抗灾能力取决于:道路自身的种类、道路涵洞的数量和桥梁的数量;监测预警能力包括:监测站、雨量站、气象站、水位站和广播预警站的数量;救援响应能力包括:从城市到道路的距离,从医院到道路的距离;
S23、明确减灾力指标与减灾力的正负相关关系,便于后续建立SVM模型;
S24、提取指标体系的各指标,基于ArcGIS10.6,利用分析工具的空间连接工具,通过将格网单元图层与各指标的图层叠加分析,获取各格网单元初始指标的量化值,再将其导出至Excel表中,暴露度指标不做处理,减灾力指标进行归一化处理,以进行后续计算;
减灾力指标归一化处理的操作为:使用以下公式在Excel中进行归一化处理,将指标限制在[0,1]的范围内:
式中,x表示归一化之前的指标量化值,xmax表示所有该指标量化值中的最大值,xmin表示所有该指标量化值中的最小值,X表示归一化之后的量化值;SVM输入数据要求所有指标都进行过归一化,并且每一列代表一个指标;
S25、通过查阅文献和相关国家标准,获得不同道路的造价表;
S3、基于支持向量机的道路山洪易损性评价的SVM模型的建立;
S4、SVM训练数据集与测试数据集的建立;
S5、SVM模型的训练和测试;
S6、道路山洪灾害易损性结果计算与分析:根据计算道路造价后得到的格网单元内道路的暴露度,与SVM模型输出得到的减灾力,通过以下公式计算格网单元的易损性:
式中,E代表格网单元内道路的暴露度,Re代表此格网单元的减灾力。
2.如权利要求1所述的基于GIS与机器学习的道路山洪易损性评价方法,其特征在于,所述步骤S1中,确定格网单元大小后,利用ArcGIS10.6的渔网工具,输入格网单元的长和宽,得到整个研究区范围的格网;利用ArcGIS10.6分析工具-提取分析-裁剪工具,使用研究区域的范围对格网进行修整,得到边缘贴合研究区范围的格网单元,即为道路山洪易损性的评价单元。
3.如权利要求1所述的基于GIS与机器学习的道路山洪易损性评价方法,其特征在于,步骤S3中,使用R4.0.4软件中提供的名为“e1071”的程序包,建立SVM模型。
4.如权利要求1所述的基于GIS与机器学习的道路山洪易损性评价方法,其特征在于,步骤S4中,采用生成随机数的方式建立SVM训练数据集和SVM测试数据集。
5.如权利要求1所述的基于GIS与机器学习的道路山洪易损性评价方法,其特征在于,步骤S5中包括以下子步骤:
步骤S51:使用SVM训练数据集训练SVM模型,即输入训练数据,对比输入值与输出值之间的误差,判断误差值是否符合要求;若误差绝对值和相对误差值均小于0.02,则符合要求,然后使用SVM测试数据集测试SVM模型的精度;若误差绝对值和相对误差值均大于等于0.02,则不符合要求,需要重新改变设置SVM模型建模方式以及核函数参数,再次使用SVM训练数据集训练SVM模型,即输入训练数据,对比输入值与输出值之间的误差,判断误差值是否符合要求,直至训练数据符合要求;然后使用SVM测试数据集测试SVM模型的精度;
步骤S52:使用SVM测试数据集测试SVM模型的精度的操作是:将测试数据集作为Input数据输入SVM模型中,将测试数据集的仿真值与SVM输出的预测的结果相比较,分析其误差和相对误差是否符合精度要求,若误差绝对值和相对误差值均小于0.02,则精度符合要求;若误差绝对值和相对误差值均大于等于0.02,则精度不符合要求;需要重新改变设置SVM模型建模方式以及核函数参数,再次使用SVM训练数据集训练SVM模型和使用SVM测试数据集测试SVM模型的精度,直至精度符合要求。
6.如权利要求1所述的基于GIS与机器学习的道路山洪易损性评价方法,其特征在于,步骤S6具体包括以下子步骤:
S61、输入真实的减灾力指标量化值数据,SVM模型将自动输出减灾力指标的评价结果值;
S62、根据格网内道路的种类、长度和单位里程造价,计算格网内道路的暴露度;
S63、根据计算道路造价后得到的格网单元内道路的暴露度,与SVM模型输出得到的减灾力,计算格网单元的易损性;
S64、通过ArcGIS10.6软件的自然断点分级方法和各种出图工具,对暴露度、减灾力和易损性的评价结果进行分级和制图,从低到高分别为极低、低、中等、高和极高;
S65、暴露度、减灾力和易损性评价结果制图和分析,根据该区域的暴露度和减灾力,可以分析什么因素对易损性的影响较大,以便提出相应的措施。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110274765.4A CN113191582B (zh) | 2021-03-15 | 2021-03-15 | 一种基于gis与机器学习的道路山洪易损性评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110274765.4A CN113191582B (zh) | 2021-03-15 | 2021-03-15 | 一种基于gis与机器学习的道路山洪易损性评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113191582A CN113191582A (zh) | 2021-07-30 |
CN113191582B true CN113191582B (zh) | 2022-09-06 |
Family
ID=76973285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110274765.4A Active CN113191582B (zh) | 2021-03-15 | 2021-03-15 | 一种基于gis与机器学习的道路山洪易损性评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113191582B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112907587B (zh) * | 2021-04-01 | 2022-03-01 | 西南石油大学 | 一种基于GEE的Otsu和边缘检测算法的高山林线提取方法 |
CN117332909B (zh) * | 2023-12-01 | 2024-03-08 | 南京师范大学 | 基于智能体的多尺度城市内涝道路交通暴露性预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530512A (zh) * | 2013-09-30 | 2014-01-22 | 西南科技大学 | 一种定量评价泥石流灾害易损性的方法 |
CN108280553A (zh) * | 2018-02-24 | 2018-07-13 | 中山大学 | 基于gis-神经网络集成的山洪灾害风险区划及预测方法 |
CN109067800A (zh) * | 2018-09-29 | 2018-12-21 | 南京明博互联网安全创新研究院有限公司 | 一种固件漏洞的跨平台关联检测方法 |
-
2021
- 2021-03-15 CN CN202110274765.4A patent/CN113191582B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530512A (zh) * | 2013-09-30 | 2014-01-22 | 西南科技大学 | 一种定量评价泥石流灾害易损性的方法 |
CN108280553A (zh) * | 2018-02-24 | 2018-07-13 | 中山大学 | 基于gis-神经网络集成的山洪灾害风险区划及预测方法 |
CN109067800A (zh) * | 2018-09-29 | 2018-12-21 | 南京明博互联网安全创新研究院有限公司 | 一种固件漏洞的跨平台关联检测方法 |
Non-Patent Citations (2)
Title |
---|
公路洪水灾害风险评价研究;屈云帅;《中国优秀硕士学位论文全文数据库》;20140515(第5期);第C034-127页 * |
区域农业水资源系统恢复力特征及其对农业种植结构影响效应研究;徐磊;《中国优秀硕士学位论文全文数据库》;20190915(第9期);第A013-20页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113191582A (zh) | 2021-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108280553B (zh) | 基于gis-神经网络集成的山洪灾害风险区划及预测方法 | |
Roy et al. | Predicting land cover change in a Mediterranean catchment at different time scales | |
CN110852577A (zh) | 基于城市韧性与城市流域水文模型的城市洪涝评估方法 | |
CN113191582B (zh) | 一种基于gis与机器学习的道路山洪易损性评价方法 | |
CN111665575B (zh) | 一种基于统计动力的中长期降雨分级耦合预报方法及系统 | |
CN101673369A (zh) | 基于投影寻踪的排水管网洪涝风险评价方法 | |
CN111489008B (zh) | 一种交通事故影响因素空间效应分析方法及其应用 | |
CN115689293B (zh) | 一种基于压力-状态-响应框架的城市内涝韧性评估方法 | |
CN116777223B (zh) | 一种城市地下管网安全综合风险评估方法及系统 | |
Szeląg et al. | Influence of urban catchment characteristics and rainfall origins on the phenomenon of stormwater flooding: Case study | |
CN114723283A (zh) | 一种面向城市群的生态承载力遥感评估方法及装置 | |
Wang et al. | Application of the hidden Markov model in a dynamic risk assessment of rainstorms in Dalian, China | |
CN110889196B (zh) | 基于水质模型的水环境承载力评估方法、装置及存储介质 | |
CN114897378A (zh) | 地质灾害精细化气象风险预警区评价方法及装置 | |
CN114997671A (zh) | 基于人工神经网络和熵值法的基坑变形安全风险评估的方法 | |
CN109101734A (zh) | 一种连续刚构桥梁下挠风险的预测方法 | |
CN112434887A (zh) | 一种结合网络核密度估计和svm的供水管网风险预测方法 | |
CN116384627A (zh) | 一种基于机器学习的地质灾害评价方法 | |
Jin et al. | Integration of an improved transformer with physical models for the spatiotemporal simulation of urban flooding depths | |
CN113642162B (zh) | 一种城市道路交通应急预案仿真综合分析方法 | |
CN105912775A (zh) | 桥梁动态称重系统车辆轴重数据的多模态建模方法 | |
CN113689048A (zh) | 一种预测未来人口精细化空间分布的方法、系统及计算机可读存储介质 | |
Owolabi et al. | Development of priority index assessment model for road pavements in Nigeria | |
Li et al. | Contribution modeling on condition evaluation of asphalt pavement using uncertainty measurement and entropy theory | |
CN113807724B (zh) | 一种基于综合风险评价的弃碴场选址方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |