CN118114994B - 基于多种算法集成的地质灾害风险自适应评价方法及系统 - Google Patents
基于多种算法集成的地质灾害风险自适应评价方法及系统 Download PDFInfo
- Publication number
- CN118114994B CN118114994B CN202410532498.XA CN202410532498A CN118114994B CN 118114994 B CN118114994 B CN 118114994B CN 202410532498 A CN202410532498 A CN 202410532498A CN 118114994 B CN118114994 B CN 118114994B
- Authority
- CN
- China
- Prior art keywords
- data
- risk
- evaluation
- corrected
- evaluation value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 201
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 24
- 230000010354 integration Effects 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 claims description 35
- 238000007781 pre-processing Methods 0.000 claims description 32
- 238000013210 evaluation model Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 14
- 238000012502 risk assessment Methods 0.000 claims description 13
- 238000007477 logistic regression Methods 0.000 claims description 11
- 230000006698 induction Effects 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 230000001939 inductive effect Effects 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000005520 cutting process Methods 0.000 claims description 6
- 230000000763 evoking effect Effects 0.000 claims description 6
- 238000011161 development Methods 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims 6
- 238000011160 research Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012876 topography Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及地质模型算法技术领域,具体而言,涉及基于多种算法集成的地质灾害风险自适应评价方法及系统,主要包括了数据预处理模块、易发性评价模块、危险性评价模块、易损性评价模块和风险性判断模块,基于地质灾害易发评价基础上,构建评价模型,并对评价结果进行归一化处理,通过对风险评价分类划分结果对比分析,建立风险评价分类数值标准,最终形成“数据输入‑成果导出”数据格式和分类划分呈标准化,实现地质灾害风险智能评价与区划,通过上述模块的多次计算和判断,融合区域地质灾害易发性、危险性、易损性评价,得到相较于现有技术中更精确的判断结果。
Description
技术领域
本发明涉及地质模型算法技术领域,具体而言,涉及基于多种算法集成的地质灾害风险自适应评价方法及系统。
背景技术
在地质灾害领域中,早在2013年,便有了建立国家地质环境数据仓库的构想,以地质环境信息大集成、大综合为目标,整合多源复杂数据。最开始灾害监测数据处理,已有了大数据概念的雏形。而后,大数据的概念和技术不断扩展,3S技术的灾害预警、地质灾害危险性区划和滑坡三维建模,都是地质大数据技术在灾害领域的具体研究。近几年地质灾害的预警和易发性评价更是研究的重点,通过多源异构数据的集成进行综合评价,研究主要集中在系统框架、权重分配算法等,在地质灾害风险评价研究中,各类影响因子来源广泛,具有典型的多源异构特点。
但数据有效整合应用是地质灾害评价的前提,与评价精准度息息相关,在现有技术中,存在多种对地质评价的各种模型,但是各种模型之间是相对独立的,一般仅通过一个评价模型,得到评价结果,所得到的评价结果的精度仍然有待提高。
发明内容
本发明的目的是提供基于多种算法集成的地质灾害风险自适应评价方法及系统,来解决现有技术中的上述问题。
本发明的实施例通过以下技术方案实现:
第一方面,本发明提供了基于多种算法集成的地质灾害风险自适应评价系统,包括数据预处理模块、易发性评价模块、危险性评价模块、易损性评价模块和风险性判断模块;
所述预处理模块,用于收集基础数据,并对基础数据进行预处理,所述基础数据包括地质数据、地形数据、温度数据和湿度数据;
所述易发性评价模块,用于接收预处理模块所预处理的基础数据,并建立评价模型,通过预处理后的基础数据与评价模型得到易发性评价数值;
所述危险性评价模块,用于接收易发性评价数值,设置易发性评价数值阈值,并判断易发性评价数值是否超过易发性评价数值阈值;
若超过易发性评价数值阈值,则获取诱发因素,所述诱发因素包括地震和降雨,通过诱发因素和易发性评价数值得到修正危险性评价数值;
若未超过易发性评价数值阈值,则输出为地质灾害低风险;
所述易损性评价模块,用于接收修正危险性评价数值,设置修正危险性评价数值阈值,并判断是否超过修正危险性评价数值阈值;
若超过修正危险性评价数值阈值,则获取承灾体数据,所述承灾体数据包括人口数据和经济财产数据,通过承灾体数据和修正危险性评价数值得到修正易损性评价数值;
若未超过修正危险性评价数值阈值,则输出为地质灾害中低风险;
所述风险性判断模块,用于接收修正易损性评价数值,并设置修正易损性评价数值阈值,并判断修正易损性评价数值是否超过修正易损性评价数值阈值,若未超过,则输出为地质灾害中高风险,若超过则输出为地质灾害高风险。
在本发明的一实施例中,所述对基础数据进行预处理包括;
判断基础数据中的数据为静态数据或者为动态数据,将静态数据进行直接保存选取;
将动态数据划分为训练集、测试集和验证集,所述训练集用于预处理模块的初始学习,所述验证集用于预处理模块的参数调优和性能验证,所述测试集用于评估预处理模块在未见数据上的性能;
对训练集的数据进行异常处理后,得到初始动态数据集,对初始动态数据集进行冗余数据处理,输出最终动态数据集。
在本发明的一实施例中,还包括:
设置动态数据获取周期和每个周期获取个数,并设置动态数据相同阈值;
当相邻周期内的动态数据是否大于相同阈值,若是,则不做更新替换,若否,则将对该周期内的动态数据重新进行预处理,并对动态数据进行更新替换。
在本发明的一实施例中,所述进行异常处理包括:
步骤S101:建立孤立树,令训练集中的每个数据点有d个特征,从d个特征中随机选择一个特征;
步骤S102:选择一个随机的切割点,该切割点在特征的最小值和最大值之间,进行递归分割数据集为两个子集;
对每个子集进行步骤S101和步骤S102的过程,直至达到终止条件。
在本发明的一实施例中,所述冗余数据处理包括:
步骤S201:随机选择K个数据点作为初始质心集,计算初始动态数据集中的每个数据点与初始质心集中每个质心的距离,并分配给最近的质心;
重复步骤S201,直至质心位置不在变化。
在本发明的一实施例中,所述建立评价模型包括:
选取评价指标,通过各评价指标计算得到若干确定性系数;
式中,为确定性系数;为地质灾害在评价指标a分类中发生的概率;为地质灾害发育的先验概率。
通过若干确定性系数和LR模型计算得到易发性评价数值;
式中,P为易发性评价数值,即地质灾害发生的概率,Y为地质灾害与地址环境条件的关系方程;为逻辑回归系数,为常数,为各评价指标对应的值。
在本发明的一实施例中,所述逻辑回归系数的计算包括:
将作为自变量,是否发生地质灾害作为因变量,通过SPSS模型计算得到若干个逻辑回归系数。
在本发明的一实施例中,所述通过诱发因素和易发性评价数值得到修正危险性评价数值包括:
计算诱发因素中单个因素对地质灾害发生事件提供的信息量值;
计算诱发因素内的总信息量值,通过总信息量值对易发性评价数值进行修正,得到修正危险性评价数值;
式中,S为修正危险性评价数值,为诱发因素内的总信息量值。
在本发明的一实施例中,所述通过承灾体数据和修正危险性评价数值得到修正易损性评价数值包括:
通过人口数据和财产数据分别计算得到人口指数和经济财产指数;
通过人口指数和经济财产指数对修正危险性评价数值进行修正,得到修正易损性评价数值;
式中,为人口指数,为经济财产指数,E为修正易损性评价数值,为加权系数。
第二方面,本发明还提供了基于多种算法集成的地质灾害风险自适应评价方法,包括使用上述的基于多种算法集成的地质灾害风险自适应评价系统进行地质灾害的评价。
本发明实施例的技术方案至少具有如下优点和有益效果:
采用本发明所提供的系统或者方法,主要包括了数据预处理模块、易发性评价模块、危险性评价模块、易损性评价模块和风险性判断模块,基于地质灾害易发评价基础上,构建评价模型,并对评价结果进行归一化处理,通过对风险评价分类划分结果对比分析,建立风险评价分类数值标准,最终形成“数据输入-成果导出”数据格式和分类划分呈标准化,实现地质灾害风险智能评价与区划,通过上述模块的多次计算和判断,融合区域地质灾害易发性、危险性、易损性评价,得到相较于现有技术中更精确的判断结果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
本申请中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行。
独立说明的模块或子模块可以是物理上分离的,也可以不是物理上的分离:可以是软件实现的,也可以是硬件实现的,且可以部分模块或子模块通过软件实现,由处理器调用该软件实现这部分模块或子模块的功能,且其它部分模板或子模块通过硬件实现,例如通过硬件电路实现。此外,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
请参照图1,本发明提供了基于多种算法集成的地质灾害风险自适应评价系统,包括数据预处理模块、易发性评价模块、危险性评价模块、易损性评价模块和风险性判断模块;
预处理模块,用于收集基础数据,并对基础数据进行预处理,所述基础数据包括地质数据、地形数据、温度数据和湿度数据;
其中,地质数据包括地质构造、岩石组成、矿物组成、地层分布、地貌特征、地球物理特征等内容。这些数据通过地质勘探、地质调查和地质研究获得。
地形数据包括地表高程、地形起伏、地形曲率、坡度、坡向、流域分布、河流网络、山地地貌等信息。这些数据可以通过地形测量、遥感技术、数字地形模型等手段获取。
易发性评价模块,用于接收预处理模块所预处理的基础数据,并建立评价模型,通过预处理后的基础数据与评价模型得到易发性评价数值;
危险性评价模块,用于接收易发性评价数值,设置易发性评价数值阈值,并判断易发性评价数值是否超过易发性评价数值阈值;若超过易发性评价数值阈值,则获取诱发因素,所述诱发因素包括地震和降雨,通过诱发因素和易发性评价数值得到修正危险性评价数值;若未超过易发性评价数值阈值,则输出为地质灾害低风险;
其中,关于诱发因素中的地震和降雨,还可以将地震进行烈度的划分,进行分析,对降雨的降雨量,进行设置降雨阈值划分,进行分析。
易损性评价模块,用于接收修正危险性评价数值,设置修正危险性评价数值阈值,并判断是否超过修正危险性评价数值阈值;若超过修正危险性评价数值阈值,则获取承灾体数据,所述承灾体数据包括人口数据和经济财产数据,通过承灾体数据和修正危险性评价数值得到修正易损性评价数值;若未超过修正危险性评价数值阈值,则输出为地质灾害中低风险;
其中,获得的人口数据和经济财产数据主要是针对于获得人口指数和经济财产指数。
风险性判断模块,用于接收修正易损性评价数值,并设置修正易损性评价数值阈值,并判断修正易损性评价数值是否超过修正易损性评价数值阈值,若未超过,则输出为地质灾害中高风险,若超过则输出为地质灾害高风险。
在本发明中,通过上述模块,可以对地质的风险程度进行综合评判,输出地质灾害低风险、地质灾害中低风险、地质灾害中高风险和地质灾害高风险,在上述的各种阈值获取中,可以根据历史的灾害数据进行总结得到。
可选的是,阈值的选取中,可以提供以下分值作为实例,易发性评价值的范围0-100%,0-60%为低易发,60%-70%为中易发,70%-80%为高易发,80%-100%为极高易发;
危险性评价,危险性值范围采用归一化后,值范围0-100%,可以设置为0-60%为低危险,60%-70%为中危险,70%-80%为高危险,80%-100%为极高危险;
易损性评价:总易损值范围0-100%,可以设置为0-60%为低易损,60%-70%为中易损,70%-80%为高易损,80%-100%为极高易损;
风险性判断:归一化处理后,值变成0-100%,可以设置为0-60%为低风险,60%-70%为中风险,70%-80%为高风险,80%-100%为极高风险。
基于影响因子自由选择、训练非灾样本自动生成、地质灾害评价模型可选择、评价精度可评估等系列功能需求,利用开源平台二次开发功能,融合区域地质灾害易发性、危险性、易损性评价思路,研发“数据录入-指标选取-模型构建-评价分析”的全流程评价系统,具有功能模块可扩展、评价指标可更新、评价模型可自选等自适应功能,并进行案例应用测试和系统优化,实现数据驱动自适应更新的标准化、规范化、智能化地质灾害易损性评价。
本发明的一个实例性实施方式,所述对基础数据进行预处理包括;
判断基础数据中的数据为静态数据或者为动态数据,将静态数据进行直接保存选取,其中静态数据由于基本不会发生变化,所以在本实施例中,不做数据的预处理,动态数据会进行实时的变化,所以可以进行数据的预处理,包括数据的异常处理和冗余数据处理,其中,静态数据可以为地质数据和地形数据,动态数据可以为温度数据和湿度数据。
将动态数据划分为训练集、测试集和验证集,所述训练集用于预处理模块的初始学习,所述验证集用于预处理模块的参数调优和性能验证,所述测试集用于评估预处理模块在未见数据上的性能;对训练集的数据进行异常处理后,得到初始动态数据集,对初始动态数据集进行冗余数据处理,输出最终动态数据集。
具体的,数据集的划分保持其时间连贯性。选择数据集中的60%作为训练集,这部分用于模型初始学习。选择数据集的20%数据作为验证集,这部分用于在模型训练过程中进行参数调优和性能验证,以避免模型过拟合。
选择数据集中的20%作为测试集,这部分用于评估模型在未见数据上的性能,确保模型的泛化能力。提出的数据集涵盖了地质数据、地形数据、温度数据和湿度数据,划分方法考虑了时间序列数据的特性,确保了用于数据清洗数据集的全面性和代表性。
本发明的一个实例性实施方式,为了将降低系统的运算负担,可以设置一定的时间间隔,来进行判断是否进行数据的更行和数据的重新预处理。
主要包括设置动态数据获取周期和每个周期获取个数,并设置动态数据相同阈值;当相邻周期内的动态数据是否大于相同阈值,若是,则不做更新替换,若否,则将对该周期内的动态数据重新进行预处理,并对动态数据进行更新替换。
例如,设置动态数据的获取周期为1个小时,每1个小时获取10个数据,设置的动态数据相同阈值为8个,当下个周期所获取的动态数据有9个与上个周期相同,则,该周期的数据进行舍弃,不做更新,不必再去进行数据的预处理过程,相反的是,若下个周期所获取的动态数据有7个与上个周期相同,小于相同阈值,则需要对数据进行更新。
更具体的是,本实施例采用了孤立森林模型进行异常处理,包括:
步骤S101:建立孤立树,令训练集中的每个数据点有d个特征,从d个特征中随机选择一个特征;
步骤S102:选择一个随机的切割点,该切割点在特征的最小值和最大值之间,进行递归分割数据集为两个子集;
对每个子集进行相同的步骤S101和步骤S102的过程,直至达到终止条件。
每个数据点在树中的路径长度也就是终止条件是评估其异常程度的关键。对于数据点,其在单棵树中的路径长度可以递归计算,从根节点开始,每经过一个节点,路径长度增加1;继续这个过程直到达到一个外部节点(叶节点)或达到树的最大深度。
孤立森林中的每个数据点都有一个异常分数,该分数是基于其在多棵树中的平均路径长度计算的。对于数据点,其在所有树中的平均路径长度为。异常分数由以下公式计算:
式中,为异常分数,n为数据集中的数据点数目,c(n)为归一化因子,用于调整不同大小动态数据集的平均路径长度。通过以上步骤,孤立森林能够有效地在动态数据集中识别异常值。
其次,所述冗余数据处理包括:
步骤S201:随机选择K个数据点作为初始质心集,计算初始动态数据集中的每个数据点与初始质心集中每个质心的距离,并分配给最近的质心;
式中,d()为距离函数,通常设置为欧氏距离,argmin()表示计算出使得距离函数取得最小值的聚类中心,为第i个数据点的质心。
重复上述步骤S201,直至质心位置不在变化。
本发明的一个实例性实施方式,所述建立评价模型选用多个易发性评价评价因子(包括坡度、坡向、高差、与断层距离、地层岩性、水系距离、NDVI指数…等),集成层次分析法、信息量法、确定性系数法、证据权法、逻辑回归、支持向量机、随机森林等7种评价模型,通过人工选择其中一种或者多种评价模型,如果选择2种及以上的评价模型,系统会利用AOC曲线、Acc等方法对评价结果的精度进行评估,选出一种最优评价模型。
在本实施例中,采用确定性系数法,进行举例说明包括:
选取评价指标,通过各评价指标计算得到若干确定性系数;
式中,为确定性系数,通常取值为[-1,1],值越大地质灾害发生的确定性越大;为地质灾害在评价指标a分类中发生的概率,通常用地质环境条件a 中的地灾数量与地质环境条件a 总面积的比值表示,其取值范围为[0,1];为地质灾害发育的先验概率,通常用地质灾害总数与研究区面积比值表示,同一研究区内为定值。
在本实施例中,其中评价指标可以选取的如下:
坡度:斜坡岩土体是在各种力相互作用下保持平衡的,其中坡度的大小直接影响重力沿斜坡向下的分力,是影响斜坡稳定性的重要因素. 坡度的大小还决定地质灾害发生的类型和破坏机制。
地形曲率:斜坡剖面形态影响了岩土体内的应力分布,凸型坡在坡体前缘形成应力集中,更容易发生失稳,地形曲率是斜坡剖面形态的定量度量指标,正值表示凸型坡,负值表示凹型坡,曲率越接近0 表示坡面越平坦。
到断层距离:断层破坏岩土体的完整性,控制地质灾害边缘,为雨水入渗提供通道. 一般到断层距离越近,岩土体结构面越发育,结构越破碎,地质灾害发育也越集中。
到水系距离:河流对地质灾害的影响主要在于水流对河道两侧岸坡的侵蚀作用,不断增加的岸坡高度和坡度,为岩土体失稳提供了临空条件。
夜间灯光指数:为人类活动的一种有效表征形势,对国民生产总值、人口数量有一定的指示意义。
NDVI:植被能减少雨水冲刷,减缓水流入渗,对自然斜坡具有一定保护作用,但植被的自重加载和根劈作用又破坏着坡体的稳定性。
通过若干确定性系数和LR模型计算得到易发性评价数值;
式中,P为易发性评价数值,即地质灾害发生的概率,Y为地质灾害与地址环境条件的关系方程;为逻辑回归系数,为常数,表示在不受任何因素影响条件下,地质灾害发生与不发生概率之比的对数值,为各评价指标对应的值。
其次,所述逻辑回归系数的计算包括:
将作为自变量,是否发生地质灾害作为因变量,通过SPSS模型计算得到若干个逻辑回归系数。
具体的,采用LR模型计算回归系数,首先需要选择训练样本,确定训练样本集,样本选择的合理与否直接影响计算结果的准确性。
在本实施例中,采用随机选取的方式确定,其中地质灾害点随机选取总数的80%左右,非地质灾害点在地质灾害点200m缓冲区以外的区域内随机生成,共选取714处地质灾害点和714处非地质灾害点,形成包含1428点的训练集。通过点提取,确定各样本对应的评价指标分类,并替换成各值。
将值作为自变量,是否发生地质灾害作为因变量(0为否,1为是),导入SPSS模型进行逻辑回归,计算结果。
在本发明的一实施例中,所述通过诱发因素和易发性评价数值得到修正危险性评价数值包括:
计算诱发因素中单个因素对地质灾害发生事件提供的信息量值;
式中,为信息量,S为评价单元的总数,N为进行地质灾害发生评价的区域总数,为含有诱发因素的评价单元数,为含有诱发因素的区域总数。
计算诱发因素内的总信息量值,通过总信息量值对易发性评价数值进行修正,得到修正危险性评价数值;
式中,S为修正危险性评价数值,为诱发因素内的总信息量值,n为单个因素信息量值的数量。
其次,分析研究地质灾害诱发条件,确定主要诱发因素;收集整理人口、经济指数等承灾体数据,并对多源数据进行格式标准化处理;基于地质灾害易发评价基础上,构建地质灾害风险定量化评价模型,并对评价结果进行归一化处理,通过对风险评价分类划分结果对比分析,建立风险评价分类数值标准,最终形成“数据输入-成果导出”数据格式和分类划分呈标准化,实现地质灾害风险智能评价与区划。
在本发明的一实施例中,所述通过承灾体数据和修正危险性评价数值得到修正易损性评价数值包括:
通过人口数据和财产数据分别计算得到人口指数和经济财产指数;
通过人口指数和经济财产指数对修正危险性评价数值进行修正,得到修正易损性评价数值;
式中,为人口指数,为经济财产指数,E为修正易损性评价数值,为加权系数,一般取0.5,人口指数为某地被评价区域的人口数除以某地总人数,经济财产指数为某地被评价区域的经济除以某地总经济。
被评价区域的人口数即被评价的这块区域人口数,例如,如果被评价的区域为区的话,总人数可以为市的总人数,被评价的区域为市的话,总人数可以为省的总人数,总人数在地理意义上比区域人数大一级,经济指数同理。
进行解释的是,本发明加入了和的差值对整体E值的影响修正。
具体的,和的差值越大,整体结果会越大,由于传统方案核心是计算和的和,未考虑到人口指数与经济财产指数之间的关系,若人口指数远大于经济财产指数,说明此处的更适合宜居,在受到灾害时更加易损,应当对易损性评价数值赋予更大的值,同理,若经济财产指数远大于人口指数,说明此处的经济发达,亦应当对易损性评价数值赋予更大的值。
所以通过,来凸显出和的差值,对E的影响,达到修正的目的,和越接近,则对整体公式影响越小。
结合本方案的上述内容,提供一个具体的实例进行详细的说明。
在分别设置易发性评价数值阈值为50%;修正危险性评价数值阈值为70%;修正易损性评价数值阈值为80%;
收集基础数据,并进行基础数据的预处理后,若通过评价模型得到易发性评价数值为小于等于50%,则直接输出该区域为地质灾害低风险的结果;
若大于50%,则与诱发因素进行结合计算修正危险性评价数值,若修正危险性评价数值小于等于70%,则直接输出该区域为中地质灾害中低风险的结果;
若大于70%,则与承灾体数据进行结合计算修正易损性评价数值,若修正易损性评价数值小于等于80%,则直接输出该区域为地质灾害中高风险结果;
若大于80%,则输出该区域为地质灾害高风险的结果。
本发明还提供了基于多种算法集成的地质灾害风险自适应评价方法,包括使用上述的基于多种算法集成的地质灾害风险自适应评价系统进行地质灾害的评价。
采用本系统,收集复杂山区斜坡地质灾害相关的地质、地形、气象、水文等多源数据;通过收集到的数据进行预处理,包括数据清洗、数据融合、数据格式转换等,以确保数据的准确性和一致性;基于收集到的地质大数据,采用统计分析方法、机器学习方法或人工智能算法等,建立数学模型来描述地质灾害的发生机理和影响因素,构建针对西南复杂山区斜坡地质灾害风险评估模型;基于建立的地质灾害风险评估模型,设计并开发智能评估及自适应评价系统,设计包括数据管理、模型计算、可视化展示等功能,能够自对输入的数据进行处理和分析,支持实时数据更新和模型参数调整,以适应不同地区、不同时间段的地质灾害风险评估需求;将研发的智能评估及自适应评价系统应用于实际的地质灾害风险评估工作中,并结合实际情况进行案例分析,验证系统的实用性和可行性;最后根据实际应用中的反馈和需求,不断优化和改进系统,提高评估结果的准确性和实用性。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,包括数据预处理模块、易发性评价模块、危险性评价模块、易损性评价模块和风险性判断模块;
所述预处理模块,用于收集基础数据,并对基础数据进行预处理,所述基础数据包括地质数据、地形数据、温度数据和湿度数据;
所述易发性评价模块,用于接收预处理模块所预处理的基础数据,并建立评价模型,通过预处理后的基础数据与评价模型得到易发性评价数值;
所述危险性评价模块,用于接收易发性评价数值,设置易发性评价数值阈值,并判断易发性评价数值是否超过易发性评价数值阈值;
若超过易发性评价数值阈值,则获取诱发因素,所述诱发因素包括地震和降雨,通过诱发因素和易发性评价数值得到修正危险性评价数值;
若未超过易发性评价数值阈值,则输出为地质灾害低风险;
所述易损性评价模块,用于接收修正危险性评价数值,设置修正危险性评价数值阈值,并判断是否超过修正危险性评价数值阈值;
若超过修正危险性评价数值阈值,则获取承灾体数据,所述承灾体数据包括人口数据和经济财产数据,通过承灾体数据和修正危险性评价数值得到修正易损性评价数值;
若未超过修正危险性评价数值阈值,则输出为地质灾害中低风险;
所述风险性判断模块,用于接收修正易损性评价数值,并设置修正易损性评价数值阈值,并判断修正易损性评价数值是否超过修正易损性评价数值阈值,若未超过,则输出为地质灾害中高风险,若超过则输出为地质灾害高风险
所述通过诱发因素和易发性评价数值得到修正危险性评价数值包括:
计算诱发因素中单个因素对地质灾害发生事件提供的信息量值;
计算诱发因素内的总信息量值,通过总信息量值对易发性评价数值进行修正,得到修正危险性评价数值;
式中,P为易发性评价数值,S为修正危险性评价数值,为诱发因素内的总信息量值;
所述通过承灾体数据和修正危险性评价数值得到修正易损性评价数值包括:
通过人口数据和财产数据分别计算得到人口指数和经济财产指数;
通过人口指数和经济财产指数对修正危险性评价数值进行修正,得到修正易损性评价数值;
式中,为人口指数,为经济财产指数,E为修正易损性评价数值, 为加权系数。
2.根据权利要求1所述的基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,所述对基础数据进行预处理包括;
判断基础数据中的数据为静态数据或者为动态数据,将静态数据进行直接保存选取;
将动态数据划分为训练集、测试集和验证集,所述训练集用于预处理模块的初始学习,所述验证集用于预处理模块的参数调优和性能验证,所述测试集用于评估预处理模块在未见数据上的性能;
对训练集的数据进行异常处理后,得到初始动态数据集,对初始动态数据集进行冗余数据处理,输出最终动态数据集。
3.根据权利要求2所述的基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,还包括:
设置动态数据获取周期和每个周期获取个数,并设置动态数据相同阈值;
当相邻周期内的动态数据是否大于相同阈值,若是,则不做更新替换,若否,则将对该周期内的动态数据重新进行预处理,并对动态数据进行更新替换。
4.根据权利要求3所述的基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,所述进行异常处理包括:
步骤S101:建立孤立树,令训练集中的每个数据点有d个特征,从d个特征中随机选择一个特征;
步骤S102:选择一个随机的切割点,该切割点在特征的最小值和最大值之间,进行递归分割数据集为两个子集;
对每个子集进行步骤S101和步骤S102的过程,直至达到终止条件。
5.根据权利要求4所述的基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,所述冗余数据处理包括:
步骤S201:随机选择K个数据点作为初始质心集,计算初始动态数据集中的每个数据点与初始质心集中每个质心的距离,并分配给最近的质心;
重复步骤S201,直至质心位置不在变化。
6.根据权利要求1所述的基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,所述建立评价模型包括:
选取评价指标,利用确定性系数模型计算各评价指标的确定性系数;
式中,为确定性系数;为地质灾害在评价指标a分类中发生的概率;为地质灾害发育的先验概率;
通过若干确定性系数和LR模型计算得到易发性评价数值;
式中,P为易发性评价数值,即地质灾害发生的概率,Y为地质灾害与地址环境条件的关系方程;为逻辑回归系数,为常数,为各评价指标对应的值。
7.根据权利要求6所述的基于多种算法集成的地质灾害风险自适应评价系统,其特征在于,所述逻辑回归系数的计算包括:
将作为自变量,是否发生地质灾害作为因变量,通过SPSS模型计算得到若干个逻辑回归系数。
8.基于多种算法集成的地质灾害风险自适应评价方法,其特征在于,包括使用所述权利要求1-7任意一项所述的基于多种算法集成的地质灾害风险自适应评价系统进行地质灾害的评价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410532498.XA CN118114994B (zh) | 2024-04-30 | 2024-04-30 | 基于多种算法集成的地质灾害风险自适应评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410532498.XA CN118114994B (zh) | 2024-04-30 | 2024-04-30 | 基于多种算法集成的地质灾害风险自适应评价方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118114994A CN118114994A (zh) | 2024-05-31 |
CN118114994B true CN118114994B (zh) | 2024-07-19 |
Family
ID=91209061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410532498.XA Active CN118114994B (zh) | 2024-04-30 | 2024-04-30 | 基于多种算法集成的地质灾害风险自适应评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118114994B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553792B (zh) * | 2021-09-18 | 2021-12-21 | 中国科学院、水利部成都山地灾害与环境研究所 | 一种山地灾害全过程数值模拟与险情预报方法 |
CN114926067B (zh) * | 2022-05-31 | 2024-09-13 | 山东省地质调查院(山东省自然资源厅矿产勘查技术指导中心) | 一种基于信息量模型的层次分析地质灾害风险评价方法 |
CN116050708A (zh) * | 2023-02-01 | 2023-05-02 | 中国地质科学院 | 一种区域性地质灾害风险性评价方法 |
CN117493805A (zh) * | 2023-11-04 | 2024-02-02 | 广东省核工业地质调查院 | 一种地质灾害评价过程中斜坡单元的评分取值方法 |
-
2024
- 2024-04-30 CN CN202410532498.XA patent/CN118114994B/zh active Active
Non-Patent Citations (1)
Title |
---|
四川省会理市地质灾害风险评价;彭培雄;中国优秀硕士学位论文全文数据库 工基础科学;20230915;1-97 * |
Also Published As
Publication number | Publication date |
---|---|
CN118114994A (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Landslide susceptibility zonation method based on C5. 0 decision tree and K-means cluster algorithms to improve the efficiency of risk management | |
Shahabi et al. | Remote sensing and GIS-based landslide susceptibility mapping using frequency ratio, logistic regression, and fuzzy logic methods at the central Zab basin, Iran | |
CN113642849A (zh) | 考虑空间分布特征的地质灾害危险性综合评价方法及装置 | |
CN113408917B (zh) | 自然灾害风险评估方法、装置、计算机设备及存储介质 | |
Xing et al. | Large-scale landslide susceptibility mapping using an integrated machine learning model: A case study in the Lvliang mountains of China | |
CN117935081B (zh) | 一种基于遥感卫星数据的耕地变化监测方法及系统 | |
CN112200358B (zh) | 一种滑坡等级预测方法、装置、设备和存储介质 | |
CN104881783A (zh) | 电子银行账户欺诈行为及风险检测方法与系统 | |
Hysa et al. | A GIS based method for indexing the broad-leaved forest surfaces by their wildfire ignition probability and wildfire spreading capacity | |
CN111310898A (zh) | 一种基于rnn的滑坡灾害易发性预测方法 | |
US20240242289A1 (en) | Spatial simulation method for assessment of direct economic losses of typhoon flood based on remote sensing | |
CN111898385B (zh) | 一种地震灾害评估方法及系统 | |
CN117195750B (zh) | 一种参考时序形变的滑坡灾害敏感性模型构建方法 | |
CN117390555A (zh) | 一种实现泥石流灾害风险多维分类预测方法 | |
Balti et al. | Big data based architecture for drought forecasting using LSTM, ARIMA, and Prophet: Case study of the Jiangsu Province, China | |
CN116882625A (zh) | 一种岩溶山地乡村聚落用地空间脆弱性识别方法 | |
Soma et al. | The Performance of Land Use Change Causative Factor on Landslide Susceptibility Map in Upper Ujung-Loe Watersheds South Sulawesi, Indonesia | |
Koolagudi | Long-range prediction of Indian summer monsoon rainfall using data mining and statistical approaches | |
CN118114994B (zh) | 基于多种算法集成的地质灾害风险自适应评价方法及系统 | |
Distefano et al. | Brief communication: Rainfall thresholds based on Artificial neural networks can improve landslide early warning | |
CN112232689A (zh) | 一种茶叶连片种植区的生态地质脆弱性评价方法 | |
CN116110210B (zh) | 复杂环境下数据驱动的滑坡灾害辅助决策方法 | |
Martin et al. | A study on development of landslide susceptibility map in malaysia landslide prone areas by using geographic information system (GIS) and machine learning | |
Suraj et al. | Landslide susceptibility modelling of central highland part of Chaliyar River Basin, Kerala, India with integrated algorithms of frequency ratio and Shannon entropy | |
Kumar et al. | Comparison of Frequency Ratio Model and Analytic Hierarchy Process methods upon landslide susceptibility mapping using Geospatial techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |