CN112819208A - 一种基于特征子集耦合模型的空间相似性地质灾害预测方法 - Google Patents
一种基于特征子集耦合模型的空间相似性地质灾害预测方法 Download PDFInfo
- Publication number
- CN112819208A CN112819208A CN202110071022.7A CN202110071022A CN112819208A CN 112819208 A CN112819208 A CN 112819208A CN 202110071022 A CN202110071022 A CN 202110071022A CN 112819208 A CN112819208 A CN 112819208A
- Authority
- CN
- China
- Prior art keywords
- disaster
- data
- geological
- geological disaster
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000008878 coupling Effects 0.000 title claims abstract description 21
- 238000010168 coupling process Methods 0.000 title claims abstract description 21
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 21
- 238000012549 training Methods 0.000 claims abstract description 40
- 230000035945 sensitivity Effects 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 17
- 238000012795 verification Methods 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 8
- 239000003086 colorant Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013138 pruning Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000013215 result calculation Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于地质灾害预测技术领域,公开了一种基于特征子集耦合模型的空间相似性地质灾害预测方法,获取地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成地质灾害因子图层;获取到历史地质灾害点及相关数据,得到灾害点矩阵,并制成图;设置成员分类器数量、子空间维数,生成特征子集;针对生成的每个特征子集生成一棵逻辑模型树,并调整相应的参数,计算得到每个子集最佳的训练结果,判断模型性能;并,制成相应的地质灾害敏感性图,根据地质灾害敏感性图来进行地质灾害危险性预测。本发明降低了因子对于预测结果的影响,提高预测的准确率。
Description
技术领域
本发明属于地质灾害预测技术领域,尤其涉及一种基于特征子集耦合模型的空间相似性地质灾害预测方法。
背景技术
目前,地质灾害具有破坏力大,突发性强,预防困难的特点,每年给中国造成大量的人员伤亡和巨额的财产损失,所以对于地质灾害的预测预报工作迫在眉睫。从上个世纪以来,多种研究方法用于地质灾害的预测。最开始流行的是专家打分模型,这是一种定性模型,以专家的经验知识为基础,评估每个地质环境因子对地质灾害发生造成的英雄,然后计算出目标区域发生地质灾害的可能性,这种方法的缺点在于过于依赖专家的专业知识,有着很大的不确定性,结果也不一定准确。后来,AHP模型引入到地质灾害预测领域,这是一种半定量模型,由专家设置每个地质灾害因子相对于其他因子的权重,然后由AHP矩阵计算出每个因子对地质灾害发生的权重,这种方法相较于专家打分法结果更为准确,但仍带有较强的主观因素。
在近十年以来,随着信息技术的发展,人工智能技术也在飞速进步,机器学习的方法也渐渐应用到地质灾害预测领域,机器学习方法属于一种统计学方法,它基于一个假设:发生地质灾害的环境总是相似的,过去的地质灾害环境能为未发生的地质灾害提供参考。相较于传统方法,机器学习方法完全摒弃了主观的因素,只参考已发生的地质灾害数据,从过去的数据中训练模型,并预测即将发生的灾害。比较流行的模型有决策树、逻辑回归模型,支持向量机等。目前,地质灾害预测模型的研究以单一算法为主,导致预测结果受环境影响较大,难以获得一个较稳定的结果。而且地质灾害在不同的因子组合下会呈现出不同的预测结果,有的地质灾害因子会对结果的准确性造成负面作用,所以地质环境因子的筛选也是相当重要的一步,然而这也是目前大多数研究所忽视的。
通过上述分析,现有技术存在的问题及缺陷为:现有地质灾害预测方法预测对环境变化比较敏感,难以获得一个准确且稳定的结果。另外,现有技术无法区分对地质灾害发生有贡献的因子,对结果造成一定干扰。
解决以上问题及缺陷的难度为:基础预测方法经历了多年的推导,已经相当成熟,难以从模型公式进行改进从而提升鲁棒性与准确性;目前国内外对于地质灾害致灾因子筛选的研究较少,难以提供足够的参考,只能依靠有限的资料来推导合适且有效的筛选方案。
解决以上问题及缺陷的意义为:提高地质灾害预测方法的准确性与鲁棒性,减少更多的人员伤亡与财产损失,同时,给行业内提供一种新的解决方案,促进更多的相关研究。
发明内容
针对现有技术存在的问题,本发明提供了一种基于特征子集耦合模型的空间相似性地质灾害预测方法。
本发明是这样实现的,一种基于特征子集耦合模型的空间相似性地质灾害预测方法,所述基于特征子集耦合模型的空间相似性地质灾害预测方法包括:
步骤一,从地形图、气象图、DEM、土地利用数据图及其他等数据中获取地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成地质灾害因子图层;
步骤二,从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图;
步骤三,将获取的灾害点及相关数据划分为训练数据与验证数据,利用训练数据进行模型训练;设置成员分类器数量、子空间维数,生成特征子集;
步骤四,针对生成的每个特征子集生成一棵逻辑模型树,并调整相应的参数,计算得到每个子集最佳的训练结果,并采用投票方式综合每个子集的预测结果获取最终的训练结果;
步骤五,根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能;并基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测。
进一步,步骤一中,所述对所获取到的致灾因子进行标准化处理包括:
对连续型致灾因子,利用下式进行标准化处理:
其中,μ表示致灾因子的均值,σ表示致灾因子的标准差;
对离散型致灾因子,利用数值代替类别,进行归一化处理。
进一步,步骤二中,所述从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图包括:
获取目标区域的历史灾害数据,筛选足够数量的年份较劲的灾害点,根据经纬度在地图上标识出来,并与获取的各个致灾因子地图相交,将每个灾害点表示为(x1,x2,…,xn)的形式,其中xi表示第i种致灾因子在该灾害点的值;同时筛选与灾害点数目相同的非灾害点作为对照数据,与灾害点进行相同处理,也表示在地图中。
进一步,步骤二中,所述地质灾害点相关数据包括发生时间,地点,影响范围及其他数据。
进一步,步骤三中,所述将获取的灾害点及相关数据划分为训练数据与验证数据包括:
将获取的灾害点及相关数据按照7::3比例划分为训练数据与验证数据。
进一步,步骤三中,所述设置成员分类器数量、子空间维数,生成特征子集包括:
1)设置子空间数目、子空间维数,生成特征子集,则对p维的输入矩阵,生成的r维的子空间表示为:
2)设置参数,所述参数包括:子空间个数、分类器迭代次数、以及子空间特征系数。
进一步,步骤四中,所述逻辑模型树的主要参数包括每个叶子上实例的数目,分类器最大迭代次数以及权重修剪值。
进一步,步骤四中,所述每个子集的预测结果获取方法包括:
(1)利用下式计算子空间内的数据的分类结果:
其中,LC(x)表示某分类下拟合该类别的概率,xi表示第i个致灾因子,βi表示第i个致灾因子的拟合系数,β0是结果的修正值;
(2)利用下式计算某点的最终预测结果:
其中D表示分类的数量,即发生地质灾害或未发生地质灾害;
(3)重复步骤(1)至步骤(2)直至所有子空间的结果计算完成,按照投票规则计算最终的预测结果:
其中,C(x)表示每个逻辑模型树计算的结果,δi,j(i=1,2,...,n,j=1,2,...,r)表示Kronecker符号,y∈{1,-1}表示分类标签,表示发生/未发生地质灾害。
进一步,步骤五中,所述根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能包括:
根据各指标计算模型预测的准确率,并结合专家知识判断该模型是否可用,各计算指标如下:
其中TP表示真阳性,TN表示真阴性,FT表示假阳性,FN表示假阴性。
进一步,步骤五中,所述基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测包括:
(1)将目标区域分为一个个栅格,将每个栅格与各个因子图层叠加,得到一个个输入数据;
(2)将得到的目标区域数据输入到训练好的模型,计算每个栅格的分类结果;
(3)根据得到的分类结果,按照比例进行危险性划分,输入所有栅格到Arcgis软件中进行制图,得到地质灾害敏感性评估图;
(4)根据地质灾害敏感性评估图,发生极端天气时候,根据图上不同分区,进行不同等级的预报。
进一步,所述栅格与地质灾害发生范围相似。
进一步,步骤(3)中,所述按照比例进行危险性划分包括:
前10%为非常危险,10%-30%为危险,30%-50%中等危险,50%-80%为轻度危险,剩下的区域较为安全,不同区域标为不同颜色,颜色越深表示越危险。
本发明的另一目的在于提供一种基于特征子集耦合模型的空间相似性地质灾害预测系统,所述基于特征子集耦合模型的空间相似性地质灾害预测系统包括:
地质灾害因子图层获取模块,用于从地形图、气象图、DEM、土地利用数据图及其他等数据中获取地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成地质灾害因子图层;
灾害点矩阵获取模块,用于从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图;
特征子集生成模块,用于将获取的灾害点及相关数据划分为训练数据与验证数据,利用训练数据进行模型训练;设置成员分类器数量、子空间维数,生成特征子集;
地质灾害危险性预测模块,用于对生成的每个特征子集生成一棵逻辑模型树,并调整相应的参数,计算得到每个子集最佳的训练结果,并采用投票方式综合每个子集的预测结果获取最终的训练结果;
根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能;并基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于特征子集耦合模型的空间相似性地质灾害预测方法。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于特征子集耦合模型的空间相似性地质灾害预测方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明能有效筛选出合理有效的地质环境因子组合,提高模型的准确性和鲁棒性;本发明使用随机子空间将致灾因子映射到多个维度,消除了不良致灾因子对预测结果的影响。同时综合了多个子空间的预测结果,解决了单一分类器性能不稳定的问题。
本发明改进传统的随机子空间中的决策树算法,采用逻辑模型树作为分类器,遍历特征后能自行寻找最佳分割点,并采用CART算法剪枝,避免过拟合,进一步降低因子对于预测结果的影响,同时叶子节点使用逻辑回归算法,相比传统的决策树算法更具优势。
为了验证本发明的实用性和优越性,用传统的地质灾害预测方法朴素贝叶斯(NB)、逻辑模型树(LMT)、逻辑回归模型(LR)与本发明(RSLMT)的结果进行对比,以四川省青川县为例,将青川县的地质灾害数据以7:3的比例,分为训练数据和验证数据,分别制作受试者工作曲线作为验证手段,在该曲线下,数值越接近1,表明该模型的预测效果越好。
如图3所示,无论是对已有数据的拟合能力(图a),还是对未知数据的预测能力(图b),本发明提出的RSLMT模型都比其他三个传统模型表现更优秀,这也证实了本发明的优秀效果。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于特征子集耦合模型的空间相似性地质灾害预测方法原理图。
图2是本发明实施例提供的基于特征子集耦合模型的空间相似性地质灾害预测方法流程图。
图3是本发明实施例提供的基于特征子集耦合模型的空间相似性地质灾害预测结果对比图。
图3(a)对已有数据的拟合能力,图3(b)对未知数据的预测能力。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于特征子集耦合模型的空间相似性地质灾害预测方法,下面结合附图对本发明作详细的描述。
如图1-图2所示,本发明实施例提供的基于特征子集耦合模型的空间相似性地质灾害预测方法包括以下步骤:
S101,从地形图、气象图、DEM、土地利用数据图及其他等数据中获取地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成地质灾害因子图层;
S102,从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图;
S103,将获取的灾害点及相关数据划分为训练数据与验证数据,利用训练数据进行模型训练;设置成员分类器数量、子空间维数,生成特征子集;
S104,针对生成的每个特征子集生成一棵逻辑模型树,并调整相应的参数,计算得到每个子集最佳的训练结果,并采用投票方式综合每个子集的预测结果获取最终的训练结果;
S105,根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能;并基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测。
步骤S101中,本发明实施例提供的对所获取到的致灾因子进行标准化处理包括:
对连续型致灾因子,利用下式进行标准化处理:
其中,μ表示致灾因子的均值,σ表示致灾因子的标准差;
对离散型致灾因子,利用数值代替类别,进行归一化处理。
步骤S102中,本发明实施例提供的从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图包括:
获取目标区域的历史灾害数据,筛选足够数量的年份较劲的灾害点,根据经纬度在地图上标识出来,并与获取的各个致灾因子地图相交,将每个灾害点表示为(x1,x2,…,xn)的形式,其中xi表示第i种致灾因子在该灾害点的值;同时筛选与灾害点数目相同的非灾害点作为对照数据,与灾害点进行相同处理,也表示在地图中。
步骤S102中,本发明实施例提供的地质灾害点相关数据包括发生时间,地点,影响范围及其他数据。
步骤S103中,本发明实施例提供的将获取的灾害点及相关数据划分为训练数据与验证数据包括:
将获取的灾害点及相关数据按照7::3比例划分为训练数据与验证数据。
步骤S103中,本发明实施例提供的设置成员分类器数量、子空间维数,生成特征子集包括:
1)设置子空间数目、子空间维数,生成特征子集,则对p维的输入矩阵,生成的r维的子空间表示为:
2)设置参数,所述参数包括:子空间个数、分类器迭代次数、以及子空间特征系数。
步骤S104中,本发明实施例提供的逻辑模型树的主要参数包括每个叶子上实例的数目,分类器最大迭代次数以及权重修剪值。
步骤S104中,本发明实施例提供的每个子集的预测结果获取方法包括:
(1)利用下式计算子空间内的数据的分类结果:
其中,LC(x)表示某分类下拟合该类别的概率,xi表示第i个致灾因子,βi表示第i个致灾因子的拟合系数,β0是结果的修正值;
(2)利用下式计算某点的最终预测结果:
其中D表示分类的数量,即发生地质灾害或未发生地质灾害;
(3)重复步骤(1)至步骤(2)直至所有子空间的结果计算完成,按照投票规则计算最终的预测结果:
其中,C(x)表示每个逻辑模型树计算的结果,δi,j(i=1,2,...,n,j=1,2,...,r)表示Kronecker符号,y∈{1,-1}表示分类标签,表示发生/未发生地质灾害。
步骤S105中,本发明实施例提供的根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能包括:
根据各指标计算模型预测的准确率,并结合专家知识判断该模型是否可用,各计算指标如下:
其中TP表示真阳性,TN表示真阴性,FT表示假阳性,FN表示假阴性。
步骤S105中,本发明实施例提供的基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测包括:
将目标区域分为一个个栅格,将每个栅格与各个因子图层叠加,得到一个个输入数据;将得到的目标区域数据输入到训练好的模型,计算每个栅格的分类结果;根据得到的分类结果,按照比例进行危险性划分,输入所有栅格到Arcgis软件中进行制图,得到地质灾害敏感性评估图;根据地质灾害敏感性评估图,发生极端天气时候,根据图上不同分区,进行不同等级的预报。
本发明实施例提供的栅格与地质灾害发生范围相似。
步骤S101中,本发明实施例提供的按照比例进行危险性划分包括:
前10%为非常危险,10%-30%为危险,30%-50%中等危险,50%-80%为轻度危险,剩下的区域较为安全,不同区域标为不同颜色,颜色越深表示越危险。
下面结合具体实施例对本发明的技术效果作进一步描述。
实施例1:
基于该模型的地质灾害预测包括以下步骤:
(1)灾害因子的提取,包括从地形图、气象图、DEM、土地利用数据图等数据中获取到地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成相应图层。
(2)灾害点的获取,从目标区域的地质灾害历史数据库中,获取到历史地质灾害点,包括发生时间,地点,影响范围等关键数据,获取到灾害点后,结合步骤1中的地质灾害因子图层,制作灾害点矩阵,并制成图。
(3)将步骤二中获得的灾害点制成训练数据,设置成员分类器数量、子空间维数,生成特征子集;
(4)在每个特征子集中,生成一棵逻辑模型树,调整好相应的参数后,计算得到每个子集最佳的训练结果,最后采用投票方式综合每个子集的预测结果来获取最终的训练结果。
(5)根据已有的历史数据计算召回率、准确率等关键信息,结合专家知识判断该模型的性能。
(6)对步骤4中获取的预测结果,根据发生地质灾害的概率的大小来进行分级,制成相应的地质灾害敏感性图,根据该地图来进行地质灾害危险性预测。
实施例2:
基于特征子集耦合模型的空间相似性地质灾害预测的具体实施方法如下步骤:
(1)提取灾害因子,具体来说,可以运用Arcgis软件,从目标区域的地形图、DEM、气象图等提取出关键的致灾因子,例如坡度、坡向、断层、平均降雨量、水系等,提取后,各个因子需要进行归一化处理,对于连续型因子,可以使用以下公式进行处理:
其中,μ是该因子的均值,σ是该因子的标准差。对于离散型因子,例如坡向,可以使用数值代替类别,例如1表示正北方向。进行归一化处理后,继续使用Arcgis软件进行制图,制作目标区域的致灾因子地图。
(2)获取目标区域的历史灾害数据,挑选出足够数量的年份较劲的灾害点,根据经纬度在地图上标识出来,并与步骤1中得到的各个致灾因子地图相交,这样每个灾害点可以表示为(x1,x2,…,xn)的形式,其中xi表示第i种致灾因子在该灾害点的值。为了预测的准确性,还需挑选与灾害点数目相同的非灾害点作为对照数据,与灾害点进行相同处理,也表示在地图中。
(3)将步骤二中获得的数据按照7::3比例制成训练数据与验证数据,设置成员分类器数量、子空间维数,生成特征子集;具体来说分为以下几步:
3.1:设置子空间数目、子空间维数,生成特征子集,对于一个p维的输入矩阵,生成的r维的子空间可以表示为:
3.2设置参数,所述参数包括:子空间个数、分类器迭代次数、以及子空间特征系数等。
(4)在每个子空间内生成一棵逻辑模型树,并调整好树的参数,得到每个子空间的分类结果,最后综合所有结果得到预测结果。具体来说:
4.1在子空间内生成一棵逻辑模型树,经过多次运行,根据得到的结果,来调整逻辑模型树的各个参数,逻辑模型树的主要参数包括每个叶子上实例的数目,分类器最大迭代次数以及权重修剪值。
4.2计算子空间内的数据的分类结果,计算公式如下:
其中LC(x)表示某分类下拟合该类别的概率,xi表示第i个致灾因子,βi表示第i个致灾因子的拟合系数,β0是结果的修正值。
在本发明中,分类只有两种,发生地质灾害与未发生地质灾害,某点的最终预测结果可以按如下公式计算:
其中D表示分类的数量,在本发明中为2。
4.3重复4.1,4.2两个步直至所有子空间的结果计算完成,按照投票规则计算最终的预测结果:
其中C(x)是每个逻辑模型树计算的结果,δi,j(i=1,2,...,n,j=1,2,...,r)是Kronecker符号,y∈{1,-1}是分类标签,表示发生/未发生地质灾害。
(5)根据各指标计算模型预测的准确率,并结合专家知识判断该模型是否可用,各计算指标如下:
其中TP表示真阳性,TN表示真阴性,FT表示假阳性,FN表示假阴性。
(6)计算目标区域进行地质灾害预测值,根据预测值的大小分类,然后制作地质灾害敏感性制图,以此进行地质灾害预测,具体来说如下:
6.1将目标区域分为一个个栅格,每个栅格与地质灾害发生范围相似,与步骤二中处理灾害点相似,将每个栅格与各个因子图层叠加,得到一个个输入数据。
6.2将6.1中得到的目标区域数据输入到步骤五中得到的训练好的模型,计算每个栅格的分类结果。
6.3根据得到的分类结果,按照比例进行危险性划分,前10%为非常危险,10%-30%为危险,30%-50%中等危险,50%-80%为轻度危险,剩下的区域较为安全,不同区域标为不同颜色,颜色越深表示越危险,然后输入所有栅格到Arcgis软件中进行制图,得到地质灾害敏感性评估图。
6.4根据地质灾害敏感性评估图,发生极端天气时候,可根据图上不同分区,进行不同等级的预报,采取不同的措施,减少相关人员伤亡以及减少经济损失。
下面结合具体实施例对本发明效果作进一步描述。
以四川省青川县为例,应用本发明。首先从青川的地形地貌图、气象图、DEM等地图中选取青川县12个致灾因子,坡度、坡向、平面曲率、剖面曲率、高程、断层距离、水系距离、公路距离、地震烈度、年均降雨量、岩性、地貌,进行归一化与标准化处理,并制成相应图层。然后从数据库中挑选近年来发生的地质灾害631例,随机挑出相同数目的非地质灾害点,作为本次实践的原始数据,其中7成作为训练数据,3成作为验证数据。应用本发明的模型(RSLMT)以及3种传统的地质灾害预测模型朴素贝叶斯(NB)、逻辑模型树(LMT)、逻辑回归模型(LR),进行模型训练与预测,得到预测结果,模型间的精度对比如下表(其中T表示训练数据,V表示验证数据):
从上表可以看出,从各项指标比较,本发明中的模型,在各项指标中,表现大幅优于同类相关模型,证实了本发明的正确性以及优越性。
如图3所示,无论是对已有数据的拟合能力(图a),还是对未知数据的预测能力(图b),本发明提出的RSLMT模型都比其他三个传统模型表现更优秀,这也证实了本发明的优秀效果。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于特征子集耦合模型的空间相似性地质灾害预测方法,其特征在于,所述基于特征子集耦合模型的空间相似性地质灾害预测方法包括:
从地形图、气象图、DEM、土地利用数据图数据中获取地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成地质灾害因子图层;
从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图;
将获取的灾害点及相关数据划分为训练数据与验证数据,利用训练数据进行模型训练;设置成员分类器数量、子空间维数,生成特征子集;
对生成的每个特征子集生成一棵逻辑模型树,并调整相应的参数,计算得到每个子集最佳的训练结果,并采用投票方式综合每个子集的预测结果获取最终的训练结果;
根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能;并基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测。
3.如权利要求1所述基于特征子集耦合模型的空间相似性地质灾害预测方法,其特征在于,所述从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图包括:
获取目标区域的历史灾害数据,筛选足够数量的年份较劲的灾害点,根据经纬度在地图上标识出来,并与获取的各个致灾因子地图相交,将每个灾害点表示为(x1,x2,…,xn)的形式,其中xi表示第i种致灾因子在该灾害点的值;同时筛选与灾害点数目相同的非灾害点作为对照数据,与灾害点进行相同处理,也表示在地图中。
4.如权利要求1所述基于特征子集耦合模型的空间相似性地质灾害预测方法,其特征在于,所述地质灾害点相关数据包括发生时间,地点,影响范围及其他数据;
所述将获取的灾害点及相关数据划分为训练数据与验证数据包括:
将获取的灾害点及相关数据按照7::3比例划分为训练数据与验证数据。
6.如权利要求1所述基于特征子集耦合模型的空间相似性地质灾害预测方法,其特征在于,所述逻辑模型树的主要参数包括每个叶子上实例的数目,分类器最大迭代次数以及权重修剪值;
所述每个子集的预测结果获取方法包括:
(1)利用下式计算子空间内的数据的分类结果:
其中,LC(x)表示某分类下拟合该类别的概率,xi表示第i个致灾因子,βi表示第i个致灾因子的拟合系数,β0是结果的修正值;
(2)利用下式计算某点的最终预测结果:
其中D表示分类的数量,即发生地质灾害或未发生地质灾害;
(3)重复步骤(1)至步骤(2)直至所有子空间的结果计算完成,按照投票规则计算最终的预测结果:
其中,C(x)表示每个逻辑模型树计算的结果,δi,j(i=1,2,...,n,j=1,2,...,r)表示Kronecker符号,y∈{1,-1}表示分类标签,表示发生/未发生地质灾害;
所述根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能包括:
根据各指标计算模型预测的准确率,并结合专家知识判断该模型是否可用,各计算指标如下:
其中TP表示真阳性,TN表示真阴性,FT表示假阳性,FN表示假阴性。
7.如权利要求1所述基于特征子集耦合模型的空间相似性地质灾害预测方法,其特征在于,所述基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测包括:
(1)将目标区域分为一个个栅格,将每个栅格与各个因子图层叠加,得到一个个输入数据;
(2)将得到的目标区域数据输入到训练好的模型,计算每个栅格的分类结果;
(3)根据得到的分类结果,按照比例进行危险性划分,输入所有栅格到Arcgis软件中进行制图,得到地质灾害敏感性评估图;所述按照比例进行危险性划分包括:
前10%为非常危险,10%-30%为危险,30%-50%中等危险,50%-80%为轻度危险,剩下的区域较为安全,不同区域标为不同颜色,颜色越深表示越危险;
(4)根据地质灾害敏感性评估图,发生极端天气时候,根据图上不同分区,进行不同等级的预报;
所述栅格与地质灾害发生范围相似。
8.一种基于特征子集耦合模型的空间相似性地质灾害预测系统,其特征在于,所述基于特征子集耦合模型的空间相似性地质灾害预测系统包括:
地质灾害因子图层获取模块,用于从地形图、气象图、DEM、土地利用数据图及其他等数据中获取地质灾害相关的致灾因子,并对所获取到的致灾因子进行标准化处理,制成地质灾害因子图层;
灾害点矩阵获取模块,用于从目标区域的地质灾害历史数据库中,获取到历史地质灾害点及相关数据;获取到灾害点后,结合地质灾害因子图层,得到灾害点矩阵,并制成图;
特征子集生成模块,用于将获取的灾害点及相关数据划分为训练数据与验证数据,利用训练数据进行模型训练;设置成员分类器数量、子空间维数,生成特征子集;
地质灾害危险性预测模块,用于对生成的每个特征子集生成一棵逻辑模型树,并调整相应的参数,计算得到每个子集最佳的训练结果,并采用投票方式综合每个子集的预测结果获取最终的训练结果;
根据已有的历史数据计算召回率、准确率及其他关键信息,结合专家知识判断模型性能;并基于每个子集的预测结果,根据发生地质灾害的概率的大小进行分级,制成相应的地质灾害敏感性图,根据所述地质灾害敏感性图进行地质灾害危险性预测。
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~7任意一项所述基于特征子集耦合模型的空间相似性地质灾害预测方法。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~7任意一项所述基于特征子集耦合模型的空间相似性地质灾害预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110071022.7A CN112819208A (zh) | 2021-01-19 | 2021-01-19 | 一种基于特征子集耦合模型的空间相似性地质灾害预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110071022.7A CN112819208A (zh) | 2021-01-19 | 2021-01-19 | 一种基于特征子集耦合模型的空间相似性地质灾害预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112819208A true CN112819208A (zh) | 2021-05-18 |
Family
ID=75870189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110071022.7A Pending CN112819208A (zh) | 2021-01-19 | 2021-01-19 | 一种基于特征子集耦合模型的空间相似性地质灾害预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819208A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393037A (zh) * | 2021-06-16 | 2021-09-14 | 潍坊科技学院 | 一种区域地质灾害趋势预测方法及系统 |
CN116629134A (zh) * | 2023-06-01 | 2023-08-22 | 中国地质科学院矿产资源研究所 | 一种三稀矿产开发区域的环境影响预测方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144651A (zh) * | 2019-12-26 | 2020-05-12 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN111582386A (zh) * | 2020-05-11 | 2020-08-25 | 四川师范大学 | 一种基于随机森林的地质灾害多灾种综合风险评价方法 |
KR20210000510A (ko) * | 2019-06-25 | 2021-01-05 | 주식회사 업데이터 | 전기 화재 예측 장치, 방법 및 그 방법을 이용한 기록 매체 |
CN112232526A (zh) * | 2020-09-28 | 2021-01-15 | 中山大学 | 一种基于集成策略的地质灾害易发性评价方法及系统 |
-
2021
- 2021-01-19 CN CN202110071022.7A patent/CN112819208A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210000510A (ko) * | 2019-06-25 | 2021-01-05 | 주식회사 업데이터 | 전기 화재 예측 장치, 방법 및 그 방법을 이용한 기록 매체 |
CN111144651A (zh) * | 2019-12-26 | 2020-05-12 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN111582386A (zh) * | 2020-05-11 | 2020-08-25 | 四川师范大学 | 一种基于随机森林的地质灾害多灾种综合风险评价方法 |
CN112232526A (zh) * | 2020-09-28 | 2021-01-15 | 中山大学 | 一种基于集成策略的地质灾害易发性评价方法及系统 |
Non-Patent Citations (3)
Title |
---|
刘志强: "基于数据挖掘的客户行为分析和预测研究", 《中国优秀硕士论文全文数据库》, 29 February 2012 (2012-02-29), pages 33 - 34 * |
张艺梅;丁香乾;贺英;王丽丽;徐硕;: "逻辑模型树算法性能分析与改进研究", 微型机与应用, no. 23, 10 December 2014 (2014-12-10), pages 25 - 28 * |
郝国栋: "基于随机森林模型的商南县滑坡易发性评价", 《中国优秀硕士论文全文数据库 工程科技II辑》, pages 6 - 58 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393037A (zh) * | 2021-06-16 | 2021-09-14 | 潍坊科技学院 | 一种区域地质灾害趋势预测方法及系统 |
CN116629134A (zh) * | 2023-06-01 | 2023-08-22 | 中国地质科学院矿产资源研究所 | 一种三稀矿产开发区域的环境影响预测方法及装置 |
CN116629134B (zh) * | 2023-06-01 | 2023-10-27 | 中国地质科学院矿产资源研究所 | 一种三稀矿产开发区域的环境影响预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112819207B (zh) | 基于相似性度量的地质灾害空间预测方法、系统及存储介质 | |
CN101354757B (zh) | 一种精细尺度下的动态风险及易损性预测方法 | |
CN111178611B (zh) | 一种日电量预测的方法 | |
CN110895878B (zh) | 一种基于ge-gan的交通状态虚拟检测器的生成方法 | |
CN112735097A (zh) | 一种区域滑坡预警方法及系统 | |
CN114493052B (zh) | 多模型融合自适应新能源功率预测方法和系统 | |
CN112819208A (zh) | 一种基于特征子集耦合模型的空间相似性地质灾害预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN107967454B (zh) | 顾及空间邻域关系的双路卷积神经网络遥感分类方法 | |
CN116169670A (zh) | 一种基于改进神经网络的短期非居民负荷预测方法及系统 | |
CN112036598A (zh) | 一种基于多信息耦合的充电桩使用信息预测方法 | |
CN113283546B (zh) | 加热炉完整性管理集控装置的炉况异常报警方法及系统 | |
CN117808214A (zh) | 水利工程数据分析系统 | |
Zhu et al. | Fuzzy c-means clustering identification method of urban road traffic state | |
CN112434887B (zh) | 一种结合网络核密度估计和svm的供水管网风险预测方法 | |
CN111898822B (zh) | 基于多相关日场景生成的充电负荷区间预测方法 | |
CN116258279B (zh) | 基于综合赋权的滑坡易发性评价方法和装置 | |
CN117408167A (zh) | 基于深度神经网络的泥石流灾害易发性预测方法 | |
CN116933947A (zh) | 一种基于软投票集成分类器的滑坡易发性预测方法 | |
Xu et al. | MM-UrbanFAC: Urban functional area classification model based on multimodal machine learning | |
CN114154617A (zh) | 一种基于vfl的低压居民用户异常用电识别方法及系统 | |
CN115209441A (zh) | 基站退服告警预测方法、装置、设备及存储介质 | |
CN103955953A (zh) | 一种面向数字土壤制图的地形协同变量选取方法 | |
JP2020035042A (ja) | データ判定装置、方法、及びプログラム | |
CN118349877B (zh) | 基于机器学习的车联网数据分析方法及其相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |