CN112735094B - 基于机器学习的地质灾害预测方法、装置和电子设备 - Google Patents
基于机器学习的地质灾害预测方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112735094B CN112735094B CN202011503011.3A CN202011503011A CN112735094B CN 112735094 B CN112735094 B CN 112735094B CN 202011503011 A CN202011503011 A CN 202011503011A CN 112735094 B CN112735094 B CN 112735094B
- Authority
- CN
- China
- Prior art keywords
- type
- geological disaster
- time sequence
- early warning
- physical parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000010801 machine learning Methods 0.000 title claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 155
- 238000012549 training Methods 0.000 claims abstract description 150
- 238000012360 testing method Methods 0.000 claims abstract description 99
- 238000012545 processing Methods 0.000 claims description 46
- 230000003203 everyday effect Effects 0.000 claims description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 238000006073 displacement reaction Methods 0.000 claims description 28
- 238000010606 normalization Methods 0.000 claims description 25
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 9
- 238000009434 installation Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000006872 improvement Effects 0.000 abstract description 3
- 239000011435 rock Substances 0.000 abstract 1
- 238000012544 monitoring process Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/02—Alarms for ensuring the safety of persons
- G08B21/10—Alarms for ensuring the safety of persons responsive to calamitous events, e.g. tornados or earthquakes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Emergency Management (AREA)
- Geology (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Environmental & Geological Engineering (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Pit Excavations, Shoring, Fill Or Stabilisation Of Slopes (AREA)
Abstract
本发明提供一种基于机器学习的地质灾害预测方法、装置和电子设备,包括:采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;任一预测模型是基于任一类型灾害样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型。本发明提供的方法、装置和电子设备,实现了提高地质灾害预测的准确性,并保障地质灾害预测的实时性。
Description
技术领域
本发明涉及地质灾害预测技术领域,尤其涉及一种基于机器学习的地质灾害预测方法、装置、电子设备和存储介质。
背景技术
传统的地质灾害预警方法,主要通过布设传感器,采用实时监测地质灾害高发地段的数据,若监测数据达到预设的阈值,就立即报警的方法。然而,传统的地质灾害预警方法的存在如下缺点:
1、监测方式单一:一直采用先设置固定阈值,再监测数据,最后基于监测的数据反馈结果重新设置固定阈值的方法,监测手段过于单一;
2、预警滞后:如果将报警阈值设置的过高,往往灾害来临时,没有给受灾人员撤退和灾害救援提供足够的时间;
3、准确性低:如果将报警阈值设置的过低,则预警往往发生较大偏差,浪费不必要的人力和物力;
4、未考虑环境因素:不同的地理环境和不同的时期,往往对应不同的预警阈值,所以更多的时候是无法进行准确预警的。
因此,如何避免现有的地质灾害预警方法准确率低、实时性差,监测手段过于单一,仍然是本领域技术人员亟待解决的问题。
发明内容
本发明提供一种基于机器学习的地质灾害预测方法、装置和电子设备,用以解决现有的地质灾害预警方法准确率低、实时性差,监测手段过于单一,仍然是本领域技术人员亟待解决的缺陷,通过基于机器学习训练得到的预测模型,通过获取的历史数据得到大量样本构建的训练集可以保障预测模型的准确率,而实时采集的数据输入预测模型即时可输出预测结果保障预测的实时性。
本发明提供一种基于机器学习的地质灾害预测方法,该方法包括:
采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;
将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;
其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。
根据本发明提供的一种基于机器学习的地质灾害预测方法,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,具体包括:
当所述任一类型地质灾害为泥石流类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型仅包括含水率;
当所述任一类型地质灾害为山体滑坡类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、绝对坐标位移值、倾角变化量;
当所述任一类型地质灾害为崩塌类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、倾角变化量。
根据本发明提供的一种基于机器学习的地质灾害预测方法,
所述裂缝宽度变化量包括每天最晚采集时刻与最早采集时刻采集的裂缝宽度之差和每天最晚采集时刻与采集设备安置初始时刻采集的裂缝宽度之差;
所述绝对坐标位移值包括每天最晚采集时刻与最早采集时刻采集的绝对坐标之间位移值和每天最晚采集时刻与采集设备安置初始时刻采集的绝对坐标之间位移值;
所述倾角变化量包括每天最晚采集时刻与最早采集时刻采集的倾角之差和每天最晚采集时刻与采集设备安置初始时刻采集的倾角之差。
根据本发明提供的一种基于机器学习的地质灾害预测方法,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,具体包括:
基于历史数据采用预设相关算法计算任一待测影响预测预警物理参数类型与所述描述因子向量中的任一预警物理参数类型之间的相关度;
若所述相关度超过预设阈值,则确定所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型包括所述任一待测影响预测预警物理参数类型。
根据本发明提供的一种基于机器学习的地质灾害预测方法,所述预设相关算法为皮尔逊相关系数算法。
根据本发明提供的一种基于机器学习的地质灾害预测方法,所述用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,具体包括:
训练样本集的构建包括以下步骤,
采集直至当前时刻前Q天的全套地质灾害预警物理参数组合形成全套影响因子向量时序序列,其中,所述全套地质灾害预警物理参数组合中的物理参数类型包括裂缝宽度变化量、绝对坐标位移值、倾角变化量、雨量和含水率;
按照预设比例将所述全套影响因子向量时序序列进行训练集和测试集的划分得到训练集时序序列和测试集时序序列,其中,所述训练集时序序列相对于所述测试集时序序列为前段时序序列;
采用宽度为M+N且步长为1的滑动窗口对所述训练集时序序列和所述测试集时序序列进行滑动采样,得到多个训练数据时序序列和多个测试数据时序序列;
采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列;
对所述多个标准化训练数据时序序列和所述多个标准化测试数据时序序列中的每个时序序列进行M:N比例的划分切割,并基于所述任一类型地质灾害的描述因子向量中的预警物理参数类型和所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型确定所述任一类型地质灾害的数据集中每个标准化训练数据时序序列的样本和标签,以及每个标准化测试数据时序序列中的样本和标签。
根据本发明提供的一种基于机器学习的地质灾害预测方法,所述采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列,具体包括:
将任一训练数据时序序列中的任一训练数据向量进行预设归一化处理,得到所述任一训练数据时序序列对应的标准化训练数据时序序列;
将任一测试数据时序序列中的任一测试数据向量进行预设归一化处理,得到所述任一测试数据时序序列对应的标准化测试数据时序序列;
其中,所述预设归一化处理为将待处理向量中所有元素数值除以所述待处理向量中首个数值不为0的元素数值。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的基于机器学习的地质灾害预测方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的基于机器学习的地质灾害预测方法的步骤。
本发明提供的基于机器学习的地质灾害预测方法、装置和电子设备,通过采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。由于基于机器学习训练得到的预测模型,而通过获取的历史数据得到大量样本构建的训练集可以保障预测模型的准确率,且实时采集的数据输入预测模型即时可输出预测结果保障预测的实时性。因此,本发明提供的方法、装置和电子设备,实现了提高地质灾害预测的准确性,并保障地质灾害预测的实时性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于机器学习的地质灾害预测方法的流程示意图;
图2为本发明提供的基于机器学习的地质灾害预测装置的结构示意图;
图3为本发明提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的地质灾害预警方法普遍存在准确率低、实时性差,监测手段过于单一的问题。下面结合图1描述本发明的一种基于机器学习的地质灾害预测方法。图1为本发明提供的基于机器学习的地质灾害预测方法的流程示意图,如图1所示,该方法包括:
步骤110,采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列。
具体地,本发明提供的基于机器学习的地质灾害预测方法是使用基于机器学习用历史数据训练出的预测模型进行当前时刻未来一段时间内的地质灾害的预测。在地质灾害监测点会放置多种测量仪器,包括用来测裂缝宽度的裂缝传感器、用来测降雨量的雨量计、用来测土壤含水率的含水率检测仪、用来测监测点的绝对位置坐标的GNSS传感器和用来测监测点倾角的倾角传感器,然后根据采集的直至当前时刻前M天的上述数据作未来N天的地质灾害的预警。由于本发明提供多种地质灾害类型的灾害预警,因此,用于描述不同类型地质灾害的预警物理参数类型组合也不同,而作为预测模型的输入的影响地质灾害预警的预警物理参数类型组合也不同,故只有在确定地质灾害类型后,依次确定裂缝宽度、降雨量、含水率、位移值和倾角中哪些参数类型需要被选中作为展示该地质灾害类型的预警结果的参数组合,以及确定裂缝宽度、降雨量、含水率、位移值和倾角中哪些参数类型需要被选中作为影响输出结果中任一参数类型的输入的参数组合中的一种参数类型。作为当前预测任一类型地质灾害的用于输入预测模型的数据,需要采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合构建影响因子向量时序序列,所述M天中采集的任一天的预警物理参数组合对应于该影响因子向量时序序列的时序中所述任一天对应的向量元素。
步骤120,将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;
其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。
具体地,作预测时,将影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列。其中,不同的地质灾害类型对应的预测模型是不同的,因为不同的地质灾害类型预测模型训练时也是基于预测不同类型地质灾害的样本和标签训练得到的,因此,虽然训练过程一样,训练的神经网络一样,但是由于构建的训练集中的样本数据和标签数据不同,导致不同类型的地质灾害对应的预测模型不同。本发明提供的地质灾害的预警事实上可以提供多种类型的地质灾害的预警,包括山体滑坡类型、泥石流类型和崩塌类型,而针对于这三种地质灾害,用于表征它们预警结果的物理参数和用于作为影响预警结果的物理参数都不相同。通常,在地质灾害监测点会放置多种测量仪器,包括用来测裂缝宽度的裂缝传感器、用来测降雨量的雨量计、用来测土壤含水率的含水率检测仪、用来测监测点的绝对位置坐标的GNSS传感器和用来测监测点倾角的倾角传感器,在确定需要预测的地质灾害类型之后,就可以从上述物理参数类型中依次确定表征它们预警结果的物理参数和用于作为影响预警结果的物理参数。在任一模型的训练过程中,用于训练和测试的数据集都是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,即构建用于训练和测试的数据集时对于一段历史数据可以做到最高效率的利用,从有限数据量的历史数据提取出最大数量的样本和标签。
本发明提供的基于机器学习的地质灾害预测方法,通过采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。由于基于机器学习训练得到的预测模型,而通过获取的历史数据得到大量样本构建的训练集可以保障预测模型的准确率,且实时采集的数据输入预测模型即时可输出预测结果保障预测的实时性。因此,本发明提供的方法,实现了提高地质灾害预测的准确性,并保障地质灾害预测的实时性。
在上述实施例的基础上,该方法中,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,具体包括:
当所述任一类型地质灾害为泥石流类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型仅包括含水率;
当所述任一类型地质灾害为山体滑坡类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、绝对坐标位移值、倾角变化量;
当所述任一类型地质灾害为崩塌类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、倾角变化量。
具体地,对于不同类型的地质灾害具体确定用于描述其预测结果的物理参数组合中各物理参数类型,所述描述其预测结果的物理参数组合也是该类型地质灾害预测模型输出的描述因子向量时许序列中任一向量元素中物理参数类型的组合。由于泥石流发生的表象仅仅与土壤含水率有关,因此将含水率作为描述泥石流预测结果的唯一物理参数类型;由于山体滑坡发生的表象与缝宽度变化量、绝对坐标位移值和倾角变化量都相关,即输出未来N天内裂缝宽度的急剧变大、位移值急剧变大和/或倾角变化量急剧变大都表征未来N天发生山体滑坡;由于山体崩塌发生的表象仅仅与裂缝宽度变化量、倾角变化量有关,因此将裂缝宽度变化量和倾角变化量组成的组合作为描述崩塌预测结果的物理参数类型组合。
在上述实施例的基础上,该方法中,所述裂缝宽度变化量包括每天最晚采集时刻与最早采集时刻采集的裂缝宽度之差和每天最晚采集时刻与采集设备安置初始时刻采集的裂缝宽度之差;
所述绝对坐标位移值包括每天最晚采集时刻与最早采集时刻采集的绝对坐标之间位移值和每天最晚采集时刻与采集设备安置初始时刻采集的绝对坐标之间位移值;
所述倾角变化量包括每天最晚采集时刻与最早采集时刻采集的倾角之差和每天最晚采集时刻与采集设备安置初始时刻采集的倾角之差。
具体地,对于裂缝宽度变化量、绝对坐标位移值和倾角变化量都可以采用两种计量方法进行表征,裂缝宽度变化量包括每天最晚采集时刻与最早采集时刻采集的裂缝宽度之差和每天最晚采集时刻与采集设备安置初始时刻采集的裂缝宽度之差,即相当于裂缝宽度变化量可以用每天的“瞬时”变化量表示又可以用每天的“累计”变化量(让每天最后一个采集时刻采集到的裂缝宽度与作为基准宽度的裂缝传感器安装初始时刻采集的裂缝宽度做差)表示,同理,绝对坐标位移值和倾角变化量都有上述“瞬时”和“累计”两种计量方式来表示。对于其他预警物理参数的表征方式,每天的含水率是采集每天最晚时刻采集的含水率数值,每天的降雨量将当天所有时段采集的雨量进行相加求和。
在上述实施例的基础上,该方法中,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,具体包括:
基于历史数据采用预设相关算法计算任一待测影响预测预警物理参数类型与所述描述因子向量中的任一预警物理参数类型之间的相关度;
若所述相关度超过预设阈值,则确定所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型包括所述任一待测影响预测预警物理参数类型。
具体地,根据地质灾害类型确定了描述因子向量中的预警物理参数类型后,再需要根据所述描述因子向量中的预警物理参数类型确定对应影响因子向量中的预警物理参数类型。而确定过程是基于历史数据采用预设相关算法计算任一待测影响预测预警物理参数类型与所述描述因子向量中的任一预警物理参数类型之间的相关度;若所述相关度超过预设阈值,则确定所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型包括所述任一待测影响预测预警物理参数类型。例如,对于预测崩塌类型的地质灾害,其描述因子向量中的预警物理参数类型包括裂缝宽度变化量、倾角变化量,从裂缝宽度变化量、绝对坐标位移值、倾角变化量、雨量和含水率组成的全套地质灾害预警物理参数组合中选择出与裂缝宽度变化量或倾角变化量存在高度相关性的物理参数类型作为崩塌类型地质灾害的影响因子向量中的预警物理参数类型。
在上述实施例的基础上,该方法中,所述预设相关算法为皮尔逊相关系数算法。
具体地,本发明采用最常用的计算相关性的算法:计算需要考察的两个参数之间的皮尔逊系数,为了提高准确率,可以增加样本数量,例如,要考察的待定影响因子物理参数类型A和已定描述因子物理参数类型B之间的相关性,计算大量的前M天的物理参数类型A构成的M维向量和后N天的物理参数类型B构成的N维向量之间的皮尔逊系数。
在上述实施例的基础上,该方法中,所述用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,具体包括:
训练样本集的构建包括以下步骤,
采集直至当前时刻前Q天的全套地质灾害预警物理参数组合形成全套影响因子向量时序序列,其中,所述全套地质灾害预警物理参数组合中的物理参数类型包括裂缝宽度变化量、绝对坐标位移值、倾角变化量、雨量和含水率;
按照预设比例将所述全套影响因子向量时序序列进行训练集和测试集的划分得到训练集时序序列和测试集时序序列,其中,所述训练集时序序列相对于所述测试集时序序列为前段时序序列;
采用宽度为M+N且步长为1的滑动窗口对所述训练集时序序列和所述测试集时序序列进行滑动采样,得到多个训练数据时序序列和多个测试数据时序序列;
采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列;
对所述多个标准化训练数据时序序列和所述多个标准化测试数据时序序列中的每个时序序列进行M:N比例的划分切割,并基于所述任一类型地质灾害的描述因子向量中的预警物理参数类型和所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型确定所述任一类型地质灾害的数据集中每个标准化训练数据时序序列的样本和标签,以及每个标准化测试数据时序序列中的样本和标签。
具体地,对于构建任一灾害类型预警模型的用于训练和测试的数据集,需要确定出所述任一灾害类型的影响因子向量中的物理参数类型和描述因子向量中的物理参数类型。由于本发明提供的地质灾害预警方法可以提供山体滑坡类型、泥石流类型和崩塌类型三种地质灾害的预警,因此,用于描述预测结果和用于输入预测模型的影响因子向量中的预警物理参数类型都需要被采集,都需要搜集历史数据,以保证在需要预测上述三种地质灾害类型中的任一种时都可以进行训练得到对应预测模型,并实时计算出当前时刻开始的未来N天的所述任一种灾害的发生概率。因此,在获取用于构建训练集和测试集的历史数据时,是获取历史前Q天的全套地质灾害预警物理参数组合,全套地质灾害预警物理参数组合中物理参数类型包括缝宽度变化量、绝对坐标位移值、倾角变化量、雨量和含水率,获取得到的数据表征方式是,裂缝宽度变化量、倾角变化量和可以用每天的“瞬时”变化量表示又可以用每天的“累计”变化量(让每天最后一个采集时刻采集到的裂缝宽度与作为基准宽度的裂缝传感器安装初始时刻采集的裂缝宽度做差)表示,同理,绝对坐标位移值和倾角变化量都有上述“瞬时”和“累计”两种计量方式来表示。对于其他预警物理参数的表征方式,每天的含水率是采集每天最晚时刻采集的含水率数值,每天的降雨量将当天所有时段采集的雨量进行相加求和。所述训练集时序序列相对于所述测试集时序序列为前段时序序列,采用宽度为M+N且步长为1的滑动窗口对所述训练集时序序列和所述测试集时序序列进行滑动采样,得到多个训练数据时序序列和多个测试数据时序序列,举例说明:Q=365,M=10,N=2,也就是要根据过去一年的历史数据构建出训练集和测试集,先使用宽度为12的滑动窗每移动1个步长提取样本加标签的单个数据,该单个数据用于训练或者测试,因此,可以滑动提取出365-12+1=354个数据,用于作训练数据或者测试数据,由于训练数据在按照时间进行排序的情况下排在测试数据之前,例如,训练集和测试集的划分比例是8:2,那么上文所述354个数据中,八成分到训练集中,两成分到测试集中,让训练集和测试集的划分遵循时间先后原则,也是为了保证测试的有效性,保证是在用未来数据作为预测效果检验历史数据训练出的模型的准确性。归一算法的种类有多种,因此,此处对于预设归算法不作具体限定。最后再对每个窗口移动切出来的整体数据进行训练数据中的样本和标签的切分,以及测试数据中的样本和标签的切分,并按照需要训练的地质灾害类型预测模型确定的样本包括哪些物理参数、标签包括哪些物理参数,从全套预警物理参数类型组合中进行挑选。如此,先归一化再切分样本和标签,也使得标签数据得到了和样本数据一样的归一化处理,更适用于预测模型的训练。
在上述实施例的基础上,该方法中,所述采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列,具体包括:
将任一训练数据时序序列中的任一训练数据向量进行预设归一化处理,得到所述任一训练数据时序序列对应的标准化训练数据时序序列;
将任一测试数据时序序列中的任一测试数据向量进行预设归一化处理,得到所述任一测试数据时序序列对应的标准化测试数据时序序列;
其中,所述预设归一化处理为将待处理向量中所有元素数值除以所述待处理向量中首个数值不为0的元素数值。
具体地,对于预设归一算法事实上是在传统归一算法之上做了一些改进,使得算法更简单,直接用向量中第一个不为0的元素数值作为除数,让该向量中其他元素都除以该除数,得到的数值更新原来元素的数值,尽量将不同元素的数据范围缩近,虽然不能完全将数值范围统一在某个确定范围内但是在平衡计算量的情况下也能做到调整不同物理参数的数值范围避免数值之间相差太大无法进行后续神经网络中的特征融合。
下面对本发明提供的基于机器学习的地质灾害预测装置进行描述,下文描述的基于机器学习的地质灾害预测装置与上文描述的第一种基于机器学习的地质灾害预测方法可相互对应参照。
图2为本发明提供的基于机器学习的地质灾害预测装置的结构示意图,如图2所示,该装置包括采集单元210和预测单元220,其中,
所述采集单元210,用于采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;
所述预测单元220,用于将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;
其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。
本发明提供的基于机器学习的地质灾害预测装置,通过采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。由于基于机器学习训练得到的预测模型,而通过获取的历史数据得到大量样本构建的训练集可以保障预测模型的准确率,且实时采集的数据输入预测模型即时可输出预测结果保障预测的实时性。因此,本发明提供的装置,实现了提高地质灾害预测的准确性,并保障地质灾害预测的实时性。
在上述实施例的基础上,该装置中,
所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,具体包括:
当所述任一类型地质灾害为泥石流类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型仅包括含水率;
当所述任一类型地质灾害为山体滑坡类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、绝对坐标位移值、角度变化量;
当所述任一类型地质灾害为崩塌类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、角度变化量。
在上述实施例的基础上,该装置中,
所述裂缝宽度变化量包括每天最晚采集时刻与最早采集时刻采集的裂缝宽度之差和每天最晚采集时刻与采集设备安置初始时刻采集的裂缝宽度之差;
所述绝对坐标位移值包括每天最晚采集时刻与最早采集时刻采集的绝对坐标之间位移值和每天最晚采集时刻与采集设备安置初始时刻采集的绝对坐标之间位移值;
所述角度变化量包括每天最晚采集时刻与最早采集时刻采集的角度之差和每天最晚采集时刻与采集设备安置初始时刻采集的角度之差。
在上述实施例的基础上,该装置中,
所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,具体包括:
基于历史数据采用预设相关算法计算任一待测影响预测预警物理参数类型与所述描述因子向量中的任一预警物理参数类型之间的相关度;
若所述相关度超过预设阈值,则确定所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型包括所述任一待测影响预测预警物理参数类型。
在上述实施例的基础上,该装置中,
所述预设相关算法为皮尔逊相关系数算法。
在上述实施例的基础上,该装置中,
所述用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,具体包括:
训练样本集的构建包括以下步骤,
采集直至当前时刻前Q天的全套地质灾害预警物理参数组合形成全套影响因子向量时序序列,其中,所述全套地质灾害预警物理参数组合中的物理参数类型包括裂缝宽度变化量、绝对坐标位移值、角度变化量、雨量和含水率;
按照预设比例将所述全套影响因子向量时序序列进行训练集和测试集的划分得到训练集时序序列和测试集时序序列,其中,所述训练集时序序列相对于所述测试集时序序列为前段时序序列;
采用宽度为M+N且步长为1的滑动窗口对所述训练集时序序列和所述测试集时序序列进行滑动采样,得到多个训练数据时序序列和多个测试数据时序序列;
采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列;
对所述多个标准化训练数据时序序列和所述多个标准化测试数据时序序列中的每个时序序列进行M:N比例的划分切割,并基于所述任一类型地质灾害的描述因子向量中的预警物理参数类型和所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型确定所述任一类型地质灾害的数据集中每个标准化训练数据时序序列的样本和标签,以及每个标准化测试数据时序序列中的样本和标签。
在上述实施例的基础上,该装置中,
所述采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列,具体包括:
将任一训练数据时序序列中的任一训练数据向量进行预设归一化处理,得到所述任一训练数据时序序列对应的标准化训练数据时序序列;
将任一测试数据时序序列中的任一测试数据向量进行预设归一化处理,得到所述任一测试数据时序序列对应的标准化测试数据时序序列;
其中,所述预设归一化处理为将待处理向量中所有元素数值除以所述待处理向量中首个数值不为0的元素数值。
基于上述实施例,本发明提供一种基于机器学习的地质灾害预测流程,所述流程的步骤如下:
1、在地质灾害监测点放置裂缝传感器、雨量计、含水率检测仪、GNSS传感器和倾角传感器,实时监测并采集数据。
2、获取实时监测采集的数据,首先进行数据处理:
2.1、对缺失值进行线性插值填充,或者补充0,根据特征不同进行相应处理;
2.2、异常值剔除,采用方式①进行填充;
2.3、用时间作为索引,并按照从小到大的时间顺序,根据统一单位对所有特征进行合并。例如按照天为单位,对裂缝、雨量、含水率等特征进行合并;每一条数据为某天相应的各特征值数据,生成统一单位的数据;
2.4、进行特征选择,计算所有数据特征之间的相关性。利用皮尔逊相关系数,得到所有特征之间的相关系数,显示为矩阵形式,说明两个特征之间的相关密切度,越大说明两个特征之间的相关性越密切。从而过滤出与目标特征不相干的特征,避免过多的特征对最终的模型训练造成干扰。
3、样本集构建及模型训练:
3.1、在配置文件中设置参数,包括样本切分的比例、项目利用历史M天数据来预测未来N天数据、总序列长度L(L=m+n),以及模型参数设置,例如epoch、batch_size等;
3.2、读取处理完成后数据文件,数据按照时间进行排序,根据样本切分比例参数,将所有数据切分为训练集和测试集,按照前半段与后半段切分,不可是随机划分;
3.3、采用滑动窗口方式来划分数据。对训练集、测试集数据进行处理,将训练集、测试集中按照顺序以L长度步长为1的窗口进行滑动,形成多个L长度数组组成的数组,其中每个L维度的表示所有特征L天的数据,即为模型输入的一条模型训练和测试的数据。划分到最后不足L个数据,则丢弃,不参与模型训练或测试,根据计算可划分为K个L段的数据,K=总数据/L。即生成了特征列*L*K的三维数组;
3.4、将其上的数组进行数据处理,遍历数组K维度数组,对每个特征列*L数组,按照特征列进行处理,获取每个特征列的L长度数据,得到数组的第一个元素,将其他元素除以第一个元素,进行统一处理。并检验被除数是否为0,为0则选择下一位元素,若全部为0,则不进行处理。并保存被除数,保证后期还原为原始数据。这种数据处理方式是针对每个特征进行,处理完成后同样为特征列*L*K的三维数组;
3.5、将进行归一化后的数组进行划分x,y,即根据x条数据预测y条数据。遍历三维数组,将特征数*L的序列进行处理,根据参数,切分为特征数*M的x数据,y数据。根据预测目标来确定y数据的列,如果只预测其中一个特征列,则y数据为1*N的数组,若是多个特征预测,则y数据是特征数*N的数组;
3.6、此时,数据处理操作完毕,建立LSTM网络层,将训练数据输入到网络层进行训练,生成模型文件,可通过配置文件来进行网络层的配置,设置lstm、repeatvector、dropout、dense等参数来进行网络层的设置,更改网络结构以及调整参数更为方便;
3.7、使用窗口方法进行回归的LSTM。利用上述样本处理后的数据,训练模型,并调整训练参数,采用评估指标验证模型,达到最优后保存模型,若模型训练效果不佳,可调整LSTM网络层以及相应层级中的参数;
3.8、最后,用测试数据对模型进行评估。
4、利用模型进行预测:
接收需要进行预测的数据,调用训练好的模型,将数据输入模型,模型输出结果则是未来时间相应特征的预测值。输入的预测数据要求:特征列与训练数据一致,并且数据量必须达到M条。通过模型预测后,可获取得到预测未来N天的数值。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行基于机器学习的地质灾害预测方法,该方法包括:采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于机器学习的地质灾害预测方法,该方法包括:采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于机器学习的地质灾害预测方法,该方法包括:采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种基于机器学习的地质灾害预测方法,其特征在于,包括:
采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;
将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;
其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数;
所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,具体包括:
基于历史数据采用预设相关算法计算任一待测影响预测预警物理参数类型与所述描述因子向量中的任一预警物理参数类型之间的相关度;
若所述相关度超过预设阈值,则确定所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型包括所述任一待测影响预测预警物理参数类型。
2.根据权利要求1所述的基于机器学习的地质灾害预测方法,其特征在于,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,具体包括:
当所述任一类型地质灾害为泥石流类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型仅包括含水率;
当所述任一类型地质灾害为山体滑坡类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、绝对坐标位移值、倾角变化量;
当所述任一类型地质灾害为崩塌类型,所述任一类型地质灾害的描述因子向量中的预警物理参数类型包括裂缝宽度变化量、倾角变化量。
3.根据权利要求2所述的基于机器学习的地质灾害预测方法,其特征在于,
所述裂缝宽度变化量包括每天最晚采集时刻与最早采集时刻采集的裂缝宽度之差和每天最晚采集时刻与采集设备安置初始时刻采集的裂缝宽度之差;
所述绝对坐标位移值包括每天最晚采集时刻与最早采集时刻采集的绝对坐标之间位移值和每天最晚采集时刻与采集设备安置初始时刻采集的绝对坐标之间位移值;
所述倾角变化量包括每天最晚采集时刻与最早采集时刻采集的倾角之差和每天最晚采集时刻与采集设备安置初始时刻采集的倾角之差。
4.根据权利要求1所述的基于机器学习的地质灾害预测方法,其特征在于,所述预设相关算法为皮尔逊相关系数算法。
5.根据权利要求1所述的基于机器学习的地质灾害预测方法,其特征在于,所述用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,具体包括:
训练样本集的构建包括以下步骤,
采集直至当前时刻前Q天的全套地质灾害预警物理参数组合形成全套影响因子向量时序序列,其中,所述全套地质灾害预警物理参数组合中的物理参数类型包括裂缝宽度变化量、绝对坐标位移值、倾角变化量、雨量和含水率;
按照预设比例将所述全套影响因子向量时序序列进行训练集和测试集的划分得到训练集时序序列和测试集时序序列,其中,所述训练集时序序列相对于所述测试集时序序列为前段时序序列;
采用宽度为M+N且步长为1的滑动窗口对所述训练集时序序列和所述测试集时序序列进行滑动采样,得到多个训练数据时序序列和多个测试数据时序序列;
采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列;
对所述多个标准化训练数据时序序列和所述多个标准化测试数据时序序列中的每个时序序列进行M:N比例的划分切割,并基于所述任一类型地质灾害的描述因子向量中的预警物理参数类型和所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型确定所述任一类型地质灾害的数据集中每个标准化训练数据时序序列的样本和标签,以及每个标准化测试数据时序序列中的样本和标签。
6.根据权利要求5所述的基于机器学习的地质灾害预测方法,其特征在于,所述采用预设归一化算法处理所述多个训练数据时序序列和所述多个测试数据时序序列得到多个标准化训练数据时序序列和多个标准化测试数据时序序列,具体包括:
将任一训练数据时序序列中的任一训练数据向量进行预设归一化处理,得到所述任一训练数据时序序列对应的标准化训练数据时序序列;
将任一测试数据时序序列中的任一测试数据向量进行预设归一化处理,得到所述任一测试数据时序序列对应的标准化测试数据时序序列;
其中,所述预设归一化处理为将待处理向量中所有元素数值除以所述待处理向量中首个数值不为0的元素数值。
7.一种基于机器学习的地质灾害预测装置,其特征在于,包括:
采集单元,用于采集直至当前时刻前M天的影响预测任一类型地质灾害的预警物理参数组合得到影响因子向量时序序列;
预测单元,用于将所述影响因子向量时序序列输入任一类型地质灾害预测模型,输出未来N天的预测所述任一类型地质灾害的描述因子向量时序序列;
其中,所述任一类型地质灾害预测模型是基于所述任一类型地质灾害的样本影响因子向量时序序列和描述因子向量时序序列标签进行训练得到的,用于训练和测试的数据集是训练前基于以宽度为M+N的滑动窗口大小处理历史数据构建的,所述任一类型地质灾害的描述因子向量中的预警物理参数类型是基于所述任一类型地质灾害确定的,所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,所述地质灾害类型包括山体滑坡类型、泥石流类型和崩塌类型,M和N为正整数;
所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型是基于所述描述因子向量中的预警物理参数类型确定的,具体包括:
基于历史数据采用预设相关算法计算任一待测影响预测预警物理参数类型与所述描述因子向量中的任一预警物理参数类型之间的相关度;
若所述相关度超过预设阈值,则确定所述影响预测任一类型地质灾害的预警物理参数组合中的参数类型包括所述任一待测影响预测预警物理参数类型。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一项所述的基于机器学习的地质灾害预测方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于机器学习的地质灾害预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011503011.3A CN112735094B (zh) | 2020-12-17 | 2020-12-17 | 基于机器学习的地质灾害预测方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011503011.3A CN112735094B (zh) | 2020-12-17 | 2020-12-17 | 基于机器学习的地质灾害预测方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112735094A CN112735094A (zh) | 2021-04-30 |
CN112735094B true CN112735094B (zh) | 2022-08-09 |
Family
ID=75603913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011503011.3A Active CN112735094B (zh) | 2020-12-17 | 2020-12-17 | 基于机器学习的地质灾害预测方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112735094B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393037A (zh) * | 2021-06-16 | 2021-09-14 | 潍坊科技学院 | 一种区域地质灾害趋势预测方法及系统 |
CN113537595A (zh) * | 2021-07-16 | 2021-10-22 | 上海电气风电集团股份有限公司 | 模型训练方法、风功率预测方法、系统、设备及介质 |
CN113611084B (zh) * | 2021-09-29 | 2021-12-21 | 中通服建设有限公司 | 一种针对自然灾害可视化监测预警方法、装置和设备 |
CN113988552A (zh) * | 2021-10-18 | 2022-01-28 | 北理新源(佛山)信息科技有限公司 | 基于大数据的氢产业链风险监测系统 |
CN115331394B (zh) * | 2022-08-30 | 2023-09-01 | 重庆地质矿产研究院 | 基于关键参数预测值降低地质灾害预警系统故障率的方法 |
CN115394052B (zh) * | 2022-08-30 | 2023-06-27 | 重庆地质矿产研究院 | 基于机器学习获得地质灾害预警关键参数预测值的方法 |
CN115938095B (zh) * | 2023-02-22 | 2023-05-30 | 湖北通达数科科技有限公司 | 一种基于集成融合模型的山体滑坡监测预警方法及系统 |
CN116797030A (zh) * | 2023-08-25 | 2023-09-22 | 山东省地质调查院(山东省自然资源厅矿产勘查技术指导中心) | 地质监测预警方法、系统、计算机设备及存储介质 |
CN116821799B (zh) * | 2023-08-28 | 2023-11-07 | 成都理工大学 | 基于gru-dnn的地灾预警数据分类方法 |
CN117037432B (zh) * | 2023-10-08 | 2023-12-19 | 四川省公路规划勘察设计研究院有限公司 | 基于多方法协同的风险评价地质灾害预警方法 |
CN118570988A (zh) * | 2024-07-26 | 2024-08-30 | 三亚学院 | 一种基于卷积神经网络地质灾害的预警方法、装置及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108363886A (zh) * | 2018-03-08 | 2018-08-03 | 杭州鲁尔物联科技有限公司 | 基于深度学习的变形预测方法及系统 |
CN110824142A (zh) * | 2019-11-13 | 2020-02-21 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN111275931A (zh) * | 2019-12-24 | 2020-06-12 | 湖北民族大学 | 一种危岩体断裂预警方法及系统 |
CN111459955A (zh) * | 2020-03-13 | 2020-07-28 | 济南轨道交通集团有限公司 | 一种基于gis平台的三维地质结构模型自动更新方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106815971B (zh) * | 2016-12-21 | 2019-11-26 | 西安工程大学 | 一种基于rbf神经网络的滑坡灾害预报方法 |
CN108334907B (zh) * | 2018-02-09 | 2019-05-17 | 哈尔滨工业大学(威海) | 一种基于深度学习的复杂装备点异常检测方法及系统 |
CN109063247B (zh) * | 2018-06-26 | 2023-04-18 | 西安工程大学 | 基于深度信念网络的滑坡灾害预报方法 |
CN109146144B (zh) * | 2018-07-26 | 2021-11-19 | 西安工程大学 | 基于改进贝叶斯网络的滑坡灾害预测方法 |
CN110008301B (zh) * | 2019-04-12 | 2021-07-02 | 杭州鲁尔物联科技有限公司 | 基于机器学习的区域性地质灾害易发性预测方法及装置 |
CN111144656A (zh) * | 2019-12-27 | 2020-05-12 | 兰州大方电子有限责任公司 | 一种基于gis的灾害评价分析方法 |
CN111539904B (zh) * | 2020-05-13 | 2023-07-18 | 成都理工大学 | 一种基于降雨量的灾害易发性预测方法 |
CN111881359B (zh) * | 2020-08-04 | 2023-11-17 | 携程计算机技术(上海)有限公司 | 互联网信息检索中的排序方法、系统、设备及存储介质 |
-
2020
- 2020-12-17 CN CN202011503011.3A patent/CN112735094B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108363886A (zh) * | 2018-03-08 | 2018-08-03 | 杭州鲁尔物联科技有限公司 | 基于深度学习的变形预测方法及系统 |
CN110824142A (zh) * | 2019-11-13 | 2020-02-21 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN111275931A (zh) * | 2019-12-24 | 2020-06-12 | 湖北民族大学 | 一种危岩体断裂预警方法及系统 |
CN111459955A (zh) * | 2020-03-13 | 2020-07-28 | 济南轨道交通集团有限公司 | 一种基于gis平台的三维地质结构模型自动更新方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112735094A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112735094B (zh) | 基于机器学习的地质灾害预测方法、装置和电子设备 | |
CN109949290B (zh) | 路面裂缝检测方法、装置、设备及存储介质 | |
CN112819207B (zh) | 基于相似性度量的地质灾害空间预测方法、系统及存储介质 | |
CN110008301B (zh) | 基于机器学习的区域性地质灾害易发性预测方法及装置 | |
CN114118576A (zh) | 一种区域地质灾害趋势预测方法及系统 | |
CN117037076B (zh) | 一种基于遥感技术的土壤墒情智能监测方法 | |
CN110456026A (zh) | 一种土壤墒情监测方法及装置 | |
CN114911788B (zh) | 一种数据插补方法、装置及存储介质 | |
CN115185932A (zh) | 数据处理方法及装置 | |
CN114037673A (zh) | 一种基于机器视觉的硬件衔接接口监测方法及系统 | |
CN117095292A (zh) | 建筑进度监控方法及其装置、设备、介质 | |
CN111971581B (zh) | 用于验证由雨量传感器提供的数据的设备、方法和计算机程序产品 | |
CN111444833B (zh) | 果实测产方法、装置、计算机设备及存储介质 | |
CN115063337A (zh) | 埋地管道智能维修决策方法及装置 | |
CN115356400B (zh) | 一种基于BiLSTM的超声波木材无损检测方法及系统 | |
CN117058451A (zh) | 基于二维卷积神经网络的结构加速度数据异常检测方法 | |
CN118038633A (zh) | 一种滑坡地质灾害监测预警方法及装置 | |
CN111738259A (zh) | 一种杆塔状态检测方法及装置 | |
CN114938339B (zh) | 一种数据处理方法和相关装置 | |
CN115618928A (zh) | 一种边坡位移预测方法、装置和电子设备 | |
CN114283344A (zh) | 一种森林生态水文过程自动实时监测方法及系统 | |
CN115511341A (zh) | 一种滑坡时变失效概率评估方法及装置 | |
CN112651338B (zh) | 一种输电线路违章施工隐患的判别方法及装置 | |
CN114022305A (zh) | 地下水动态监测方法及装置 | |
CN116448062B (zh) | 一种桥梁沉降变形检测方法、装置、计算机及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |