CN115630751A - 基于大数据的风险预测系统及其预测方法 - Google Patents

基于大数据的风险预测系统及其预测方法 Download PDF

Info

Publication number
CN115630751A
CN115630751A CN202211420527.0A CN202211420527A CN115630751A CN 115630751 A CN115630751 A CN 115630751A CN 202211420527 A CN202211420527 A CN 202211420527A CN 115630751 A CN115630751 A CN 115630751A
Authority
CN
China
Prior art keywords
feature vectors
gaussian
data
vectors
gaussian density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211420527.0A
Other languages
English (en)
Inventor
刘笑颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Wuping Technology Co ltd
Original Assignee
Hangzhou Wuping Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Wuping Technology Co ltd filed Critical Hangzhou Wuping Technology Co ltd
Priority to CN202211420527.0A priority Critical patent/CN115630751A/zh
Publication of CN115630751A publication Critical patent/CN115630751A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Analysis (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Computational Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本申请涉及风险预测的领域,其具体地公开了一种基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。

Description

基于大数据的风险预测系统及其预测方法
技术领域
本申请涉及风险预测的领域,且更为具体地,涉及一种基于大数据的风险预测系统及其预测方法。
背景技术
地球地质环境的变化导致滑坡的发生,人类对地质结构影响使得滑坡发生频率增大,给社会、国家和个人带来严重的危害。滑坡是一种普遍的全球性的自然地质灾害,给人类的生命财产安全带来了严重危害。
滑坡地质灾害发生频繁造成的危害严重,归结其原因在于滑坡发生具有很强的隐蔽性和突发性,导致人们不易察觉,从而造成严重的影响。如何有效地进行预测预警监测滑坡,减少其带来的危害,是亟需解决的技术问题。
因此,期望一种基于大数据的风险预测系统以对山体滑坡灾害进行准确地预测,进而减小其带来的危害。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
根据本申请的一个方面,提供了一种基于大数据的风险预测系统,其包括:
训练模块,包括:
训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;
高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;
分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;
系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;
训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及
推断模块,包括:
原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;
分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及
分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
与现有技术相比,本申请提供的基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于大数据的风险预测系统的场景示意图。
图2为根据本申请实施例的基于大数据的风险预测系统的框图。
图3A为根据本申请实施例的基于大数据的风险预测系统的预测方法中训练阶段的流程图。
图3B为根据本申请实施例的基于大数据的风险预测系统的预测方法中推断阶段的流程图。
图4为根据本申请实施例的基于大数据的风险预测系统的预测方法中训练阶段的架构示意图。
图5为根据本申请实施例的基于大数据的风险预测系统的预测方法中推断阶段的架构示意图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如前所述,地球地质环境的变化导致滑坡的发生,人类对地质结构影响使得滑坡发生频率增大,给社会、国家和个人带来严重的危害。滑坡是一种普遍的全球性的自然地质灾害,给人类的生命财产安全带来了严重危害。
滑坡地质灾害发生频繁造成的危害严重,归结其原因在于滑坡发生具有很强的隐蔽性和突发性,导致人们不易察觉,从而造成严重的影响。如何有效地进行预测预警监测滑坡,减少其带来的危害,是亟需解决的技术问题。
因此,期望一种基于大数据的风险预测系统以对山体滑坡灾害进行准确地预测,进而减小其带来的危害。
引发滑坡的自然因素主要是地震和降雨。在自然环境下,地球剧烈的地质运动,改变了地貌的同时伴随着滑坡的出现。其中较为剧烈的地质运动主要是地震的作用,引发滑坡其表现的形式主要通过地震能量的传递,由于山体顶部重心较高,易受到地震能量的影响,较为陡的坡体山体更易出现滑坡,坡体主要表现的特征为坡度、山体出现滑移。滑坡坡度与滑坡发生总体上呈正态分布的特点。大多数滑坡发生概率在10°到60°发生概率较大,在10°和60°中间的概率最大,所以有必要对滑坡坡度角度进行监测,并通过角度坡度进行量化和权重的确定,对滑坡灾害预测提供参考信息。
滑坡中土壤中含水率会引起土壤内聚力的改变。随着含水率增加,土壤内聚力减小,从而导致坡体的移动。表明滑坡发生与土壤含水率存在正相关关系。当含水率增大时,其内聚力减小。
因此,在本申请的技术方案中,首先获取观测时间段内的多个时间点的角度数据,并通过包含嵌入层的基于上下文的编码器模型获得多个角度特征向量,然后构造第一高斯密度图:
Figure BDA0003940994110000051
其中μ1为多个角度特征向量的均值向量,且∑1是每两个角度特征向量之间的向量间均方误差的协方差矩阵。
同样地,对于阻抗,位移和温度,得到第二到第四高斯密度图,然后对第一高斯密度图到第四高斯密度图构造高斯混合模型
Figure BDA0003940994110000052
Figure BDA0003940994110000053
因此,将求和符号移到括号内,则高斯混合模型可以表示为混合高斯密度图:
Figure BDA0003940994110000054
也就是,均值向量为μ1到μ4乘以系数后进行点加,且协方差矩阵也为∑1到∑4乘以系数后进行点加。
然后,再将混合高斯密度图进行高斯离散化以得到分类矩阵,并通过分类器获得分类结果。
这里,高斯混合模型的系数πk作为超参数,且引入系数损失函数来平衡不同高斯密度图之间的概率密度分布的个体差异,表示为:
Figure BDA0003940994110000061
基于此,本申请提出了一种基于大数据的风险预测系统,其包括训练模块和推断模块。其中,训练模块,包括:训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。其中,推断模块,包括:原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及,分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
图1图示了根据本申请实施例的基于大数据的风险预测系统的场景示意图。如图1所示,在该应用场景的训练阶段中,首先,通过布置于滑坡(例如,如图1中所示意的H)的阵列传感器(例如,如图1中所示意的T)来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。然后,将获得的所述多个时间点的角度数据、阻抗数据、位移数据和温度数据输入至部署有基于大数据的风险预测算法的服务器(例如,如图1中所示意的S)中,其中,所述服务器能够基于基于大数据的风险预测算法以所述多个时间点的角度数据、阻抗数据、位移数据和温度数据对基于大数据的风险预测系统的所述编码器模型进行训练。
在训练完成后,在推断阶段中,首先,通过布置于滑坡(例如,如图1中所示意的H)的阵列传感器(例如,如图1中所示意的T)来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。然后,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据输入至部署有基于大数据的风险预测算法的服务器(例如,如图1中所示意的S)中,其中,所述服务器能够以基于大数据的风险预测算法对所述多个时间点的角度数据、阻抗数据、位移数据和温度数据进行处理,以生成用于表示是否有山体滑坡的风险的分类结果。进而,基于所述分类结果能够对山体滑坡的风险性进行准确地预测,以减小其带来的危害。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图2图示了根据本申请实施例的基于大数据的风险预测系统的框图。如图2所示,根据本申请实施例的基于大数据的风险预测系统200,包括:训练模块210和推断模块220。其中,训练模块210,包括:训练数据单元2101,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征编码单元2102,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯融合单元2103,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合单元2104,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;高斯离散化单元2105,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;分类损失函数值计算单元2106,用于将所述分类矩阵通过分类器以获得分类损失函数值;系数损失函数值单元2107,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;训练单元2108,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。其中,推断模块220,包括:原始数据获取单元221,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征向量生成单元222,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯密度图生成单元223,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合模型生成单元224,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;分类矩阵生成单元225,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及,分类结果生成单元226,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
具体地,在本申请实施例中,在训练模块210中,所述训练数据单元2101和特征编码单元2102,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据,并将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量。如前所述,本申请是通过阵列传感器来对坡度变化进行过程分析,对坡度形变量和环境相关因素进行监控以进行滑坡风险预测及预警。因此,在本申请的技术方案中,首先通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。然后,将获取的所述多个时间点的各个参数数据分别通过包含嵌入层的基于上下文的编码器模型中进行编码处理,以提取出所述各个参数全局性的关联信息,从而获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量。
更具体地,在本申请实施例中,所述特征编码单元,包括:首先,使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列。然后,使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。应可以理解,由于基于转换器的编码器模型能够基于上下文对所述输入向量进行编码,因此所获得的角度特征向量、所述阻抗特征向量、所述位移特征向量和所述温度特征向量具有全局性的角度关联信息、阻抗关联信息、位移关联信息、温度关联信息和角度-阻抗-位移-温度关联信息。
具体地,在本申请实施例中,在训练模块210中,所述高斯融合单元2103,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成。应可以理解,考虑到所述各个参数的多个特征向量在高维特征空间中分别对应着一个特征分布流形,而这些特征分布流形由于本身的不规则形状和散布位置,如果仅通过将所述各个参数特征向量级联来获得分类特征向量,将相当于简单地将这些特征分布流形按原位置和形状来进行叠加,使得新获得的特征分布流形的边界变得非常不规则和复杂,在通过梯度下降来寻找最优点时,非常容易陷入局部极值点中而无法获得全局最优点。因此,需要进一步地对这些所述参数特征向量进行适当的融合,使得各个特征分布能够相对于彼此在型面上收敛,从而提高后续分类的准确性。
也就是,在本申请的技术方案中,在得到所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量后,进一步使用高斯密度图来融合所述各个参数的多个特征向量,从而得到第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图。相应地,在一个具体示例中,使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;其中,所述公式为
Figure BDA0003940994110000111
其中,μi为所述第一至第四高斯密度图的均值向量,且∑i是所述第一至第四高斯密度图的协方差矩阵。
具体地,在本申请实施例中,在训练模块210中,所述高斯混合单元2104,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1。也就是,为了有效地对所述各个特征信息进行融合,在本申请的技术方案中,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型。应可以理解,高斯混合模型可以通过加权系数来对各个高斯分布之间实现了响应均一化,从而实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异。
更具体地,在本申请实施例中,所述高斯混合单元,进一步用于:基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;其中,所述公式为:
Figure BDA0003940994110000112
所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。
具体地,在本申请实施例中,在训练模块210中,所述高斯离散化单元2105和所述分类损失函数值计算单元2106,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵,并将所述分类矩阵通过分类器以获得分类损失函数值。也就是,在本申请的技术方案中,接着再将所述高斯混合模型进行高斯离散化以获得分类矩阵。应可以理解,对所述高斯混合模型进行高斯离散化可以使得特征信息在融合时不产生信息损失,进而提高分类的准确性。然后,将所述分类矩阵通过分类器以获得分类损失函数值。
更具体地,在本申请实施例中,所述分类损失函数值计算单元,进一步用于:首先,使用所述分类器以如下公式对所述分类矩阵进行处理以获得分类结果;其中,所述公式为:softmax{(Wn,Bn):…:W1,B1Project(F)},其中Project(F)表示将所述分类矩阵投影为向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置矩阵。然后,计算所述分类结果和真实值之间的交叉熵值作为所述分类损失函数值。
具体地,在本申请实施例中,在训练模块210中,所述系数损失函数值单元2107和所述训练单元2108,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异,以及基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。应可以理解,在本申请的技术方案中,所述高斯混合模型的系数πk作为超参数,且引入系数损失函数来平衡不同高斯密度图之间的概率密度分布的个体差异。也就是,具体地,基于所述预定系数构造用于表示所述第一至第四高斯密度图之间的概率密度分布之间差异的系数损失函数值,以提高分类的准确性。
更具体地,在本申请实施例中,所述系数损失函数值单元,进一步用于:基于所述预定系数以如下公式来构造所述系数损失函数值;
其中,所述公式为:
Figure BDA0003940994110000121
在完成对所述编码器模型的训练之后,就可以按照上述方法得到用于表示是否有山体滑坡的风险的分类结果。
具体地,在本申请实施例中,在推断模块220中,首先,通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。接着,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量。然后,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成。接着,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型。然后,将所述高斯混合模型进行高斯离散化以获得分类矩阵。最后,将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
综上,基于本申请实施例的所述基于大数据的风险预测系统200被阐明,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
如上所述,根据本申请实施例的基于大数据的风险预测系统200可以实现在各种终端设备中,例如基于大数据的风险预测的服务器等。在一个示例中,根据本申请实施例的基于大数据的风险预测系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于大数据的风险预测系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于大数据的风险预测系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于大数据的风险预测系统200与该终端设备也可以是分立的设备,并且该基于大数据的风险预测系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图3A图示了根据本申请实施例的基于大数据的风险预测系统的预测方法中训练阶段的流程图。如图3A所示,根据本申请实施例的基于大数据的风险预测系统的预测方法,包括:训练阶段,包括步骤:S110,通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;S120,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;S130,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;S140,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;S150,将所述高斯混合模型进行高斯离散化以获得分类矩阵;S160,将所述分类矩阵通过分类器以获得分类损失函数值;S170,基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;S180,基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。
图3B图示了根据本申请实施例的基于大数据的风险预测系统的预测方法中推断阶段的流程图。图3B所示,根据本申请实施例的基于大数据的风险预测系统的预测方法,包括:推断阶段,包括步骤:S210,通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;S220,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;S230,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;S240,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;S250,将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及,S260,将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
图4图示了根据本申请实施例的基于大数据的风险预测系统的预测方法中训练阶段的架构示意图。如图4所示,在训练阶段中,在该网络架构中,首先,将获取的所述多个时间点的角度数据(例如,如图4中所示意的P1)、阻抗数据(例如,如图4中所示意的P2)、位移数据(例如,如图4中所示意的P3)和温度数据(例如,如图4中所示意的P4)分别通过包含嵌入层的基于上下文的编码器模型(例如,如图4中所示意的E1)以获得多个角度特征向量(例如,如图4中所示意的VF1)、多个阻抗特征向量(例如,如图4中所示意的VF2)、多个位移特征向量(例如,如图4中所示意的VF3)和多个温度特征向量(例如,如图4中所示意的VF4);接着,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图(例如,如图4中所示意的GD1)、第二高斯密度图(例如,如图4中所示意的GD2)、第三高斯密度图(例如,如图4中所示意的GD3)和第四高斯密度图(例如,如图4中所示意的GD4);然后,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型(例如,如图4中所示意的GMM);接着,将所述高斯混合模型进行高斯离散化以获得分类矩阵(例如,如图4中所示意的MF);然后,将所述分类矩阵通过分类器(例如,如图4中所示意的分类器)以获得分类损失函数值(例如,如图4中所示意的CLV);接着,基于所述预定系数构造系数损失函数值(例如,如图4中所示意的CFV);最后,基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。
图5图示了根据本申请实施例的基于大数据的风险预测系统的预测方法中推断阶段的架构示意图。如图5所示,在推断阶段中,在该网络架构中,首先,将所述多个时间点的角度数据(例如,如图5中所示意的P1)、阻抗数据(例如,如图5中所示意的P2)、位移数据(例如,如图5中所示意的P3)和温度数据(例如,如图5中所示意的P4)分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型(例如,如图5中所示意的E2)以获得多个角度特征向量(例如,如图5中所示意的VF1)、多个阻抗特征向量(例如,如图5中所示意的VF2)、多个位移特征向量(例如,如图5中所示意的VF3)和多个温度特征向量(例如,如图5中所示意的VF4);接着,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图(例如,如图5中所示意的GD1)、第二高斯密度图(例如,如图5中所示意的GD2)、第三高斯密度图(例如,如图5中所示意的GD3)和第四高斯密度图(例如,如图5中所示意的GD4);然后,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型(例如,如图5中所示意的GMM);接着,将所述高斯混合模型进行高斯离散化以获得分类矩阵(例如,如图5中所示意的MF);以及,最后,将所述分类矩阵通过分类器(例如,如图5中所示意的分类器)以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
综上,基于本申请实施例的所述基于大数据的风险预测系统的预测方法被阐明,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

Claims (10)

1.一种基于大数据的风险预测系统,其特征在于,包括:
训练模块,包括:
训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;
高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;
分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;
系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;
训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及
推断模块,包括:
原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;
分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及
分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
2.根据权利要求1所述的基于大数据的风险预测系统,其中,所述特征编码单元,进一步用于使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列;以及,使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。
3.根据权利要求2所述的基于大数据的风险预测系统,其中,所述高斯融合单元,用于使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;
其中,所述公式为
Figure FDA0003940994100000032
其中,μi为所述第一至第四高斯密度图的均值向量,且∑i是所述第一至第四高斯密度图的协方差矩阵。
4.根据权利要求3所述的基于大数据的风险预测系统,其中,所述高斯混合单元,进一步用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;
其中,所述公式为:
Figure FDA0003940994100000031
所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。
5.根据权利要求4所述的基于大数据的风险预测系统,其中,所述分类损失函数值计算单元,进一步用于使用所述分类器以如下公式对所述分类矩阵进行处理以获得分类结果;
其中,所述公式为:softmax{(Wn,Bn):…:(W1,B1)|Project(F)},其中Project(F)表示将所述分类矩阵投影为向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置矩阵;以及
计算所述分类结果和真实值之间的交叉熵值作为所述分类损失函数值。
6.根据权利要求5所述的基于大数据的风险预测系统,其中,所述系数损失函数值单元,进一步用于基于所述预定系数以如下公式来构造所述系数损失函数值;
其中,所述公式为:
Figure FDA0003940994100000041
7.一种基于大数据的风险预测系统的预测方法,其特征在于,包括:
训练阶段,包括:
通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;
将所述高斯混合模型进行高斯离散化以获得分类矩阵;
将所述分类矩阵通过分类器以获得分类损失函数值;
基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;
基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及
推断阶段,包括:
通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;
将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及
将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
8.根据权利要求7所述的基于大数据的风险预测系统的预测方法,其中,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量,包括:
使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列;以及
使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。
9.根据权利要求7所述的基于大数据的风险预测系统的预测方法,其中,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,包括:
使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;
其中,所述公式为
Figure FDA0003940994100000061
其中,μi为所述第一至第四高斯密度图的均值向量,且∑i是所述第一至第四高斯密度图的协方差矩阵。
10.根据权利要求7所述的基于大数据的风险预测系统的预测方法,其中,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,包括:
基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;
其中,所述公式为:
Figure FDA0003940994100000062
所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。
CN202211420527.0A 2022-11-14 2022-11-14 基于大数据的风险预测系统及其预测方法 Withdrawn CN115630751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211420527.0A CN115630751A (zh) 2022-11-14 2022-11-14 基于大数据的风险预测系统及其预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211420527.0A CN115630751A (zh) 2022-11-14 2022-11-14 基于大数据的风险预测系统及其预测方法

Publications (1)

Publication Number Publication Date
CN115630751A true CN115630751A (zh) 2023-01-20

Family

ID=84910409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211420527.0A Withdrawn CN115630751A (zh) 2022-11-14 2022-11-14 基于大数据的风险预测系统及其预测方法

Country Status (1)

Country Link
CN (1) CN115630751A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116089648A (zh) * 2023-04-10 2023-05-09 云南远信科技有限公司 基于人工智能的档案管理系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116089648A (zh) * 2023-04-10 2023-05-09 云南远信科技有限公司 基于人工智能的档案管理系统及方法
CN116089648B (zh) * 2023-04-10 2023-06-06 云南远信科技有限公司 基于人工智能的档案管理系统及方法

Similar Documents

Publication Publication Date Title
CN109142171B (zh) 基于特征扩张的融合神经网络的城市pm10浓度预测方法
Douglas Physical vulnerability modelling in natural hazard risk assessment
Zhou et al. Response surface method based on radial basis functions for modeling large‐scale structures in model updating
Lee et al. Earthquake-induced landslide-susceptibility mapping using an artificial neural network
Ding et al. Structural damage identification by sparse deep belief network using uncertain and limited data
CN115630751A (zh) 基于大数据的风险预测系统及其预测方法
CN111242351A (zh) 基于自编码器和gru神经网络的热带气旋轨迹预测方法
Hashemi et al. A machine learning-based surrogate finite element model for estimating dynamic response of mechanical systems
KR20220091714A (ko) 인공 지능 모델을 이용한 기후 지수 예측 결과에 대한 불확실성과 기여도를 제공하는 기후 지수 예측 방법 및 시스템
Cao et al. UTrans-Net: A model for short-term precipitation prediction
CN115099328A (zh) 基于对抗网络的交通流量预测方法、系统、设备及存储介质
Xue et al. Predicting wind-induced structural response with LSTM in transmission tower-line system
CN113743592A (zh) 一种基于gan的遥测数据异常检测方法
Bond et al. An unsupervised machine learning approach for ground‐motion spectra clustering and selection
KR20190105429A (ko) 독성 가스 릴리스 모델링 장치 및 모델링 방법
CN111695729A (zh) 一种基于dmap模型的余震预测方法
CN102156298A (zh) 一种基于非统计假设检验的地震动强度快速评定方法
CN115587641B (zh) 一种基于多生成器的环境因素引导的台风多趋势预测方法
CN115456048A (zh) 海上风机的可靠性评估系统及其方法
Zheng et al. Tunnel displacement prediction under spatial effect based on Gaussian process regression optimized by differential evolution
Nuhn et al. Preparation of complex landslide simulation results with clustering approaches for decision support and early warning
Wang et al. MATLAB code to estimate landslide volume from single remote sensed image using genetic algorithm and imagery similarity measurement
Lee Rapid prediction of tsunamis and storm surges using machine learning
JP7499137B2 (ja) 地震時諸現象統合評価モデル生成方法、地震時諸現象統合評価モデル生成装置、地震時諸現象統合評価方法、及び、地震時諸現象統合評価装置
Pritikin et al. AI based Out-Of-Distribution Analysis of Sea Surface Height Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20230120

WW01 Invention patent application withdrawn after publication