CN114638413A - 一种基于深度元学习的中强震短临余震智能预测模型 - Google Patents

一种基于深度元学习的中强震短临余震智能预测模型 Download PDF

Info

Publication number
CN114638413A
CN114638413A CN202210261243.5A CN202210261243A CN114638413A CN 114638413 A CN114638413 A CN 114638413A CN 202210261243 A CN202210261243 A CN 202210261243A CN 114638413 A CN114638413 A CN 114638413A
Authority
CN
China
Prior art keywords
aftershock
learning
deep
seismic
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210261243.5A
Other languages
English (en)
Inventor
王茂发
单维锋
张润杰
龚启舟
黄鸿亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202210261243.5A priority Critical patent/CN114638413A/zh
Publication of CN114638413A publication Critical patent/CN114638413A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度元学习的中强震短临余震智能预测模型,其特征在于,包括多源地震目录预处理模型、中强震短临余震预测动态框架模型和余震预测深度元学习网络;所述多源地震目录预处理模型,包括三部分,地震目录重复样本的剔除、地震能量等缺失字段的填充和采用箱型图法处理地震样本异常值;所述中强震短临余震预测动态框架模型,包括余震预测模型训练样本生成、余震预测模型参数动态选择和基于元学习的多个深度学习算法灵活切换,本发明能够突破在余震预测研究中对主、余震参数间地球物理学关系的依赖,并利用AI算法去挖掘、研究地震目录中复杂、抽象、深层的关联关系。

Description

一种基于深度元学习的中强震短临余震智能预测模型
技术领域
本发明涉及地震预报技术领域,具体为一种基于深度元学习的中强震短临余震智能预测模型。
背景技术
地震预报是一个国际公认的世界性难题。全世界地震预报事业经过几十年多年的发展,积累了丰富的宝贵经验和大量历史数据资料,尤其是近年来随着通讯技术、网络技术、观测技术等的进一步完善和提高,地震数据库中的数据急剧增加。因此,人们更希望进一步探索隐藏在地震数据背后的知识信息,它们大多是隐含的、事先未知的、具有潜在价值的,期待着人们采用更新的、更有效的技术来发现隐含在其中的重要地震规律,并预测未来的地震发展趋势。而地震目录是历史地震记录数据中最为宝贵和关键的数据之一。
国际上现存的多源地震目录,包含了大量的地震能量辐射和震源机制解信息,蕴含着丰富的地震时空关联关系,探索这些关联关系对地震趋势的准确判定,尤其是中强震后短临余震的预测,有着非常重要的现实价值。一般认为主震震级、视应力、地震矩、震源深度等地震参数,与最大余震震级、最大余震发生时间、最大余震空间位置之间存在着抽象的关联关系,建立基于地震记录间的数学统计模型,可为震后趋势快速判定提供强有力的理论依据。
震后趋势的判定是地震预报工作中非常重要的一部分内容,受到国内外地震工作者的高度重视。目前,根据地震活动性来判断地震趋势仍是主要判定方法,如b值、h值、K值、U值、地震活动图像、地震活动增强和平静、震源机制、地震活动的太阴时特征等。这些方法已在实际地震预报工作中发挥了较好的作用,并且还将继续发挥他们的作用。
现有的基于深度元学习的中强震短临余震智能预测模型存在的缺陷是:
1.所采用的全球地震目录种类和数量相对较少,样本代表性还不高,需要不断丰富,信息无法满足需求;
2.现有技术多采用单一的算法,无法精准的对模型进行预测,容易造成预测不准确的情况出现
3.现有技术预测研究出来后,应用较为复杂,无法及时达到通知居民的作用。
发明内容
本发明的目的在于提供一种基于深度元学习的中强震短临余震智能预测模型的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度元学习的中强震短临余震智能预测模型,包括多源地震目录预处理模型、中强震短临余震预测动态框架模型和余震预测深度元学习网络;
所述多源地震目录预处理模型,包括地震目录重复样本的剔除、地震能量等缺失字段的填充和采用箱型图法处理地震样本异常值;
所述中强震短临余震预测动态框架模型,包括余震预测模型训练样本生成、余震预测模型参数动态选择和基于元学习的多个深度学习算法灵活切换;
所述余震预测深度元学习网络包括主余震序列间复杂的时空关系拟合方法和元学习优化深度学习模型网络参数两种方法进行模拟。
优选的,所述多源地震目录预处理模型通过对多种地震目录的深入分析,确定最终须保留的字段,并剔除重复样本。
优选的,所述地震目录重复样本的剔除是指收集到的地震目录数据很大,在收集过程中难免会人为或者其他未知因素使得个别数据在收集整理过程中出现重复,这些数据需要作为重复样本剔除。
优选的,所述地震能量等缺失字段的填充主要指,采用支持向量机对地震能量等缺失字段进行拟合填充:①根据地震发生的力学特征,将CMT目录中的地震按照相应的滑动角分为四大类:逆冲型、正断型、走滑型和其他类型;
②采用支持向量机构造非线性回归预测模型,分别预测四类地震中能量字段,进而实现对能量字段的填充。
优选的,所述采用箱型图法处理地震样本异常值具体为采用箱型图法寻找地震样本中的异常值。
优选的,所述余震预测模型训练样本生成,地震的三要素是标识一次地震的关键信息,也是最大余震预测模型主要预测的目标值,对多种地震目录的深入分析得出最大余震预测模型的13个特征参数及需预测的目标值表述:
通过寻找所有符合条件的主、余震序列及对应的最大余震构建余震预测样本,设主震发生时间为,余震发生时间为
Figure 100002_DEST_PATH_IMAGE002
,主、余震发生时间差;主、余震发生距离为
Figure 100002_DEST_PATH_IMAGE004
;主震震级
Figure 100002_DEST_PATH_IMAGE006
,余震震级
Figure 100002_DEST_PATH_IMAGE008
,判断一个地震是某个主震的余震的条件包括:
Figure 100002_DEST_PATH_IMAGE010
Figure 100002_DEST_PATH_IMAGE012
Figure 100002_DEST_PATH_IMAGE014
,从处理好的地震样本中迭代遍历所有地震,筛选出所有满足条件的地震样本,最终形成余震预测样本信息。
优选的,所述余震预测模型参数动态选择,收集到的所有地震信息中所列的特征参数我们都会进行选取,结合当下地震震源机制解的信息对个别特征参数做灵活调整。
优选的,所述基于元学习的多个深度学习算法灵活切换,采用不同的深度学习算法可以满足不同情况下对地震余震的预测,采用基于元学习的多个深度学习算法构建余震预测AI模型,并且根据不同深度学习算法的预测结果进行误差对比分析,实现算法间的灵活切换。
优选的,所述主余震序列间复杂的时空关系拟合方法,针对主震(震级、辐射能量、视应力、地震矩等多项参数)与后续余震(震级、主余震时间差,主余震空间距离)之间抽象、深层、有机的时空关系,专利采用的深度学习算法如下:
1)嵌套长短时记忆网络(Nested LSTMs)余震预测AI模型;
2)Transformer网络余震预测AI模型。
优选的,所述元学习优化深度学习模型网络参数,采用MAML等元学习技术优化Nested LSTMs和Transformer网络模型中的参数,先利用处理好的地震目录数据作为输入数据分别构建Nested LSTMs和Transformer网络的余震预测AI模型,接着将Nested LSTMs和Transformer网络两种深度学习算法作为算子分别嵌入到MAML元学习框架中,拿其中任意一个算法举例,另一个同理:①将地震目录按照相应的滑动角划分为四大类;②在这四类地震目录样本空间上采样,对算子模型进行元学习,以提高算子的鲁棒性,并获取算子模型的泛化(初步)参数;③针对某一具体地震类型样本,从元学习获得泛化参数开始,继续精化训练算子,最终获得有较高准确率的深度元学习模型。
与现有技术相比,本发明的有益效果如下:
1.本发明能够突破在余震预测研究中对主、余震参数间地球物理学关系的依赖,并利用AI算法去挖掘、研究地震目录中复杂、抽象、深层的关联关系;
2.本发明针对主震(震级、地震视应力、震矩等)与最大余震(震级、与主震时空差)之间深层、抽象的关联关系,改进多种最新的深度学习算法,如Nested LSTMs和Transformer网络,从而给出中强震短临余震AI预测模型,并利用MAML等元学习技术优化对应的模型网络参数,显著提高模型的预测效果;
3.本发明提供基于AI平台研发的高精度预测软件,使余震预测研究、应用过程简化,更具时效性。
附图说明
图1为本发明的基于深度元学习的中强震短临余震智能预测模型结构示意图;
图2为本发明的强震短临余震预测流程图;
图3为本发明的 Nested LSTMs神经网络构建余震预测AI模型结构图
图4为本发明的Transformer模块内部结构图
图5为本发明的基于Transformer网络构建余震预测AI模型结构图;
图6为本发明的余震预测模型元学习框架图;
图7为本发明的地震类型表;
图8为本发明的余震预测模型特征参数及预测目标值。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1、图2、图3、图4、图5、图6、图7和图8,一种基于深度元学习的中强震短临余震智能预测模型,
实施例一:包括多源地震目录预处理模型、中强震短临余震预测动态框架模型和余震预测深度元学习网络;
所述多源地震目录预处理模型,包括三部分,地震目录重复样本的剔除、地震能量等缺失字段的填充和采用箱型图法处理地震样本异常值;
所述中强震短临余震预测动态框架模型,包括余震预测模型训练样本生成、余震预测模型参数动态选择和基于元学习的多个深度学习算法灵活切换;
所述余震预测深度元学习网络包括主余震序列间复杂的时空关系拟合方法和元学习优化深度学习模型网络参数这两种方法进行模拟。
实施例二:所述多源地震目录预处理模型通过对多种地震目录的深入分析,确定最终须保留的字段,并剔除重复样本,并采用支持向量机等算法进行地震能量等缺失字段的填充,设计箱线法或标准差法模型剔除地震样本异常值。
所述地震目录重复样本的剔除是指收集到的地震目录数据很大,在收集过程中难免会人为或者其他未知因素使得个别数据在收集整理过程中出现重复,这些数据需要作为重复样本剔除,从而防止致模型出现过拟合现象,提高模型泛化能力。
所述地震能量等缺失字段的填充主要指,采用支持向量机对地震能量等缺失字段进行拟合填充:①根据地震发生的力学特征,将CMT目录中的地震按照相应的滑动角分为四大类:
②采用支持向量机构造非线性回归预测模型,分别预测四类地震中能量字段,进而实现对能量字段的填充。
所述采用箱型图法处理地震样本异常值具体为采用箱型图法寻找地震样本中的异常值,根据箱型图展示的数据分布找出数据中位于上下边缘外的数据,上边缘为上四分位数加上1.5倍的四分位距,下边缘为下四分位数减去1.5倍的四分位距,删除这些数据,实现地震样本中对异常值剔除。
实施例三:所述余震预测模型训练样本生成,地震的三要素是标识一次地震的关键信息,也是最大余震预测模型主要预测的目标值,具体来说,将模型的训练样本输入到基于深度学习的余震预测AI模型中,输出余震震级、余震时间和余震空间3个预测目标值,模型的训练样本集和预测样本集特征参数均以CMT目录为主,同时添加了地震能量字段(来自NEIC地震目录)作为训练数据的一个特征参数,除能量字段外把地震视应力也作为一个输入的地震参数,地震视应力可由地震效率与震源平均应力相乘获得,地震震源应力场的强弱可以通过平均地震视应力反映,地震视应力越高,对应的震源区应力水平就越高;相反,震源区的应力水平越低,很多研究表明:在低应力水平下强震发生后再次发生更大或较大地震的可能性较小,而在高应力水平下强震发生之后再次发生更大或较大地震的可能性更大,因此本文将地震视应力也作为余震预测的一个特征值,最后对多种地震目录的深入分析得出最大余震预测模型的13个特征参数及需预测的目标值表述:
之后,通过寻找所有符合条件的主、余震序列及对应的最大余震构建余震预测样本,设主震发生时间为,余震发生时间为
Figure 145367DEST_PATH_IMAGE002
,主、余震发生时间差;主、余震发生距离为
Figure 328086DEST_PATH_IMAGE004
;主震震级
Figure 638982DEST_PATH_IMAGE006
,余震震级
Figure 925869DEST_PATH_IMAGE008
,判断一个地震是某个主震的余震的条件包括:
Figure 271400DEST_PATH_IMAGE010
Figure 359442DEST_PATH_IMAGE012
Figure 767420DEST_PATH_IMAGE014
,从处理好的地震样本中迭代遍历所有地震,筛选出所有满足条件的地震样本,最终形成余震预测样本信息。
所述余震预测模型参数动态选择,收集到的所有地震信息中所列的特征参数我们都会进行选取,但在特殊情况下(如数据缺失等),无法使用所有特征参数,亦可根据地震专家面对实际的地震情况,结合当下地震震源机制解的信息对个别特征参数做灵活调整。
所述基于元学习的多个深度学习算法灵活切换,采用不同的深度学习算法可以满足不同情况下对地震余震的预测,采用基于元学习的多个深度学习算法构建余震预测AI模型,并且根据不同深度学习算法的预测结果进行误差对比分析,实现算法间的灵活切换,在元学习框架下,根据不同深度学习算法的优势,使用多种不同深度学习算法,构建多种基于不同深度学习的余震预测AI模型,并对这些模型所预测的结果进行误差对比分析,根据分析结果以及地震专家实际的判断,灵活选择合适的余震预测AI模型来预测最大余震。
实施例四:所述主余震序列间复杂的时空关系拟合方法,针对主震(震级、辐射能量、视应力、地震矩等多项参数)与后续余震(震级、主余震时间差,主余震空间距离)之间抽象、深层、有机的时空关系,专利采用的深度学习算法如下:
1)嵌套长短时记忆网络(Nested LSTMs)余震预测AI模型
在访问内部记忆时,Nested LSTMs相比传统的堆栈 LSTM有更高的自由度,从而能处理更长时间规模的内部记忆;直观上,LSTM中的输出门会编码仍旧值得记忆的信息,这些记忆可能与当前的时间步骤不相关,而Nested LSTMs 根据这一直观理解来创造一种新的记忆时间层级,访问内部记忆以同样的方式被门控,以便于长期信息只有在情景相关的条件下才能选择性地访问,实验也表明,Nested LSTMs在多种任务上都超越了堆栈LSTM,Nested LSTMs的这些特点符合地震序列时间间隔长短不一,序列间关联关系高度抽象、模糊难于用简单物理公式直接解释的特点,图3是基于Nested LSTMs神经网络构建余震预测AI模型结构图,一种适合余震预测的Nested LSTMs的变体深度学习模型,将地震序列作为输入,基于Tensorflow和Keras平台进行余震预测AI模型训练,实现对余震的智能预测;
2)Transformer网络余震预测AI模型
Transformer模块仅基于注意机制,不再采用任何RNN或者CNN的结构,图4是Transformer模块内部结构,Transformer模块包含Encoders和Decoders两个部分,每个部分又是由6个相同的encoder或decoder模块叠加而成,而单个encoder和decoder模块中均包含注意机制部分,采用注意机制的优势在于计算两个位置之间的关联所需的操作次数不随距离增长,解决了RNN中存在的长距离依赖问题,并且支持并行化计算,大幅度提升了模型的训练效率,图5是基于Transformer网络构建余震预测AI模型结构图,一种适合余震预测的Transformer网络模型,同样输入地震序列,并基于Tensorflow和Keras平台进行余震预测AI模型训练,实现对余震的智能预测。
所述元学习优化深度学习模型网络参数,参数的好坏直接影响一个模型训练速度、是否过拟合、准确性等问题,本发明采用MAML等元学习技术优化Nested LSTMs和Transformer网络模型中的参数,先利用处理好的地震目录数据作为输入数据分别构建Nested LSTMs和Transformer网络的余震预测AI模型,接着将Nested LSTMs和Transformer网络两种深度学习算法作为算子分别嵌入到MAML元学习框架中,拿其中任意一个算法举例,另一个同理:①将地震目录按照相应的滑动角划分为四大类;②在这四类地震目录样本空间上采样,对算子模型进行元学习,以提高算子的鲁棒性,并获取算子模型的泛化(初步)参数;③针对某一具体地震类型样本,从元学习获得泛化参数开始,继续精化训练算子,最终获得有较高准确率的深度元学习模型,余震预测模型元学习框架如图6所示,利用这种办法有效提高中强震短临余震预测模型在不同来源地震样本上的泛化能力,并使模型在面对小样本数据时具有更高的精度和较低的误差,基于Keras平台研发一套基于多源地震目录和震源机制解的中强震短临余震智能预测软件。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于深度元学习的中强震短临余震智能预测模型,其特征在于,包括多源地震目录预处理模型、中强震短临余震预测动态框架模型和余震预测深度元学习网络;
所述多源地震目录预处理模型,包括地震目录重复样本的剔除、地震能量缺失字段的填充和采用箱型图法处理地震样本异常值;
所述中强震短临余震预测动态框架模型,包括余震预测模型训练样本生成、余震预测模型参数动态选择和基于元学习的多个深度学习算法灵活切换;
所述余震预测深度元学习网络包括主余震序列间复杂的时空关系拟合方法和元学习优化深度学习模型网络参数两种方法进行模拟。
2.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述多源地震目录预处理模型通过对多种地震目录的深入分析,确定最终须保留的字段,并剔除重复样本。
3.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述地震目录重复样本的剔除是指收集到的地震目录数据很大,在收集过程中难免会人为或者其他未知因素使得个别数据在收集整理过程中出现重复,这些数据需要作为重复样本剔除。
4.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述地震能量等缺失字段的填充主要指,采用支持向量机对地震能量等缺失字段进行拟合填充:
①根据地震发生的力学特征,将CMT目录中的地震按照相应的滑动角分为四大类:逆冲型、正断型、走滑型和其他类型;
②采用支持向量机构造非线性回归预测模型,分别预测四类地震中能量字段,进而实现对能量字段的填充。
5.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述采用箱型图法处理地震样本异常值为采用箱型图法寻找地震样本中的异常值。
6.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述余震预测模型训练样本生成,地震的三要素是标识一次地震的关键信息,也是最大余震预测模型主要预测的目标值,对多种地震目录的深入分析得出最大余震预测模型的13个特征参数及需预测的目标值表述:
通过寻找所有符合条件的主、余震序列及对应的最大余震构建余震预测样本,设主震发生时间为,余震发生时间为
Figure DEST_PATH_IMAGE002
,主、余震发生时间差;主、余震发生距离为
Figure DEST_PATH_IMAGE004
;主震震级
Figure DEST_PATH_IMAGE006
,余震震级
Figure DEST_PATH_IMAGE008
,判断一个地震是某个主震的余震的条件包括:
Figure DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
,从处理好的地震样本中迭代遍历所有地震,筛选出所有满足条件的地震样本,最终形成余震预测样本信息。
7.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述余震预测模型参数动态选择,是选取收集到的所有地震信息中所列的特征参数,结合当下地震震源机制解的信息对个别特征参数做灵活调整。
8.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述基于元学习的多个深度学习算法灵活切换,采用不同的深度学习算法可以满足不同情况下对地震余震的预测,采用基于元学习的多个深度学习算法构建余震预测AI模型,并且根据不同深度学习算法的预测结果进行误差对比分析,实现算法间的灵活切换。
9.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述主余震序列间复杂的时空关系拟合方法,针对主震与后续余震之间抽象、深层、有机的时空关系,采用的深度学习算法如下:
1)嵌套长短时记忆网络(Nested LSTMs)余震预测AI模型;
2)Transformer网络余震预测AI模型。
10.根据权利要求1所述的一种基于深度元学习的中强震短临余震智能预测模型,其特征在于:所述元学习优化深度学习模型网络参数,采用MAML等元学习技术优化NestedLSTMs和Transformer网络模型中的参数,先利用处理好的地震目录数据作为输入数据分别构建Nested LSTMs和Transformer网络的余震预测AI模型,接着将Nested LSTMs和Transformer网络两种深度学习算法作为算子分别嵌入到MAML元学习框架中:
①将地震目录按照相应的滑动角划分为四大类;
②在这四类地震目录样本空间上采样,对算子模型进行元学习,以提高算子的鲁棒性,并获取算子模型的泛化参数;
③针对某一具体地震类型样本,从元学习获得泛化参数开始,继续精化训练算子,最终获得有较高准确率的深度元学习模型。
CN202210261243.5A 2022-03-17 2022-03-17 一种基于深度元学习的中强震短临余震智能预测模型 Pending CN114638413A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210261243.5A CN114638413A (zh) 2022-03-17 2022-03-17 一种基于深度元学习的中强震短临余震智能预测模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210261243.5A CN114638413A (zh) 2022-03-17 2022-03-17 一种基于深度元学习的中强震短临余震智能预测模型

Publications (1)

Publication Number Publication Date
CN114638413A true CN114638413A (zh) 2022-06-17

Family

ID=81949675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210261243.5A Pending CN114638413A (zh) 2022-03-17 2022-03-17 一种基于深度元学习的中强震短临余震智能预测模型

Country Status (1)

Country Link
CN (1) CN114638413A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115630722A (zh) * 2022-06-24 2023-01-20 华院计算技术(上海)股份有限公司 一种改进的自适应连铸质量预判数字化模型参数生成方法、系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115630722A (zh) * 2022-06-24 2023-01-20 华院计算技术(上海)股份有限公司 一种改进的自适应连铸质量预判数字化模型参数生成方法、系统、设备及存储介质
CN115630722B (zh) * 2022-06-24 2023-06-20 华院计算技术(上海)股份有限公司 一种改进的自适应连铸质量预判数字化模型参数生成方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN114896472B (zh) 一种基于多源时空数据的知识图谱机器推理系统和方法
CN111636891B (zh) 盾构姿态实时预测系统和预测模型的构建方法
CN113688869B (zh) 一种基于生成对抗网络的光伏数据缺失重构方法
CN113988477A (zh) 基于机器学习的光伏功率短期预测方法、装置及存储介质
CN114638413A (zh) 一种基于深度元学习的中强震短临余震智能预测模型
CN114819372A (zh) 一种基于神经网络的电力消费概率预测方法
CN113009553A (zh) 基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法
Yu et al. Solar radio spectrum classification with LSTM
CN116486255A (zh) 自注意力特征融合的高分辨率遥感影像语义变化检测方法
CN115809601A (zh) 一种沉积岩构造背景判别方法
CN112906935A (zh) 一种风电场超短期功率预测方法
CN117593653B (zh) 基于遥感监测的地质灾害预警方法
Bartal et al. Optimal seismic networks in Israel in the context of the Comprehensive Test Ban Treaty
CN110543615A (zh) 基于spss解释结构模型的风险因子交互作用分析方法
CN117473305A (zh) 一种近邻信息增强的储层参数预测方法及系统
Mazumdar et al. Optimized machine learning model for predicting groundwater contamination
CN115858763A (zh) 多模态数据融合的城管事件分析方法及其应用
Wang et al. AutoTS: Automatic time series forecasting model design based on two-stage pruning
CN111709238B (zh) 一种基于地学专家知识的网页地学相关性计算方法
CN111680843A (zh) 基于深度svdd模型的中药材适生区预测方法及系统
Gao et al. Integrated Deep Neural Networks‐Based Complex System for Urban Water Management
Ren et al. Research on the application of data mining technology in military audit
CN118070687B (zh) 一种基于深度学习的海冰密集度的预测方法
CN117454762B (zh) Markov-神经网络的穿煤隧道掌子面瓦斯浓度预测方法
Wang Intelligent Malfunction Identification Method in Mechanical Manufacturing Process Based on Multisensor Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination