CN112380198B - 一种基于深度学习的地震接收函数自动挑选方法 - Google Patents
一种基于深度学习的地震接收函数自动挑选方法 Download PDFInfo
- Publication number
- CN112380198B CN112380198B CN202011184316.2A CN202011184316A CN112380198B CN 112380198 B CN112380198 B CN 112380198B CN 202011184316 A CN202011184316 A CN 202011184316A CN 112380198 B CN112380198 B CN 112380198B
- Authority
- CN
- China
- Prior art keywords
- receiving function
- seismic
- deep learning
- waveform data
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Remote Sensing (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明请求保护一种基于深度学习的地震接收函数自动挑选方法,搭建深度学习模型,借鉴LeNet5模型构建一维数据二分类CNN神经网络,并利用中国国家台网记录的波形数据计算提取的接收函数构建不同规模的训练集和测试集进行模型训练和验证,最终得到的模型用于接收函数的自动挑选。分别使用人工挑选的接收函数和自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各项异性进行计算,并对结果进行分析,证明了本方法的有效性。利用本发明提出的深度学习自动挑选接收函数方法具有较高的准确率和数据质量,所述自动挑选方法可以应用于震级较小的远震,有效地提高了观测数据的利用率,为后续的分析研究提供更好的约束。
Description
技术领域
本发明属于地球动力学研究技术领域,具体的,涉及一种基于深度学习的地震接收函数自动挑选方法
背景技术
海量地震数据的取得为人类认识地球带来了可能。随着计算机硬件水平的快速发展,应用计算机自动处理地震数据,替代繁复机械的人工流程进行震相识别、走时初至拾取、接收函数挑选、余震序列识别等工作是十分必要的。传统的自动处理算法包括:利用短长时平均比值的STA/LTA方法(Allen,1978;Withers et al.,1998)进行震相识别,利用“V”字分形曲线首个突变点拾取震相的分形分维法(Sleeman and Van,1999;赵大鹏等,2013),利用不同波震相信噪比挑选接收函数等(Gao and Liu,2014)。
自Hinton(2006)的开创性工作以来,深度学习蓬勃发展,并在地震大数据的自动处理和油气藏研究中崭露头角。付超等(2018)将卷积神经网络与支持向量机方法结合,提出了多波地震油气储层分布预测的深度学习方法;林年添等(2018)利用卷积神经网络预测地震油气储层;赵明等(2019a,2019b)利用U型卷积神经网络进行Pg和Sg震相的识别和到时提取,常规的U网络用来处理二维或者三维数据,将其降维设计即可用来处理一维地震波形;蒋一然等(2019)利用支持向量机设计了地震信号探测器SSD和震相分离器SPS用来震相的分类和到时的拾取;李健等(2020)利用美国南加州地震台网的200万条震相和噪声数据训练的卷积神经网络模型应用到实际地震数据的震相拾取当中取得了较好的效果。地震紧急预警中的应用可见胡安冬等(2020)的文章;奚先等(2020)应用卷积神经网络进行地震剖面中散射体的定位和成像。许多优秀的模型和程序包也被分享到开源社区当中供研究人员学习和使用,如用于识别震相的PhasePApy(Chen and Austin,2016);泛化能力较强的ConvNet(Ross et al.,2018);断层自动识别软件FaultSeg3D(Wu et al.,2018);用以地震走时初至拾取的PickNet等(Wang et al.,2019;Geng and Wang,2020)。
然而这些方法在处理精度和效率上各有局限,仍需发展更加全面快捷的计算机自动处理方案。深度学习在地震震相识别、走时拾取、断层识别等领域的发展和应用较快并取得了较好的成果,但是在接收函数研究中仍少有应用。接收函数和地震波一样都是一种时间序列,常规处理中同样需要人工重复机械的挑选。将应用于地震波中的深度学习方法迁移到接收函数挑选是可行且必要的。接收函数在特定的区域具有较为一致的形态,通常会根据P波、Ps转换波以及PpSs+PsPs的震相是否清晰一致选择保留或舍弃,这实质上构成了一种二分类问题,且特征数量较少,使得接收函数的挑选训练不需要巨量的数据,也不需要过于复杂的网络即可达到令人满意的准确度。这一前提保证了即使是流动台站或其它观测周期较短的台站,也可以通过手动挑选少量接收函数来构建训练集,使用训练后的模型对剩余数据以及小于5.5级的小震数据进行挑选,以实现节省人工,提高整体接收函数质量的目的。而对于永久台站,训练一次模型就可以供以后本台所有数据的挑选使用,若能建立起区域台网模型字典,将具有较高的应用价值。卷积神经网络(Convolutional NeuralNetwork,CNN)是深度学习中具有代表性的一种,其人工神经元可以使邻近的神经元之间互相产生影响。常规的卷积神经网络包括卷积层(Convolutional Neural Layers)、池化层(Max Pooling)和全连接层(Fully Connected Neural Layers,FCN)。相比其它深度学习结构,CNN在图像识别和语音识别方面具有一定优势,且已经有很成熟的开源框架,可以较容易的搭建出面向接收函数挑选问题的网络结构。
发明内容
为了充分运用深度学习对于地震勘测领域接收函数的应用,提升处理精度和效率,据此本发明设计了一种基于深度学习的地震接收函数自动挑选方法,使用CNN网络来挑选接收函数,并利用实际观测数据来验证方法的可行性。
本发明请求保护一种基于深度学习的地震接收函数自动挑选方法一种基于深度学习的地震接收函数自动挑选方法,其特征在于,包括步骤:
A01提取中国国家台网两个台站的记录的波形数据,对所述波形数据进行预处理,计算预处理后的所述波形数据的接收函数;
A02提取训练集和测试集,对所述接收函数进行人工挑选和标签的制作;
A03搭建神经网络模型,将所述波形数据的接收函数输入所述搭建好的神经网络模型,采用深度学习方法构造训练模型,作出接收函数保留或舍弃的判断;
A04从所述中国国家台网记录的波形数据中提取测试集,将所述测试集输入所述训练模型,得到自动挑选接收函数;
A05使用所述人工挑选的接收函数和搜索自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各项异性进行计算,并对对比结果进行分析。
进一步地,所述步骤A01提取中国国家台网两个台站的记录的波形数据,还包括:
所述中国国家台网两个台站的记录的波形数据取自全球地震台网的两台永久台站,黑龙江省牡丹江地震台,以下称为MDJ地震台,和北京地震台,以下称为BJT地震台;
所述MDJ地震台和BJT地震台都具有较长的地震观测周期,能够提取大量接收函数应用模型训练;
所述中国国家台网两个台站的记录的波形数据下载自http://ds.iris.edu,选取2000年到2019年的震级大于5.1级、震中距30°-90°的三分量事件波形数据。
进一步地,所述步骤A01对所述波形数据进行预处理,计算预处理后的所述波形数据的接收函数,还包括:
根据P波理论到时截取波形P波前20秒,后60秒,进行去均值、尖刺、倾斜操作,并对所述波形数据进行0.05-10Hz的带通滤波,并由ZNE垂、北、西坐标系旋转至ZRT垂、径向、切向坐标系;
采用频率域反褶积方法计算接收函数,高斯因子设置为2.5;
所述训练集使用2000年到2016年的数据。
进一步地,所述A02提取训练集和测试集,对所述接收函数进行人工挑选和标签的制作,还包括:
所述训练集使用2000年到2016年的数据,所述测试集使用2017年到2019年的数据;
所述接收函数保存为sac文件格式,截取P波前5s,后25秒共30秒的数据,采样率20Hz,保留的接收函数头文件中t1参数设置为1,舍弃t1参数设置为0。
进一步地,所述步骤A03搭建神经网络模型,将所述波形数据的接收函数输入所述搭建好的神经网络模型,采用深度学习方法构造训练模型,作出接收函数保留或舍弃的判断,还包括:
所述神经网络基于LeNet-5手写数字识别模型;
所述神经网络有7层,前4层为卷积层和池化层交替,输入为一维序列,对所述一维序列进行卷积,后三层为全连接层;
对输出结果进行One-hot编码,保留编码为[1,0],舍弃编码为[0,1]。
进一步地,所述步骤A04从所述中国国家台网记录的波形数据中提取测试集,将所述测试集输入所述训练模型,得到自动挑选接收函数,还包括:
获取所述测试集中带有保留标签的接受函数占比值,将所述测试集输入所述训练模型后直至收敛稳定,获得准确率。
进一步地,所述步骤A05使用所述人工挑选的接收函数和搜索自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各项异性进行计算,并对对比结果进行分析,还包括:
所述地壳厚度、波速比的计算采用接收函数处理中常用的“H-k叠加”方法,如果所述MDJ台站和BJT台站经深度学习挑选的接收函数H-k叠加结果和所述人工挑选结果基本一致,说明神经网络用于接收函数的自动挑选具有较好的适用性;
所述地壳各向异性估计使用接收函数Ps震相估计台站下方的地壳方位各项异,将所述MDJ台站和BJT台站的各向异性对比结果绘制在的地形图上,如果人工挑选的接收函数和深度学习挑选的接收函数估计出的各项异性结果比较一致,说明神经网络用于接收函数的自动挑选具有较好的适用性。
进一步地,对于接收函数挑选这类二分类问题,即使较小规模的训练集也能起到较好的训练结果,在实际应用中可以挑选少量接收函数训练模型并应用于剩余接收函数的自动挑选以节省人工;
将小于5.5级的事件计算的接收函数参与到训练中;
采用多台数据联合训练,建立公共的模型。
本发明请求保护的这种基于深度学习的地震接收函数自动挑选方法,搭建深度学习模型,借鉴LeNet5模型构建一维数据二分类CNN神经网络,并利用中国国家台网记录的波形数据计算提取的接收函数构建不同规模的训练集和测试集进行模型训练和验证,最终得到的模型用于接收函数的自动挑选。分别使用人工挑选的接收函数和自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各项异性进行计算,并对结果进行分析,证明了本方法的有效性。利用本发明提出的深度学习自动挑选接收函数方法具有较高的准确率和数据质量,所述自动挑选方法可以应用于震级较小的远震,有效地提高了观测数据的利用率,为后续的分析研究提供更好的约束。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的工作流程图;
图2为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的接收函数网络结构图;
图3为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的Loss函数随训练次数变化曲线图;
图4为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的接收函数挑选结果对比图;
图5为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的H-κ叠加结果对比图;
图6为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的地壳方位各向异性结果对比图;
图7为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的台站所在位置及各项异性最终结果对比地形图;
图8为本发明所述的一种基于深度学习的地震接收函数自动挑选方法的双台联合训练自动挑选的接收函数H-κ叠加结果图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明请求保护一种基于深度学习的地震接收函数自动挑选方法一种基于深度学习的地震接收函数自动挑选方法,其特征在于,包括步骤:
A01提取中国国家台网两个台站的记录的波形数据,对所述波形数据进行预处理,计算预处理后的所述波形数据的接收函数;
A02提取训练集和测试集,对所述接收函数进行人工挑选和标签的制作;
A03搭建神经网络模型,将所述波形数据的接收函数输入所述搭建好的神经网络模型,采用深度学习方法构造训练模型,作出接收函数保留或舍弃的判断;
A04从所述中国国家台网记录的波形数据中提取测试集,将所述测试集输入所述训练模型,得到自动挑选接收函数;
A05使用所述人工挑选的接收函数和搜索自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各项异性进行计算,并对对比结果进行分析。
进一步地,所述步骤A01提取中国国家台网两个台站的记录的波形数据,还包括:
所述中国国家台网两个台站的记录的波形数据取自全球地震台网的两台永久台站,黑龙江省牡丹江地震台,以下称为MDJ地震台,和北京地震台,以下称为BJT地震台;
所述MDJ地震台和BJT地震台都具有较长的地震观测周期,能够提取大量接收函数应用模型训练;
所述中国国家台网两个台站的记录的波形数据下载自http://ds.iris.edu,选取2000年到2019年的震级大于5.1级、震中距30°-90°的三分量事件波形数据。
进一步地,所述步骤A01对所述波形数据进行预处理,计算预处理后的所述波形数据的接收函数,还包括:
根据P波理论到时截取波形P波前20秒,后60秒,进行去均值、尖刺、倾斜操作,并对所述波形数据进行0.05-10Hz的带通滤波,并由ZNE垂、北、西坐标系旋转至ZRT垂、径向、切向坐标系;
采用频率域反褶积方法计算接收函数,高斯因子设置为2.5;
所述训练集使用2000年到2016年的数据。
进一步地,所述A02提取训练集和测试集,对所述接收函数进行人工挑选和标签的制作,还包括:
所述训练集使用2000年到2016年的数据,所述测试集使用2017年到2019年的数据;
所述接收函数保存为sac文件格式,截取P波前5s,后25秒共30秒的数据,采样率20Hz,保留的接收函数头文件中t1参数设置为1,舍弃t1参数设置为0。
接收函数形态受地形影响较大,不同的地壳结构获得的接收函数具有一定的差异。例如高原地区的接收函数由于地壳过于复杂,各个震相会难以辨别(Shi et al.,2015),而沉积盆地地区的接收函数直达P波、转换波和多次反射波会被沉积层混响所覆盖(朱洪翔等,2018)。因此采用单台计算出的接收函数,每台训练一个属于自己的模型,将在一定程度上保证训练和测试样本的相关性,从而降低学习难度,提高识别准确率。
首先要构建训练所需的训练集和测试集,我们将两个台站的所有数据进行人工挑选,并按照上文所述对t1参数进行标记。训练集使用2000年到2016年的数据,测试集使用2017年到2019年的数据。MDJ训练集13531个接收函数中带有保留标签的有1969个,占比14.5%;测试集1798个接收函数中带有标签的有283个,占比15.7%;BJT训练集12730个接收函数中带有保留标签的有3285个,占比25.8%;测试集1812个接收函数中带有标签的有496个,占比27.3%.
进一步地,所述步骤A03搭建神经网络模型,将所述波形数据的接收函数输入所述搭建好的神经网络模型,采用深度学习方法构造训练模型,作出接收函数保留或舍弃的判断,还包括:
所述神经网络基于LeNet-5手写数字识别模型;
所述神经网络有7层,前4层为卷积层和池化层交替,输入为一维序列,对所述一维序列进行卷积,后三层为全连接层;
对输出结果进行One-hot编码,保留编码为[1,0],舍弃编码为[0,1]。
具体的,本研究搭建的神经网络基于LeNet-5(LeCun et al.,1998;LeCun etal.,2015)手写数字识别模型。如图2所示,整个网络有7层,前4层为卷积层和池化层交替,输入为一维序列,对其进行卷积,使用大小为1×5的一维卷积核,滑动步长1,深度16,选用ReLU函数作为激活函数,此时神经元数量为600×16=9600个。后接一层池化层,设定一个1×2的滑动窗口,滑动步长为2,选取其中的最大值输出到下一层,神经元数量减少到4800个。重复进行一次卷积、池化操作,神经元数目进一步减少到2400个。后三层为全连接层,大小设置为256、60和2,采用Dropout(Srivastava et al.,2014)方法,按照0.5的概率舍弃部分神经元以防止训练过程中的过拟合情况发生。
对于接收函数挑选,只有两种结果:保留、舍弃。这本质上构成了一种二分类问题,可以对输出结果进行One-hot编码,保留编码为[1,0],舍弃编码为[0,1]。基于TensorFlow软件平台和Python语言环境搭建深度学习模型,每次输入100个带标签的接收函数作为训练集,采用加入L2正则化的交叉熵损失函数作为Loss函数,利用Adam优化算法(Kingma andBa,2014)训练网络参数,最大训练次数设置为30000次。
进一步地,所述步骤A04从所述中国国家台网记录的波形数据中提取测试集,将所述测试集输入所述训练模型,得到自动挑选接收函数,还包括:
获取所述测试集中带有保留标签的接受函数占比值,将所述测试集输入所述训练模型后直至收敛稳定,获得准确率。
两个台站的网络结构从8000次训练左右开始收敛稳定,如图3所示的Loss变化曲线。使用最终训练模型测试两个台站的测试集,MDJ台的准确率达到92.3%,BJT台的准确率达到93.1%.原始接收函数见图4(a、d)挑选结果见图4(b、e),与人工相比,图4(c、f),二者具有较高的相似性。
进一步地,所述步骤A05使用所述人工挑选的接收函数和搜索自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各项异性进行计算,并对对比结果进行分析,还包括:
所述地壳厚度、波速比的计算采用接收函数处理中常用的“H-k叠加”方法,如果所述MDJ台站和BJT台站经深度学习挑选的接收函数H-k叠加结果和所述人工挑选结果基本一致,说明神经网络用于接收函数的自动挑选具有较好的适用性;
具体的,为估计两个台站下方的地壳厚度以及波速比,我们采用接收函数处理中常用的“H-k叠加”(Zhu and Kanamori,2000)方法。P波、Ps转换波以及PpSs+PsPs多次波相对于P波的时差(tPs、tPpPs、tPpSs+PsPs)可以表示为地壳厚度、地壳纵横波速度和射线参数的函数。将一个台站的所有的接收函数按照公式(2.1)进行叠加,即可估计台站下方地壳厚度H和平均波速比κ。式2.1中,Ai为第i个接收函数对应时差的幅值,ω1、ω2、ω3分别为三种震相叠加的权系数,MDJ台权系数设为0.7、0.2和0.1,BJT设为0.8、0.1和0.1。N为该台站参与叠加的接收函数的数目。
图5(a、d)分别为MDJ台和BJT台测试集通过深度学习算法挑选的接收函数的H-k叠加结果;图5(b、e)分别为MDJ台和BJT台测试集通过人工挑选的接收函数H-k叠加结果;图5(c、f)分别为MDJ台和BJT台所有人工挑选的接收函数H-k叠加结果。图5(a、b、c)对比可以看出不同挑选方案得到的MDJ台下地壳厚度分别为35.2km、34.9km、34.8km,平均波速比分别为1.83、1.84、1.84;图5(d、e、f)对比可以看出不同挑选方案得到的BJT台下地壳厚度和波速比分别为38.4km/1.78、37.9km/1.79、37.8km/1.80;可以看出两个台站经深度学习挑选的接收函数H-k叠加结果和人工结果基本一致,说明神经网络用于接收函数的自动挑选具有较好的适用性。
所述地壳各向异性估计使用接收函数Ps震相估计台站下方的地壳方位各项异,将所述MDJ台站和BJT台站的各向异性对比结果绘制在的地形图上,如果人工挑选的接收函数和深度学习挑选的接收函数估计出的各项异性结果比较一致,说明神经网络用于接收函数的自动挑选具有较好的适用性。
具体的,进一步使用接收函数Ps震相估计台站下方的地壳方位各项异性。在单层水平地壳假设下,接收函数Ps转换波与直达P波的到时差可以由反方位角余弦表示(Liuand Niu,2012;Zheng et al.,2018),公式如下:
式2.2中,t为接收函数Ps转换波与直达P波的到时差,t0为各向同性介质假设下的到时差,Δt为各向异性介质产生的到时差。dt是表征地壳各向异性强度的横波分裂后快慢横波到时差、Φ是表征地壳各向异性快轴方向的快横波极化方向,Baz为反方位角。我们需要估计的即是t0、dt、Φ三个参数。在本研究中,参数估计利用遗传算法(Holland,1992)进行,采用二进制编码,每个参数由八位二进制表示,总基因长度为24,t0、dt、Φ三个参数范围分别设置为4~8s、0~0.8s、-90°~90°,所有接收函数Ps转换波振幅值之和作为适应度函数,用公式表示为:
式中F为适应度函数,RFA(t)表示Ps转换波振幅值,t由式2.2表示。种群设置为50,遗传100代截止,交叉概率和变异概率分别设置为0.6和0.05。
接收函数预处理采用Zheng et al.(2018)提出的方法,为消除不同震中距对到时差的影响,Ps震相经过了动校正处理。接下来对接收函数进行叠加平均,使用平均后的接收函数估计各个参数。
图6(a、e)分别为MDJ台和BJT台通过深度学习方法从测试集中挑选出的接收函数通过遗传算法估计t0、dt、Φ三个参数的进化图;图6(b、f)对应图6(a、e)中接收函数的到时差;图5(c、g)分别为MDJ台和BJT台人工从测试集中挑选出的接收函数通过遗传算法估计t0、dt、Φ三个参数的进化图;图6(b、f)对应图6(d、h)中接收函数的到时差。将两台各向异性对比结果绘制在图7所示的地形图上,可以看出人工挑选的接收函数和深度学习挑选的接收函数估计出的各项异性结果比较一致。
进一步地,对于接收函数挑选这类二分类问题,即使较小规模的训练集也能起到较好的训练结果,在实际应用中可以挑选少量接收函数训练模型并应用于剩余接收函数的自动挑选以节省人工;
将小于5.5级的事件计算的接收函数参与到训练中;
采用多台数据联合训练,建立公共的模型。
本文使用了2000-2016年16年的接收函数作为训练集,2017-2019两年的接收函数作为测试集,测试集与训练集之比接近1:7,最终模型自动挑选接收函数可以达到较好的精度。然而,对于布设时间较短的流动台站或其它临时台站,无法提供大量的数据以供训练。为此我们探究了只应用较小规模的训练集是否也能达到较好的效果。我们重新划分训练集规模进行训练,剩余数据用作测试集进行试验。
表1为MDJ台不同训练集大小的训练结果,训练集规模从552条接收函数递增,最终增加到13531条,准确率均达到了90%以上,结果表明对于接收函数挑选这类二分类问题,即使较小规模的训练集也能起到较好的训练结果,在实际应用中可以挑选少量接收函数训练模型并应用于剩余接收函数的自动挑选以节省人工。
表1.MDJ台不同训练集规模情况下的测试集准确率
本文使用了近20年时间跨度的地震数据,使得我们可以通过统计学对接收函数挑选中所使用的地震震级情况进行分析。MDJ和BJT台站接收到的震级范围5.1~5.5的事件占比分别为64.5%和64.7%,占比明显高于震级>=5.5的事件,但是人工挑选出的接收函数分别只占到2.5%和7.07%,而从震级>=5.5的事件中挑选出的接收函数占比达到23.21%和16.29%,这在人工挑选过程中,是没有必要花费大量精力但只获取较少的数据的,这就是我们通常只选取震级大于5.5级的事件进行接收函数分析工作的原因。
由于人工挑选数据的局限性舍弃掉的小震级接收函数数据,在使用自动挑选时则可以得以保留。采用机器学习自动挑选接收函数时,不需要担心人工成本的问题,同时将小于5.5级的事件计算的接收函数参与到训练中去可以明显提高训练集的规模,在一定程度上增强了训练集样本的多样性,从而提高模型的训练精度。以BJT台为例,加入小于5.5级的事件训练相比不加入,使用相同测试集检测模型的精度,准确率由92.1%提高到了93.1%。应用训练好的模型可以快速从小于5.5级的地震事件中挑选出少量较高质量的接收函数,从而提高数据的利用率。
对于永久台站,可以选取每个台站几年的数据进行训练,将所有模型建立一个台网字典供以后直接使用。但是对于大量的流动台站和临时台站,单台接收函数训练结果泛化能力有较大的局限性,此时采用多台数据联合训练,建立一个公共的模型是有必要的。
受台站数目限制,本次研究仅对上文使用的两个台站进行联合训练测试,我们将MDJ台和BJT台的训练集合并,测试集合并,同样经历30000次训练,得到的模型准确性达到了92.5%,再次使用H-k叠加方法对台站下方的地壳厚度和各项异性进行估计,如图8所示,MDJ台下地壳厚度为35.2km,平均波速比为1.83;BJT台下地壳厚度为37.9km,平均波速比为1.79。两台最终结果与人工挑选和单台自动挑选结果均较为一致,表明建立区域多台联合接收函数挑选模型具有一定可行性。更多台站准确分析结果需要后续工作继续跟进。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于深度学习的地震接收函数自动挑选方法,其特征在于,包括步骤:
A01提取中国国家台网两个台站的记录的波形数据,对所述波形数据进行预处理,计算预处理后的所述波形数据的接收函数;
A02 提取训练集和测试集,对所述接收函数进行人工挑选和标签的制作;
A03搭建神经网络模型,将所述波形数据的接收函数输入所述搭建好的神经网络模型,采用深度学习方法构造训练模型,作出接收函数保留或舍弃的判断;
A04从所述中国国家台网记录的波形数据中提取测试集,将所述测试集输入所述训练模型,得到自动挑选接收函数;
A05 使用所述人工挑选的接收函数和搜索自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各向 异性进行计算,并对对比结果进行分析;
所述神经网络基于LeNet-5手写数字识别模型;所述神经网络有7层,前4层为卷积层和池化层交替,输入为一维序列,对所述一维序列进行卷积,后三层为全连接层;对输出结果进行One-hot编码,保留编码为[1,0],舍弃编码为[0,1]。
2.如权利要求1所述的一种基于深度学习的地震接收函数自动挑选方法,其特征在于:
所述步骤A01提取中国国家台网两个台站的记录的波形数据,还包括:
所述中国国家台网两个台站的记录的波形数据取自全球地震台网的两台永久台站,黑龙江省牡丹江地震台,以下称为MDJ地震台,和北京地震台,以下称为BJT地震台;所述中国国家台网两个台站的记录的波形数据下载自http://ds.iris.edu,选取2000年到2019年的震级大于5.1级、震中距30°- 90°的三分量事件波形数据。
3.如权利要求1所述的一种基于深度学习的地震接收函数自动挑选方法,其特征在于:
所述步骤A01对所述波形数据进行预处理,计算预处理后的所述波形数据的接收函数,还包括:
根据P波理论到时截取波形P波前20秒,后60秒,进行去均值、尖刺、倾斜操作,并对所述波形数据进行0.05-10Hz的带通滤波,并由ZNE垂、北、西坐标系旋转至ZRT垂、径向、切向坐标系;
采用频率域反褶积方法计算接收函数,高斯因子设置为2.5;
所述训练集使用2000年到2016年的数据。
4.如权利要求1所述的一种基于深度学习的地震接收函数自动挑选方法,其特征在于:
所述A02 提取训练集和测试集,对所述接收函数进行人工挑选和标签的制作,还包括:
所述训练集使用2000年到2016年的数据,所述测试集使用2017年到2019年的数据;
所述接收函数保存为sac文件格式,截取P波前5s,后25秒共30秒的数据,采样率20Hz。
5.如权利要求1所述的一种基于深度学习的地震接收函数自动挑选方法,其特征在于:
所述步骤A04从所述中国国家台网记录的波形数据中提取测试集,将所述测试集输入所述训练模型,得到自动挑选接收函数,还包括:
获取所述测试集中带有保留标签的接受函数占比值,将所述测试集输入所述训练模型后直至收敛稳定,获得准确率。
6.如权利要求2所述的一种基于深度学习的地震接收函数自动挑选方法,其特征在于:
所述步骤A05 使用所述人工挑选的接收函数和搜索自动挑选的接收函数对两个台站下方的地壳厚度、波速比以及方位各向 异性进行计算,并对对比结果进行分析,还包括:
所述地壳厚度、波速比的计算采用接收函数处理中常用的“H-k叠加”方法,如果所述MDJ地震台和BJT地震台经深度学习挑选的接收函数H-k叠加结果和所述人工挑选结果一致,说明神经网络用于接收函数的自动挑选具有较好的适用性;
地壳各向 异性估计使用接收函数Ps震相估计台站下方的地壳方位各向 异,将所述MDJ地震台和BJT地震台的各向 异性对比结果绘制在的地形图上,如果人工挑选的接收函数和深度学习挑选的接收函数估计出的各向 异性结果一致,说明神经网络用于接收函数的自动挑选具有较好的适用性。
7.如权利要求1所述的一种基于深度学习的地震接收函数自动挑选方法,其特征在于,还包括:
在实际应用中挑选少量接收函数训练模型并应用于剩余接收函数的自动挑选以节省人工;
将小于5.5级的事件计算的接收函数参与到训练中;
采用多台数据联合训练,建立公共的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011184316.2A CN112380198B (zh) | 2020-10-29 | 2020-10-29 | 一种基于深度学习的地震接收函数自动挑选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011184316.2A CN112380198B (zh) | 2020-10-29 | 2020-10-29 | 一种基于深度学习的地震接收函数自动挑选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112380198A CN112380198A (zh) | 2021-02-19 |
CN112380198B true CN112380198B (zh) | 2022-06-21 |
Family
ID=74576894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011184316.2A Active CN112380198B (zh) | 2020-10-29 | 2020-10-29 | 一种基于深度学习的地震接收函数自动挑选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112380198B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545356B (zh) * | 2022-11-30 | 2024-02-27 | 深圳市峰和数智科技有限公司 | 预测模型的确定方法、s波走时曲线预测方法及相关设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111538076A (zh) * | 2020-05-13 | 2020-08-14 | 浙江大学 | 基于深度学习特征融合的地震震级快速估算方法 |
CN111723329A (zh) * | 2020-06-19 | 2020-09-29 | 南京大学 | 一种基于全卷积神经网络的震相特征识别波形反演方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140297193A1 (en) * | 2013-03-26 | 2014-10-02 | Cgg Services Sa | Seismic methods and systems employing shallow shear-wave splitting analysis using receiver functions |
CN105676266A (zh) * | 2015-12-14 | 2016-06-15 | 丁陶生 | 地震预测预报的方法和系统 |
CN106407649B (zh) * | 2016-08-26 | 2019-01-29 | 中国矿业大学(北京) | 基于时间递归神经网络的微震信号到时自动拾取方法 |
CN106405640B (zh) * | 2016-08-26 | 2018-07-10 | 中国矿业大学(北京) | 基于深度信念神经网络的微震信号到时自动拾取方法 |
CN106772598B (zh) * | 2016-12-12 | 2018-04-17 | 中国石油大学(华东) | 利用接收函数周期性测量沉积地层时间厚度的方法 |
CN109685127A (zh) * | 2018-12-17 | 2019-04-26 | 郑州云海信息技术有限公司 | 一种并行深度学习初至拾取的方法和系统 |
CN110471111B (zh) * | 2019-09-06 | 2020-04-14 | 中国海洋大学 | 一种基于卷积神经网络的速度谱自动拾取方法 |
CN110632662A (zh) * | 2019-09-25 | 2019-12-31 | 成都理工大学 | 一种利用DCNN-Inception网络自动识别微地震信号的算法 |
-
2020
- 2020-10-29 CN CN202011184316.2A patent/CN112380198B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111538076A (zh) * | 2020-05-13 | 2020-08-14 | 浙江大学 | 基于深度学习特征融合的地震震级快速估算方法 |
CN111723329A (zh) * | 2020-06-19 | 2020-09-29 | 南京大学 | 一种基于全卷积神经网络的震相特征识别波形反演方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112380198A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108961235B (zh) | 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法 | |
CN107529222B (zh) | 一种基于深度学习的WiFi室内定位系统 | |
CN102148987B (zh) | 基于先验模型和l0范数的压缩感知图像重构方法 | |
CN114152980B (zh) | 一种快速自动化产出震源机制解的方法与装置 | |
CN114509811B (zh) | 一种基于深度学习的单台站后方位角估计方法与装置 | |
CN111983676A (zh) | 一种基于深度学习的地震监测方法及装置 | |
CN112884134B (zh) | 面向地震震相识别的基于时域的卷积神经网络模型及应用 | |
CN116206185A (zh) | 一种基于改进YOLOv7的轻量级小目标检测方法 | |
CN111832404B (zh) | 一种基于特征生成网络的小样本遥感地物分类方法及系统 | |
CN114063153A (zh) | 一种自动反演震源机制解的方法与装置 | |
CN109884591A (zh) | 一种基于麦克风阵列的多旋翼无人机声信号增强方法 | |
CN112380198B (zh) | 一种基于深度学习的地震接收函数自动挑选方法 | |
CN115436993A (zh) | 一种基于PPNet网络的地震信号P波检测方法 | |
CN109389553A (zh) | 基于t样条的气象传真图等值线插值方法 | |
CN113075462A (zh) | 一种基于神经网络的电磁场分布定位方法 | |
CN113238280A (zh) | 一种基于格林函数的地震监测方法 | |
CN116306203A (zh) | 一种海上目标航迹智能仿真生成方法 | |
CN115826042B (zh) | 一种边云端结合的分布式地震数据处理方法与装置 | |
CN115272278A (zh) | 一种用于遥感图像变化检测的变化检测模型的构建方法 | |
CN116594057B (zh) | 一种基于深度学习和边缘计算的地震预警方法与装置 | |
CN112881812B (zh) | 基于机器学习编码的全闪实时定位方法及装置 | |
CN113985479A (zh) | 一种基于边缘计算的地震信息处理方法与装置 | |
CN117710508A (zh) | 基于改进条件生成对抗网络的近地表温度反演方法和装置 | |
CN111505706B (zh) | 基于深度T-Net网络的微地震P波初至拾取方法及装置 | |
CN116068644A (zh) | 一种利用生成对抗网络提升地震数据分辨率和降噪的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |