CN112733425A - 神经网络训练方法、装置、计算机设备及存储介质 - Google Patents

神经网络训练方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112733425A
CN112733425A CN202011455851.7A CN202011455851A CN112733425A CN 112733425 A CN112733425 A CN 112733425A CN 202011455851 A CN202011455851 A CN 202011455851A CN 112733425 A CN112733425 A CN 112733425A
Authority
CN
China
Prior art keywords
data samples
data
neural network
incremental
network training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011455851.7A
Other languages
English (en)
Other versions
CN112733425B (zh
Inventor
张�雄
田宵
陈慧慧
汪明军
刘勇健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Institute of Technology
Original Assignee
East China Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Institute of Technology filed Critical East China Institute of Technology
Priority to CN202011455851.7A priority Critical patent/CN112733425B/zh
Publication of CN112733425A publication Critical patent/CN112733425A/zh
Application granted granted Critical
Publication of CN112733425B publication Critical patent/CN112733425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/10Noise analysis or noise optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开了一种神经网络训练方法、装置、计算机设备及存储介质,其中,该神经网络训练方法包括:获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本;采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,增量数据样本包括三分量波形;将三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中,a、b、c和d为随机数;通过d个向上采样层对所有震相拾取信息进行转换,形成输出标签。该方法可获取充足的数据来训练出适合应用于地震勘探工业的神经网络,极大克服了震勘探工业中难以获取大量野外实际数据的困难。

Description

神经网络训练方法、装置、计算机设备及存储介质
技术领域
本发明涉及微地震检测技术领域,尤其涉及一种神经网络训练方法、装置、计算机设备及存储介质。
背景技术
微地震监测是采矿、地热和天然气/石油行业中非常重要的监测手段,训练数据不足导致泛化能力有限也影响了深度学习方法在微地震监测中的应用。例如,页岩气开发中的水力压裂作业需要实时定位微震事件,这些微震事件一般由井下或地面接收器监测。
深度学习方法在微地震监测中的应用正在迅速增长,成功的应用通常涉及大量的样本来训练广义神经网络。Zhu et al.(2019)提出利用图像分割得到的神经网络架构来解决地震学单站P/S相位提取问题。研究人员从北加利福尼亚地震目录的889个地震台收集了234,117次地震,并利用具有P波和S波的到达时间的三分量数据产生了779,514个样本来训练和测试神经网络模型。经过训练的模型可以很好地推广和应用于地震学研究中的相位选取,例如自动描述地震活动性。最近,Mousavi等人改进了深度学习方法,用于检测和拾取地震震相,其利用了100万事件波形和30万噪音波形,训练和测试神经网络。与传统方法相比,经过训练的模型能够探测到两倍多数量的地震。得益于地震学界对数据集的开放访问,机器学习方法可以探索全球地震数据集的信息特征。
而与地震学行业相比,野外数据一般不向公众分享,尤其对于地震勘探行业,并不总是有足够的数据来训练神经网络模型,从而难以为地震勘探工业中的复杂问题训练出泛化的神经网络模型。如何通过充足的数据来训练出适合应用于地震勘探工业的神经网络成为亟待解决的问题。
发明内容
本发明实施例提供一种神经网络训练方法、装置、计算机设备及存储介质,以解决通过充足的数据来训练出适合应用于地震勘探工业的神经网络的问题。
一种神经网络训练方法,包括:
获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本;
采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,增量数据样本包括三分量波形;
将三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c 个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中,a、b、 c和d为随机数;
通过d个向上采样层对所有震相拾取信息进行转换,形成输出标签。
一种神经网络训练装置,包括:
获取原始样本模块,用于获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本;
获取增量样本模块,用于采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,增量数据样本包括三分量波形;
提取震相信息模块,用于将三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中,a、b、c和d为随机数;
形成输出标签模块,用于通过d个向上采样层对所有震相拾取信息进行转换,形成输出标签。
一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述神经网络训练方法。
一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述神经网络训练方法。
上述神经网络训练方法、装置、计算机设备及存储介质,基于水力压裂作业一个阶段获取的少量原始数据样本,通过数据增强方法增强该原始数据样本,可获取充足的增量数据样本,并基于增量数据样本训练出一个泛化的U-Net神经网络模型,以将训练好的模型应用于不同水力压裂阶段和不同项目。该方法可获取充足的数据来训练出适合应用于地震勘探工业的神经网络,极大克服了震勘探工业中难以获取大量野外实际数据的困难。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中神经网络训练方法的应用环境示意图;
图2是本发明一实施例中神经网络训练方法的流程图;
图3是本发明一实施例中神经网络训练方法的UNET模型体系结构图;
图4是本发明一实施例中神经网络训练方法的另一流程图;
图5是本发明一实施例中神经网络训练方法的另一流程图;
图6是本发明一实施例中神经网络训练方法的另一流程图;
图7是本发明一实施例中神经网络训练方法的另一流程图;
图8是本发明一实施例中神经网络训练方法的另一流程图;
图9是本发明中所有实施例中关于数据增强方法的P/S到时对比图;
图10是本发明一实施例中神经网络训练方法的从增广训练集中选取64个典型样本的实验结果图;
图11是本发明一实施例中神经网络训练方法的基于U-Net选择器自动计算的位置结果图;
图12是图11中关于本发明一实施例中神经网络训练方法中两个阶段的两个典型事件示意图;
图13是本发明一实施例中神经网络训练装置的示意图;
图14是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的神经网络训练方法,可应用在如图1的应用环境中,该神经网络训练方法应用在神经网络训练系统中,该神经网络训练系统包括客户端和服务器,其中,客户端通过网络与服务器进行通信。客户端又称为用户端,是指与服务器相对应,为客户端提供本地服务的程序。该客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等计算机设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种神经网络训练方法,以该方法应用在图1中的服务器为例进行说明,具体包括如下步骤:
S10.获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本。
其中,接收器是弹性波接收器。原始数据样本是由接收器采集的包括P波和S波走时(以下简称P/S走时)的数据样本。预设数量是指指定采集原始数据样本的个数。
具体地,本实施例可采用12个接收器,并设定预设数量为10,也即通过 12个采集器采集10个原始数据样本以继续后续的神经网络训练方法。另外,每个接收器的最大振幅进行归一化,保留一个接收器三分量的相对振幅。输出为 12道高斯分布数据,P/S走时为高斯分布最大值所对应的时间点,如果输入中某一道数据为噪音,或者不包含P或S相位,对应的高斯分布设为零。三分量地震勘探一般指利用纵波激发,采用三分量检波器记录一个纵向分量和两个横向分量的技术。
S20.采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,增量数据样本包括三分量波形。
其中,数据增强方法是预设的增加原始数据样本的个数的方法。增量数据样本是将原始数据样本经数据增强方法后获得的更多数据的数据样本。
S30.将三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中, a、b、c和d为随机数。
其中,UNET模型是二维卷积层模型,如图3所示的UNET模型体系结构,图中通道深度标记在输入和输出数据的顶部或底部。输入和输出数据的长度和宽度标记在右侧。UNET结构最初被用于生物图像分割,可以在少量训练样本情形下得到较好的结果,通过对原始样本进行移位、旋转和变形,仅用30个原始训练样本就可以训练出一个泛化的UNET模型。
震相是在地震图上显示的性质不同或传播路径不同的地震波组。震相拾取信息是将三分量波形输入UNET模型后得到的地震波组信息。
具体地,本实施例可将来自12台接收器的三分量波形输入UNET模型。并随机获取b=512、c=1024和d=4(a已设定为12)。类似于生物医学图像分割,本实施例可将多个站台(12*512*3)的三分量波形作为图像,定位图像中的局部属性。UNET模型通过20个2D卷积层将输入波形(12*512*3)映射到高斯分布标签(12*512*1)。接收器和时间采样点的最大数量分别为12和512。四个 MaxPooling层将输入数据下采样,尺寸从12*512变换为(16*3),提取出震相拾取的关键信息,卷积层的信道数量从3增加到1024,以使预测函数更加灵活。
S40.通过d个向上采样层对所有震相拾取信息进行转换,形成输出标签。
其中,输出标签为将所有震相拾取信息进行转换后得到的输出值。
具体地,四个向上采样层将从输入中提取的所有震相拾取信息转换为最终输出标签,其大小为(12*512*1)。每个深度处的跳跃连接直接将左边输出连接到右边的层,无需更深的层处理,可以使输入中保留更多的细节信息并提高拾取精度。隐藏卷积层中使用ReLU激活函数,但是在输出卷积层使用softmax函数。
在步骤S10至S40中采用的神经网络训练方法,基于水力压裂作业一个阶段获取的少量原始数据样本,通过数据增强方法增强该原始数据样本,可获取充足的增量数据样本,并基于增量数据样本训练出一个泛化的U-Net神经网络模型,以将训练好的模型应用于不同水力压裂阶段和不同项目。该方法可获取充足的数据来训练出适合应用于地震勘探工业的神经网络,极大克服了震勘探工业中难以获取大量野外实际数据的困难。
在一实施例中,如图4所示,至少两个接收器具有初始放置顺序。
在步骤S20中,采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,具体包括如下步骤:
S211.按与至少两个接收器的初始放置顺序相反的顺序重新放置所有接收器,获取反序数据样本。
其中,初始放置顺序是多个接收器最初放置的顺序,该初始顺序形成接收器阵列。
具体地,微震事件可能发生在接收器阵列的上方或下方,按与原顺序相反的顺序放置接收器可以模拟微震事件发生在不同位置或由不同接收器分布的情况。对每个波形数据做一次顺序颠倒,数据集可在10个原始样本的基础上增加2倍。
另外,该颠倒接收器顺序的数据增强方法还可结合其他用于增强数据样本的一个或多个方法,用以大大扩充原始数据样本的数量。
S212.结合预设预设数量的原始数据样本和反序数据样本,获取增量数据样本。
其中,增量数据样本是采用数据增强方法处理预设数量的原始数据样本后,获得的超过原始数据样本数量的数据样本。
具体地,本实施例即为简单相加预设预设数量的原始数据样本和反序数据样本,即可获取增量数据样本。
步骤S211至S212,可将初始数据(本实施例中为原始数据样本)的个数增加为原来的两倍,增加了初始数据的个数,无需另外采集真实的野外地震数据。
在一实施例中,如图5所示,在步骤S20中,采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,具体包括如下步骤:
S221.获取原始数据样本的三分量波形数据,将三分量波形数据中的每一分量按照随机角度分别随机旋转θ、Φ和
Figure RE-GDA0002998375940000081
度。
具体地,微震事件可能发生在不同的方位,具有不同的震源机制。旋转分量可以模拟具有不同极化和复杂情形下的微震事件。
S222.根据旋转公式获取旋转后的旋转分量数据作为增量数据样本,其中,旋转公式为:
Figure RE-GDA0002998375940000082
其中,(dx,dy,dz)T是原始数据样本的三分量波形数据,(d′x,d′y,d′z)T是旋转后的旋转分量数据。
具体地,旋转矩阵由三个旋转角度定义。我们通过随机选择不同的旋转角度来旋转微震数据,数据集在此步骤增加40倍。另外,若本实施例中的采用旋转分量的数据增强方法基于颠倒接收器顺序的数据增强方法,数据样本总数课达到 800=20×40。该步骤也可以对P和S波分别进行旋转生成训练样本。
步骤S221至S222,可将初始数据(本实施例中为原始数据样本)的个数增加为原来的多倍,增加了初始数据的个数,无需另外采集真实的野外地震数据。
在一实施例中,如图6所示,在步骤S20中,采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,具体包括如下步骤:
S231.按预设次数随机移动原始数据样本的P波震相和S波震相的同相轴,以模拟出移动走时曲线。
其中,移动走时曲线是按预设次数随机移动原始数据样本的P波震相和S 波震相的同相轴后获得的曲线。
具体地,P/S走时与接收器分布、速度模型,事件位置等有关。为了处理更一般化的情况,本实施例可随机移动P波和S波同相轴来模拟不同因素导致的走时曲线。首先利用第一个和最后一个P波或者S波到时,内插出一条12个接收器的到时曲线,然后随机地移动第一个和最后一个P或者S到时产生新的曲线,用两条曲线的时间差来模拟每个接收器的P/S震相移动量。给定纵波或横波一个时窗范围,根据随机产生的时差来移动纵波和横波相位。若第一个和最后一个P或者S的时间扰动范围是-50到50毫秒,限定P波和S波之间的最小时间差,防止P波到时大于随机移动相位后的S波到时的情形,可把P相和S相分别移动4次,数据集放大16倍。
另外,若本实施例所采用的移动P/S震相的数据增强方法同时基于颠倒接收器顺序的数据增强方法和基于旋转分量的数据增强方法,本实施例可生成的样本数是12800=800×16。
S232.基于移动走时曲线获取增量数据样本。
具体地,本实施例中将移动走时曲线绘制为与增量数据样本匹配的波形。
步骤S231至S232,可将初始数据(本实施例中为原始数据样本)的个数增加为原来的多倍,增加了初始数据的个数,无需另外采集真实的野外地震数据。
在一实施例中,如图7所示,原始数据样本包括P幅值和P波震相。在步骤S20中,采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,具体包括如下步骤:
S241.在预设P幅值因子范围内随机获取一个P幅值因子。
其中,P幅值因子是P/S幅值比。
具体地,调整P幅值可以提高神经网络的泛化性。
S242.将P幅值乘以P幅值因子获取更新的P幅值,以降低或者增强P波震相的振幅,并获取降低或者增强振幅后的P波震相以及对应的振幅数据样本,将振幅数据样本作为增量数据样本。
具体地,在本实施例涉及的10个原始数据样本中,P振幅相对较强;因此,本实施例可通过在0.02-0.08范围内乘以一个因子来降低振幅。若结合前序所有可增强数据样本的方法,随机选取P幅值因子,最终可生成4000个样本。
步骤S241至S242,可将初始数据(本实施例中为原始数据样本)的个数增加为原来的多倍,增加了初始数据的个数,无需另外采集真实的野外地震数据。
在一实施例中,如图8所示,在步骤S20中,采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,具体包括如下步骤:
S251.从连续波形图像中截断出至少n个噪声窗口,从至少n个噪声窗口中随机获取一个噪声插入窗口,其中,n为随机数。
具体地,信噪比是影响震相拾取的另一个重要因素。本实施例可从连续波形图像中随机截断n=200个噪声窗口。
S252.将噪声插入窗口加入微震事件波形,以扩充原始数据样本,以获取增量数据样本。
具体地,本实施例可随机选取一个噪声插入窗口加入微震事件波形中,和另一个窗口的有效波形,做加法,形成新的加入噪音干扰后的地震样本。
若本实施例所采用的加噪的数据增强方法同时基于颠倒接收器顺序的数据增强方法、基于旋转分量的数据增强方法以及移动P/S震相的数据增强方法,可将原始数据样本的数量增加到8000个,成为增量数据样本。
步骤S251至S252,可将初始数据(本实施例中为原始数据样本)的个数增加为原来的多倍,增加了初始数据的个数,无需另外采集真实的野外地震数据。
优选地,一实施例可随机选择一个接收器作为噪音接收器,将该噪音接收器的波形设为噪声,模拟噪音接收器存在故障的情形。根据前序所有可增强数据样本的方法,本实施例可生成1000个增强数据样本。
该实施例可将初始数据(本实施例中为原始数据样本)的个数增加为原来的多倍,增加了初始数据的个数,无需另外采集真实的野外地震数据。
在一实施例中,如图9所示,在步骤S20中,采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,具体包括如下步骤:
S261.随机移除至少一个接收器对应的波形,模拟水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本的步骤,获取移除数据样本。
其中,移除数据样本是经随机移除至少一个接收器对应的波形,模拟水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本的步骤后得到的数据样本。
具体地,本实施例中,原10个原始数据样本来自12个接收器。然而,不同的项目的接收器数量可能不同。本实施例可模拟去除不同的地震波道数,以监测接收器数量小于12的情况。如果监测接收器大于12个,可将数据分成不同的部分作为神经网络的输入,然后将不同部分的预测结果结合起来。在这一步中,本实施例通过随机选择移除接收器的数量,结合前序所有增强数据样本的方法,可生成25600个样本。
S262.结合原始数据样本和移除数据样本,获取增量数据样本。
具体地,结合原始数据样本和移除数据样本即为相加所有数据样本的数量,以获取增量数据样本的数量。
优选地,如图10所示,为了提高检测能力,前序的所有数据增强方法还可增加200噪声样本的训练集,训练样本的总数是52400,图9显示了从训练集中选择的64个典型样本。随机选择15%的样本作为验证样本,并使用Adam优化算法训练神经网络。图中的双排虚线表示P/S到时。
微震监测工作流程实施例:
本实施例将前序训练好的神经网络模型用于水力压裂不同阶段和不同工程的微震事件检测和震相拾取。将12台接收器采集到的连续波形以截断时间窗 512ms、间隔216ms连续输入到神经网络模型中。对于输出的每道高斯分布,找到两个与P/S到时对应的最大概率值。当到达时间概率值大于0.7时,神经网络模型检测到一个微地震事件。否则,认为输入窗口是噪声或不是一个完整的微震事件。当检测到一个事件时,每个接收器的方位角和倾角通过拾取相位的窗口波形来计算。本实施例应用走时网格搜索方法来寻找最佳位置。应用中,本实施例可通过给定的速度模型和接收器分布,预先计算走时表,根据预先计算的走时表进行网格搜索是很迅速的。监控阶段的计算时间包括对连续数据的检测和震相拾取,以及对检测到的事件进行网格搜索;两种步骤速度快,满足实时监控的要求。
将训练后的神经网络模型应用于不同的项目的实施例:
用于训练的10个微地震事件来自于别的压裂项目,本实施例可利用泛化模型来检测不同项目的事件,如图4所示,从该测试项目的第14和18阶段的连续数据中拾取P/S到时。本实施例分别从阶段14和阶段18检测到1027和1073 个事件。图11显示了基于U-Net选择器自动计算的位置结果,大多数事件发生在水力压裂开始时。图中项目1第14阶段(黑色)和第18阶段(红色)的微震事件。三角形为12个监控接收器;蓝色的线是生产井。(a)、(d)、(e)为两个压裂阶段的3D视图、俯视图和侧视图。(b)和(c)分别为不同时间发生的事件数。图12显示了两个阶段的两个典型事件,其中,阶段14(a)和阶段18(b)的典型波形(三分量)。红点线是神经网络预测的高斯分布标签。波形阶段14与阶段18在波相位和时差方面都不同。虽然只使用十个事件作为基本样本来训练神经网络,但该神经网络模型能够应用于不同的压裂项目。
在步骤S10至S40中采用的神经网络训练方法,基于水力压裂作业一个阶段获取的少量原始数据样本,通过数据增强方法增强该原始数据样本,可获取充足的增量数据样本,并基于增量数据样本训练出一个泛化的U-Net神经网络模型,以将训练好的模型应用于不同水力压裂阶段和不同项目。该方法可获取充足的数据来训练出适合应用于地震勘探工业的神经网络,极大克服了震勘探工业中难以获取大量野外实际数据的困难。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种神经网络训练装置,该神经网络训练装置与上述实施例中神经网络训练方法一一对应。如图13所示,该神经网络训练装置包括获取原始样本模块10、获取增量数据样本20、提取震相信息模块30和形成输出标签模块40。各功能模块详细说明如下:
获取原始样本模块10,用于获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本。
获取增量样本模块20,用于采用数据增强方法处理预设数量的原始数据样本,获取增量数据样本,增量数据样本包括三分量波形。
提取震相信息模块30,用于将三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中,a、b、c和d为随机数。
形成输出标签模块40,用于通过d个向上采样层对所有震相拾取信息进行转换,形成输出标签。
优选地,获取增量样本模块20包括获取反序样本子模块211和获取增量子模块212。
获取反序样本子模块211,用于按与至少两个接收器的初始放置顺序相反的顺序重新放置所有接收器,获取反序数据样本。
获取增量子模块212,用于结合预设预设数量的原始数据样本和反序数据样本,获取增量数据样本。
优选地,获取增量样本模块20包括获取模型数据子模块221和作为增量样本子模块222。
获取模型数据子模块221,用于获取原始数据样本的三分量波形数据,将三分量波形数据中的每一分量按照随机角度分别随机旋转θ、Φ和
Figure RE-GDA0002998375940000151
度。
作为增量样本子模块222,用于根据旋转公式获取旋转后的旋转分量数据作为增量数据样本,其中,旋转公式为:
Figure RE-GDA0002998375940000152
其中,(dx,dy,dz)T是原始数据样本的三分量波形数据,(d′x,d′y,d′z)T是旋转后的旋转分量数据。
优选地,获取增量样本模块20包括模拟走时曲线子模块231和获取数据样本子模块232。
模拟走时曲线子模块231,用于按预设次数随机移动原始数据样本的P波震相和S波震相的同相轴,以模拟出移动走时曲线。
获取数据样本子模块232,用于基于移动走时曲线获取增量数据样本。
优选地,获取增量样本模块20包括获取幅值因子子模块241和获取更新幅值子模块242。
获取幅值因子子模块241,用于在预设P幅值因子范围内随机获取一个P 幅值因子。
获取更新幅值子模块242,用于将P幅值乘以P幅值因子获取更新的P幅值,以降低或者增强P波震相的振幅,并获取降低或者增强振幅后的P波震相以及对应的振幅数据样本,将振幅数据样本作为增量数据样本。
优选地,获取增量样本模块20包括获取插入窗口子模块251和扩充原始样本子模块252。
获取插入窗口子模块251,用于从连续波形图像中截断出至少n个噪声窗口,从至少n个噪声窗口中随机获取一个噪声插入窗口,其中,n为随机数。
扩充原始样本子模块252,用于将噪声插入窗口加入微震事件波形,以扩充原始数据样本,以获取增量数据样本。
优选地,获取增量样本模块20包括获取移除样本子模块261和结合移除样本子模块262。
获取移除样本子模块261,用于随机移除至少一个接收器对应的波形,模拟水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本的步骤,获取移除数据样本。
结合移除样本子模块262,用于结合原始数据样本和移除数据样本,获取增量数据样本。
关于神经网络训练装置的具体限定可以参见上文中对于神经网络训练方法的限定,在此不再赘述。上述神经网络训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于神经网络训练方法相关的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种神经网络训练方法。
在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例神经网络训练方法,例如图2所示S10至步骤S40。或者,处理器执行计算机程序时实现上述实施例中神经网络训练装置的各模块/单元的功能,例如图8所示模块10至模块40的功能。为避免重复,此处不再赘述。
在一实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例神经网络训练方法,例如图2所示S10 至步骤S40。或者,该计算机程序被处理器执行时实现上述装置实施例中神经网络训练装置中各模块/单元的功能,例如图13所示模块10至模块40的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路 (Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM) 等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种神经网络训练方法,其特征在于,包括:
获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本;
采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,所述增量数据样本包括三分量波形;
将所述三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中,a、b、c和d为随机数;
通过d个向上采样层对所有所述震相拾取信息进行转换,形成输出标签。
2.如权利要求1所述的神经网络训练方法,其特征在于,至少两个所述接收器具有初始放置顺序;
所述采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,包括:
按与至少两个所述接收器的初始放置顺序相反的顺序重新放置所有所述接收器,获取反序数据样本;
结合所述预设预设数量的原始数据样本和所述反序数据样本,获取所述增量数据样本。
3.如权利要求1所述的神经网络训练方法,其特征在于,所述采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,包括:
获取所述原始数据样本的三分量波形数据,将所述三分量波形数据中的每一分量按照随机角度分别随机旋转θ、Φ和
Figure FDA0002828273740000012
度;
根据旋转公式获取旋转后的旋转分量数据作为所述增量数据样本,其中,所述旋转公式为:
Figure FDA0002828273740000011
其中,(dx,dy,dz)T是所述原始数据样本的三分量波形数据,(d′x,d′y,d′z)T是旋转后的所述旋转分量数据。
4.如权利要求1所述的神经网络训练方法,其特征在于,所述原始数据样本包括P/S走时,所述P/S走时包括P波震相和S波震相;
采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,包括:
按预设次数随机移动所述原始数据样本的P波震相和S波震相的同相轴,以模拟出移动走时曲线;
基于所述移动走时曲线获取所述增量数据样本。
5.如权利要求1所述的神经网络训练方法,其特征在于,所述原始数据样本包括P幅值和P波震相;
采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,包括:
在预设P幅值因子范围内随机获取一个P幅值因子;
将所述P幅值乘以所述P幅值因子获取更新的所述P幅值,以降低或者增强所述P波震相的振幅,并获取降低或者增强振幅后的P波震相以及对应的振幅数据样本,将所述振幅数据样本作为所述增量数据样本。
6.如权利要求1所述的神经网络训练方法,其特征在于,所述水力压裂作业阶段包括连续波形图像和信噪比;所述原始数据样本包括微震事件波形;
采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,包括:
从所述连续波形图像中截断出至少n个噪声窗口,从至少n个所述噪声窗口中随机获取一个噪声插入窗口,其中,n为随机数;
将所述噪声插入窗口加入所述微震事件波形,以扩充所述原始数据样本,以获取所述增量数据样本。
7.如权利要求1所述的神经网络训练方法,其特征在于,所述水力压裂作业阶段包括连续波形图像和信噪比;所述原始数据样本包括微震事件波形;
采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,包括:
随机移除至少一个所述接收器对应的波形,模拟所述水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本的步骤,获取移除数据样本;
结合所述原始数据样本和所述移除数据样本,获取所述增量数据样本。
8.一种神经网络训练装置,其特征在于,包括:
获取原始样本模块,用于获取水力压裂作业阶段中通过至少两个接收器获取的预设数量的原始数据样本;
获取增量样本模块,用于采用数据增强方法处理所述预设数量的原始数据样本,获取增量数据样本,所述增量数据样本包括三分量波形;
提取震相信息模块,用于将所述三分量波形输入UNET模型,用以通过a个接收器、b个时间采样点、c个卷积层信道以及d个MAXPOOLING层,提取出震相拾取信息,其中,a、b、c和d为随机数;
形成输出标签模块,用于通过d个向上采样层对所有所述震相拾取信息进行转换,形成输出标签。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述神经网络训练方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述神经网络训练方法。
CN202011455851.7A 2020-12-10 2020-12-10 神经网络训练方法、装置、计算机设备及存储介质 Active CN112733425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011455851.7A CN112733425B (zh) 2020-12-10 2020-12-10 神经网络训练方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011455851.7A CN112733425B (zh) 2020-12-10 2020-12-10 神经网络训练方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112733425A true CN112733425A (zh) 2021-04-30
CN112733425B CN112733425B (zh) 2023-01-03

Family

ID=75599503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011455851.7A Active CN112733425B (zh) 2020-12-10 2020-12-10 神经网络训练方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112733425B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990445A (zh) * 2021-05-13 2021-06-18 国网浙江省电力有限公司金华供电公司 一种配电网监控信息智能分析机器学习方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107807387A (zh) * 2017-10-31 2018-03-16 中国科学技术大学 基于神经网络的地震初至波走时获取方法
CN108805269A (zh) * 2018-06-28 2018-11-13 杭州叙简科技股份有限公司 一种基于lstm循环神经网络拾取震相到时的方法
CN110032975A (zh) * 2019-04-15 2019-07-19 禁核试北京国家数据中心 一种地震震相的拾取方法
US20190324167A1 (en) * 2018-04-18 2019-10-24 Geotomo Llc First-break picking of seismic data and generating a velocity model
WO2020037960A1 (zh) * 2018-08-21 2020-02-27 深圳大学 一种sar目标识别方法、装置、计算机设备及存储介质
US20200116882A1 (en) * 2018-10-16 2020-04-16 China University Of Mining And Technology, Beijing Method for automatically locating microseismic events based on deep belief neural network and coherence scanning
CN111027452A (zh) * 2019-12-05 2020-04-17 中国矿业大学(北京) 基于深度神经网络的微震信号到时和震相识别方法及系统
CN111458746A (zh) * 2020-05-29 2020-07-28 东北大学 一种基于U-Net神经网络的隧道微震波形到时拾取方法
US20200301036A1 (en) * 2017-09-12 2020-09-24 Schlumberger Technology Corporation Seismic image data interpretation system
CN111723329A (zh) * 2020-06-19 2020-09-29 南京大学 一种基于全卷积神经网络的震相特征识别波形反演方法
CN112017059A (zh) * 2020-07-14 2020-12-01 北京淇瑀信息科技有限公司 一种分级优化的风险控制方法、装置和电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200301036A1 (en) * 2017-09-12 2020-09-24 Schlumberger Technology Corporation Seismic image data interpretation system
CN107807387A (zh) * 2017-10-31 2018-03-16 中国科学技术大学 基于神经网络的地震初至波走时获取方法
US20190324167A1 (en) * 2018-04-18 2019-10-24 Geotomo Llc First-break picking of seismic data and generating a velocity model
CN108805269A (zh) * 2018-06-28 2018-11-13 杭州叙简科技股份有限公司 一种基于lstm循环神经网络拾取震相到时的方法
WO2020037960A1 (zh) * 2018-08-21 2020-02-27 深圳大学 一种sar目标识别方法、装置、计算机设备及存储介质
US20200116882A1 (en) * 2018-10-16 2020-04-16 China University Of Mining And Technology, Beijing Method for automatically locating microseismic events based on deep belief neural network and coherence scanning
CN110032975A (zh) * 2019-04-15 2019-07-19 禁核试北京国家数据中心 一种地震震相的拾取方法
CN111027452A (zh) * 2019-12-05 2020-04-17 中国矿业大学(北京) 基于深度神经网络的微震信号到时和震相识别方法及系统
CN111458746A (zh) * 2020-05-29 2020-07-28 东北大学 一种基于U-Net神经网络的隧道微震波形到时拾取方法
CN111723329A (zh) * 2020-06-19 2020-09-29 南京大学 一种基于全卷积神经网络的震相特征识别波形反演方法
CN112017059A (zh) * 2020-07-14 2020-12-01 北京淇瑀信息科技有限公司 一种分级优化的风险控制方法、装置和电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘勇健等: "软土工程性质与微观结构关系的神经网络模型", 《地下空间与工程学报》 *
李安等: "基于样本增强的卷积神经网络震相拾取方法", 《地震学报》 *
李楠等: "裂缝性储层缝网压裂机理研究分析", 《石化技术》 *
李达等: "基于BP神经网络的苏里格气田裂缝强制闭合模型分析", 《地质与勘探》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990445A (zh) * 2021-05-13 2021-06-18 国网浙江省电力有限公司金华供电公司 一种配电网监控信息智能分析机器学习方法
CN112990445B (zh) * 2021-05-13 2021-07-16 国网浙江省电力有限公司金华供电公司 一种配电网监控信息智能分析机器学习方法

Also Published As

Publication number Publication date
CN112733425B (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
Zahradník et al. Iterative deconvolution of regional waveforms and a double-event interpretation of the 2003 Lefkada earthquake, Greece
Gao et al. Automatic fault detection on seismic images using a multiscale attention convolutional neural network
Bergen et al. Preface to the focus section on machine learning in seismology
Saad et al. Automatic waveform-based source-location imaging using deep learning extracted microseismic signals
McBrearty et al. Earthquake phase association with graph neural networks
Wang et al. Direct microseismic event location and characterization from passive seismic data using convolutional neural networks
CN112733425B (zh) 神经网络训练方法、装置、计算机设备及存储介质
Huot et al. Detection and characterization of microseismic events from fiber‐optic DAS data using deep learning
Lee et al. GPU‐accelerated automatic microseismic monitoring algorithm (GAMMA) and its application to the 2019 Ridgecrest earthquake sequence
Tous et al. Deep Neural Networks for Earthquake Detection and Source Region Estimation in North‐Central Venezuela
Chen et al. CubeNet: Array‐based seismic phase picking with deep learning
Tang et al. Automating the detection of dynamically triggered earthquakes via a deep metric learning algorithm
Fornasari et al. A Machine‐Learning Approach for the Reconstruction of Ground‐Shaking Fields in Real Time
Merry et al. The influence of the North Anatolian Fault and a fragmenting slab architecture on upper mantle seismic anisotropy in the eastern Mediterranean
Birnie et al. An introduction to distributed training of deep neural networks for segmentation tasks with large seismic data sets
AlSalmi et al. Automated seismic semantic segmentation using Attention U-Net
Zhang et al. A simulation-free seismic survey design by maximizing the spectral gap
Wamriew et al. Deep neural network for real-time location and moment tensor inversion of borehole microseismic events induced by hydraulic fracturing
Song et al. Domain adaptation in automatic picking of phase velocity dispersions based on deep learning
Luo et al. Detecting and Locating Aftershocks for the 2020 M w 6.5 Stanley, Idaho, Earthquake Using Convolutional Neural Networks
Wang et al. Monitoring seismicity in the southern Sichuan Basin using a machine learning workflow
Tao et al. Upgoing and downgoing wave separation in vertical seismic profiling data based on deep learning
Wang et al. Intelligent seismic stratigraphic modeling using temporal convolutional network
CN109490952B (zh) 地震相干体分析方法及系统
Di et al. 3D curvature analysis of seismic waveform and its interpretational implications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant