一种利用生成对抗网络提升地震数据分辨率和降噪的方法
技术领域
本发明属于地球物理勘探领域,特别涉及一种基于合成地震数据利用生成对抗网络提升地震数据分辨率和降噪的新方法。
背景技术
地震图像是地质学家确定地下地层的沉积年代、分析结构运动、推断沉积环境以及找寻油气藏最重要的基础资料之一。高分辨率和信噪比的地震数据对于提高分析结果的准确性,减少判断的不确定性,提高资源勘探的成功率至关重要。由于地震数据采集条件和稀疏采样方法的限制,地震现场数据通常伴随着低分辨率和噪声,这往往导致地球物理学家做出错误的解释。因此,如何提高地震数据的分辨率和信噪比是有一项有重要意义但又具有挑战性的研究。
专利申请CN201910818535.2公开了一种基于深度学习的地震数据分辨率提高方法,首先需要获取地震和测井数据,然后利用神经网络对测井和地震数据进行训练,利用测井的高分辨特性提高地震数据的分辨率。该方法虽然提供了一种井震结合提分地震数据分辨率的思路,但是要想花费人力和物力获取测井和地震匹配的数据,其次是测井和地震数据尺度不匹配会严重降低分辨率提升结果的可靠性。专利申请CN201611259346.9公开了一种基于小波变换提高地震数据分辨率的方法,利用连续小波域的多分辨率特性基于谐频分析拓展地震数据的频宽。该方法可以有效的拓展了低频和高频成分,但是步骤繁琐,而且只能对地震数据的纵向分辨率进行提升。
专利申请CN201810946707.X公开了一种基于Huber范数替换的目标函数噪音抑制方法。该方法虽然在压制随机噪音的同时又能有效去除规则噪音,但是在噪音去除时也可能会导致层位特征的改变。专利申请CN201910485137.3公开了一种利用曲波变换消除地震数据随机噪音的方法。该方法操作方便,实施简单,但是仅根据曲波变换后的阈值去分离噪音有时会破坏有用的地震信号。
由于地震资料在地质解释中扮演着十分重要的角色,为了提高解释的准确性和可靠性,提高地震数据分辨率和信噪比的方法得到了广泛的研究。但是无论是传统的方法还是目前的基于深度学习的方法都没有同时对地震数据进行分辨率提升和降噪的研究。此外,传统的方法需要人为设计复杂的算法以应对不同地质背景的地震数据,这导致了模型的鲁棒性降低使用性较差。然而目前基于深度学习的方法,非常依赖于训练数据的质量和数量,受数据采集和资金投入的限制,获得大规模高质量的训练数据是非常困难的。
发明内容
为了解决上述问题,本发明的首要目地是提供一种不依赖实际地震数据且同时提升地震数据分辨率和信噪比的方法,该方法基于合成地震数据利用生成对抗网络建立低分辨率有噪音的数据和高分辨率无噪音的数据的映射关系,将该映射关系应用到实际地震数据中即可同时实现分辨率和信噪比的提升。
为实现上述目的,本发明的技术方案为:
一种利用生成对抗网络提升地震数据分辨率和降噪的方法,包括以下步骤:
S1.基于随机参数控制模拟包含褶皱和断层等地质特征在内的地层反射率模型;
具体的,S1中,首先我们应用(Wu et al.,2020;Wu et al.,2019)提出的方法随机生成地层反射率模型。首先,在这个工作流中,我们随机建立了一个具有水平层的反射率模型。接下来,我们通过对水平层流模型应用垂直扰动来模拟地层倾角。然后,我们使用高斯叠加方程将褶皱构造添加到模型中。最后,我们利用体积向量场来模拟地层中的断层分布。上述每个步骤都由随机参数控制,以生成不同的反射率模型。
S2.基于地层反射率模型生成成对的高分辨率无噪音和低分辨率有噪音的地震数据;
具体的,S2中,首先,我们将S2中生成的反射率分别与峰值频率较低和峰值频率较高的雷克子波卷积,生成高频地震数据和低频地震数据。随后,我们向低频地震数据中加入随机噪声。然后从生成的三维地震数据中提取二维地震切片。考虑到相邻地震切片的高度相似性,为了获得非冗余的训练数据,我们分别沿crossline和inline测线方向每16个切片提取一个切片。最后,我们对低频地震图像进行下采样操作得到低分辨率有噪音的地震图像用作生成对抗网络训练的输入。将高频地震数据中提取的二维切片用作生成对抗网络训练的输出。
S3.搭建用于地震图像分辨率提升和降噪的生成对抗网络模型;
具体的,在S3中,我们搭建的生成对抗网络包含一个生成器和一个判别器,生成器被用来将一幅低分辨率有噪音的地震图像重构为一幅高分辨率无噪音的地震图像。判别器被用来甄别一幅高分辨率的图像是真实的高分辨无噪音的地震图像还是由生成器重构的高分辨率无噪音的地震图像。通过交替对抗训练生成器和判别器可以让生成器学习到分辨率有噪音的地震图像到高分辨率无噪音的地震图像非线性映射,训练公式如下:
式中,IHR表示真实的高分辨率无噪音的地震图像,ILR表示低分辨率有噪音的地震图像,D表示判别器,θD是判别器网络的参数,G表示生成器,θG是生成器网络的参数。
我们生成器的网络结构首先将低分辨率的噪声地震图像ILR通过卷积层,然后使用ParametricReLU作为激活函数。然后,输出被送入五个含有残差连接的卷积块,每个卷积块有两个卷积层,两个批处理规范化层,以及一个ParametricReLU激活函数,在五个卷积块之后,接另一个卷积层,然后再跟一个批归一化层的,在进入卷积块之前的特征图与现在的输出的特征图通过跳过连接对进行相加。接下来,,使用卷积层将特征图的数量从64个扩展到256个,再使用亚像素像素卷积来增加图像的尺寸。最后,再接一个卷积层和Tanh激活函数产生最终的输出。该输出结果就是由生成器从低分辨率有噪音的地震图像生成的高分辨率无噪音的地震图像。
与生成器不同的是,除了最后一层外,判别器的网络结构中使用的激活函数都是LeakyReLU激活函数。网络总共包含八个卷积层,其中有七个卷积块,每个卷积块由一个卷积层、一个批处理规范化层和一个Leaky ReLU激活函数组成。每个卷积层的卷积核大小为3×3,在整个网络中特征图的数量从64个增加到512个,并使用移动步长为2的卷积操作来降低图像分辨率。最后,使用两个密集层和一个sigmoid激活函数来确定输入图像是否是真正的高分辨率无噪声地震图像。
S4.定义训练时的生成器和判别器的损失函数;
具体的,S4中,生成器的损失函数对生成的图像的质量影响至关重要。虽然均方误差(MSE)损失可以获得更高的峰值信噪比(PSNR)经常用于生成器,但更高的PSNR只能表示像素级的近似,有时与人的判断相反。为了解决这个问题,我们在生成器的损失中引入了VGG损失,通过计算生成的图像与真实的图像在VGG网络的特征提取空间的差异来提升生产图像的质量。我们对生成器的损失定义如下:
lG=lMSE+0.6×lVGG+0.1×ladv
式中,lMSE表示像素级的MSE损失,lVGG表示VGG损失,,ladv表示对抗性损失。
lMSE计算生成的图像和其对应的真实图像逐个像素的均方误差,计算公式如下:
式中,W和H表示低分辨率噪声地震图像ILR的维度,t表示从ILR到IHR的分辨率提升的倍数。
VGG网络已被证明具有强大的特征提取能力(Simonyan和Zisserman,2014)。我们通过计算生成的图像与真实的图像在VGG网络的特征提取空间的差异来提升生产图像的质量。我们基于预训练的16层VGG网络(VGG16)定义VGG损失函数。我们计算由生成器生成的高分辨率无噪声地震图像和其对应的真实图像IHR在VGG16网络内第i层最大池化层之前的第j次卷积(激活函数后)得到的特征图之间的欧氏距离。该欧式距离被用作VGG损失来衡量重建图像与真实图像在VGG网络特征表示空间中的相似度,计算公式如下:
式中,φi,j表示在第i个最大值池化层之前提取第j个卷积层(激活函数后)的特征图的操作,Wi,j和Hi,j表示VGG网络每个特征提取层的特征图的尺寸。
为了欺骗判别器,生成器尽可能地学习真实的高分辨率无噪声地震图像的分布。因此,我们根据判别器将重构的地震图像识别为真实高分辨率无噪声图像的概率来定义ladv:
式中,N代表低分辨率有噪声样本的数量,表示判别器将由生成器重建的地震图像视为真正的高分辨率无噪声地震图像的概率。为了获得更好的梯度优化,我们最小化而不是
上述步骤定义好了生成器的损失函数,接下来我们定义判别器的损失函数。与生成器的损失函数相比,判别器的损失函数形式更简单,因为它只计算图像是真实高分辨率无噪声地震图像的概率。判别器的目标是最大限度地提高真实图像IHR的概率,尽可能地减少由生成器重构的高分辨率无噪音的地震图像的概率。我们对判别器的损失函数定义如下:
其中M代表真实的高分辨率无噪声IHR样本数,N代表低分辨率噪声ILR样本数,表示将真实的高分辨率无噪声地震图像识别为真实的高分辨率无噪声图像的概率。
S5.在合成地震数据上进行生成对抗网络的训练,验证和测试;
具体的,S5中,基于定义好的网络框架和损失函数,我们首先在合成地震数据集上训练,验证和测试我们提出的网络的性能,其特征在于S5中,为了统一前述随机生成的地震数据的分布,方便后续的GAN训练,我们将所有输入的地震图像ILR和标签的图像IHR都按照下式进行归一到处理:
式中,x是归一化前的地震图像,y表示归一化后的地震图像,xmax和xmin是归一化前地震图像的最大值和最小值。
数据增强是提高模型鲁棒性的有效策略,我们在网络的训练中对样本进行随机垂直和水平翻转以及图像旋转180度的数据增强操作。我们使用参数为β1=0.9,β2=0.999,ε=10-8的Adam优化器作为更新生成器和判别器网络参数的优化器。为了提高训练速度,我们将训练批次大小设定为32,迭代次数设为100次。我们使用Pytorch的2.0版本的神经网络框架在NVIDIA Tesla V100 32G上进行实验。根据模型在验证集上的最优表现作为GAN的参数用于模型的测试。
S6.将训练好的网络生成器应用到野外地震数据上进行真实地震数据的分辨率提升和降噪。
具体的,S6中,我们基于S5中训练好的GAN的模型参数,将实际地震数据集作为GAN的输入,利用GAN中生成器重构地震图像以提升原始数据的分辨率和信噪比。
本发明可以在没有任何真实的地震数据的条件下通过合成地震数据进行网络训练,并且能够同时有效的对地震图像进行分辨率和信噪比的提升。它主要的特点是不需要真实地震或其他地质资料,也不需要人为主观干预就可以自动化的提升地震图像的分辨率和信噪比。经过我们提出的方法重构的地震图像具有更强的层位连续性,更容易识别相邻的薄层和更突出的断层特征,即使是小规模的断层,放大后的图像也更加清晰。我们的方法将为层序地层学、构造运动解释和沉积环境分析等研究带来极大的帮助。
本发明首先基于随机参数控制模拟包含褶皱和断层等地质特征在内的地层反射率模型,然后利用地层反射率模型生成成对的高分辨率无噪音和低分辨率有噪音的地震数据。准备好训练数据后,我们搭建用于地震图像分辨率提升和降噪的生成对抗网络模型。接下来,定义训练时生成器和判别器的损失函数。之后在合成地震数据上进行生成对抗网络的训练,验证和测试。根据模型在合成地震数据验证集上的表现确定最优模型,并将该模型应用到野外地震数据上进行真实地震数据的分辨率提升和降噪。由此可见,该方法可以在没有任何真实的地震数据的条件下通过合成地震数据进行网络训练,并且能够同时有效的对地震图像进行分辨率和信噪比的提升。它主要的特点是不需要真实地震或其他地质资料,也不需要人为主观干预就可以自动化的提升地震图像的分辨率和信噪比。将该方法应用到合成地震数据的测试集和野外真实地震上,结果表明经过我们提出的方法重构的地震图像具有更强的层位连续性,更容易识别相邻的薄层和更突出的断层特征,放大后的图像也更加光滑和清晰。
附图说明
图1为本发明所实现随机生成用于生成对抗网络训练的数据的工作流。
图2为本发明所实现用于数据训练的生成对抗网络的架构。
图3为本发明所实现在合成地震数据测试集上的应用。
图4为本发明所实现在野外真实地震数据上的应用。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明所实现的基于合成地震数据利用生成对抗网络提升地震图像分辨率和降噪的方法,包括以下步骤:
S1.基于随机参数控制模拟包含褶皱和断层等地质特征在内的地层反射率模型;
S2.基于地层反射率模型生成成对的高分辨率无噪音和低分辨率有噪音的地震数据;
S3.搭建用于地震图像分辨率提升和降噪的生成对抗网络模型;
S4.定义训练时的生成器和判别器的损失函数;
S5.在合成地震数据上进行生成对抗网络的训练,验证和测试;
S6.将训练好的网络生成器应用到野外地震数据上进行真实地震数据的分辨率提升和降噪。
具体的,S1中,首先我们应用(Wu et al.,2020;Wu et al.,2019)提出的方法随机生成地层反射率模型。首先,在这个工作流中,我们随机建立了一个具有水平层的反射率模型。接下来,我们通过对水平层流模型应用垂直扰动来模拟地层倾角。然后,我们使用高斯叠加方程将褶皱构造添加到模型中。最后,我们利用体积向量场来模拟地层中的断层分布。上述每个步骤都由随机参数控制,以生成不同的反射率模型。生成的反射率模型见附图1(a)。
具体的,S2中,首先,我们将S2中生成的反射率分别与峰值频率较低和峰值频率较高的雷克子波卷积,生成高频地震数据和低频地震数据。随后,我们向低频地震数据中加入随机噪声。然后从生成的三维地震数据中提取二维地震切片。考虑到相邻地震切片的高度相似性,为了获得非冗余的训练数据,我们分别沿crossline和inline测线方向每16个切片提取一个切片。最后,我们对低频地震图像进行下采样操作得到低分辨率有噪音的地震图像用作生成对抗网络训练的输入。将高频地震数据中提取的二维切片用作生成对抗网络训练的输出。具体的数据生成工作流见附图1。
需要说明的是,在本实施例中,我们随机给定的高频子波的峰值频率范围在35-60hz,低频雷克子波的峰值频率范围在10-25HZ。同时我们给定随机噪音的信噪比范围为4-14。在其他实施例中,可以给定不同的子波峰值频率范围以及信噪比范围。我们总共随机生成了400对维度为256×256×256高分辨率无噪音和低分辨率有噪音的成对地震数据体,然后我们从中提取了12800对切片,其中75%用于训练,20%用于验证,5%用于测试。在其他实施例中,可以生成其他数量的训练数据。
具体的,在S3中,我们搭建的生成对抗网络包含一个生成器和一个判别器,生成器被用来将一幅低分辨率有噪音的地震图像重构为一幅高分辨率无噪音的地震图像。判别器被用来甄别一幅高分辨率的图像是真实的高分辨无噪音的地震图像还是由生成器重构的高分辨率无噪音的地震图像。通过交替对抗训练生成器和判别器可以让生成器学习到分辨率有噪音的地震图像到高分辨率无噪音的地震图像非线性映射,训练公式如下:
式中,IHR表示真实的高分辨率无噪音的地震图像,ILR表示低分辨率有噪音的地震图像,D表示判别器,θD是判别器网络的参数,G表示生成器,θG是生成器网络的参数。
我们生成器的网络结构首先将低分辨率的噪声地震图像ILR通过卷积层,然后使用ParametricReLU作为激活函数。然后,输出被送入五个含有残差连接的卷积块(附图2(c)),每个卷积块有两个卷积层,两个批处理规范化层,以及一个ParametricReLU激活函数,在五个卷积块之后,接另一个卷积层,然后再跟一个批归一化层的,在进入卷积块之前的特征图与现在的输出的特征图通过跳过连接对进行相加。接下来,,使用卷积层将特征图的数量从64个扩展到256个,再使用亚像素像素卷积来增加图像的尺寸。最后,再接一个卷积层和Tanh激活函数产生最终的输出。该输出结果就是由生成器从低分辨率有噪音的地震图像生成的高分辨率无噪音的地震图像。具体的生成器架构见附图2(a)。
与生成器不同的是,除了最后一层外,判别器的网络结构中使用的激活函数都是LeakyReLU激活函数。网络总共包含八个卷积层,其中有七个卷积块(附图2(d)),每个卷积块由一个卷积层、一个批处理规范化层和一个Leaky ReLU激活函数组成。每个卷积层的卷积核大小为3×3,在整个网络中特征图的数量从64个增加到512个,并使用移动步长为2的卷积操作来降低图像分辨率。最后,使用两个密集层和一个sigmoid激活函数来确定输入图像是否是真正的高分辨率无噪声地震图像。具体的判别器架构见附图2(b)。图中的k表示卷积核的尺寸,n表示特征图的数量,s表示卷积操作的步长。
具体的,S4中,生成器的损失函数对生成的图像的质量影响至关重要。虽然均方误差(MSE)损失可以获得更高的峰值信噪比(PSNR)经常用于生成器,但更高的PSNR只能表示像素级的近似,有时与人的判断相反。为了解决这个问题,我们在生成器的损失中引入了VGG损失,通过计算生成的图像与真实的图像在VGG网络的特征提取空间的差异来提升生产图像的质量。我们对生成器的损失定义如下:
lG=lMSE+0.6×lVGG+0.1×ladv (2)
式中,lMSE表示像素级的MSE损失,lVGG表示VGG损失,,ladv表示对抗性损失。
lMSE计算生成的图像和其对应的真实图像逐个像素的均方误差,计算公式如下:
式中,W和H表示低分辨率噪声地震图像ILR的维度,t表示从ILR到IHR的分辨率提升的倍数。
VGG网络已被证明具有强大的特征提取能力(Simonyan和Zisserman,2014)。我们通过计算生成的图像与真实的图像在VGG网络的特征提取空间的差异来提升生产图像的质量。我们基于预训练的16层VGG网络(VGG16)定义VGG损失函数。我们计算由生成器生成的高分辨率无噪声地震图像和其对应的真实图像IHR在VGG16网络内第i层最大池化层之前的第j次卷积(激活函数后)得到的特征图之间的欧氏距离。该欧式距离被用作VGG损失来衡量重建图像与真实图像在VGG网络特征表示空间中的相似度,计算公式如下:
式中,φi,j表示在第i个最大值池化层之前提取第j个卷积层(激活函数后)的特征图的操作,Wi,j和Hi,j表示VGG网络每个特征提取层的特征图的尺寸。
为了欺骗判别器,生成器尽可能地学习真实的高分辨率无噪声地震图像的分布。因此,我们根据判别器将重构的地震图像识别为真实高分辨率无噪声图像的概率来定义ladv:
式中,N代表低分辨率有噪声样本的数量,表示判别器将由生成器重建的地震图像视为真正的高分辨率无噪声地震图像的概率。为了获得更好的梯度优化,我们最小化而不是
上述步骤定义好了生成器的损失函数,接下来我们定义判别器的损失函数。与生成器的损失函数相比,判别器的损失函数形式更简单,因为它只计算图像是真实高分辨率无噪声地震图像的概率。判别器的目标是最大限度地提高真实图像IHR的概率,尽可能地减少由生成器重构的高分辨率无噪音的地震图像的概率。我们对判别器的损失函数定义如下:
其中M代表真实的高分辨率无噪声IHR样本数,N代表低分辨率噪声ILR样本数,表示将真实的高分辨率无噪声地震图像识别为真实的高分辨率无噪声图像的概率。
具体的,S5中,我们基于定义好的网络框架和损失函数,我们首先在合成地震数据集上训练,验证和测试我们提出的网络的性能,其特征在于S5中,为了统一前述随机生成的地震数据的分布,方便后续的GAN训练,我们将所有输入的地震图像ILR和标签的图像IHR都按照下式进行归一到处理:
式中,x是归一化前的地震图像,y表示归一化后的地震图像,xmax和xmin是归一化前地震图像的最大值和最小值。
数据增强是提高模型鲁棒性的有效策略,在本实施例中,我们在网络的训练中对样本进行随机垂直和水平翻转以及图像旋转180度的数据增强操作。我们使用参数为β1=0.9,β2=0.999,ε=10-8的Adam优化器作为更新生成器和判别器网络参数的优化器。为了提高训练速度,我们将训练批次大小设定为32,迭代次数设为100次。我们使用Pytorch的2.0版本的神经网络框架在NVIDIA Tesla V100 32G上进行实验。根据模型在验证集上的最优表现作为GAN的参数用于模型的测试。在其他实施例中,可以使用其他的优化器、训练参数、训练设备和数据增强方式。
本实施例中,我们将训练好的生成对抗网络模型应用到合成地震数据的测试集上,具体结果见附图3,(a)是喂给网络的低分辨率有噪音的地震图像,(b)是其对应的高分辨无噪音的标签图像,(c)是经过我们的GAN重构的地震图像。对比(a)和(c)可以发现图(c)中的随机噪音被很好的移除了,分辨率得到了有效的提升,薄层和断层特征更加突出。对比(b)和(c)发现我们的方法重构的高分辨无噪音的地震图像与真实的标签图像相似度非常高,这证实了我们提出的方法的有效性和可靠性。
具体的,S6中,我们基于S5中训练好的GAN的模型参数,将实际地震数据集作为GAN的输入,利用GAN中生成器重构地震图像以提升原始数据的分辨率和信噪比。本实施例中的实际数据应用效果见附图4,(a)是原始的野外真实地震图像,(b)是经过我们提出的生成对抗网络重构的地震图像,(c)和(d)分别是(a)和(b)中放大的地震图像。对比(a)和(b)可以发现我们重构的地震图像有效的移除了原始图像中的噪音,图中的分辨率得到了有效的提升,我们可以更容易去分别一些薄层,断层特征也变得更加突出。通过放大后的图像(c)和(d)的进行进一步的进行对比,我们重构的图像在放大后更加清晰,具有更多的细节特征,一些小尺度断层也更容易被发现了,一些相邻薄层的同相轴得到了很好的分离。
本发明首先基于随机参数控制模拟包含褶皱和断层等地质特征在内的地层反射率模型,然后利用地层反射率模型生成成对的高分辨率无噪音和低分辨率有噪音的地震数据。准备好训练数据后,我们搭建用于地震图像分辨率提升和降噪的生成对抗网络模型。接下来,定义训练时生成器和判别器的损失函数。之后在合成地震数据上进行生成对抗网络的训练,验证和测试。根据模型在合成地震数据验证集上的表现确定最优模型,并将该模型应用到野外地震数据上进行真实地震数据的分辨率提升和降噪。由此可见,该方法可以在没有任何真实的地震数据的条件下通过合成地震数据进行网络训练,并且能够同时有效的对地震图像进行分辨率和信噪比的提升。它主要的特点是不需要真实地震或其他地质资料,也不需要人为主观干预就可以自动化的提升地震图像的分辨率和信噪比。将该方法应用到合成地震数据的测试集和野外真实地震上,结果表明经过我们提出的方法重构的地震图像具有更强的层位连续性,更容易识别相邻的薄层和更突出的断层特征,放大后的图像也更加光滑和清晰。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。