CN113706380A - 基于弱监督生成对抗网络提高地震资料分辨率方法及系统 - Google Patents
基于弱监督生成对抗网络提高地震资料分辨率方法及系统 Download PDFInfo
- Publication number
- CN113706380A CN113706380A CN202110962067.3A CN202110962067A CN113706380A CN 113706380 A CN113706380 A CN 113706380A CN 202110962067 A CN202110962067 A CN 202110962067A CN 113706380 A CN113706380 A CN 113706380A
- Authority
- CN
- China
- Prior art keywords
- training
- resolution
- generator
- module
- seismic data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000012549 training Methods 0.000 claims abstract description 140
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000002441 reversible effect Effects 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims abstract description 18
- 238000010606 normalization Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 32
- 125000004122 cyclic group Chemical group 0.000 claims description 25
- 230000004913 activation Effects 0.000 claims description 9
- 230000006872 improvement Effects 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 4
- 230000008485 antagonism Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 abstract description 5
- 239000010410 layer Substances 0.000 description 21
- 230000008569 process Effects 0.000 description 18
- 238000003860 storage Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000007796 conventional method Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 208000032538 Depersonalisation Diseases 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了一种基于弱监督生成对抗网络提高地震资料分辨率方法及系统,对属于不同工区的两块三维地震数据进行归一化处理;划分训练集和测试集;在训练区域内采用随机抽取的方式获得训练样本对;将低分辨率地震数据送入到前向生成器中;将前向生成器的输出送入到反向生成器中;将前向生成器的输出和对应的高分辨率标签共同送入到判别器中进行判别;交替训练生成器和判别器,不断更新网络参数直到模型收敛,训练结束后,将整块低分辨率地震数据送入到前向生成器中进行测试,得到最终的高分辨结果。本发明能够在没有配对的输入和标签的前提下,学习到高分辨率地震数据的分布特征,准确、有效地恢复出原始地震数据的高频信息。
Description
技术领域
本发明属于地震勘探数据处理技术领域,具体涉及一种基于弱监督生成对抗网络提高地震资料分辨率方法。
背景技术
地震子波在地下传播过程中,由于地层吸收、非弹性衰减和层间反射的影响,使得高频分量迅速衰减,子波波形展宽,分辨率降低。提高地震资料的分辨率对于精确地解释地层结构具有重要的意义。
现有技术1:传统方法:传统提高地震资料分辨率的方法主要有反褶积、谱白化和反Q滤波等。这些方法需要满足一些假设条件,具有一定的局限性,例如谱白化方法假设反射系数序列的谱是白的,反褶积方法假设子波是最小相位的,反Q滤波方法估计出来的Q值不准确等,因此传统方法恢复出来的结果仍存在不理想的地方。
现有技术2:强监督方法:深度学习具有提取多层特征、将低层特征重组以获取高层抽象特征的能力,擅长从数据本身挖掘信息。目前利用深度学习提高地震资料的分辨率的方法主要是基于强监督学习。例如基于有监督学习的U-net网络能够实现单道地震数据的高分辨率处理,基于有监督学习的生成对抗网络能够提高三维地震资料的分辨率,基于优化的生成对抗网络架构(OGAN)能够实现稀疏地震数据超分辨率重建。然而这些方法都是强监督的,需要传统方法所得到的高分辨率结果作为标签,低分辨率数据要与高分辨率标签一一对应,网络学习的效果也受限于标签的好坏。又由于传统方法也存在一定的局限性,使得一个好的标签的获得十分困难。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于弱监督生成对抗网络提高地震资料分辨率方法,利用循环生成对抗网络,从低分辨率地震数据学习与之不相关的高分辨率地震数据的特征,实现弱监督的学习过程。
本发明采用以下技术方案:
基于弱监督生成对抗网络提高地震资料分辨率方法,包括以下步骤:
S1、对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;
S2、从步骤S1归一化处理后的数据中划分一部分作为训练集;
S3、采用随机抽取的方式从步骤S2划分的训练集中获得训练样本对;
S4、设置循环生成对抗网络模型的参数;
S5、将步骤S3获得的训练样本对中的低分辨率地震数据送入步骤S4设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);
S6、将步骤S5前向生成器的高分辨结果G(x)送入步骤S4设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;
S7、将步骤S5得到的高分辨结果G(x)和步骤S3训练样本对中的高分辨率标签数据共同送入步骤S4设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;
S8、联合训练步骤S5的前向生成器和步骤S6的反向生成器,并与步骤S7的判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;
S9、将低分辨率地震数据作为测试集送入步骤S8训练好的前向生成器中进行测试,得到最终的高分辨结果。
具体的,步骤S4中,模型参数包括patch的大小,学习率初始值,学习率衰减方式,batch的大小,训练总轮数epoch,每轮训练总的样本个数,每隔多少轮重新抽取新的训练数据。
进一步的,patch的大小为96×96,初始化学习率为0.0002,学习率呈指数衰减,衰减率为0.5,衰减周期为100轮,batch的大小为16,训练总轮数epoch等于600,每轮训练总的样本数为800,每隔200轮在训练区域内重新抽取新的训练样本对。
具体的,步骤S5中,前向生成器的损失函数LGen具体为:
LGen=w1LGAN+w2Lcyc+w3Lidt+w4LTV
其中,LGAN表示对抗损失,Lcyc表示循环一致性损失,Lidt表示恒等损失,LTV表示总变差损失,w1,w2,w3,w4表示各损失项的权重。
进一步的,对抗损失LGAN如下:
其中,i=1,2,3,…,N表示训练样本数,xi为低分辨率数据,G为前向生成器,D为判别器。
进一步的,循环一致性损失Lcyc为:
其中,i=1,2,3,…,N表示训练样本数,xi为低分辨率数据,G为前向生成器,F为反向生成器。
进一步的,恒等损失Lidt为:
Lidt=L1+LMS-SSIM
其中,L1为范数损失,LMS-SSIM为多尺度结构自相似损失。
进一步的,总变差损失LTV为:
具体的,步骤S7中,判别器包括9个卷积层,BN层和激活层,激活函数采用LeakyRelu,最后一层为sigmoid激活函数层,判别器的损失函数LDis为:
本发明的另一技术方案是,一种基于弱监督生成对抗网络提高地震资料分辨率的系统,包括:
处理模块,对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;
划分模块,从处理模块归一化处理后的数据中划分一部分作为训练集;
样本模块,采用随机抽取的方式从划分模块划分的训练集中获得训练样本对;
参数模块,设置循环生成对抗网络模型的参数;
第一训练模块,将样本模块获得的训练样本对中的低分辨率地震数据送入参数模块设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);
第二训练模块,将第一训练模块前向生成器的高分辨结果G(x)送入参数模块设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;
判别模块,将第一训练模块得到的高分辨结果G(x)和样本模块训练样本对中的高分辨率标签数据共同送入参数模块设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;
更新模块,联合训练第一训练模块的前向生成器和第二训练模块的反向生成器,并与判别模块的判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;
提高模块,将低分辨率地震数据作为测试集送入更新模块训练好的前向生成器中进行测试,得到最终的高分辨结果。
与现有技术相比,本发明至少具有以下有益效果:
本发明基于弱监督生成对抗网络提高地震资料分辨率方法,数据处理前对三维地震数据进行整体归一化操作,能够尽可能保证不同位置信号的相对能量保持不变,利用弱监督学习的优势,不需要与低分辨率数据完全配对的标签数据,即可获得与强监督学习相当甚至更好的结果,弥补了用传统方法的结果作为标签数据时的不足;通过学习两块完全不同的低高分辨率地震数据之间的映射,实现提高高分辨率的过程,对于新的数据,省去了先用传统方法进行处理再将得到的结果作为标签的步骤,只需要利用之前传统方法处理过的数据中比较好的一些结果作为新数据的标签即可。此外,本发明的只需要抽取很少的数据进行训练,便能获得很好的学习效果。
进一步的,步骤S4中考虑到网络训练的时间,网络训练的效果,网络收敛的速度以及内存的限制,本发明对网络训练过程中涉及到的参数进行合理的设置。
进一步的,步骤S4中,patch是每次放入网络中的数据块的大小,在超分辨网络中通常取96×96。学习率用来控制梯度下降的速度,不能过大或过小,过小会导致收敛速度很慢,过大会阻碍收敛,即在极值点附近振荡,因此通常会控制学习率,将其初始值设置一个较大值,如0.0002,然后随着迭代次数衰减,使得网络可以顺利收敛。batch表示每次放入网络训练的样本数,理论上batch的取值越大越好,但考虑到内存限制,本发明取16。训练轮数epoch为600,每轮训练总的样本数为800时,网络正常收敛并能得到较好的训练结果。由于在弱监督学习中低分辨率数据与标签不配对,因此本发明每隔一定的训练轮数,如200轮,会重新抽取新的训练样本对,从而保证模型的泛化能力。
进一步的,在步骤S5中,前向生成器的损失函数是由对抗损失、循环一致性损失、恒等损失和总变差损失加权组合得到,能够保证前向生成器将低分辨率地震数据生成一个类似高分辨率标签的高分辨率结果,从而骗过判别器。
进一步的,对抗损失能够保证生成器的输出能够欺骗判别器,被判别器判别为真。
进一步的,循环一致性损失能够保证生成器的高分辨过程的是可逆的。
进一步的,恒等损失能够用来约束生成器,保证生成器的高分辨过程方向的正确性。
进一步的,总变差损失能够保证生成器在迭代的过程中,梯度在一定的范围内,避免梯度过大。
进一步的,在步骤S7中,将前向生成器输出的高分辨率结果和高分辨率标签分别送入到判别器中进行判别,希望判别器能够正确地分辨真假数据,即判别高分辨率标签为真,判别生成器的输出为假。
综上所述,本发明能够在没有配对的输入和标签的前提下,学习到高分辨率地震数据的分布特征,准确、有效地恢复出原始地震数据的高频信息,为解决地震数据的高频衰减问题提供了一个新方法。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的流程图;
图2为本发明的整体框架图;
图3为前向生成器网络和反向生成器网络的结构图;
图4为判别器网络的结构图;
图5为crossline剖面上的结果对比图;
图6为inline剖面上的结果对比图;
图7为在时间切片上的结果对比图;
图8为多道平均振幅谱的对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的,其中为了清楚表达的目的,放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
本发明提供了一种基于弱监督生成对抗网络提高地震资料分辨率方法,面向地震资料提高分辨率的相关研究,基于弱监督学习和循环生成对抗网络来实现地震资料的高分辨处理。通过三维叠后实际地震数据来验证本发明的有效性,借助Tensorflow平台来实现代码和操作流程,采用CentOS 7.9.2009操作系统,实验配置为一个2.10GHz 8-core IntelXeon Silver 4110的CPU和一个NVIDIAGTX1080的GPU。本发明提出了一种基于弱监督生成对抗网络的地震资料提高分辨率处理模型,实验证明,弱监督方法能够获得与强监督方法和传统方法相当甚至更好的结果。
请参阅图1,本发明一种基于弱监督生成对抗网络的提高地震资料分辨率方法,标签采用与原始低分辨率地震数据不配对的另一块高分辨率数据,网络通过学习低分辨率到高分辨率的分布,能够获得与强监督方法相当甚至更好的效果;包括以下步骤:
S1、数据预处理,对属于不同工区的两块三维地震数据进行归一化处理;
分别将低分辨率地震数据和高分辨率标签数据归一化至(-1,1)。其中,低分辨率地震数据是某工区三维叠后地震数据,大小为I1×C1×N1(分别表示inline总数,crossline总数和采样点数),采样频率为f1。高分辨率标签是采用传统方法对另一区工区的低分辨率地震数据进行处理所得到的高分辨率结果,大小为I2×C2×N2,采样频率为f2。
低分辨率地震数据是某工区三维叠后地震数据,大小为611×581×1001,采样频率为1000Hz。高分辨率标签是另一区工区的高分辨率地震数据,大小为772×1021×801,采样频率为1000Hz。地震数据总道数为M,归一化的过程表示为:
其中,i=1,2,...,M,X为归一化前的地震数据,X=[x1(n),x2(n),...,xM(n)],n为采样点数,Y为归一化后的地震数据,Y=[y1(n),y2(n),...,yM(n)]。
S2、将步骤S1归一化之后的数据中划分一部分作为训练集;
选择低分辨率数据中某一块固定的区域进行训练,训练区域大小为I×C×N,I为inline总数,C为crossline总数,N为采样点数,其余部分用于测试,然后在高分辨率数据中选择与低分辨数据相同大小的区域作为训练的标签。
S3、采用随机抽取的方式从步骤S2划分的训练集中获得训练样本对;
在低分辨率地震数据的训练区域内随机抽取大小为P×P的二维剖面数据,抽取方式为随机的沿着线号或道号在训练区域内进行均匀分布的随机采样。在高分辨率标签数据中也按照同样的方法抽取同样大小的二维剖面标签数据,二者作为一组训练样本对,然后放到网络中进行训练,每次抽取的训练样本对的大小为96×96。
利用标准正态分布随机数生成器,每次产生一个随机数,若随机数大于0,则沿着crossline方向采样,否则沿着inline方向采样。这种随机抽取的方式相比仅沿着crossline或inline方向进行采样,数据能够得到的更充分、更有效的利用。
S4、设置模型的参数;
模型参数包括patch大小,学习率初始值,学习率衰减方式,batch的大小,训练总轮数epoch,每轮训练总的样本个数,每隔多少轮重新抽取新的训练数据。
优选的,设置patch的大小为96×96,初始化学习率为0.0002,学习率呈指数衰减,衰减率为0.5,衰减周期为100轮,设置batch的大小为16,训练总轮数epoch等于600,每轮训练总的样本数为800,每隔200轮在训练区域内重新抽取新的训练样本对。
由于本发明中所使用的训练数据与标签是不配对的,因此每隔一定的轮数会在训练区域内进行重新抽取得到新的训练样本对,从而让网络学习到更多的数据特征。
S5、将低分辨率地震数据x送入到前向生成器G中;
生成器学习一个由低分辨率数据到高分辨率数据的一个分布G(x),生成一个类似于高分辨率标签y的高分辨率结果y'。
请参阅图2,前向生成器的作用是实现低分辨率地震数据到高分辨率地震数据的一个映射,其输入是某一块原始低分辨率地震数据,输出是高分辨率结果,标签是用传统方法在另一块低分辨率地震数据上处理得到的高分辨率结果。即网络的输入和对应的标签是完全不同的两块数据。
前向生成器的损失函数共包括四个组成部分,分别为对抗损失,循环一致性损失,恒等损失和总变差损失。最终的损失函数由这几项损失通过加权组合得到,可以表示为:
LGen=w1LGAN+w2Lcyc+w3Lidt+w4LTV (1)
其中,LGAN表示对抗损失,Lcyc表示循环一致性损失,Lidt表示恒等损失,LTV表示总变差损失。w1,w2,w3,w4表示各损失项的权重,通过多次实验,本发明的权重分别取值为1,10,5,2。
对抗损失是为了保证生成器的输出能够欺骗判别器,即y'能够被判别器D判别为真,定义如下:
循环一致性损失是为了保证生成器的高分辨过程的是可逆的。其定义如下:
恒等损失的作用是用来约束生成器,保证生成器的高分辨过程方向的正确性。其定义如下:
因此,本发明用L1损失和多尺度结构自相似损失LMS-SSIM代替L2损失,使得前向生成器的输出结果与对应的高分辨率标签在结构上具有高度相似性。实验证明,在很多场景下,基于MS-SSIM的损失函数能取得比L1损失和L2损失更好的效果,而组合MS-SSIM和L1通常会有更好的效果。即将公式(4)修改为公式(5):
Lidt=L1+LMS-SSIM (5)
其中,Lms-ssim=1-MS-SSIM(G(yi ↓),yi),多尺度结构自相似性(MS-SSIM)定义为:其中,M表示不同的分辨率尺度,lM(x,y),cj(x,y),sj(x,y)分别表示两幅图像的亮度、对比度和结构信息。
总变差损失是为了保证生成器在迭代的过程中,梯度在一定的范围内,避免梯度过大。其定义如下:
S6、将前向生成器的输出G(x)(或y')送入到反向生成器F中;
请参阅图2,反向生成器是前向生成器的逆过程,即前向生成器实现的是一个提高分辨率的功能,反向生成器实现的是一个降低分辨率的功能,通过训练反向生成器,使得其输出F(G(x))(或x')与原始低分辨率数据x相等。
反向生成器实现的是由高分辨率地震数据映射回原始低分辨率数据,其作用是为了说明前向生成器的生成过程即高分辨过程是可逆的,其输入是前向生成器输出的高分辨率结果,输出是与前向生成器的输入相似的低分辨率结果。反向生成器是与前向生成器联合训练的,与前向生成器共享同一个损失函数。
S7、将前向生成器的输出G(x)(或y')和对应的高分辨率标签y共同送入到判别器D中进行判别,标签y是采用连续小波域自适应频谱扩展的方法得到的高分辨率数据;
判别器对输入的数据判别真假,输出一个概率值,判别高分辨率标签数据y为真,输出的概率值接近于1,判别前向生成器生成的数据y'为假,输出的概率值接近于0。
判别器的作用是评判前向生成器的学习效果,输入的是前向生成器的输出结果和高分辨率标签,输出一个概率判断输入是来自标签还是前向生成器的输出,在网络迭代的过程中判别器将前向生成器的学习结果不断反馈给生成器,前向生成器获得反馈后不断更新参数,通过降低损失函数来达到更好的学习效果以骗过判别器。二者在博弈的过程中,实现自身能力的提升。
判别器损失函数包括两部分,是为了保证判别器能够正确分辨真假数据,即判别高分辨率标签y为真,输出为1,判别生成器的输出结果y′为假,输出为0。其定义如下:
请参阅图3,图3为生成器网络的结构图,前向生成器和反向生成器共享同一个网络结构,但参数更新是独立的,共包含37个卷积层,具有如下几个特征:
a.不包含池化层,避免了有效信息的损伤;
b.使用多个残差单元(16个),加入残差单元可以使得网络能够在比较深的情况下性能不会变差,从而提取出更多的特征;
c.去掉BN层,ESRGAN论文中指出,BN层在当网络比较深和在GAN网络下训练时可能带来一些伪影,限制了模型的泛化能力。因此,本发明为了训练稳定和一致性去除了BN层。此外,去除BN层有助于提高泛化能力,减少计算复杂度和内存使用;
d.使用亚像素卷积层对提取到的反映地层结构信息的多幅特征图进行特征重组,亚像素卷积层会放大输入数据的尺寸,因此在亚像素卷积层之后,本发明增加了一个步长为2的卷积层来缩小数据尺寸,从而保证网络的输入与输出的数据大小相等。这样可以在保持输入输出尺寸一致的同时,高效完成地震数据的特征重组,使得网络具备从低分辨率数据到高分辨率数据的复杂映射的能力。
请参阅图4,图4为判别器网络的结构图,包含9个卷积层,BN层和激活层,激活函数采用LeakyRelu(α=0.2),最后一层为sigmoid激活函数层,使得网络输出一个0到1之间的概率值。
S8、联合训练前向生成器和反向生成器,并与判别器交替训练,反复迭代更新网络参数直到模型收敛,认为前向生成器的输出被判别为真,即为训练完成。
S9、训练结束后,将整块低分辨率地震数据送入步骤S8训练好的前向生成器G中进行测试,得到最终的高分辨结果。
本发明再一个实施例中,提供一种基于弱监督生成对抗网络提高地震资料分辨率的系统,该系统能够用于实现上述基于弱监督生成对抗网络提高地震资料分辨率方法,具体的,该基于弱监督生成对抗网络提高地震资料分辨率的系统包括处理模块、划分模块、样本模块、参数模块、第一训练模块、第二训练模块、判别模块、更新模块以及提高模块。
其中,处理模块,对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;
划分模块,从处理模块归一化处理后的数据中划分一部分作为训练集;
样本模块,采用随机抽取的方式从划分模块划分的训练集中获得训练样本对;
参数模块,设置循环生成对抗网络模型的参数;
第一训练模块,将样本模块获得的训练样本对中的低分辨率地震数据送入参数模块设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);
第二训练模块,将第一训练模块前向生成器的高分辨结果G(x)送入参数模块设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;
判别模块,将第一训练模块得到的高分辨结果G(x)和样本模块训练样本对中的高分辨率标签数据共同送入参数模块设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;
更新模块,联合训练第一训练模块的前向生成器和第二训练模块的反向生成器,并与判别模块的判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;
提高模块,将低分辨率地震数据作为测试集送入更新模块训练好的前向生成器中进行测试,得到最终的高分辨结果。
本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于基于弱监督生成对抗网络提高地震资料分辨率方法的操作,包括:
对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;从归一化处理后的数据中划分一部分作为训练集;采用随机抽取的方式从划分的训练集中获得训练样本对;设置循环生成对抗网络模型的参数;将训练样本对中的低分辨率地震数据送入设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);将前向生成器的高分辨结果G(x)送入设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;将高分辨结果G(x)和训练样本对中的高分辨率标签数据共同送入设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;合训练前向生成器和反向生成器,并与判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;将低分辨率地震数据作为测试集送入训练好的前向生成器中进行测试,得到最终的高分辨结果。
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关基于弱监督生成对抗网络提高地震资料分辨率方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:
对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;从归一化处理后的数据中划分一部分作为训练集;采用随机抽取的方式从划分的训练集中获得训练样本对;设置循环生成对抗网络模型的参数;将训练样本对中的低分辨率地震数据送入设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);将前向生成器的高分辨结果G(x)送入设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;将高分辨结果G(x)和训练样本对中的高分辨率标签数据共同送入设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;合训练前向生成器和反向生成器,并与判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;将低分辨率地震数据作为测试集送入训练好的前向生成器中进行测试,得到最终的高分辨结果。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图5,图5为某一crossline剖面上的结果对比,其中(a)为原始低分辨率地震数据,(b)为传统方法处理后的结果,(c)为本发明处理后的结果。可以看出,在crossline剖面上,传统方法和本发明都很明显的提高了原始低分辨率地震数据的分辨率。对比图中椭圆所示区域,可以发现本文方法恢复出来的结果相比传统方法同相轴的连续性更好,且更加清晰光滑,而且本发明能够恢复出更多的有效信息;对比矩形框所示区域,可以发现本发明能够分离出传统方法难以分离的同相轴,且十分清晰。
请参阅图6,图6为某一inline剖面上的结果对比,其中(a)为原始低分辨率地震数据,(b)为传统方法处理后的结果,(c)为本发明处理后的结果。可以看出,在inline剖面上传统方法和本发明都很明显的提高了原始低分辨率地震数据的分辨率。对比图中椭圆所示区域,可以发现在本发明的结果中同相轴的连续性要比传统方法好很多,同相轴要更加光滑,延展走向也更加清晰,且能恢复出更多的有效信息;对比矩形框所示区域,可以发现对于传统方法同相轴难以分离的区域,本发明能够很好的分离,分辨率更高。
请参阅图7,图7为第1150ms的时间切片上的结果对比,其中(a)为原始低分辨率地震数据,(b)为传统方法处理后的结果,(c)为本发明处理后的结果。可以看出,在时间切片上,传统方法和本发明都很大程度上提高了原始地震数据的分辨率,两种方法的处理效果结果相当。对比矩形框所示区域可以发现,本发明恢复出来的结果要比传统方法恢复出来的结果能量更强,同相轴的延展走向更加清晰,结构性也更加明显。
请参阅图8,图8为多道平均振幅谱的对比,其中实线代表原始低分辨率地震数据,点划线代表传统方法处理后的结果,点线代表本发明处理后的结果。可以看出,传统方法和本发明都明显扩展了原始低分辨率地震数据的有效频宽,两种方法得到的振幅谱相似,扩展的范围和扩展的幅度也基本相同,且均未损失原始地震数据的低频信息,这说明基于弱监督学习来提高地震资料的分辨率是可行的。此外,本发明对高频部分的抬升要比传统方法更高,说明弱监督的学习效果在一定程度上优于传统方法。
综上所述,本发明一种基于弱监督生成对抗网络提高地震资料分辨率方法,结合了三维地震资料的特点,采用一种随机抽取的方式,高效地完成样本的获取。借助循环生成对抗网络和弱监督学习的优势,省去了获取配对标签数据的步骤,通过训练能够实现无配对的两块低、高分辨率地震数据之间的映射,完成地震资料提高分辨率的过程。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。
Claims (10)
1.基于弱监督生成对抗网络提高地震资料分辨率方法,其特征在于,包括以下步骤:
S1、对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;
S2、从步骤S1归一化处理后的数据中划分一部分作为训练集;
S3、采用随机抽取的方式从步骤S2划分的训练集中获得训练样本对;
S4、设置循环生成对抗网络模型的参数;
S5、将步骤S3获得的训练样本对中的低分辨率地震数据送入步骤S4设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);
S6、将步骤S5前向生成器的高分辨结果G(x)送入步骤S4设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;
S7、将步骤S5得到的高分辨结果G(x)和步骤S3训练样本对中的高分辨率标签数据共同送入步骤S4设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;
S8、联合训练步骤S5的前向生成器和步骤S6的反向生成器,并与步骤S7的判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;
S9、将低分辨率地震数据作为测试集送入步骤S8训练好的前向生成器中进行测试,得到最终的高分辨结果。
2.根据权利要求1所述的方法,其特征在于,步骤S4中,模型参数包括patch的大小,学习率初始值,学习率衰减方式,batch的大小,训练总轮数epoch,每轮训练总的样本个数,每隔多少轮重新抽取新的训练数据。
3.根据权利要求2所述的方法,其特征在于,patch的大小为96×96,初始化学习率为0.0002,学习率呈指数衰减,衰减率为0.5,衰减周期为100轮,batch的大小为16,训练总轮数epoch等于600,每轮训练总的样本数为800,每隔200轮在训练区域内重新抽取新的训练样本对。
4.根据权利要求1所述的方法,其特征在于,步骤S5中,前向生成器的损失函数LGen具体为:
LGen=w1LGAN+w2Lcyc+w3Lidt+w4LTV
其中,LGAN表示对抗损失,Lcyc表示循环一致性损失,Lidt表示恒等损失,LTV表示总变差损失,w1,w2,w3,w4表示各损失项的权重。
7.根据权利要求4所述的方法,其特征在于,恒等损失Lidt为:
Lidt=L1+LMS-SSIM
其中,L1为范数损失,LMS-SSIM为多尺度结构自相似损失。
10.一种基于弱监督生成对抗网络提高地震资料分辨率的系统,其特征在于,包括:
处理模块,对属于不同工区的低分辨率地震数据和高分辨率标签数据进行归一化处理;
划分模块,从处理模块归一化处理后的数据中划分一部分作为训练集;
样本模块,采用随机抽取的方式从划分模块划分的训练集中获得训练样本对;
参数模块,设置循环生成对抗网络模型的参数;
第一训练模块,将样本模块获得的训练样本对中的低分辨率地震数据送入参数模块设置的循环生成对抗网络模型的前向生成器中,得到高分辨结果G(x);
第二训练模块,将第一训练模块前向生成器的高分辨结果G(x)送入参数模块设置的循环生成对抗网络模型的反向生成器中,得到对应的低分辨率结果,用于计算前向生成器的损失;
判别模块,将第一训练模块得到的高分辨结果G(x)和样本模块训练样本对中的高分辨率标签数据共同送入参数模块设置的循环生成对抗网络模型的判别器中进行判别,确定判别器的损失函数;
更新模块,联合训练第一训练模块的前向生成器和第二训练模块的反向生成器,并与判别模块的判别器交替训练,反复迭代更新网络参数直到模型收敛,当前向生成器的输出被判别为真时训练完成;
提高模块,将低分辨率地震数据作为测试集送入更新模块训练好的前向生成器中进行测试,得到最终的高分辨结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110962067.3A CN113706380B (zh) | 2021-08-20 | 2021-08-20 | 基于弱监督生成对抗网络提高地震资料分辨率方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110962067.3A CN113706380B (zh) | 2021-08-20 | 2021-08-20 | 基于弱监督生成对抗网络提高地震资料分辨率方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113706380A true CN113706380A (zh) | 2021-11-26 |
CN113706380B CN113706380B (zh) | 2022-12-09 |
Family
ID=78653701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110962067.3A Active CN113706380B (zh) | 2021-08-20 | 2021-08-20 | 基于弱监督生成对抗网络提高地震资料分辨率方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113706380B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114236610A (zh) * | 2021-12-24 | 2022-03-25 | 西安交通大学 | 基于深度卷积网络先验的迭代地震资料解混方法及系统 |
CN115936990A (zh) * | 2022-12-07 | 2023-04-07 | 中国科学技术大学 | 地震资料多尺度超分辨率与去噪同步处理方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978762A (zh) * | 2019-02-27 | 2019-07-05 | 南京信息工程大学 | 一种基于条件生成对抗网络的超分辨率重建方法 |
CN110097103A (zh) * | 2019-04-22 | 2019-08-06 | 西安电子科技大学 | 基于生成对抗网络的半监督图像分类方法 |
-
2021
- 2021-08-20 CN CN202110962067.3A patent/CN113706380B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978762A (zh) * | 2019-02-27 | 2019-07-05 | 南京信息工程大学 | 一种基于条件生成对抗网络的超分辨率重建方法 |
CN110097103A (zh) * | 2019-04-22 | 2019-08-06 | 西安电子科技大学 | 基于生成对抗网络的半监督图像分类方法 |
Non-Patent Citations (1)
Title |
---|
耿艳磊等: "基于半监督生成对抗网络的遥感影像地物语义分割", 《测绘与空间地理信息》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114236610A (zh) * | 2021-12-24 | 2022-03-25 | 西安交通大学 | 基于深度卷积网络先验的迭代地震资料解混方法及系统 |
CN115936990A (zh) * | 2022-12-07 | 2023-04-07 | 中国科学技术大学 | 地震资料多尺度超分辨率与去噪同步处理方法及系统 |
CN115936990B (zh) * | 2022-12-07 | 2023-11-17 | 中国科学技术大学 | 地震资料多尺度超分辨率与去噪同步处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113706380B (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Roy et al. | A robust anomaly finder based on autoencoders | |
CN113706380B (zh) | 基于弱监督生成对抗网络提高地震资料分辨率方法及系统 | |
CN106709532A (zh) | 图像处理方法和装置 | |
CN110473142B (zh) | 基于深度学习的单幅图像超分辨率重建方法 | |
CN110163813A (zh) | 一种图像去雨方法、装置、可读存储介质及终端设备 | |
CN108108751A (zh) | 一种基于卷积多特征和深度随机森林的场景识别方法 | |
CN110490265B (zh) | 一种基于双路卷积和特征融合的图像隐写分析方法 | |
CN115409755B (zh) | 贴图处理方法和装置、存储介质及电子设备 | |
CN112150476A (zh) | 基于时空判别性特征学习的冠状动脉序列血管分割方法 | |
CN109087375A (zh) | 基于深度学习的图像空洞填充方法 | |
Zhao et al. | ADRN: Attention-based deep residual network for hyperspectral image denoising | |
CN109801232A (zh) | 一种基于深度学习的单幅图像去雾方法 | |
CN106991355A (zh) | 基于拓扑保持的解析型字典学习模型的人脸识别方法 | |
CN108122221A (zh) | 弥散加权成像图像中脑缺血区域的分割方法及装置 | |
Rivadeneira et al. | Thermal image super-resolution challenge-pbvs 2021 | |
CN108765540B (zh) | 一种基于图像与集成学习的重光照方法 | |
CN114913262B (zh) | 采样模式与重建算法联合优化的核磁共振成像方法及系统 | |
CN109949200A (zh) | 基于滤波器子集选择和cnn的隐写分析框架构建方法 | |
CN117635418B (zh) | 生成对抗网络的训练方法、双向图像风格转换方法和装置 | |
CN113643183B (zh) | 非匹配遥感图像弱监督学习超分辨率重建方法及系统 | |
Kaul et al. | Focusnet++: Attentive aggregated transformations for efficient and accurate medical image segmentation | |
Yang et al. | Research on digital camouflage pattern generation algorithm based on adversarial autoencoder network | |
CN112541566B (zh) | 一种基于重构损失的图像翻译方法 | |
CN112819731A (zh) | 灰度图像增强方法、装置、计算机设备及存储介质 | |
CN105389573B (zh) | 一种基于局部三值模式分层重构的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |