CN115688541A - 一种半监督深度类别自编码岩相识别方法及装置 - Google Patents
一种半监督深度类别自编码岩相识别方法及装置 Download PDFInfo
- Publication number
- CN115688541A CN115688541A CN202110871884.8A CN202110871884A CN115688541A CN 115688541 A CN115688541 A CN 115688541A CN 202110871884 A CN202110871884 A CN 202110871884A CN 115688541 A CN115688541 A CN 115688541A
- Authority
- CN
- China
- Prior art keywords
- lithofacies
- data
- attribute
- self
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提供了一种半监督深度类别自编码岩相识别方法、装置、存储介质及电子设备,涉及岩相识别技术领域,所述方法包括:获取待识别岩相的属性;将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。本发明提供的技术方案,能够使得岩相识别的结果更加准确。
Description
技术领域
本发明涉及岩相识别技术领域,特别地涉及一种半监督深度类别自编码岩相识别方法及装置。
背景技术
岩相识别在油气田、煤田勘探与开发、储层表征和建模及储层精细描述方面起着基础和关键支撑作用。
岩相,是指具有明显不同的岩石物理特征和地震特性的地震尺度沉积单元,可以是岩性的分类,也可以是岩性与孔隙流体集合的分类。例如,将含水砂岩和含油砂岩作为两种不同的岩相进行分类。岩相对岩石的弹性性质起着决定作用,因此岩相识别对于预测储层的孔隙度、渗透率等物性参数具有指导意义。错误的岩相判别结果可能导致储层物性预测的准确性降低,并增加预测结果的不确定性,因此岩相的准确判别和分析对于储层物性参数的预测具有关键作用,并且判别岩相在地层对比、沉积相分析等研究中是一项重要的内容。
传统的岩石识别方法主要通过岩石物理理论实现,通过模型驱动实现岩相识别。但岩石物理理论建立在诸多假设条件下,识别精度受到较大限制。深度学习可以从数据本身出发,挖掘数据中的特征,通过训练样本和标签已知的数据建立关系,从而以有监督的方式实现岩相识别。现有技术中,有监督深度学习仅利用岩相已知的测井数据(即有标签训练数据)做训练,且要求大量的训练样本,实际数据标签信息有限并依赖于处理人员的经验。通常,训练样本和标签主要来自于测井数据,但测井数据获取成本高,数量有限,较难满足上述要求。在训练样本和标签不足的情况下,岩相识别泛化性和精度受到制约。地震数据中包含诸多的岩相信息,通过无监督深度学习可以实现地震相划分,但其识别尺度较大,不适用于岩相分析和储层预测。并且无监督学习未能利用宝贵的岩相已知的井中标签数据。
可见,上述深度学习理论所分析的数据来源单一,要么来源于测井数据,要么来源于地震数据,无法多角度地提取数据特征。此外,现有的深度学习方法在训练过程中,仅依靠传统的基本正则化项,缺乏针对性。上述缺陷均导致目前基于深度学习的岩相识别所获得的结果并不准确。
发明内容
针对上述现有技术中的问题,本申请提出了一种半监督深度类别自编码岩相识别方法及装置,能够使得岩相识别的结果更加准确。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种半监督深度类别自编码岩相识别方法,所述方法包括:
获取待识别岩相的属性;
将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。
优选地,所述岩相识别模型采用以下方式建立:
建立自编码器;
基于预先获取的有标签训练数据,建立类别正则化项;其中,所述有标签训练数据为由岩相属性和岩相类别所组成的数据对集;
基于所述类别正则化项,约束所述自编码器的网络训练,获得已训练的自编码器;
基于所述已训练的自编码器,采用逐层贪婪学习算法形成深层自编码网络模型作为所述岩相识别模型。
优选地,所述自编码器包括依次连接的编码器和解码器,所述自编码器采用以下表达式表达:
优选地,所述类别正则化项采用以下表达式表达:
其中,Rc为所述类别正则化项;F为岩相类别的数量;f为岩相类别的代码;Nf为属于岩相类别f的样本数量;为针对岩相类别f的所述解码器的输出;为属于岩相类别f的数据特征均值;为属于岩相类别f的第n个样本的数值;为针对岩相类别f所预测出的数据特征均值。
优选地,基于所述测井数据和所述地震数据得到所述岩相属性数据,包括:
基于所述测井数据得到测井曲线;
基于所述测井曲线,计算获得第一岩相属性参数和与所述第一岩相属性参数对应的岩相类别作为有标签训练数据;
对所述地震数据进行叠前反演,获得第二岩相属性参数作为无标签训练数据;
基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据;
将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据。
进一步地,在所述基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据之后,所述方法还包括:
采用Backus等效平均法,对所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数的尺度进行匹配,获得匹配后的第二岩相属性参数和匹配后的第一岩相属性参数;
从所述匹配后的第二岩相属性参数和所述匹配后的第一岩相属性参数中选择对岩相识别的贡献率超过预设阈值的参数,获得优选参数;
所述将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据,替换为:
将所述优选参数作为所述岩相属性数据。
优选地,所述岩相识别模型包括自编码器,所述自编码器用于从所述岩相属性数据中提取数据特征;所述采用半监督学习算法对所述岩相识别模型进行训练,包括:
基于所述岩相属性数据和与所述岩相属性数据对应的岩相类别,采用半监督学习算法对所述岩相识别模型进行训练,且在训练过程中,采用梯度下降算法最小化损失函数,求解并优化所述损失函数的网格参数;
所述损失函数为:
其中,Θ为所述损失函数的网格参数,所述损失函数的网格参数为所述自编码器的网格参数;N为总样本数量;m为样本序号;x为所述岩相属性数据;为所述自编码器的输出;Rb和Rc为与所述损失函数的网格参数相关的约束项;λ1为约束项Rb的权重;λ2为约束项Rc的权重。
优选地,所述待识别岩相的属性包括以下项目中的一个或多个:纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量和拉梅常数。
第二方面,本发明实施例提供了一种半监督深度类别自编码岩相识别装置,所述装置包括:
岩相属性获取单元,用于获取待识别岩相的属性;
岩相属性输入单元,用于将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。
第三方面,本发明实施例提供了一种存储介质,所述存储介质上存储有程序代码,所述程序代码被处理器执行时,实现如上述实施例中任一项所述的半监督深度类别自编码岩相识别方法。
第四方面,本发明实施例提供了一种电子设备,所述电子设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如上述实施例中任一项所述的半监督深度类别自编码岩相识别方法。
本发明实施例提供的半监督深度类别自编码岩相识别方法、装置、存储介质及电子设备,首先获取待识别岩相的属性,然后将该待识别岩相的属性输入已训练的岩相识别模型,以使该已训练的岩相识别模型输出待识别岩相的类别。由于采用的岩相识别模型为自编码网络模型,并采用了半监督学习算法对该自编码网络模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据,即本发明的训练数据综合了测井数据和地震数据,避免了采用单一来源的数据来进行特征提取,因此,使得训练出的岩相识别模型能够多角度地识别岩相,从而使得岩相识别结果更加准确。此外,本发明专门建立了针对该岩相识别模型的类别正则化项,相较于现有技术中仅依靠传统的基本正则化项的方式,本发明提供的技术方案更进一步提高了岩相识别结果的准确性。
附图说明
通过结合附图阅读下文示例性实施例的详细描述可更好地理解本发明公开的范围。其中所包括的附图是:
图1为本发明实施例的方法流程图一;
图2为本发明实施例的方法流程图二;
图3a~图3d为本发明实施例中有标签测井训练数据(图6中的well1)的输入属性和对应的岩相识别结果的对比图;其中,图3a~图3c为有标签测井训练数据的输入属性,图3d为对应的岩相识别结果;
图4a~图4d为本发明实施例中待测试数据(图6中的well2)的输入属性和对应的岩相识别结果的对比图;其中,图4a~图4c为待测试数据的输入属性,图4d为对应的岩相识别结果;
图5a~图5c为本发明实施例中无标签地震训练数据的输入属性;
图6为本发明实施例中用于测试的地震数据叠加剖面;
图7为与图4a~图4d中的待测试数据对应的半监督深度类别自编码岩相识别结果;
图8为与图5a~图5c中的无标签地震训练数据的输入属性对应的半监督深度类别自编码岩相识别结果;
图9为本发明实施例的装置结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,以下将结合附图及实施例来详细说明本发明的实施方法,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
现有技术中的深度学习理论未充分利用测井、地震等多源数据共同挖掘数据中的岩相特征。理论上,半监督深度学习可同时挖掘有标签和无标签数据中的特征,但当前的无监督深度学习岩相识别主要利用岩相已知的测井数据和岩相未知的测井数据进行训练,未考虑从多源数据中挖掘特征。
概括来说,目前基于深度学习的岩相识别方法及研究存在以下问题:1、现有的有监督深度学习仅利用有限的测井数据进行训练,泛化性和识别精度有限;2、现有的无监督深度学习利用地震数据挖掘地震信息中的地震相特征,识别尺度大,分辨率低,不适用于储层预测和表征,阻碍了其实际应用;3、现有的深度学习岩相识别方法主要从单一信息源中挖掘数据特征,未考虑多源信息同时挖掘岩相特征;4、现有的深度学习岩相识别方法建立在传统的基本正则化项上,不完全面向岩相识别,针对性不足,精度有待进一步提高。
本发明的目的在于提供一种半监督深度类别自编码岩相识别方法,以解决测井数据和地震数据等多源数据的半监督训练模型建立,从多源数据中共同学习深层特征,更好地区分不同的岩相类别,构建适用于岩相识别的类别正则化项,有针对性地提高岩相识别的泛化性和精度。
根据本发明的实施例,提供了一种半监督深度类别自编码岩相识别方法,如图1所示,本实施例所述的方法包括:
步骤S101,获取待识别岩相的属性;
本实施例中,待识别岩相的属性包括纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量和拉梅常数等弹性参数中的一个或多个。
上述岩相的属性可从测井数据或地震数据中获取。在实际应用中,若进行的是地震岩相识别,则可以利用地震反演技术对地震数据进行叠前反演以获得岩相的属性;若进行的是井中岩相识别,则基于测井数据获得测井曲线,基于预先测井曲线计算获得岩相的属性。
步骤S102,将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。
本实施例中,所述岩相识别模型采用以下方式建立:
建立自编码器;
基于预先获取的有标签训练数据,建立类别正则化项;其中,所述有标签训练数据为由岩相属性和岩相类别所组成的数据对集;
基于所述类别正则化项,约束所述自编码器的网络训练,获得已训练的自编码器;
基于所述已训练的自编码器,采用逐层贪婪学习算法形成深层自编码网络模型作为所述岩相识别模型。
本实施例中,所述自编码器包括依次连接的编码器和解码器,所述自编码器采用以下表达式表达:
本实施例中,所述类别正则化项采用以下表达式表达:
其中,Rc为所述类别正则化项;F为岩相类别的数量;f为岩相类别的代码;Nf为属于岩相类别f的样本数量;为针对岩相类别f的所述解码器的输出;为属于岩相类别f的数据特征均值;为属于岩相类别f的第n个样本的数值;为针对岩相类别f所预测出的数据特征均值。
在上述类别正则化项中,右侧第一项约束表示最小化子编码器输出的数据特征与真实数据特征均值的距离,即使得属于同一岩相的每个样本接近实际的类内平均值,从而最大限度地减少从隐藏层挖掘特征的波动。右侧第二项约束则表示最小化预测岩相特征均值与实际样本距离,减小异常值对预测结果的影响。因此,本发明提出的类别正则化项不仅量化类内平均值与输出数据样本之间的误差,还惩罚原始数据与输出数据的平均值之间的误差。虽然训练数据包括地震数据和测井数据,但真实的样本特征均值仅通过标签已知的测井数据计算获得,可见,本发明有效地利用了数量较多的无标签样本和数量较少的有标签样本,能够解决常规有监督深度学习要求训练样本充足的问题。
本实施例中,对岩相识别模型的训练数据来源于两部分——测井数据和地震数据,避免了采用单一来源的数据来进行特征提取,且训练数据的获取方式与步骤S101所述的方式相同。具体地,基于所述测井数据和所述地震数据得到所述岩相属性数据,包括:
基于所述测井数据得到测井曲线;
基于所述测井曲线,计算获得第一岩相属性参数和与所述第一岩相属性参数对应的岩相类别作为有标签训练数据;
对所述地震数据进行叠前反演,获得第二岩相属性参数作为无标签训练数据;
基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据;
将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据。
其中,第一岩相属性参数和第二岩相属性参数即为步骤S101中所述的岩相的属性,包括纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量和拉梅常数等弹性参数中的一个或多个。
为了得到更加准确的训练数据,进而使得岩相识别模型的输出结果更加准确,在上述基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据之后,本实施例所述的方法还包括:
采用Backus等效平均法,对所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数的尺度进行匹配,获得匹配后的第二岩相属性参数和匹配后的第一岩相属性参数;
从所述匹配后的第二岩相属性参数和所述匹配后的第一岩相属性参数中选择对岩相识别的贡献率超过预设阈值的参数,获得优选参数;
则,本实施例中,所述将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据,替换为:
将所述优选参数作为所述岩相属性数据。
前期研究表明,网络权重的L2,1范数可以分析不同的岩相属性参数在训练过程中的贡献率,本实施例中,如下式所示,依据不同岩相属性参数的贡献率自适应优选出敏感属性参数作为后续深度学习的输入(即上述优选参数),过滤数据冗余,简化计算复杂性,提高计算效率:
O=||W||2,1
W=[w1,…,wm,…,wM]T
其中,O为对岩相识别的贡献率;W为输入的岩相属性参数的权重矩阵;wm为第m个岩相属性参数的权重。
本实施例根据不同岩相属性参数的贡献率,按照贡献率从大到小依次排列,自适应优选敏感属性作为优选参数,如下式所示:
其中,M为待优选的岩相属性参数的数量,m1为对岩相识别的贡献率超过预设阈值的参数的数量,截取前m1个岩相属性参数作为后续对岩相识别模型进行训练时岩相识别模型的输入。
本实施例中,所述岩相识别模型包括自编码器,所述自编码器用于从所述岩相属性数据中提取数据特征;所述采用半监督学习算法对所述岩相识别模型进行训练,包括:
基于所述岩相属性数据和与所述岩相属性数据对应的岩相类别,采用半监督学习算法对所述岩相识别模型进行训练,且在训练过程中,采用梯度下降算法最小化损失函数,求解并优化所述损失函数的网格参数;
本实施例中所述的损失函数为:
其中,Θ为所述损失函数的网格参数,所述损失函数的网格参数为所述自编码器的网格参数,即Θ=[We,Wd,be,bd];N为总样本数量;m为样本序号;x为所述岩相属性数据;为所述自编码器的输出;Rb和Rc为与所述损失函数的网格参数相关的约束项;λ1为约束项Rb的权重;λ2为约束项Rc的权重。
本实施例中,上述参数Rb采用以下表达式求取:
本实施例中,采用梯度下降算法最小化损失函数,联合岩相识别模型中的分类层,求解并优化所述损失函数的网格参数Θ,且Θ=[We,Wd,be,bd],其中,所采用的迭代更新公式为:
其中,σ′表示激活函数的导数,⊙表示点乘,I表示单位矩阵。
通过上述一系列求解,即可得到网络参数Θ,从而形成半监督深度类别自编码岩相识别模型,即上述已训练的岩相识别模型。
本发明实施例提供的半监督深度类别自编码岩相识别方法,首先获取待识别岩相的属性,然后将该待识别岩相的属性输入已训练的岩相识别模型,以使该已训练的岩相识别模型输出待识别岩相的类别。由于采用的岩相识别模型为自编码网络模型,并采用了半监督学习算法对该自编码网络模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据,即本发明的训练数据综合了测井数据和地震数据,避免了采用单一来源的数据来进行特征提取,因此,使得训练出的岩相识别模型能够多角度地识别岩相,从而使得岩相识别结果更加准确。此外,本发明专门建立了针对该岩相识别模型的类别正则化项,相较于现有技术中仅依靠传统的基本正则化项的方式,本发明提供的技术方案更进一步提高了岩相识别结果的准确性。
实施例二
本实施例以实际的岩相识别过程为例,进一步详细说明半监督深度类别自编码岩相识别方法,如图2所示,本实施例所述的方法包括:
步骤S201,获取训练数据;
由于弹性参数等性质能反映岩相的类别及物性参数差异,因此利用这些性质可识别不同的岩相类别。本实施例中,提取测井数据中的相关曲线,利用测井曲线解释岩相并利用测井曲线计算合成输入属性(具体包括纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量及拉梅常数等弹性参数)作为半监督深度类别自编码网络的深度学习有标签训练数据;通过地震数据叠前反演获得井间弹性参数信息,作为半监督深度类别自编码网络的无标签训练数据。
图3a~图3d为根据上述方法所获得的有标签测井训练数据的输入属性和对应的岩相识别结果的对比图;其中,图3a~图3c为有标签测井训练数据的输入属性,具体分别为纵波波速、横波波速和岩性密度,图3d为对应的岩相识别结果。在后续对岩相识别模型的训练中,图3a~图3c为岩相识别模型的输入数据,图3d为岩相识别模型的输出数据。其中,岩相代码1表示泥岩,岩相代码2表示含水砂岩,岩相代码3表示含油砂岩,本实施例中,含油砂岩为目标储层。
图5a~图5c为根据上述方法所获得的无标签地震训练数据的输入属性,该输入属性具体分别为纵波波速、横波波速和岩性密度。图5a~图5c的纵坐标为时间,横坐标为地震数据采集中的CDP(Common Depth Point)道集。
步骤S202,对训练数据进行数据预处理;
本实施例中,基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据;采用Backus等效平均法,对第二岩相属性参数和扩展后的有标签训练数据中的第一岩相属性参数的尺度进行匹配,获得匹配后的第二岩相属性参数和匹配后的第一岩相属性参数。
在实际应用中,以测井数据为依据,以由测井数据获得的第一岩相属性参数作为输入,以与第一岩相属性参数对应的岩相类别作为输出,联合岩石物理模型和生成对抗网络共同驱动扩展有标签训练样本集。进一步地,采用Backus等效平均法,对第一岩相属性参数的尺度进行粗化,以使其与第二岩相属性参数相匹配,防止由于观测尺度的不同而造成提取特征差异,从而影响后续岩相识别模型的预测结果。进行预处理后的训练数据为后续的半监督训练奠定了基础。
步骤S203,从预处理后的训练数据中获得优选参数;
本实施例中,从匹配后的第二岩相属性参数和匹配后的第一岩相属性参数中选择对岩相识别的贡献率超过预设阈值的参数,获得优选参数,将所述优选参数作为岩相属性数据,即作为对岩相识别模型的实际训练数据。
在实际应用中,联合岩石物理模型,分析不同的岩相属性参数在训练过程中的贡献率。前期研究表明,网络权重的L2,1范数可以分析不同的岩相属性参数在训练过程中的贡献率,本实施例中,如下述式1和式2所示,依据不同岩相属性参数的贡献率自适应优选出敏感属性参数作为后续深度学习的输入(即优选参数),过滤数据冗余,简化计算复杂性,提高计算效率:
O=||W||2,1 式(1)
W=[w1,…,wm,…,wM]T 式(2)
其中,O为对岩相识别的贡献率;W为输入的岩相属性参数的权重矩阵;wm为第m个岩相属性参数的权重。
本实施例根据不同岩相属性参数的贡献率,按照贡献率从大到小依次排列,自适应优选敏感属性作为优选参数,如下述式3所示:
其中,M为待优选的岩相属性参数的数量,m1为对岩相识别的贡献率超过预设阈值的参数的数量,截取前m1个岩相属性参数作为后续对岩相识别模型进行训练时岩相识别模型的输入。
步骤S204,建立自编码器和类别正则化项,基于所述类别正则化项,约束所述自编码器的网络训练,获得已训练的自编码器;
本实施例中,所述自编码器包括依次连接的编码器和解码器,所述自编码器采用以下表达式表达:
其中,x(n)为所述编码器的输入;X(n)为所述编码器的输出;为所述解码器的输出;σ为所述自编码器的激活函数;be、bd、We、Wd均为所述自编码器的网格参数,Θ=[We,Wd,be,bd];n为一个岩相类别中的样本序号。当与x(n)直接的误差较小时,表明该自编码器的隐层可以学习到有效的数据特征。
为了提高预测精度,并实现从多源数据中挖掘岩相特征,根据岩相已知的训练数据(即由测井数据所得到的有标签训练数据)求取不同类别岩相的特征均值及预测的特征均值,建立模型与数据双驱动的类别正则化项,如下述式5所示,约束自编码器的网络训练,形成深度类别自编码网络,从而最大限度地减少从隐藏层挖掘特征的波动且减小异常值对预测结果的影响:
其中,Rc为所述类别正则化项;F为岩相类别的数量;f为岩相类别的代码;Nf为属于岩相类别f的样本数量;为针对岩相类别f的所述解码器的输出;为属于岩相类别f的数据特征均值;为属于岩相类别f的第n个样本的数值;为针对岩相类别f所预测出的数据特征均值。
在上述类别正则化项中,右侧第一项约束表示最小化子编码器输出的数据特征与真实数据特征均值的距离,即使得属于同一岩相的每个样本接近实际的类内平均值,从而最大限度地减少从隐藏层挖掘特征的波动。右侧第二项约束则表示最小化预测岩相特征均值与实际样本距离,减小异常值对预测结果的影响。因此,本发明提出的类别正则化项不仅量化类内平均值与输出数据样本之间的误差,还惩罚原始数据与输出数据的平均值之间的误差。虽然训练数据包括地震数据和测井数据,但真实的样本特征均值仅通过标签已知的测井数据计算获得,可见,本发明有效地利用了数量较多的无标签样本和数量较少的有标签样本,能够解决常规有监督深度学习要求训练样本充足的问题。
步骤S205,基于已训练的自编码器,采用逐层贪婪学习算法形成深层自编码网络模型作为岩相识别模型;
步骤S206,采用所述优选参数和与其对应的岩相类别作为训练数据对岩相识别模型进行半监督训练,获得已训练的岩相识别模型;
在实际应用中,首先设置深层自编码网络结构、激活函数等参数,初始化网络参数,然后建立自编码器损失函数J(Θ),如下述式6所示:
其中,Θ为所述损失函数的网格参数,所述损失函数的网格参数为所述自编码器的网格参数,即Θ=[We,Wd,be,bd];N为总样本数量;m为样本序号;x为所述岩相属性数据;为所述自编码器的输出;Rb和Rc为与所述损失函数的网格参数相关的约束项;λ1为约束项Rb的权重;λ2为约束项Rc的权重。
本实施例中,上述参数Rb采用以下表达式求取:
本实施例中,将优选出的扩展的有标签训练数据和由地震数据获得的无标签训练数据输入到构建的岩相识别模型中进行半监督训练,在该训练过程中,采用梯度下降算法最小化上述损失函数,联合岩相识别模型中的分类层,求解并优化所述损失函数的网格参数Θ,且Θ=[We,Wd,be,bd],其中,所采用的迭代更新公式为:
其中,σ′表示激活函数的导数,⊙表示点乘,I表示单位矩阵。
通过上述一系列求解,即可得到网络参数Θ,从而形成半监督深度类别自编码岩相识别模型,即上述已训练的岩相识别模型。
需要说明的是,在上述训练过程中,训练数据中可划分出一部分作为待测试数据,用于对训练结果进行测试。图4a~图4d为本发明实施例中待测试数据的输入属性和对应的岩相识别结果的对比图,其中,图4a~图4c为待测试数据的输入属性,具体分别为纵波波速、横波波速和岩性密度,图4d为对应的岩相识别结果,将图4d所获得的岩相识别结果与真实的岩相类别进行对比,以测试已训练的岩相识别模型的准确度。在图4d中,岩相代码1表示泥岩,岩相代码2表示含水砂岩,岩相代码3表示含油砂岩,本实施例中,含油砂岩为目标储层。图7为与图4a~图4d中的待测试数据对应的半监督深度类别自编码岩相识别结果。
图6为本发明实施例中用于测试的地震数据叠加剖面,在图6中,黑色虚线表示测井数据的位置,黑色虚线方框表示已知的目标储层,即含油砂岩,用于检验相应的岩相识别结果。
图8为与图5a~图5c中的无标签地震训练数据的输入属性对应的半监督深度类别自编码岩相识别结果。
由上述结果可见,采用上述方式所获得的已训练的岩相识别模型,能够有效地对由测井数据所获得的岩相属性或由地震数据所获得的岩相属性进行识别/预测,识别结果的准确度较高。
步骤S207,获取待识别岩相的属性;
本实施例中,待识别岩相的属性包括纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量和拉梅常数等弹性参数中的一个或多个。
上述岩相的属性可从测井数据或地震数据中获取。在实际应用中,若进行的是地震岩相识别或识别无井区域的岩相,则可以利用地震反演技术对地震数据进行叠前反演以获得岩相的属性;若进行的是井中岩相识别,则基于测井数据获得测井曲线,基于预先测井曲线计算获得岩相的属性。
步骤S208,将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别。
上述步骤也可概括为:利用测井曲线解释岩相并计算输入属性作为有标签的训练数据→将地震反演获得的弹性参数作为无标签的训练数据→匹配测井数据和地震数据尺度→分析输入属性的贡献率,自适应优选出对岩相敏感的属性→分析有标签训练数据中不同岩相类别的特征,求取相应均值→建立类别约束正则化项→建立类别自编码网络,并通过逐层贪婪策略形成深度类别自编码网络→构建半监督深度类别自编码网络的损失函数→将有标签的训练数据和无标签的训练数据输入到半监督深度类别自编码网络中进行训练→求解损失函数的网格参数→联合分类层形成半监督深度类别自编码岩相识别模型→输入待识别岩相的属性到已训练的岩相识别模型中→输出岩相识别结果→为储层预测和储层物性参数预测提供依据。
本发明实施例提供的半监督深度类别自编码岩相识别方法,首先获取待识别岩相的属性,然后将该待识别岩相的属性输入已训练的岩相识别模型,以使该已训练的岩相识别模型输出待识别岩相的类别。由于采用的岩相识别模型为自编码网络模型,并采用了半监督学习算法对该自编码网络模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据,即本发明的训练数据综合了测井数据和地震数据,避免了采用单一来源的数据来进行特征提取,因此,使得训练出的岩相识别模型能够多角度地识别岩相,从而使得岩相识别结果更加准确。此外,本发明专门建立了针对该岩相识别模型的类别正则化项,相较于现有技术中仅依靠传统的基本正则化项的方式,本发明提供的技术方案更进一步提高了岩相识别结果的准确性。
实施例三
与上述方法实施例相对应地,本发明还提供一种半监督深度类别自编码岩相识别装置,如图9所示,所述装置包括:
岩相属性获取单元301,用于获取待识别岩相的属性;
岩相属性输入单元302,用于将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。
本实施例中,所述岩相识别模型采用以下方式建立:
建立自编码器;
基于预先获取的有标签训练数据,建立类别正则化项;其中,所述有标签训练数据为由岩相属性和岩相类别所组成的数据对集;
基于所述类别正则化项,约束所述自编码器的网络训练,获得已训练的自编码器;
基于所述已训练的自编码器,采用逐层贪婪学习算法形成深层自编码网络模型作为所述岩相识别模型。
本实施例中,所述自编码器包括依次连接的编码器和解码器,所述自编码器采用以下表达式表达:
本实施例中,所述类别正则化项采用以下表达式表达:
其中,Rc为所述类别正则化项;F为岩相类别的数量;f为岩相类别的代码;Nf为属于岩相类别f的样本数量;为针对岩相类别f的所述解码器的输出;为属于岩相类别f的数据特征均值;为属于岩相类别f的第n个样本的数值;为针对岩相类别f所预测出的数据特征均值。
本实施例中,基于所述测井数据和所述地震数据得到所述岩相属性数据,包括:
基于所述测井数据得到测井曲线;
基于所述测井曲线,计算获得第一岩相属性参数和与所述第一岩相属性参数对应的岩相类别作为有标签训练数据;
对所述地震数据进行叠前反演,获得第二岩相属性参数作为无标签训练数据;
基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据;
将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据。
本实施例中,在上述获得岩相属性数据的步骤中,在所述基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据之后,还包括:
采用Backus等效平均法,对所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数的尺度进行匹配,获得匹配后的第二岩相属性参数和匹配后的第一岩相属性参数;
从所述匹配后的第二岩相属性参数和所述匹配后的第一岩相属性参数中选择对岩相识别的贡献率超过预设阈值的参数,获得优选参数;
所述将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据,替换为:
将所述优选参数作为所述岩相属性数据。
本实施例中,所述岩相识别模型包括自编码器,所述自编码器用于从所述岩相属性数据中提取数据特征;所述采用半监督学习算法对所述岩相识别模型进行训练,包括:
基于所述岩相属性数据和与所述岩相属性数据对应的岩相类别,采用半监督学习算法对所述岩相识别模型进行训练,且在训练过程中,采用梯度下降算法最小化损失函数,求解并优化所述损失函数的网格参数;
所述损失函数为:
其中,Θ为所述损失函数的网格参数,所述损失函数的网格参数为所述自编码器的网格参数;N为总样本数量;m为样本序号;x为所述岩相属性数据;为所述自编码器的输出;Rb和Rc为与所述损失函数的网格参数相关的约束项;λ1为约束项Rb的权重;λ2为约束项Rc的权重。
本实施例中,所述待识别岩相的属性包括以下项目中的一个或多个:纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量和拉梅常数。
上述装置的工作原理、工作流程等涉及具体实施方式的内容可参见本发明所提供的半监督深度类别自编码岩相识别方法的具体实施方式,此处不再对相同的技术内容进行详细描述。
本发明实施例提供的半监督深度类别自编码岩相识别装置,首先获取待识别岩相的属性,然后将该待识别岩相的属性输入已训练的岩相识别模型,以使该已训练的岩相识别模型输出待识别岩相的类别。由于采用的岩相识别模型为自编码网络模型,并采用了半监督学习算法对该自编码网络模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据,即本发明的训练数据综合了测井数据和地震数据,避免了采用单一来源的数据来进行特征提取,因此,使得训练出的岩相识别模型能够多角度地识别岩相,从而使得岩相识别结果更加准确。此外,本发明专门建立了针对该岩相识别模型的类别正则化项,相较于现有技术中仅依靠传统的基本正则化项的方式,本发明提供的技术方案更进一步提高了岩相识别结果的准确性。
实施例四
根据本发明的实施例,还提供了一种存储介质,所述存储介质上存储有程序代码,所述程序代码被处理器执行时,实现如上述实施例任一项所述的半监督深度类别自编码岩相识别方法。
实施例五
根据本发明的实施例,还提供了一种电子设备,所述电子设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如上述实施例任一项所述的半监督深度类别自编码岩相识别方法。
本发明实施例提供的半监督深度类别自编码岩相识别方法、装置、存储介质及电子设备,首先获取待识别岩相的属性,然后将该待识别岩相的属性输入已训练的岩相识别模型,以使该已训练的岩相识别模型输出待识别岩相的类别。由于采用的岩相识别模型为自编码网络模型,并采用了半监督学习算法对该自编码网络模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据,即本发明的训练数据综合了测井数据和地震数据,避免了采用单一来源的数据来进行特征提取,因此,使得训练出的岩相识别模型能够多角度地识别岩相,从而使得岩相识别结果更加准确。此外,本发明专门建立了针对该岩相识别模型的类别正则化项,相较于现有技术中仅依靠传统的基本正则化项的方式,本发明提供的技术方案更进一步提高了岩相识别结果的准确性。
此外,本发明还利用测井曲线获取岩相解释结果和相应的输入属性,联合岩石物理模型和生成对抗网络共同驱动扩展训练样本集,作为有标签训练数据;通过地震反演方法获得无标签的地震训练数据;然后,经过联合岩石物理模型和深度学习,分析不同输入属性的权重和对识别结果的影响,优选出对岩相敏感的属性作为半监督深度类别自编码网络的输入;结合已知的岩相信息,建立类别约束正则化项,构建半监督深度类别自编码目标函数,并利用随机梯度下降法最小化损失函数,求解该损失函数的网格参数,获得深度类别自编码岩相识别模型;最后,输入待测数据的输入属性,实现深度类别自编码岩相的高精度识别。
本发明将半监督深度类别自编码学习引入到岩相识别中,同时利用测井和地震等多源数据半监督训练岩相识别模型,能够从多源数据中共同学习深层特征,更好地区分不同的岩相类别,同时提出了类别正则化项,有针对性地提高岩相识别的泛化性和精度。本发明由于采取以上技术方案,其具有以下优点:1、能够同时从多源数据中挖掘岩相特征,更好地区分不同岩相的特征差异,训练样本来源更加丰富,克服了常规无监督深度学习和有监督深度学习未充分利用多源数据的不足;2、本发明通过半监督学习,综合利用有标签的测井数据和无标签的地震数据进行训练,能解决常规有监督深度学习要求大量训练样本的问题,克服训练样本不足的情况下,常规有监督深度学习岩相识别泛化性低的不足;3、本发明通过半监督学习,利用测井数据和地震数据共同建立训练模型,能够克服常规无监督深度学习仅能获得大尺度地震相特征的不足,有效提升识别分辨率,能适用于储层预测和表征;4、本发明针对岩相识别,提出了适用于岩相识别的正则化约束项,进一步提高了岩相识别的精度,具有较强的鲁棒性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (11)
1.一种半监督深度类别自编码岩相识别方法,其特征在于,所述方法包括:
获取待识别岩相的属性;
将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。
2.根据权利要求1所述的半监督深度类别自编码岩相识别方法,其特征在于,所述岩相识别模型采用以下方式建立:
建立自编码器;
基于预先获取的有标签训练数据,建立类别正则化项;其中,所述有标签训练数据为由岩相属性和岩相类别所组成的数据对集;
基于所述类别正则化项,约束所述自编码器的网络训练,获得已训练的自编码器;
基于所述已训练的自编码器,采用逐层贪婪学习算法形成深层自编码网络模型作为所述岩相识别模型。
5.根据权利要求1所述的半监督深度类别自编码岩相识别方法,其特征在于,基于所述测井数据和所述地震数据得到所述岩相属性数据,包括:
基于所述测井数据得到测井曲线;
基于所述测井曲线,计算获得第一岩相属性参数和与所述第一岩相属性参数对应的岩相类别作为有标签训练数据;
对所述地震数据进行叠前反演,获得第二岩相属性参数作为无标签训练数据;
基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据;
将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据。
6.根据权利要求5所述的半监督深度类别自编码岩相识别方法,其特征在于,在所述基于预先建立的岩石物理模型,采用预先建立的生成对抗网络对所述有标签训练数据进行扩展,获得扩展后的有标签训练数据之后,所述方法还包括:
采用Backus等效平均法,对所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数的尺度进行匹配,获得匹配后的第二岩相属性参数和匹配后的第一岩相属性参数;
从所述匹配后的第二岩相属性参数和所述匹配后的第一岩相属性参数中选择对岩相识别的贡献率超过预设阈值的参数,获得优选参数;
所述将所述第二岩相属性参数和所述扩展后的有标签训练数据中的第一岩相属性参数作为所述岩相属性数据,替换为:
将所述优选参数作为所述岩相属性数据。
7.根据权利要求5或6所述的半监督深度类别自编码岩相识别方法,其特征在于,所述岩相识别模型包括自编码器,所述自编码器用于从所述岩相属性数据中提取数据特征;所述采用半监督学习算法对所述岩相识别模型进行训练,包括:
基于所述岩相属性数据和与所述岩相属性数据对应的岩相类别,采用半监督学习算法对所述岩相识别模型进行训练,且在训练过程中,采用梯度下降算法最小化损失函数,求解并优化所述损失函数的网格参数;
所述损失函数为:
8.根据权利要求1所述的半监督深度类别自编码岩相识别方法,其特征在于,所述待识别岩相的属性包括以下项目中的一个或多个:纵波波阻抗、横波波阻抗、弹性阻抗、纵波速度、横波速度、岩性密度、弹性模量和拉梅常数。
9.一种半监督深度类别自编码岩相识别装置,其特征在于,所述装置包括:
岩相属性获取单元,用于获取待识别岩相的属性;
岩相属性输入单元,用于将所述待识别岩相的属性输入已训练的岩相识别模型,以使所述已训练的岩相识别模型输出所述待识别岩相的类别;其中,所述岩相识别模型为自编码网络模型;采用半监督学习算法对所述岩相识别模型进行训练,且进行训练的输入数据为基于预先获取的测井数据和地震数据所得到的岩相属性数据。
10.一种存储介质,所述存储介质上存储有程序代码,其特征在于,所述程序代码被处理器执行时,实现如权利要求1至8中任一项所述的半监督深度类别自编码岩相识别方法。
11.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的程序代码,所述程序代码被所述处理器执行时,实现如权利要求1至8中任一项所述的半监督深度类别自编码岩相识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110871884.8A CN115688541A (zh) | 2021-07-30 | 2021-07-30 | 一种半监督深度类别自编码岩相识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110871884.8A CN115688541A (zh) | 2021-07-30 | 2021-07-30 | 一种半监督深度类别自编码岩相识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115688541A true CN115688541A (zh) | 2023-02-03 |
Family
ID=85058958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110871884.8A Pending CN115688541A (zh) | 2021-07-30 | 2021-07-30 | 一种半监督深度类别自编码岩相识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115688541A (zh) |
-
2021
- 2021-07-30 CN CN202110871884.8A patent/CN115688541A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mukerji et al. | Statistical rock physics: Combining rock physics, information theory, and geostatistics to reduce uncertainty in seismic reservoir characterization | |
CN111596978A (zh) | 用人工智能进行岩相分类的网页显示方法、模块和系统 | |
AU2023200300B2 (en) | Detecting fluid types using petrophysical inversion | |
Liu et al. | Deep classified autoencoder for lithofacies identification | |
CN105572747A (zh) | 一种识别高盐富钾区注水开发油藏碎屑岩岩性的方法 | |
Brown et al. | Machine learning on Crays to optimize petrophysical workflows in oil and gas exploration | |
Ye et al. | Drilling formation perception by supervised learning: Model evaluation and parameter analysis | |
Ali et al. | Data-driven lithofacies prediction in complex tight sandstone reservoirs: a supervised workflow integrating clustering and classification models | |
Alameedy et al. | Evaluating machine learning techniques for carbonate formation permeability prediction using well log data | |
Hou et al. | Data-driven optimization of brittleness index for hydraulic fracturing | |
CN117452518B (zh) | 基于多学科数据融合聚类算法的储层岩性预测方法 | |
Alameedy et al. | Predicting dynamic shear wave slowness from well logs using machine learning methods in the Mishrif Reservoir, Iraq | |
Song et al. | Reservoir lithology identification based on improved adversarial learning | |
Li et al. | Lithology classification based on set-valued identification method | |
Kurniadi et al. | Local mean imputation for handling missing value to provide more accurate facies classification | |
Dramsch | Machine learning in 4D seismic data analysis | |
Isam et al. | Unsupervised learning for oil drilling data classification | |
Emelyanova et al. | Detecting specific facies in well-log data sets using knowledge-driven hierarchical clustering | |
US20240011391A1 (en) | Method for determining an electrofacies interpretation of measurements carried out in a well | |
Dong et al. | Fracture identification in shale reservoir using a deep learning method: Chang 7 reservoirs, Triassic Yanchang formation | |
CN115688541A (zh) | 一种半监督深度类别自编码岩相识别方法及装置 | |
Lee et al. | Predicting S-wave sonic logs using machine learning with conventional logs for the Delaware Basin, Texas | |
Ahmadov et al. | Machine learning-driven rock classification to optimize completion and hydraulic fracturing design in the Tuscaloosa Marine Shale | |
García-Benítez et al. | Neural model to estimate permeability from well logs and core data | |
US20240192646A1 (en) | Methods for accelerated development planning optimization using machine learning for unconventional oil and gas resources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |