CN117169969A - 一种声波测井曲线预测的方法及装置 - Google Patents

一种声波测井曲线预测的方法及装置 Download PDF

Info

Publication number
CN117169969A
CN117169969A CN202310919119.8A CN202310919119A CN117169969A CN 117169969 A CN117169969 A CN 117169969A CN 202310919119 A CN202310919119 A CN 202310919119A CN 117169969 A CN117169969 A CN 117169969A
Authority
CN
China
Prior art keywords
data
layer
convolution
drilling
logging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310919119.8A
Other languages
English (en)
Inventor
周慧
李勇根
朱光有
曾同生
张天付
王珊
翟秀芬
刘静江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Petrochina Co Ltd
Original Assignee
Petrochina Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Petrochina Co Ltd filed Critical Petrochina Co Ltd
Priority to CN202310919119.8A priority Critical patent/CN117169969A/zh
Publication of CN117169969A publication Critical patent/CN117169969A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明涉及钻井和机器学习技术领域,特别涉及一种声波测井曲线预测的方法及装置。本发明将随钻工程、测井参数相结合,实现对随钻声波曲线的预测,由于随钻工程参数可以在钻头处测出,从而大大降低了随钻测井延时性,多通道神经网络也可以更快更高效的提高随钻声波测井曲线的预测精度和效率。

Description

一种声波测井曲线预测的方法及装置
技术领域
本发明涉及钻井和机器学习技术领域,特别涉及一种声波测井曲线预测的方法及装置。
背景技术
钻井是一个复杂的过程,涉及许多操作因素和高地质不确定性。在硬岩钻井和地质导向应用中,了解地质环境对于将井置于最佳位置至关重要。利用测量和随钻测井(MWD/LWD)数据进行高级分析,是提高对钻头周围岩石力学特性理解的一种方法。声波测井通常被用来估计岩石的力学性质,与地震资料相结合可以大大减少地质解释的模糊性,有助于构建更好的油气藏模型。然而,由于成本限制或井眼问题,声波测井数据可能在目标区域的某些井中缺失,因此必须从其他常见的测井类型中估算。
从根本上来说,用数学方法预测缺失测井的任务具有挑战性。使用在相同深度测量的其他测井类型来预测特定深度的缺失测井的能力,隐含地假设测量的测井包含足够的重建信息。缺失的测井类型和测量的测井类型之间的这种依赖关系可能不存在,部分或完全不存在。在实践中,通过设计测量的测井类型往往是互补的,以便为地球科学家提供地下的多面视图,或者有效地提供地下的更完整的特征描述。假设测井类型之间存在某种程度的依赖关系,如果仅基于局部分析,建立关系的尝试可能会受到限制。从根本上讲,考虑到地质深度的变化,基于本地数据的估计可能不可靠,因为没有足够的数据来充分表征潜在的本地数据分布。为了减轻这些限制,人们可以选择使用邻近井和测井段的数据,从而改善估计结果。
现有技术中,使用机器学习(ML)算法的数据驱动方法已成功应用于解决不同行业的不同应用,包括基因组学,化学、制造业、石油和天然气等。同样,由于模型能够模拟数据中的复杂非线性关系,已经引入并提出了几项研究,以推导用于声学测井预测的ML模型。相关文献中的方法主要采用测井数据作为输入参数,推导出能够估计合成声学测井曲线的ML模型。在实时钻井作业(实时场景)中,测井测量传感器位于钻头后数十英尺处,这可能会阻碍模型估计近钻头因子。
综上所述,现有技术中尚无随钻测井声波曲线的预测方案。
发明内容
针对上述问题,本发明提供一种声波测井曲线预测的方法及装置,通过机器学习算法处理优选出的测井、钻井数据,实现了对随钻测井声波曲线的预测。
第一方面,本发明提供了一种声波测井曲线预测的方法,所述方法包括:
对随钻测井数据进行预处理,并进行数据分组和数据降维,得到输入数据;
计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征;
以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度学习网络的训练,生成随钻测井缺失曲线。
进一步的,所述对随钻测井数据进行预处理,包括:将随钻测井数据异常值去除和归一化。
进一步的,所述异常值去除,包括:
采用孤立森林算法剔除异常值。
进一步的,所述采用孤立森林算法剔除异常值,具体包括:
X={x1,…,xn}为随钻测井数据的数据集,从X中随机抽取/>个样本点构成X的子集X′放入根节点;
从若干个维度中随机指定一个维度q,在当前数据中随机产生一个切割点p,min(xij,j=q,xij∈X′)<p<max(xij,j=q,xij∈X′);维度数量根据数据分组确定,每个数据分组保留两个维度;
切割点p生成一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p的放入右子节点;
递归直至所有的叶子节点都只有一个样本点或者孤立树(iTree)已经达到指定的高度;
循环直至生成个孤立树(iTree);
对于每一个数据点xi,令其遍历每一颗孤立树(iTree),计算点xi在森林中的平均高度h(xi),对所有点的平均高度做归一化处理;异常值分数的计算公式如下所示:
其中,表示数据点平均高度,/>表示异常值分数,/>表示/>个数据点所构建的二叉树路径长度的平均值,E(*)表示期望;
其中,H(i)表示调和数,通过ln(i)+0.5772156649估算,0.5772156649为欧拉常数;
选择阈值s,当将xi剔除;得到剔除异常值后的数据集为m个数据点,X={x1,…,xm}。
进一步的,所述归一化,包括:根据数据中的最大值Xmax、最小值Xmin和原始值X,计算归一化值Xnorm
进一步的,所述数据分组,包括:
基于数据类型进行分组和信息融合,分为:岩性组:NEU、PEF、GR;电性组:RD、RS、COND;孔隙组:CAL、CNL、DEN;钻井组:钻速、转速、钻压;录井组:C1C2、MDIA、FPPG。
进一步的,所述数据降维,包括:
采用t-SNE对数据进行非线性降维,选取前若干个维度作为t-SNE的降维结果。
进一步的,所述采用t-SNE对数据进行非线性降维,具体包括:
定义一个包含m个数据点的集合X={x1,…,xm},任意两个点xi和xj,xj服从以xi为中心,方差为σj的高斯分布Pi,同样xi服从以xj为中心,方差为σj的高斯分别Pj;xi和xj相似的条件概率为:
式中:σi可根据用户指定的困惑度Perp,困惑度的定义为:其中,H(Pi)是概率分布Pi的香农信息熵,定义如下:
数据点xi与xj相似度在全部数据点中两两相似度的联合概率pij定义如下:
Y=[y1,y2,…,ym]是高维数据集X=[x1,x2,…,xm]的低维嵌入坐标;数据点xi与xj在低维空间中对应的点yi与yj的联合概率qij定义如下:
使用KL散度来度量低维空间概率分布Q和高维空间概率分布P之间的相似度:
获得最小KL散度,利用梯度下降法优化KL散度,具体表达式为
通过以上计算得出降维后的结果{y1,y2,…,ym}。
进一步的,所述计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征,包括:
以K个数据点为一个步长,利用傅里叶变换计算每一段测井曲线的K×K的时频谱;以K个融合曲线的时频谱为输入层,输入的单元为K×K×K的数据体,利用多通道卷积神经网络提取数据特征。
进一步的,所述傅里叶变换计算每一段测井曲线的K×K的时频谱,具体包括:
对于周期函数f(x),根据傅里叶级数公式有:
其中是f(x)的基;
假设f(x)的周期T=2π,且不考虑基那么f(x)的基为:
{1,sin(x),sin(2x),sin(3x),sin(4x),...,sin(nx)}
对应频率图的频率为:
{0Hz,1Hz,2Hz,3Hz,4Hz,...,nHz}
如果加大f(x)的周期,使得T=4π,且不考虑基那么f(x)的基为:
{1,sin(0.5x),sin(x),sin(1.5x),sin(2x),...,sin(nx)}
对应频率图的频率为:
{0Hz,0.5Hz,1Hz,1.5Hz,2Hz,...,0.5nHz}
进一步的,所述多通道卷积神经网络包含若干个卷积层,若干个池化层和一个全连接层,决策器由Softmax换位朴素贝叶斯。
进一步的,所述多通道卷积神经网络包含若干个卷积层和若干个池化层,具体包括:
多通道卷积神经网络包含六个卷积层C1...C6和六个池化层P1...P6;
C1层包括8个3*3的卷积核与输入图像进行卷积,得到8个特征图,大小为190*190,后由池化层P1对卷积层C1以2*2的单元进行池化操作,P1层由8个95*95的特征图构成;再以16个8*8的卷积核对P1进行卷积,得到卷积层C2,其由16个88*88大小的特征图组成,再以2*2的单元对C2进行池化操作,得到池化层P2,其由16个44*44大小的特征图组成;
C3层包括8个7*7的卷积核与输入图像进行卷积,得到8个特征图,大小为186*186,后由池化层P3对卷积层C3以2*2的单元进行池化操作,P3层由8个93*93的特征图构成;再以16个12*12的卷积核对P3进行卷积,得到卷积层C4,其由16个82*82大小的特征图组成,再以2*2的单元对C4进行池化操作,得到池化层P4,其由16个41*41大小的特征图组成;
C5层包括8个11*11的卷积核与输入图像进行卷积,得到8个特征图,大小为182*182,后由池化层P5对卷积层C5以2*2的单元进行池化操作,P5层由8个91*91的特征图构成;再以16个16*16的卷积核对P5进行卷积,得到卷积层C5,其由16个76*76大小的特征图组成,再以2*2的单元对C6进行池化操作,得到池化层P6,其由16个38*38大小的特征图组成。
进一步的,所述深度学习网络,采用平均绝对百分比误差MAPE和均方根误差RMSE两个统计性能指标对模型进行评价,
式中,N为观测次数,ym测量数据,yp为预测数据,为预测数据的平均值。
进一步的,所述进行深度学习网络的训练,生成随钻测井缺失曲线,包括:
深度学习网络采用BRNN,由若干个前向和若干个后向的卷积stm块组成,并与若干层FCNN级联;
BRNN中的块分别有M、2M和4M个神经元,BRNN在每个正反方向生成4M个包含时空信息的特征图;取前进方向和后退方向空间轴上的中间值,将它们串联在一起,得到8M个特征图;每个特征图都是一个1D序列;它们分别被送入FCNN的4层中;
添加一个dropout层在BRNN和FCNN之间随机保留若干数量的神经元,以量化模型的不确定性;使用Adam优化,设定学习率以最小化预测测井和目标测井之间的均方误差。
第二方面,本发明提供了一种声波测井曲线预测的装置,包括:依次连接的预处理单元、特征提取单元和曲线生成单元;
预处理单元,用于对随钻测井数据进行预处理,并进行数据分组和数据降维,得到输入数据;
特征提取单元,用于计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征;
曲线生成单元,用于以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度学习网络的训练,生成随钻测井缺失曲线。
第三方面,本发明提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
存储器,存储有计算机程序;
处理器,用于执行存储器上所存储的计算机程序时,实现上述的声波测井曲线预测的方法。
第四方面,本发明提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的声波测井曲线预测的方法。
本发明至少具备以下有益效果:
本发明将随钻工程、测井参数相结合,实现对随钻声波曲线的预测,由于随钻工程参数可以在钻头处测出,从而大大降低了随钻测井延时性,多通道神经网络也可以更快更高效的提高随钻声波测井曲线的预测精度和效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例曲线预测方法流程图;
图2为本发明实施例曲线预测装置结构示意图;
图3为电子设备结构示意图;
图4为本实施例多通道卷积神经网络示意图;
图5为本发明实施例深度学习网络示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种声波测井曲线预测的方法,所述方法包括:
S101,对随钻测井数据进行预处理,并进行数据分组和数据降维,得到输入数据;
S102,计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征;
S103,以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度学习网络的训练,生成随钻测井缺失曲线。
本实施例中,所述对随钻测井数据进行预处理,包括:将随钻测井数据异常值去除和归一化。
本实施例中,所述异常值去除,包括:
采用孤立森林算法剔除异常值。
本实施例中,所述采用孤立森林算法剔除异常值,具体包括:
第1步:X={x1,…,xn}为随钻测井数据的数据集,从X中随机抽取/>个样本点构成X的子集X′放入根节点;
第2步:从10个维度中随机指定一个维度q,在当前数据中随机产生一个切割点p,min(xij,j=q,xij∈X′)<p<max(xij,j=q,xij∈X′);
第3步:此切割点p生成了一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p的放入右子节点;
第4步:递归第2步和第3步,直至所有的叶子节点都只有一个样本点或者孤立树(iTree)已经达到指定的高度;
第5步:循环第1步至第4步,直至生成个孤立树(iTree);
第6步:对于每一个数据点xi,令其遍历每一颗孤立树(iTree),计算点xi在森林中的平均高度h(xi),对所有点的平均高度做归一化处理;异常值分数的计算公式如下所示:
其中,
H(i)是调和数,通过ln(i)+0.5772156649来估算;分值越小表示数据越为异常。
第7步:选择阈值s,当将xi剔除;s值选择使剔除后的剩余数据点个数约等于之前数据点个数的95%,得到剔除异常值后的数据集为m个数据点,X={x1,…,xm}。
具体实施时,随钻测井数据的数据集,根据各类测井、钻井曲线、录井曲线之间的的敏感程度,优选了敏感的常规测井数据和钻井数据、录井数据作为基础数据:NEU、PEF、GR、RD、RS、COND、CAL、CNL、DEN、钻速、转速、钻压、C1C2、MDIA、FPPG。
维度的选择,基于数据类型进行分组和信息融合,分为:第1组岩性组:NEU、PEF、GR;第2组电性组:RD、RS、COND;第3组孔隙组:CAL、CNL、DEN;第4组钻井组:钻速、转速、钻压;第5组录井组:C1C2、MDIA、FPPG。每组降维后保留两个参数,为10个维度。
本实施例中,所述归一化,包括:根据数据中的最大值Xmax、最小值Xmin和原始值X,计算归一化值Xnorm
本实施例中,所述数据分组,包括:
基于数据类型进行分组和信息融合,分为:第1组岩性组:NEU、PEF、GR;第2组电性组:RD、RS、COND;第3组孔隙组:CAL、CNL、DEN;第4组钻井组:钻速、转速、钻压;第5组录井组:C1C2、MDIA、FPPG。
本实施例中,所述数据降维,包括:
采用t-SNE对数据进行非线性降维,选取前两个维度作为t-SNE的降维结果。
本实施例中,所述采用t-SNE对数据进行非线性降维,具体包括:
第1步:构建高维空间中的概率分布
定义一个包含m个数据点的集合X={x1,…,xm},假设任意两个点xi和xj,xj服从以xi为中心,方差为σj的高斯分布Pi,同样xi服从以xj为中心,方差为σj的高斯分别Pj;xi和xj相似的条件概率为:
式中:σi可根据用户指定的困惑度Perp,困惑度的定义为:其中,H(Pi)是概率分布Pi的香农信息熵,定义如下:
数据点xi与xj相似度在全部数据点中两两相似度的联合概率pij定义如下:
第2步:构建低维空间中的概率分布
假设Y=[y1,y2,…,ym]是高维数据集X=[x1,x2,…,xm]的低维嵌入坐标;数据点xi与xj在低维空间中对应的点yi与yj的联合概率qij定义如下:
第3步:计算低维嵌入
使用KL散度来度量低维空间概率分布Q和高维空间概率分布P之间的相似度:
C值越小说明低维空间模拟点对高维空间的模拟的正确性越高,若C=0,说明二者概率分布相同;
获得最小KL散度,利用梯度下降法优化KL散度,具体表达式为
通过以上计算可以得出降维后的结果{y1,y2,…,ym}。
本实施例中,所述计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征,包括:
以10个数据点为一个步长,利用傅里叶变换计算每一段测井曲线的10×10的时频谱;以10个融合曲线的时频谱为输入层,输入的单元为10×10×10的数据体,利用多通道卷积神经网络提取数据特征。
本实施例中,所述傅里叶变换计算每一段测井曲线的10×10的时频谱,具体包括:
对于周期函数f(x),根据傅里叶级数公式有:
其中是f(x)的基;
假设f(x)的周期T=2π,且先不考虑基那么f(x)的基为:
{1,sin(x),sin(2x),sin(3x),sin(4x),...,sin(nx)}
对应频率图的频率为:
{0Hz,1Hz,2Hz,3Hz,4Hz,...,nHz}
如果加大f(x)的周期,使得T=4π,且先不考虑基那么f(x)的基为:
{1,sin(0.5x),sin(x),sin(1.5x),sin(2x),...,sin(nx)}
对应频率图的频率为:
{0Hz,0.5Hz,1Hz,1.5Hz,2Hz,...,0.5nHz}
本实施例中,所述多通道卷积神经网络包含六个卷积层,六个池化层和1个全连接层,决策器由Softmax换位朴素贝叶斯。
本实施例中,所述多通道卷积神经网络包含六个卷积层和六个池化层,具体包括:
多通道卷积神经网络包含六个卷积层C1...C6和六个池化层P1...P6;
C1层由8个3*3的卷积核与输入图像进行卷积,得到8个特征图,大小为190*190,后由池化层P1对卷积层C1以2*2的单元进行池化操作,P1层由8个95*95的特征图构成;再以16个8*8的卷积核对P1进行卷积,得到卷积层C2,其由16个88*88大小的特征图组成,再以2*2的单元对C2进行池化操作,得到池化层P2,其由16个44*44大小的特征图组成;
C3层由8个7*7的卷积核与输入图像进行卷积,得到8个特征图,大小为186*186,后由池化层P3对卷积层C3以2*2的单元进行池化操作,P3层由8个93*93的特征图构成;再以16个12*12的卷积核对P3进行卷积,得到卷积层C4,其由16个82*82大小的特征图组成,再以2*2的单元对C4进行池化操作,得到池化层P4,其由16个41*41大小的特征图组成;
C5层由8个11*11的卷积核与输入图像进行卷积,得到8个特征图,大小为182*182,后由池化层P5对卷积层C5以2*2的单元进行池化操作,P5层由8个91*91的特征图构成;再以16个16*16的卷积核对P5进行卷积,得到卷积层C5,其由16个76*76大小的特征图组成,再以2*2的单元对C6进行池化操作,得到池化层P6,其由16个38*38大小的特征图组成。
本实施例中,所述深度学习网络,采用平均绝对百分比误差MAPE和均方根误差RMSE两个统计性能指标对模型进行评价,
式中,N为观测次数,ym测量数据,yp为预测数据,和/>分别为实测数据和预测数据的平均值。
本实施例中,所述进行深度学习网络的训练,生成随钻测井缺失曲线,包括:
深度学习网络采用BRNN,由3个前向和3个后向的卷积stm块组成,并与4层FCNN级联;
BRNN中的块分别有16、32和64个神经元,BRNN在每个正反方向生成64个包含时空信息的特征图;取前进方向和后退方向空间轴上的中间值,将它们串联在一起,得到128个特征图;每个特征图都是一个1D序列;它们分别被送入1024、512、128和1个神经元的FCNN的4层中;
添加一个dropout层在BRNN和FCNN之间随机保留70%的神经元,以量化模型的不确定性;使用Adam优化,学习率为0.001,以最小化预测测井和目标测井之间的均方误差。
如图2所示,本发明提供了一种声波测井曲线预测的装置,包括:预处理单元201、特征提取单元202和曲线生成单元203;
预处理单元201,用于对随钻测井数据进行预处理,并进行数据分组和数据降维,得到输入数据;
特征提取单元202,用于计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征;
曲线生成单元203,用于以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度学习网络的训练,生成随钻测井缺失曲线。
如图3所示,本发明提供了一种电子设备,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301、通信接口302和存储器303通过通信总线304完成相互间的通信;
存储器303,存储有计算机程序;
处理器301,用于执行存储器303上所存储的计算机程序时,实现上述的声波测井曲线预测的方法。
本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的声波测井曲线预测的方法。
该计算机可读存储介质可以是上述实施例中描述的设备/装置中所包含的;也可以是单独存在,而未装配入该设备/装置中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
为使本领域的技术人员能更好的理解本发明,结合附图对本发明的原理阐述如下:
本发明利用地面钻井、测井、录井数据共同来预测声波测井。与现有技术不同,本发明进行了特征工程(从原始数据中获得额外的输入特征),并通过将预测的测井数据作为模型的输入来测试模型的性能。本发明开发了一组预测模型,其中模型来自测井数据以及它们与地面钻井数据的结合。这样的模型集合为用户提供了根据数据覆盖范围选择不同模型的灵活性。拥有准确预测声波测井的能力,可以更好地估计岩石的力学性质,特别是岩石强度,这最终降低了钻井时不同因素的不确定性。
第1步:随钻测井数据预处理
异常值去除和归一化
根据各类测井、钻井曲线、录井曲线之间的的敏感程度,优选了敏感的常规测井数据和钻井数据、录井数据作为基础数据:AC、CAL、CNL、NEU、PEF、RD、RS、COND、GR、DEN、钻速、转速、钻压、C1C2、MDIA、FPPG。本文预测的为AC曲线。
异常值剔除,应用孤立森林算法剔除异常值。
第1步:X={x1,…,xn}为随钻测井数据的数据集,从X中随机抽取/>个样本点构成X的子集X′放入根节点。
第2步:从10个维度中随机指定一个维度q,在当前数据中随机产生一个切割点p,min(xij,j=q,xij∈X′)<p<max(xij,j=q,xij∈X′)。每个数据分组保留两个维度。
第3步:此切割点p生成了一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p的放入右子节点。
第4步:递归第2步和第3步,直至所有的叶子节点都只有一个样本点或者孤立树(iTree)已经达到指定的高度。
第5步:循环第1步至第4步,直至生成个孤立树(iTree)。
第6步:对于每一个数据点xi,令其遍历每一颗孤立树(iTree),计算点xi在森林中的平均高度h(xi),对所有点的平均高度做归一化处理。异常值分数的计算公式如下所示:
其中,
H(i)是调和数,可以通过ln(i)+0.5772156649(欧拉常数)来估算。分值越小表示数据越为异常。
第7步:选择阈值的s,当将xi剔除。s值选择使剔除后的剩余数据点个数约等于之前数据点个数的95%,得到剔除异常值后的数据集为m个数据点,X={x1,…,xm}。
归一化,
数据分组与t-SNE降维
基础数据存在大量信息冗余,不利于进一步的特征提取,因此基于数据类型进行分组和信息融合。第1组(岩性组):NEU、PEF、GR;第2组(电性组):RD、RS、COND;第3组(孔隙组):CAL、CNL、DEN;第4组(钻井组):钻速、转速、钻压;第5组(录井组):C1C2、MDIA、FPPG。
非线性降维,应用t-SNE对数据进行非线性降维。地球物理数据与标志层为非线性映射,像PCA这种线性降维则无法不同类数据区分开,不利于后续的聚类。
第1步:构建高维空间中的概率分布
定义一个包含m个数据点的集合X={x1,…,xm},假设任意两个点xi和xj,xj服从以xi为中心,方差为σj的高斯分布Pi,同样xi服从以xj为中心,方差为σj的高斯分别Pj。这样xi和xj相似的条件概率为:
式中:σi可根据用户指定的困惑度Perp,困惑度的定义为:其中,H(Pi)是概率分布Pi的香农信息熵,定义如下:
数据点xi与xj相似度在全部数据点中两两相似度的联合概率pij定义如下:
第2步:构建低维空间中的概率分布
假设Y=[y1,y2,…,ym]是高维数据集X=[x1,x2,…,xm]的低维嵌入坐标。数据点xi与xj在低维空间中对应的点yi与yj的联合概率qij定义如下:
第3步:计算低维嵌入
使用KL散度来度量低维空间概率分布Q和高维空间概率分布P之间的相似度:
C值越小说明低维空间模拟点对高维空间的模拟的正确性越高,若C=0,说明二者概率分布相同。为了使模拟正确性最大,获得最小KL散度,利用梯度下降法优化KL散度,具体表达式为
通过以上计算可以得出降维后的结果{y1,y2,…,ym}。
选取前两个维度作为t-SNE的降维结果,这样数据由3维降至2维。
第2步:输入数据特征提取
根据各类测井、钻井曲线、录井曲线之间的的敏感程度,优选了敏感的常规测井数据和钻井数据、录井数据作为基础数据:NEU、PEF、GR、RD、RS、COND、CAL、CNL、DEN、钻速、转速、钻压、C1C2、MDIA、FPPG。
分段时频谱
以10个数据点为一个步长,利用傅里叶变换计算每一段测井曲线的10×10的时频谱。
对于周期函数f(x),根据傅里叶级数公式有:
其中是f(x)的基。
假设f(x)的周期T=2π,且先不考虑基那么f(x)的基为:
{1,sin(x),sin(2x),sin(3x),sin(4x),...,sin(nx)}
对应频率图的频率为:
{0Hz,1Hz,2Hz,3Hz,4Hz,...,nHz}
如果加大f(x)的周期,使得T=4π,且先不考虑基那么f(x)的基为:/>
{1,sin(0.5x),sin(x),sin(1.5x),sin(2x),...,sin(nx)}
对应频率图的频率为:
{0Hz,0.5Hz,1Hz,1.5Hz,2Hz,...,0.5nHz}
多通道卷积网络
以10个融合曲线的时频谱为输入层,输入的单元为10×10×10的数据体。
利用多通道卷积神经网络提取数据特征:
如图4所示,优化的神经网络包含6个卷积层,6个池化层(平均池化),1个全连接层,决策器由Softmax换位朴素贝叶斯。
C1层由8个3*3的卷积核与输入图像进行卷积,得到8个特征图,大小为190*190,后由池化层P1对卷积层C1以2*2的单元进行池化操作,P1层由8个95*95的特征图构成。再以16个8*8的卷积核对P1进行卷积,得到卷积层C2,其由16个88*88大小的特征图组成,再以2*2的单元对C2进行池化操作,得到池化层P2,其由16个44*44大小的特征图组成。
C3层由8个7*7的卷积核与输入图像进行卷积,得到8个特征图,大小为186*186,后由池化层P3对卷积层C3以2*2的单元进行池化操作,P3层由8个93*93的特征图构成。再以16个12*12的卷积核对P3进行卷积,得到卷积层C4,其由16个82*82大小的特征图组成,再以2*2的单元对C4进行池化操作,得到池化层P4,其由16个41*41大小的特征图组成。
C5层由8个11*11的卷积核与输入图像进行卷积,得到8个特征图,大小为182*182,后由池化层P5对卷积层C5以2*2的单元进行池化操作,P5层由8个91*91的特征图构成。再以16个16*16的卷积核对P5进行卷积,得到卷积层C5,其由16个76*76大小的特征图组成,再以2*2的单元对C6进行池化操作,得到池化层P6,其由16个38*38大小的特征图组成。
使用朴素贝叶斯替换Softmax作为决策器。Softmax分类器是卷积神经网络主要分类器,而Soft分类器对检验目标分类概率大于90%才算正确,并且损失函数会不断计算运行时间长,而朴素贝叶斯给定目标值时属性之间相互条件独立,使计算参数减少,节约内耗和时间;算法简单,快速,更有利于随钻特征提取。
第3步:深度学习曲线生成
构建新卷积网络
以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度信念网络的训练。具体输入数据:NEU、PEF、GR、RD、RS、COND、CAL、CNL、DEN、钻速、转速、钻压、C1C2、MDIA、FPPG。输出数据:AC。根据C1、C2、C3层的结构进行训练。
循环神经网络是一种内部自循环深度学习架构,用于处理序列数据的自然语言。循环神经网络在每个时间步的输出都受到当前步输入和前一步输入的影响。设x为输入序列,y为长度为T。x的输出序列x<t>和y<t>分别为输入序列和输出序列在t时刻的样本,a<t>为网络的激活输出。循环神经网络的前向传播为
2a+=g(Wyaa+b,),(1)
其中Waa,Wax,Wya,ba,by为可训练参数;g是一个激活,通常是双曲正切函数。双向循环神经网络(BRNNs)是一个无环图,循环层在时间上向前和向后,它使用了序列中较早步骤和较晚步骤的输入。网络在每个时间步的输出是通过激活输出~a来计算的和一个/>
/>
lstm是rnn的一种,它能更好地捕捉长期依赖关系,适用于长采样和高密度测井曲线。激活输出受到不同门的影响,这些门决定是否向细胞状态中删除或添加信息。从前一个时间步的激活输出和当前时间步的外部输入计算每个时间步的存储单元状态的候选值
更新和忘记门决定是否用候选对象更新单元格状态
式中s为sigmoid函数。a处的激活输出
时间步长使用输出门Go计算
为了考虑与沉积相相关的测井曲线的局部形状,用形状描述子表示每个时间点,编码点周围的局部形状信息,并应用卷积stm捕获时空相关性。ConvLSTM用卷积算子(*)替换了状态到状态和输入到状态转换中的点积,并通过其局部邻居的输入和过去状态来计算空间网格中某个单元的未来状态
形状描述符是一个以log为中心的2D窗口,它也由10个移位序列和1个样本向后移位和10个移位序列和1个样本向前移位组成。在原始测井的整个长度上滑动一个21个样本的卷积滤波器来捕获局部形状,并从21个移位序列中获得时间信息。
如图5所示,本发明提出的深度学习架构是一个BRNN,它由3个前向和3个后向的卷积stm块组成,并与4层FCNN级联。BRNN中的块分别有16、32和64个神经元。BRNN在每个正反方向生成64个包含时空信息的特征图。取前进方向和后退方向空间轴上的中间值,将它们串联在一起,得到128个特征图;每个特征图都是一个1D序列。它们分别被送入1024、512、128和1个神经元的FCNN的4层中。进一步添加了一个dropout层在BRNN和FCNN之间随机保留70%的神经元,以量化模型的不确定性。使用Adam优化,学习率为0.001,以最小化预测测井和目标测井之间的均方误差。
3.2缺失曲线模型训练及评价
采用平均绝对百分比误差(MAPE)和均方根误差(RMSE)两个统计性能指标对模型进行评价。平均误差(MAPE)和均方根误差(RMSE)的目的是通过比较模型输出和预测之间的误差来评估模型的性能,值越小表明性能越好。MAPE和RMSE的计算如下:
式中,N为观测次数,ym测量数据,yp为预测数据,为预测数据的平均值。
应用随钻测录数据,准确预测随钻声波测井,可以更好地估计岩石的力学性质,特别是岩石强度,这最终降低了钻井时不同因素的不确定性。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (17)

1.一种声波测井曲线预测的方法,其特征在于,所述方法包括:
对随钻测井数据进行预处理,并进行数据分组和数据降维,得到输入数据;
计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征;
以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度学习网络的训练,生成随钻测井缺失曲线。
2.根据权利要求1所述的一种声波测井曲线预测的方法,其特征在于,
所述对随钻测井数据进行预处理,包括:将随钻测井数据异常值去除和归一化。
3.根据权利要求2所述的一种声波测井曲线预测的方法,其特征在于,
所述异常值去除,包括:
采用孤立森林算法剔除异常值。
4.根据权利要求3所述的一种声波测井曲线预测的方法,其特征在于,
所述采用孤立森林算法剔除异常值,具体包括:
X={x1,…,xn}为随钻测井数据的数据集,从X中随机抽取/>个样本点构成X的子集X′放入根节点;
从若干个维度中随机指定一个维度q,在当前数据中随机产生一个切割点p,min(xij,j=q,xij∈X′)<p<max(xij,j=q,xij∈X′);维度数量根据数据分组确定,每个数据分组保留两个维度;
切割点p生成一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p的放入右子节点;
递归直至所有的叶子节点都只有一个样本点或者孤立树(iTree)已经达到指定的高度;
循环直至生成个孤立树(iTree);
对于每一个数据点xi,令其遍历每一颗孤立树(iTree),计算点xi在森林中的平均高度h(xi),对所有点的平均高度做归一化处理;异常值分数的计算公式如下所示:
其中,表示数据点平均高度,/>表示异常值分数,/>表示/>个数据点所构建的二叉树路径长度的平均值,E(*)表示期望;
其中,H(i)表示调和数,通过ln(i)+0.5772156649估算,0.5772156649为欧拉常数;
选择阈值s,当将xi剔除;得到剔除异常值后的数据集为m个数据点,X={x1,…,xm}。
5.根据权利要求2所述的一种声波测井曲线预测的方法,其特征在于,
所述归一化,包括:根据数据中的最大值Xmax、最小值Xmin和原始值X,计算归一化值Xnorm
6.根据权利要求1所述的一种声波测井曲线预测的方法,其特征在于,
所述数据分组,包括:
基于数据类型进行分组和信息融合,分为:岩性组:NEU、PEF、GR;电性组:RD、RS、COND;孔隙组:CAL、CNL、DEN;钻井组:钻速、转速、钻压;录井组:C1C2、MDIA、FPPG。
7.根据权利要求1所述的一种声波测井曲线预测的方法,其特征在于,
所述数据降维,包括:
采用t-SNE对数据进行非线性降维,选取前若干个维度作为t-SNE的降维结果。
8.根据权利要求7所述的一种声波测井曲线预测的方法,其特征在于,
所述采用t-SNE对数据进行非线性降维,具体包括:
定义一个包含m个数据点的集合X={x1,…,xm},任意两个点xi和xj,xj服从以xi为中心,方差为σj的高斯分布Pi,同样xi服从以xj为中心,方差为σj的高斯分别Pj;xi和xj相似的条件概率为:
式中:σi可根据用户指定的困惑度Perp,困惑度的定义为:其中,H(Pi)是概率分布Pi的香农信息熵,定义如下:
数据点xi与xj相似度在全部数据点中两两相似度的联合概率pij定义如下:
Y=[y1,y2,…,ym]是高维数据集X=[x1,x2,…,xm]的低维嵌入坐标;数据点xi与xj在低维空间中对应的点yi与yj的联合概率qij定义如下:
使用KL散度来度量低维空间概率分布Q和高维空间概率分布P之间的相似度:
获得最小KL散度,利用梯度下降法优化KL散度,具体表达式为
通过以上计算得出降维后的结果{y1,y2,…,ym}。
9.根据权利要求1所述的一种声波测井曲线预测的方法,其特征在于,
所述计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征,包括:
以K个数据点为一个步长,利用傅里叶变换计算每一段测井曲线的K×K的时频谱;以K个融合曲线的时频谱为输入层,输入的单元为K×K×K的数据体,利用多通道卷积神经网络提取数据特征。
10.根据权利要求9所述的一种声波测井曲线预测的方法,其特征在于,
所述傅里叶变换计算每一段测井曲线的K×K的时频谱,具体包括:
对于周期函数f(x),根据傅里叶级数公式有:
其中是f(x)的基;
假设f(x)的周期T=2π,且不考虑基那么f(x)的基为:
{1,sin(x),sin(2x),sin(3x),sin(4x),...,sin(nx)}
对应频率图的频率为:
{0Hz,1Hz,2Hz,3Hz,4Hz,...,nHz}
如果加大f(x)的周期,使得T=4π,且不考虑基那么f(x)的基为:
{1,sin(0.5x),sin(x),sin(1.5x),sin(2x),...,sin(nx)}
对应频率图的频率为:
{0Hz,0.5Hz,1Hz,1.5Hz,2Hz,...,0.5nHz}。
11.根据权利要求9所述的一种声波测井曲线预测的方法,其特征在于,
所述多通道卷积神经网络包含若干个卷积层,若干个池化层和一个全连接层,决策器由Softmax换位朴素贝叶斯。
12.根据权利要求11所述的一种声波测井曲线预测的方法,其特征在于,
所述多通道卷积神经网络包含若干个卷积层和若干个池化层,具体包括:
多通道卷积神经网络包含六个卷积层C1...C6和六个池化层P1...P6;
C1层包括8个3*3的卷积核与输入图像进行卷积,得到8个特征图,大小为190*190,后由池化层P1对卷积层C1以2*2的单元进行池化操作,P1层由8个95*95的特征图构成;再以16个8*8的卷积核对P1进行卷积,得到卷积层C2,其由16个88*88大小的特征图组成,再以2*2的单元对C2进行池化操作,得到池化层P2,其由16个44*44大小的特征图组成;
C3层包括8个7*7的卷积核与输入图像进行卷积,得到8个特征图,大小为186*186,后由池化层P3对卷积层C3以2*2的单元进行池化操作,P3层由8个93*93的特征图构成;再以16个12*12的卷积核对P3进行卷积,得到卷积层C4,其由16个82*82大小的特征图组成,再以2*2的单元对C4进行池化操作,得到池化层P4,其由16个41*41大小的特征图组成;
C5层包括8个11*11的卷积核与输入图像进行卷积,得到8个特征图,大小为182*182,后由池化层P5对卷积层C5以2*2的单元进行池化操作,P5层由8个91*91的特征图构成;再以16个16*16的卷积核对P5进行卷积,得到卷积层C5,其由16个76*76大小的特征图组成,再以2*2的单元对C6进行池化操作,得到池化层P6,其由16个38*38大小的特征图组成。
13.根据权利要求11所述的一种声波测井曲线预测的方法,其特征在于,
所述深度学习网络,采用平均绝对百分比误差MAPE和均方根误差RMSE两个统计性能指标对模型进行评价,
式中,N为观测次数,ym测量数据,yp为预测数据,为预测数据的平均值。
14.根据权利要求1-13中任意一项所述的一种声波测井曲线预测的方法,其特征在于,
所述进行深度学习网络的训练,生成随钻测井缺失曲线,包括:
深度学习网络采用BRNN,由若干个前向和若干个后向的卷积stm块组成,并与若干层FCNN级联;
BRNN中的块分别有M、2M和4M个神经元,BRNN在每个正反方向生成4M个包含时空信息的特征图;取前进方向和后退方向空间轴上的中间值,将它们串联在一起,得到8M个特征图;每个特征图都是一个1D序列;它们分别被送入FCNN的4层中;
添加一个dropout层在BRNN和FCNN之间随机保留若干数量的神经元,以量化模型的不确定性;使用Adam优化,设定学习率以最小化预测测井和目标测井之间的均方误差。
15.一种声波测井曲线预测的装置,其特征在于,包括:依次连接的预处理单元、特征提取单元和曲线生成单元;
预处理单元,用于对随钻测井数据进行预处理,并进行数据分组和数据降维,得到输入数据;
特征提取单元,用于计算输入数据的时频谱,将时频谱输入到多通道卷积神经网络提取数据特征;
曲线生成单元,用于以多通道卷积网络提取的数据特征和声波测井曲线作为输入,进行深度学习网络的训练,生成随钻测井缺失曲线。
16.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;
存储器,存储有计算机程序;
处理器,用于执行存储器上所存储的计算机程序时,实现权利要求1-14中任一项所述的声波测井曲线预测的方法。
17.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-14中任一项所述的声波测井曲线预测的方法。
CN202310919119.8A 2023-07-25 2023-07-25 一种声波测井曲线预测的方法及装置 Pending CN117169969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310919119.8A CN117169969A (zh) 2023-07-25 2023-07-25 一种声波测井曲线预测的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310919119.8A CN117169969A (zh) 2023-07-25 2023-07-25 一种声波测井曲线预测的方法及装置

Publications (1)

Publication Number Publication Date
CN117169969A true CN117169969A (zh) 2023-12-05

Family

ID=88936446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310919119.8A Pending CN117169969A (zh) 2023-07-25 2023-07-25 一种声波测井曲线预测的方法及装置

Country Status (1)

Country Link
CN (1) CN117169969A (zh)

Similar Documents

Publication Publication Date Title
CN109709603B (zh) 地震层位识别与追踪方法、系统
CN111784041B (zh) 一种基于图卷积神经网络的风电功率预测方法及系统
US7433851B2 (en) System and method for inferring geological classes
CN112083498B (zh) 一种基于深度神经网络的多波地震油气储层预测方法
CN112654764A (zh) 利用非监督机器学习声学数据来表征和评估井完整性的方法
CN110569901A (zh) 一种基于通道选择的对抗消除弱监督目标检测方法
CN111582610A (zh) 基于卷积神经网络对家庭能量分解的预测方法
CN114218292B (zh) 一种多元时间序列相似性检索方法
Helmy et al. Hybrid computational intelligence models for porosity and permeability prediction of petroleum reservoirs
CN116704137B (zh) 一种海上石油钻井平台点云深度学习逆向建模方法
CN113610945A (zh) 一种基于混合神经网络的地应力曲线预测方法
CN112307410A (zh) 基于船载ctd测量数据的海水温盐信息时序预测方法
CN116485029A (zh) 油田开发动态数据准确性检测方法、装置、设备及介质
CN113408699A (zh) 基于改进的径向基函数神经网络的岩性识别方法及系统
CN113902861A (zh) 一种基于机器学习的三维地质建模方法
CN115564155A (zh) 一种分散式风电机组功率预测方法及相关设备
KR102308752B1 (ko) 객체 추적 방법 및 장치
Li et al. Application of data driven optimization for change detection in synthetic aperture radar images
Li et al. Evolving a Bayesian network model with information flow for time series interpolation of multiple ocean variables
CN116364203A (zh) 一种基于深度学习的水质预测方法、系统和装置
CN117169969A (zh) 一种声波测井曲线预测的方法及装置
Gkillas et al. Resource efficient federated learning for deep anomaly detection in industrial IoT applications
CN117574269B (zh) 陆相页岩储层天然裂缝智能识别方法及系统
Jo et al. Generative geomodeling based on flow responses in latent space
CN117633658B (zh) 岩石储层岩性识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination