CN110852527B - 一种结合深度学习的储层物性参数预测方法 - Google Patents

一种结合深度学习的储层物性参数预测方法 Download PDF

Info

Publication number
CN110852527B
CN110852527B CN201911138179.6A CN201911138179A CN110852527B CN 110852527 B CN110852527 B CN 110852527B CN 201911138179 A CN201911138179 A CN 201911138179A CN 110852527 B CN110852527 B CN 110852527B
Authority
CN
China
Prior art keywords
component
physical property
prediction
input
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911138179.6A
Other languages
English (en)
Other versions
CN110852527A (zh
Inventor
王俊
曹俊兴
袁珊
尤加春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Univeristy of Technology
Original Assignee
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Univeristy of Technology filed Critical Chengdu Univeristy of Technology
Priority to CN201911138179.6A priority Critical patent/CN110852527B/zh
Publication of CN110852527A publication Critical patent/CN110852527A/zh
Application granted granted Critical
Publication of CN110852527B publication Critical patent/CN110852527B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Abstract

本发明公开一种结合深度学习的储层物性参数预测方法,步骤为:引入MIC定量测度物性参数与测井曲线的非线性相关性,选取对物性参数响应明显的测井曲线;引入CEEMDAN对物性参数数据序列分解,获得本征模态函数IMF分量和剩余RES分量,对物性参数数据序列平稳化处理;引入SE对各IMF分量和RES余量的复杂度评价,将熵值相近的分量序列重组得到新本征模态分量;对新本征模态分量数据归一化处理后划分为训练集和测试集;引入LSTM循环神经网络对重构的新分量建立预测模型,获得各新本征模态分量的预测值;将各新本征模态分量的预测值反归一化并进行叠加重构得到物性参数预测结果。本发明的方法减少了冗余信息与预测分量建模数,提高预测精度和预测速度。

Description

一种结合深度学习的储层物性参数预测方法
技术领域
本发明涉及一种结合深度学习的储层物性参数预测方法,属于深度学习方法和石油地球物理勘技术领域。
背景技术
孔隙度、渗透率是反映储层油气储集能力的重要参数,表征了不同地质时期的沉积特征。储层岩石渗透率和孔隙度分布的不均匀性直接影响油气分布、运移和开采。在油气勘探中,储层岩性参数是地质工作者估计储层含油气含量、确定井位的主要根据。开采井位确定的好坏直接影响着油气的开采层本。因此,预测岩石渗透率和孔隙度的分布是储层描述的重要内容,对油田勘探和开发具有重要的意义。
地球物理测井参数由深及浅反映了不同地质时期的声、放、电等沉积特征,由于储层分布的多相性和非均匀性,因而测井参数与孔渗饱参数之间有很强非线性映射关系,并具有时序性特征。因此无论是直接或间接的测量孔隙度和渗透率都是一个非常困难和代价昂贵的工作。孔隙度和渗透率与测井属性参数如声波时差、自然伽玛、岩石密度、电阻率、自然电位、中子密度等有关,但并非都存在着明确的一一对应关系,因此,在估计孔隙度和渗透率的过程中,很难用精确的算法来描述。
目前在油气田的勘探开发中储层参数(孔隙度、渗透率)的测定方法,分为直接和间接测定法。间接测定法中利用测井资料进行储层参数预测已成为不可或缺的方法之一,研究人员提出使用经验公式或物理模型推算储层参数,然而在许多情况下里通过经验公式来预测未知层段的储层参数有较大局限性,模型在构建时简化了地质条件与地层的真实情况。由于不同类型测井参数的响应不一,以及地震信息与测井参数的复杂非线性关联,应用传统的储层参数预测方法效果并不理想。
由于地层的沉积作用是时序渐变的,而孔隙度、渗透率是地层沉积特征的响应,具有一定的时序特征。面对复杂的非线性和动态关系,传统建模预测方法存在预测范围有限、预测精度不高、对样本数据拟合程度低等局限性,已难以满足日益精细化的储层描述需求。
综上所述,国内外已有大量对物性参数进行预测的研究,但是上述模型都未充分利用物性参数与测井曲线数据的时序性、非平稳性及强非线性特征,这对提高物性参数预测的精度及鲁棒性具有十分重要的意义。
近年来,深度学习的蓬勃发展,为研究者提供了解决这一问题的新方法。长短时记忆网络(long short-term memory,LSTM)是一种典型的深度学习算法,是对常规循环神经网络(RNN)的一种改进完善,其内部各隐藏层单元之间并不相互独立,各个隐藏层之间不仅相互联系,还与此隐藏层单元所接受时刻之前的时序输入有关,这个特性对于处理与时序相关的非线性数据具有独特的优势,符合地质学研究思想和实际地质分析经验。而且通过对网络循环体的精细设计,解决了常规RNN中的梯度消失等问题,是目前应用最成功的深度学习方法之一。
尽管在一定程度上,孔渗参数与所提供的所有样本都有着一定的相关关系,但测试数据中往往有多种从不同角度反应地层不同信息的参数。从实际角度出发,如果直接利用所有样本数据建立起测井曲线与孔隙度、渗透率值之间的映射关系模型,不但增加了模型的复杂度和算法在时间、空间上的浪费,也可能丢失部分有用信息,或包含一些无用的冗余信息,导致预测的准确性降低。因此,本发明提出利用最大信息系数定量测度物性参数与测井曲线之间的非线性相关性。
但由于实际井曲线序列数据具有随机性与波动性,仅用上述单一预测模型直接对物性参数序列进行预测难以得出最佳预测结果。目前流行的改进方法是通过对原始数据的分解,降低数据复杂度,自适应噪声的总体集合经验模态分解(CEEMDAN)本质上也属于经验模态分解(EMD),是对其改进后得到的一种变换形式,CEEMDAN方法克服了模态混叠效应,可精确地重构出原始信号,并获得了较好的模态分离谱,同时具有更高的分辨率与很强的非线性处理能力,能较好的运用于井曲线的数据处理。
发明内容
本发明解决技术问题:克服现有技术的不足,提出一种结合深度学习的储层物性参数预测方法,本发明创新性地将统计分析和深度学习的最新成果引入物性参数预测领域,建立了较为准确的MIC-CEEMDAN-SE-LSTM循环神经网络预测模型,弥补现有技术的不足,具有较强的泛化能力,实现较高的预测精度和预测速度。
本发明为实现上述的技术目的采用如下的技术方案。
本发明提供一种结合深度学习的储层物性参数预测方法,在建模的过程中,首先,通过最大信息系数(Maximal Information Coefficient,MIC)定量测度物性参数与测井曲线之间的非线性相关性,选取对物性参数响应明显的多条测井曲线;
其次,对物性参数数据序列进行CEEMDAN分解,获得相对平稳但具有不同特征的本征模态函数IMF分量和剩余RES分量,实现物性参数数据序列平稳化处理;
然后,通过复杂统计理论下的样本熵(sample entropy,SE)对各IMF分量和RES余量的复杂度进行评价分析,将熵值相近的分量序列重组得到新本征模态分量,从而有效降低原始非平稳序列对预测精度造成的影响并减小计算规模;
再者,对重构的新本征模态分量,进行数据归一化处理后划分为训练集和测试集;
对重构的新分量分别采用基于深度学习的长短时记忆(long short termmemory,LSTM)循环神经网络分别建立预测模型,获得各新本征模态分量的预测值;
最后将各新本征模态分量的预测值反归一化并进行叠加重构得到最终的物性参数预测结果。
进一步的,本发明的一种结合深度学习的储层物性参数预测方法,具体的,其步骤包括:
S1获得测井曲线并进行曲线进行异常值剔除。
具体的,所述的测井曲线包括:自然伽马、补偿中子、声波时差、密度、井径、井斜、泥质含量、地层真电阻率、冲洗带地层电阻率以及油田测井解释专家根据本工区实际情况计算得出的物性参数。
由于测井仪器、地层因素等影响,首先需要对井曲线进行异常值剔除,以减少后期其对储层参数预测结果的影响。
S2非线性相关性分析;
此步骤通过最大信息系数(MIC)定量测度物性参数与测井曲线之间的非线性相关性,选取对物性参数响应明显的多条测井曲线。最大信息系数(Maximal InformationCoefficient,MIC)是David N.Reshef等人提出的,用于在大数据集中找到潜在的相关变量对,是确定两个变量相关度的一种标准,具备广泛性和公平性,最大信息系数不仅可以对大量数据中变量间的线性和非线性关系进行度量,而且可以广泛地挖掘出变量间的非函数依赖关系。
具体的,此步骤的方法为,
S21对于给定的有序对(X,Y),其数据集为D,数据样本大小为n,分别将X,Y按x值和y值划分成x,y维,这种划分称为x×y网格划分,记为G。数据集D包含两个节点变量X,Y。X和Y的特征矩阵是一个无限矩阵,则定义信息系数公式为:
Figure BDA0002280124660000031
其中,I*(X,Y,D,i,j)=maxI(X,Y,D|G,i,j)是G被划分成i×j个网格中X,Y的最大互信息。
S22根据式(1),节点变量X,Y的最大信息系数定义为:
Figure BDA0002280124660000032
其中,B(n)=n0.6,i×j<B(n)表示网格G的划分维度的限制。
S23获得测度测度物性参数与测井曲线之间的非线性相关性的MIC,因MIC依赖于互信息,而由互信息的公式I(X,Y)=H(X)+H(Y)-H(X,Y)可知其依赖于熵
Figure BDA0002280124660000041
而熵H(X)依赖于变量X的分布,是对变量X不确定性的度量,与样本的数值大小无关,因此熵H(X)是稳健的,推理得到互信息I(X,Y)是稳健的,MIC也具有稳健性。
根据MIC的定义,MIC与相关系数相比它有以下两个优点;
a.MIC稳健,即MIC不受异常值的影响,然而相关系数易受异常值的影响;
b.MIC可以检测出相关系数无法识别的函数关系。
S3自适应噪声的完全集合经验模态分解
对物性参数数据序列进行CEEMDAN分解,获得相对平稳但具有不同特征的本征模态函数IMF分量和剩余RES分量,实现物性参数数据序列平稳化处理。
CEEMDAN是在集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)的基础上改进的。EEMD是一种噪声辅助数据处理方法,它的本质是在原始信号中加入高斯噪声的多次EMD,原始信号中加入白噪声后,利用白噪声频谱的均匀分布特性,消除原始信号中的间歇现象,从而有效地抑制模态混叠问题,可精确地重构出原始信号,并获得了较好的模态分离谱,同时具有更高的分辨率与很强的非线性处理能力,能较好的运用于物性参数数据序列的处理。
具体的,本步骤的方法为:
S31在原始信号x(t)中多次加入具有零均值,幅值标准差为常数的白噪声vi(t),即:
xi(t)=x(t)+vi(t) (3)
式中:xi(t)表示第i次加入高斯白噪声的信号。
S32对所得的含有白噪声的信号xi(t)分别进行EMD分解,得到各自的IMF分量记为Gij(t),得到的一个余量记为ui(t)。其中Gij(t)表示第i次加入白噪声后分解所得的第j个IMF。
S33将上述对应的IMF进行总体平均运算,得到EEMD分解后最终的IMF,即:
Figure BDA0002280124660000042
式中:Gj(t)表示对原始信号进行EEMD分解后所得到的第j个IMF。
S34在CEEMDAN算法中,设原始测井物性参数信号为y(t),ω(t)为不同幅值ε的高斯白噪声,Ei(·)表示对信号进行EMD分解后的第i个IMF分量,则CEEMDAN算法步骤如下:
S341根据EEMD中的方法分解信号y(t)+ε0ω(t),得到第一个IMF分量:
Figure BDA0002280124660000051
S342 k=1时,计算第一个唯一的余量:
r1(t)=y(t)-c1(t) (6)
S343分解信号r1(t)+ε1ω1i(t)](i=1,2,…,n),直到得出第一个EMD模态分量,第二个IMF分量的计算如下:
Figure BDA0002280124660000052
S344对于k=2,…,K,与S343的计算过程一样,计算第k个余量和第k+1个分量:
rk(t)=rk-1-ck(t) (8)
Figure BDA0002280124660000053
Figure BDA0002280124660000054
S345将k加1,执行S344,当余量信号不再可能被分解时,即余量的极值点不超过两个,停止分解最终的余量为:
Figure BDA0002280124660000055
式中:K为所有模态分量的数量,分解过程中n一般取102数量级,ε一般取10-2数量级。
因此原始孔隙度序列y(t)可被分解为:
Figure BDA0002280124660000056
通过以上算法实现过程可以看出CEEMDAN分解的过程是完整的,不仅可以在EEMD的基础上减少计算量,而且可以更精确地重构原始测井参数信号。
S4通过样本熵对各分量的复杂度进行评价分析;
通过复杂统计理论下的样本熵(SE)对各IMF分量和RES余量的复杂度进行评价分析,将熵值相近的分量序列重组得到新本征模态分量,有效降低了原始非平稳序列对预测精度造成的影响并减小计算规模。
样本熵由Richman提出,是一种新的用于衡量时间序列复杂性的方法。与常用的近似熵法相比,该方法具有不依赖数据长度、一致性高及对缺失数据不敏感的特点。对于给定的时间序列x(t),其样本熵的计算流程如下:具体包括以下步骤:
S41将x(t)组成m维矢量u(i)={x(i),x(i+1),…,x(i+m-1)},其中i=N-m+1,m为嵌入维数,通常m=1或2。
S42定义时间序列u(i)和u(j)对应元素偏差的最大值为它们之间的距离,记D[u(i),u(j)]。
D[u(i),u(j)]=max|u(i)-u(j)|,(i,j=1,2,…,N-m+1,且j≠i) (13)
S43计算平均模版匹配概率Bm(r)。即对每一个i值统计满足条件D[u(i),u(j)]<r的数目,并计算其与总数N-m+1的比值,记为
Figure BDA0002280124660000061
Figure BDA0002280124660000062
式中:l(·)为计数函数统计满足D[u(i),u(j)]<r条件的次数;r为相似容限,取值范围为r=0.1~0.25SD,SD为序列标准差。则平均模版匹配概率为:
Figure BDA0002280124660000063
S44更新嵌入维数m=m+1,重复步骤S41~S43可得:
Figure BDA0002280124660000064
S45理论上该时间序列的样本熵为:
Figure BDA0002280124660000065
实际应用中物性参数序列长度N通常为有限值,因此x(t)的样本熵估计值为:
SE(m,r,N)=-ln[Bm+1(r)/Bm(r)] (18)
由样本熵的计算式可知,样本熵值越低,时间序列自我相似性越高,产生新模式的概率越低,时间序列越稳定;反之,时间序列越复杂。
S46根据样本熵计算分析结果,将熵值相近的分量序列重组得到新本征模态分量。
S5对新本征模态分量进行数据归一化处理,构造预测模型的训练和测试数据集;
对重构的分量进行数据归一化处理并划分为训练和测试数据集的具体方法如下:
在进行模型预测时,当输入或输出向量的各个分量量纲不同或大小相差很大时,应对不同的分量在其取值范围内分别进行归一化处理。
S51本发明采用离差标准化方法进行归一化变换处理,进而将模型输入输出变换为[0,1]区间的值,具体归一化公式如下:
Figure BDA0002280124660000066
其中,y为模型的输入或输出分量,y*为经过归一化处理后的输入或输出分量,ymax和ymin分别为模型输入或输出量的最大值和最小值。
S52按照设定的比例将归一化的数据划分为训练集和测试集。
S6对新分量分别采用基于深度学习的长短时记忆循环神经网络分别建立预测模型,利用训练数据训练模型,获得各新本征模态分量的预测值;
LSTM网络由一系列递归连接的记忆区块的子网络构成,每个记忆区块中包含一个或多个记忆细胞和三个乘法单元:输入门(Input Gate)、输出门(Output Gate)和遗忘门(Forget Gate),可以对记忆细胞进行连续的写、读和重置操作,来决定应该忘记哪些来自前一时刻的信息以及当前时刻中的哪些信息应该被添加到输出。
S61构造基于深度学习的LSTM循环神经网络模型;
S62利用训练数据集训练LSTM循环神经网络模型,优化网络结构;
S63利用训练好的LSTM网络预测模型对各分量物性参数进行预测。
具体的,S61构造基于深度学习的LSTM循环神经网络模型如下:
在深度学习模型的训练过程中,网络架构的设计起着至关重要的作用,它决定了模型的好坏,直接影响数据的预测结果。
本实发明中使用TensorFlow框架来实现深度学习的快速原型,因为TensorFlow提供了多种网络框架以供用户选择,用户可以以现有的框架为基础,根据自己的需求设计新的网络原型;同时,构建各种网络时所需的代码比较少、设计速度快。
LSTM算法是一种特定形式的循环神经网络,网络的整体结构由输入层、隐状态层和输出层组成,输入层用于数据的输入,隐状态层对输入数据进行处理,由多个判断信息有用与否的LSTM单元组成,输出层输出预测数据,其中,LSTM单元主要由三个门构成,分别是遗忘门、输入门和输出门。
遗忘门:自循环的权重由遗忘门(forget gate)fi (t)控制,并通过sigmoid非线性激活函数将权重值设定在[0,1]:
Figure BDA0002280124660000071
其中,x(t)表示当前的输入,h(t)表示隐藏层状态,h(t)表示输出。bf,Uf,Wf分别表示偏置向量、输入权重值以及遗忘门的循环权重。
隐藏层状态:LSTM细胞内部状态以如下方式更新:
Figure BDA0002280124660000072
其中,b,U,W分别表示长短时网络细胞中的偏置值、输入权重以及遗忘门的循环权重。
输入门:输入门(input gate)
Figure BDA0002280124660000081
的更新表达式为:
Figure BDA0002280124660000082
输出门:LSTM细胞的输出
Figure BDA0002280124660000083
也可以由输出门(output gate)
Figure BDA0002280124660000084
关闭:
Figure BDA0002280124660000085
Figure BDA0002280124660000086
其中,bo,Uo,Wo分别是偏置、输入权重和遗忘门的循环权重。
S62利用训练数据集训练LSTM循环神经网络模型,优化网络结构步骤如下,
S621从左到右前向传播时按照前向计算方法计算LSTM细胞的输出值;
S622将模型输出值与实际值进行比较,反向计算每个LSTM细胞的误差项,包括按时序和网络层级两个反向传播方向;
S623根据相应的误差项,计算每个权重的梯度;
S624应用Adam优化算法更新权重,使预测结果向实际值靠近,最终得到满足要求的网络结构。
利用训练数据训练模型,优化网络参数,确定超参数:time_step为20;batch_size为100,input_dim为4,隐含层中LSTM层为2层,隐藏节点数为30,激活函数为Sigmoid函数。
S63利用训练好的LSTM网络预测模型对各分量物性参数进行预测,具体步骤如下:
利用训练好的模型对测试数据集对应的物性参数分量进行预测。
S7对各新本征模态分量的预测值反归一化并进行叠加,得到最终的物性参数预测结果;
将三个不同分量的预测值反归一化处理后进行重构叠加,得到目标对应目标物性参数的预测值。
作为一种优选的方案,本发明的一种深度学习的储层物性参数预测方法,还包括S7预测效果与误差分析步骤,具体步骤如下:
选用均方根误差(RMSE),平均绝对误差(MAE)、均方误差(MSE)和平均相对误差均值(MAPE)作为预测效果的评价指标。
Figure BDA0002280124660000087
Figure BDA0002280124660000091
Figure BDA0002280124660000092
其中,yi—预测值,
Figure BDA0002280124660000093
—实际值,N—样本总数。
RMSE、MAE、MAPE数值越小,模型预测结果与真实值偏差越小,结果越准确。
本发明与现有技术相比其具有如下显著优点。
1、采用最大信息系数定量测度物性参数与测井曲线之间的非线性相关性,优敏感属性,提取有用信息,能够降低计算复杂度以及算法在时间、空间上的浪费,提高模型预测准确度和预测效率。
2、采用CEEMDAN-SE对物性参数序列进行处理,实现物性参数数据序列平稳化处理,有效降低了原始非平稳序列对预测精度造成的影响并减小计算规模,并且基本保留的原始数据的所有内在信息,一定程度上实现了数据量与信息量的平衡。
3、本发明利用深度学习算法,与传统方法相比,使用深度学习的方法对物性参数进行预测,不仅节约了人力物力资源,且具有更好的学习和泛化能力。
4、采用基于LSTM神经网络的深度学习模型进行物性参数预测。LSTM相比简单的循环神经网络,更易于学习测井参数间长期的依赖,能够很好的解决非线性序列相关的预测问题,符合地质学研究思想和实际地质分析经验。通过多层的非线性转换,LSTM能够很好的适应复杂任务的建模,通过足够的样本数据的训练,该模型能挖掘出测井数据中的大量的有价值的信息。可以实现对测井数据的充分利用,极大的提高了预测效率和准确度,同时具有较高的泛化能力,具有较大的社会价值和现实意义。
5、采用本发明方法可以快速、精确、有效而且几乎无成本的预测对应的物性参数。
附图说明
图1为本发明一种结合深度学习的储层物性参数预测方法的结构框图;
图2为本发明涉及的LSTM循环神经网络结构图;
图3为本发明一种结合深度学习的储层物性参数预测方法的流程图;
图4为本发明涉及的MIC非线性相关性结果图;
图5为本发明涉及的各CEEMDAN分量SE计算结果图;
图6为本发明实施例经CEEMDAN-SE处理后的孔隙度各新本征模态分量;
图7为本发明实施例经CEEMDAN-SE处理后的渗透率各新本征模态分量;
图8为本发明实施例孔隙度各新本征模态分量预测结果图;
图9为本发明实施例渗透率各新本征模态分量预测结果图;
图10为本发明物性参数预测结果图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。在本发明的一种实施方式中描述的元素和特征可以与一个或更多个其它实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1和图3,本发明提供一种结合深度学习的储层物性参数预测方法,在建模的过程中,首先,通过最大信息系数(Maximal Information Coefficient,MIC)定量测度物性参数与测井曲线之间的非线性相关性,选取对物性参数响应明显的多条测井曲线;
其次,对物性参数数据序列进行CEEMDAN分解,获得相对平稳但具有不同特征的本征模态函数IMF分量和剩余RES分量,实现物性参数数据序列平稳化处理;
然后,通过复杂统计理论下的样本熵(sample entropy,SE)对各IMF分量和RES余量的复杂度进行评价分析,将熵值相近的分量序列重组得到新本征模态分量,从而有效降低原始非平稳序列对预测精度造成的影响并减小计算规模;
再者,对重构的新本征模态分量,进行数据归一化处理后划分为训练集和测试集;
对重构的新分量分别采用基于深度学习的长短时记忆(long short termmemory,LSTM)循环神经网络分别建立预测模型,获得各新本征模态分量的预测值;
最后将各新本征模态分量的预测值反归一化并进行叠加重构得到最终的物性参数预测结果。
请再参见图3,进一步的,本发明的一种结合深度学习的储层物性参数预测方法,具体的,其步骤包括:
S1获得测井曲线并进行曲线进行异常值剔除。
具体的,所述的测井曲线包括:自然伽马、补偿中子、声波时差、密度、井径、井斜、泥质含量、地层真电阻率、冲洗带地层电阻率以及相对应的油田测井解释专家根据本工区实际情况计算得出的物性参数。
由于测井仪器、地层因素等影响,首先需要对井曲线进行异常值剔除,以减少后期其对储层参数预测结果的影响。
S2非线性相关性分析;
此步骤通过最大信息系数(MIC)定量测度物性参数与测井曲线之间的非线性相关性,选取对物性参数响应明显的多条测井曲线。最大信息系数(Maximal InformationCoefficient,MIC)是David N.Reshef等人提出的,用于在大数据集中找到潜在的相关变量对,是确定两个变量相关度的一种标准,具备广泛性和公平性,最大信息系数不仅可以对大量数据中变量间的线性和非线性关系进行度量,而且可以广泛地挖掘出变量间的非函数依赖关系。
具体的,此步骤的方法为,
S21对于给定的有序对(X,Y),其数据集为D,数据样本大小为n,分别将X,Y按x值和y值划分成x,y维,这种划分称为x×y网格划分,记为G。数据集D包含两个节点变量X,Y。X和Y的特征矩阵是一个无限矩阵,则定义信息系数公式为:
Figure BDA0002280124660000111
其中,I*(X,Y,D,i,j)=maxI(X,Y,D|G,i,j)是G被划分成i×j个网格中X,Y的最大互信息。
S22根据式(1),节点变量X,Y的最大信息系数定义为:
Figure BDA0002280124660000112
其中,B(n)=n0.6,i×j<B(n)表示网格G的划分维度的限制。
S23获得测度测度物性参数与测井曲线之间的非线性相关性的MIC,因MIC依赖于互信息,而由互信息的公式I(X,Y)=H(X)+H(Y)-H(X,Y)可知其依赖于熵
Figure BDA0002280124660000113
而熵H(X)依赖于变量X的分布,是对变量X不确定性的度量,与样本的数值大小无关,因此熵H(X)是稳健的,推理得到互信息I(X,Y)是稳健的,MIC也具有稳健性。
根据MIC的定义,MIC与相关系数相比它有以下两个优点;
c.MIC稳健,即MIC不受异常值的影响,然而相关系数易受异常值的影响;
d.MIC可以检测出相关系数无法识别的函数关系。
S3自适应噪声的完全集合经验模态分解
对物性参数数据序列进行CEEMDAN分解,获得相对平稳但具有不同特征的本征模态函数IMF分量和剩余RES分量,实现物性参数数据序列平稳化处理。
CEEMDAN是在集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)的基础上改进的。EEMD是一种噪声辅助数据处理方法,它的本质是在原始信号中加入高斯噪声的多次EMD,原始信号中加入白噪声后,利用白噪声频谱的均匀分布特性,消除原始信号中的间歇现象,从而有效地抑制模态混叠问题,可精确地重构出原始信号,并获得了较好的模态分离谱,同时具有更高的分辨率与很强的非线性处理能力,能较好的运用于物性参数数据序列的处理。
具体的,本步骤的方法为:
S31在原始信号x(t)中多次加入具有零均值,幅值标准差为常数的白噪声vi(t),即:
xi(t)=x(t)+vi(t) (3)
式中:xi(t)表示第i次加入高斯白噪声的信号。
S32对所得的含有白噪声的信号xi(t)分别进行EMD分解,得到各自的IMF分量记为Gij(t),得到的一个余量记为ui(t)。其中Gij(t)表示第i次加入白噪声后分解所得的第j个IMF。
S33将上述对应的IMF进行总体平均运算,得到EEMD分解后最终的IMF,即:
Figure BDA0002280124660000121
式中:Gj(t)表示对原始信号进行EEMD分解后所得到的第j个IMF。
S34在CEEMDAN算法中,设原始测井物性参数信号为y(t),ω(t)为不同幅值ε的高斯白噪声,Ei(·)表示对信号进行EMD分解后的第i个IMF分量,则CEEMDAN算法步骤如下:
S341根据EEMD中的方法分解信号y(t)+ε0ω(t),得到第一个IMF分量:
Figure BDA0002280124660000122
S342 k=1时,计算第一个唯一的余量:
r1(t)=y(t)-c1(t) (6)
S343分解信号r1(t)+ε1ω1i(t)](i=1,2,…,n),直到得出第一个EMD模态分量,第二个IMF分量的计算如下:
Figure BDA0002280124660000123
S344对于k=2,…,K,与S343的计算过程一样,计算第k个余量和第k+1个分量:
rk(t)=rk-1-ck(t) (8)
Figure BDA0002280124660000131
Figure BDA0002280124660000132
S345将k加1,执行S344,当余量信号不再可能被分解时,即余量的极值点不超过两个,停止分解最终的余量为:
Figure BDA0002280124660000133
式中:K为所有模态分量的数量,分解过程中n一般取102数量级,ε一般取10-2数量级。
因此原始孔隙度序列y(t)可被分解为:
Figure BDA0002280124660000134
通过以上算法实现过程可以看出CEEMDAN分解的过程是完整的,不仅可以在EEMD的基础上减少计算量,而且可以更精确地重构原始测井参数信号。
S4通过样本熵对各分量的复杂度进行评价分析;
通过复杂统计理论下的样本熵(SE)对各IMF分量和RES余量的复杂度进行评价分析,将熵值相近的分量序列重组得到新本征模态分量,有效降低了原始非平稳序列对预测精度造成的影响并减小计算规模。
样本熵由Richman提出,是一种新的用于衡量时间序列复杂性的方法。与常用的近似熵法相比,该方法具有不依赖数据长度、一致性高及对缺失数据不敏感的特点。对于给定的时间序列x(t),其样本熵的计算流程如下:具体包括以下步骤:
S41将x(t)组成m维矢量u(i)={x(i),x(i+1),…,x(i+m-1)},其中i=N-m+1,m为嵌入维数,通常m=1或2。
S42定义时间序列u(i)和u(j)对应元素偏差的最大值为它们之间的距离,记D[u(i),u(j)]。
D[u(i),u(j)]=max|u(i)-u(j)|,(i,j=1,2,…,N-m+1,且j≠i) (13)
S43计算平均模版匹配概率Bm(r)。即对每一个i值统计满足条件D[u(i),u(j)]<r的数目,并计算其与总数N-m+1的比值,记为
Figure BDA0002280124660000135
Figure BDA0002280124660000136
式中:l(·)为计数函数统计满足D[u(i),u(j)]<r条件的次数;r为相似容限,取值范围为r=0.1~0.25SD,SD为序列标准差。则平均模版匹配概率为:
Figure BDA0002280124660000137
S44更新嵌入维数m=m+1,重复步骤S41~S43可得:
Figure BDA0002280124660000141
S45理论上该时间序列的样本熵为:
Figure BDA0002280124660000142
实际应用中物性参数序列长度N通常为有限值,因此x(t)的样本熵估计值为:
SE(m,r,N)=-ln[Bm+1(r)/Bm(r)] (18)
由样本熵的计算式可知,样本熵值越低,时间序列自我相似性越高,产生新模式的概率越低,时间序列越稳定;反之,时间序列越复杂。
S46根据样本熵计算分析结果,将熵值相近的分量序列重组得到新本征模态分量。
S5对新本征模态分量进行数据归一化处理,构造预测模型的训练和测试数据集;
对重构的分量进行数据归一化处理并(如4:1)划分为训练和测试数据集的具体方法如下:
在进行模型预测时,当输入或输出向量的各个分量量纲不同或大小相差很大时,应对不同的分量在其取值范围内分别进行归一化处理。
S51本发明采用离差标准化方法进行归一化变换处理,进而将模型输入输出变换为[0,1]区间的值,具体归一化公式如下:
Figure BDA0002280124660000143
其中,y为模型的输入或输出分量,y*为经过归一化处理后的输入或输出分量,ymax和ymin分别为模型输入或输出量的最大值和最小值。
S52按照设定的比例将归一化的数据划分为训练集和测试集。
一般的,训练集的数据量大于测试集的数据量。
S6对新分量采用基于深度学习的长短时记忆循环神经网络分别建立预测模型,利用训练数据训练模型,获得各新本征模态分量的预测值;
请参见图2,LSTM网络由一系列递归连接的记忆区块的子网络构成,每个记忆区块中包含一个或多个记忆细胞和三个乘法单元:输入门(Input Gate)、输出门(Output Gate)和遗忘门(Forget Gate),可以对记忆细胞进行连续的写、读和重置操作,来决定应该忘记哪些来自前一时刻的信息以及当前时刻中的哪些信息应该被添加到输出。
S61构造基于深度学习的LSTM循环神经网络模型;
S62利用训练数据集训练LSTM循环神经网络模型,优化网络结构;
S63利用训练好的LSTM网络预测模型对各分量物性参数进行预测。
具体的,S61构造基于深度学习的LSTM循环神经网络模型如下:
在深度学习模型的训练过程中,网络架构的设计起着至关重要的作用,它决定了模型的好坏,直接影响数据的预测结果。
本实发明中使用TensorFlow框架来实现深度学习的快速原型,因为TensorFlow提供了多种网络框架以供用户选择,用户可以以现有的框架为基础,根据自己的需求设计新的网络原型;同时,构建各种网络时所需的代码比较少、设计速度快。
LSTM算法是一种特定形式的循环神经网络,网络的整体结构由输入层、隐状态层和输出层组成,输入层用于数据的输入,隐状态层对输入数据进行处理,由多个判断信息有用与否的LSTM单元组成,输出层输出预测数据,其中,LSTM单元主要由三个门构成,分别是遗忘门、输入门和输出门。
遗忘门:自循环的权重由遗忘门(forget gate)fi (t)控制,并通过sigmoid非线性激活函数将权重值设定在[0,1]:
Figure BDA0002280124660000151
其中,x(t)表示当前的输入,h(t)表示隐藏层状态,h(t)表示输出。bf,Uf,Wf分别表示偏置向量、输入权重值以及遗忘门的循环权重。
隐藏层状态:LSTM细胞内部状态以如下方式更新:
Figure BDA0002280124660000152
其中,b,U,W分别表示长短时网络细胞中的偏置值、输入权重以及遗忘门的循环权重。
输入门:输入门(input gate)
Figure BDA0002280124660000153
的更新表达式为:
Figure BDA0002280124660000154
输出门:LSTM细胞的输出
Figure BDA0002280124660000155
也可以由输出门(output gate)
Figure BDA0002280124660000156
关闭:
Figure BDA0002280124660000157
Figure BDA0002280124660000158
其中,bo,Uo,Wo分别是偏置、输入权重和遗忘门的循环权重。
S62利用训练数据集训练LSTM循环神经网络模型,优化网络结构步骤如下,
S621从左到右前向传播时按照前向计算方法计算LSTM细胞的输出值;
S622将模型输出值与实际值进行比较,反向计算每个LSTM细胞的误差项,包括按时序和网络层级两个反向传播方向;
S623根据相应的误差项,计算每个权重的梯度;
S624应用Adam优化算法更新权重,使预测结果向实际值靠近,最终得到满足要求的网络结构。
利用训练数据训练模型,优化网络参数,确定超参数:time_step为20;batch_size为100,input_dim为4,隐含层中LSTM层为2层,隐藏节点数为30,激活函数为Sigmoid函数。
S63利用训练好的LSTM网络预测模型对各分量物性参数进行预测,具体步骤如下:
利用训练好的模型对测试数据集对应的物性参数分量进行预测。
S7对各新本征模态分量的预测值反归一化并进行叠加,得到最终的物性参数预测结果;
将三个不同分量的预测值反归一化处理后进行重构叠加,得到目标对应目标物性参数的预测值。
作为一种优选的方案,本发明的一种深度学习的储层物性参数预测方法,还包括S7预测效果与误差分析步骤,具体步骤如下:
选用均方根误差(RMSE),平均绝对误差(MAE)、均方误差(MSE)和平均相对误差均值(MAPE)作为预测效果的评价指标。
Figure BDA0002280124660000161
Figure BDA0002280124660000162
Figure BDA0002280124660000163
其中,yi—预测值,
Figure BDA0002280124660000164
—实际值,N—样本总数。
RMSE、MAE、MAPE数值越小,模型预测结果与真实值偏差越小,结果越准确。
下面结合具体的实施例对本发明的一种结合深度学习的储层物性参数预测方法的预测效果、精确度进行分析。
具体的,基于MIC-CEEMDAN-SE-LSTM循环神经网络组合模型的物性参数预测。
本实施例的原始数据来源于四川盆地中部某勘探区的实际测井数据,包括自然伽马、补偿中子、声波时差、密度、井径、井斜、泥质含量、地层真电阻率、冲洗带地层电阻率以及相对应物性参数孔隙度、渗透率。
对以上数据进行曲线异常值剔除。
通过MIC定量测度物性参数与测井曲线之间的非线性相关性,选取对物性参数响应明显的多条测井曲线。
具体的,通过MIC定量测度物性参数与测井曲线之间的非线性相关性,经计算得到的最大信息系数和Pearson相关系数汇总如图4所示。图4还给出了采用传统的Pearson相关性分析的结果。
由图4可以看出,传统的Pearson相关性分析时常会忽略变量之间的非线性相关性。例如在测井曲线与物性参数相关关系计算中,补偿中子、自然伽马与孔隙度的Pearson相关系数分别为0.01和0.13,表明补偿中子、自然伽马与物性参数之间的线性相关性较弱。但计算得到的最大信息系数较分别为0.40和0.41,说明虽然补偿中子、自然伽马与孔隙度的线性相关程度较低,但非线性相关程度较高,即测井曲线与孔隙度之间存在强非线性相关关系。由图4也可看出各测井曲线与渗透率的Pearson相关系数均较低,表明测井曲线与渗透率之间的线性相关性较弱,但自然伽马、补偿中子、泥质含量、地层真电阻率与渗透率的MIC相对较高,表明虽然自然伽马、补偿中子、泥质含量、地层真电阻率与渗透率的线性相关程度较低,但非线性相关程度较高。
故在综合分析最大信息系数和Pearson相关系数的基础上,本实施例中选择密度、泥质含量和补偿中子、自然伽马测井数据作为模型的输入变量预测对应的孔隙度,选择自然伽马、补偿中子、泥质含量、地层真电阻率测井数据作为模型的输入变量预测对应与渗透率。
对物性参数(孔隙度、渗透率)数据序列进行CEEMDAN分解,获得相对平稳但具有不同特征的本征模态函数IMF分量和剩余RES分量,然后,采用复杂系统理论的样本熵对每一个IMF分量和剩余RES分量的复杂度进行评价分析,各分量的样本熵值如图5所示。
从图5可看出部分相邻的IMF的熵值相差不大,为减少建模的计算规模,将熵值相近的分量序列重组得到新本征模态分量,新分量的组成成分如表1所示,孔隙度、渗透率经CEEMDAN-SE处理得到的新本征模态分量如图6、图7所示。
表1为各新本征模态分量的组成成分;
表1各IMF分量合并为新子序列的结果
Figure BDA0002280124660000171
Figure BDA0002280124660000181
将重构的新本征模态分量进行归一化处理并划分训练集和测试集,利用训练数据训练LSTM模型,然后利用训练好的模型对物性参数分量进行预测,各新本征模态分量预测值与真实值的拟合结果如图8、图9所示,最后将各新本征莫泰分量的预测值反归一化并进行叠加得到物性参数预测值。
最终物性参数孔隙度、渗透率的预测值与真实值的拟合结果如图10所示,物性参数预测值与真实值的均方根误差(RMSE)、均方误差(MSE)和平均绝对误差(MAE)如表2所示。
表2为预测值与真实值的RMSE、MSE和MAE;
表2为预测值与真实值的RMSE、MSE和MAE
Figure BDA0002280124660000182
从表2和图8、图9、图10可以看出,综合比较RMSE、MSE和MAE的结果可得出,基于MIC-CEEMDAN-SE-LSTM组合模型的物性参数预测结果具有良好的预测精度和较小的误差。本发明不仅能够较准确捕捉物性参数随测井曲线的变化,而且也能较快的预测到物性参数的整体变化趋势,提高模型的预测准确度。由此,说明本发明对于物性参数的预测具有较高的预测精度与稳定性,证明了本发明方法的有效性与先进性。
以上显示和描述描述了本发明专利的基本原理,主要特征和本发明专利的特点。本行业的技术人员应该了解,本发明专利不受上述实施例的限制,上述实施例和说明书中描述的只是本发明专利的原理,在不脱离本发明专利精神和范围的前提下,本发明专利还会有各种变化和改进,这些变化的改进都落入要求保护的本发明专利的范围内。

Claims (6)

1.一种结合深度学习的储层物性参数预测方法,其特征在于包括以下步骤:
S1获得测井曲线并对曲线进行异常值剔除;
S2通过最大信息系数定量测度物性参数与测井曲线之间的非线性相关性,选取对物性参数响应明显的多条测井曲线;
S3对物性参数序列进行基于自适应噪声的完全集合经验模态分解,获得相对平稳但具有不同特征的本征模态函数IMF分量和剩余RES分量,实现物性参数数据序列平稳化处理;
S4通过复杂统计理论下的样本熵对各IMF分量和RES余量的复杂度进行评价分析,将熵值相近的分量序列重组得到新本征模态分量;
S5对新本征模态分量进行数据归一化处理,构造预测模型的训练和测试数据集;
S6对新分量分别采用基于深度学习的长短时记忆循环神经网络分别建立预测模型,利用训练数据训练模型,获得各新本征模态分量的预测值;
S7对各新本征模态分量的预测值反归一化并进行叠加,得到最终的物性参数预测结果;
所述测井曲线包含自然伽马、补偿中子、声波时差、密度、井径、井斜、泥质含量、地层真电阻率、冲洗带地层电阻率以及油田测井解释专家根据本工区实际情况计算得出的物性参数;
其中,S3的具体步骤为:
S31在原始信号x(t)中多次加入具有均值为零,幅值标准差为常数的白噪声vi(t),即:
xi(t)=x(t)+vi(t)
式中:xi(t)表示第i次加入高斯白噪声的信号;
S32对所得的含有白噪声的信号xi(t)分别进行EMD分解,得到各自的IMF分量记为Gij(t),得到的一个余量记为ui(t),其中Gij(t)表示第i次加入白噪声后分解所得的第j个IMF;
S33将上述对应的IMF进行总体平均运算,得到EEMD分解后最终的IMF,即:
Figure FDA0003590356380000011
式中:Gj(t)表示对原始信号进行EEMD分解后所得到的第j个IMF;
S34在CEEMDAN算法中,设原始测井物性参数信号为y(t),ω(t)为不同幅值ε的高斯白噪声,Ei(·)表示对信号进行EMD分解后的第i个IMF分量,则CEEMDAN的算法步骤如下:
S341根据EEMD中的方法分解信号y(t)+ε0ω(t),得到第一个IMF分量:
Figure FDA0003590356380000012
S342 k=1时,计算第一个唯一的余量:
r1(t)=y(t)-c1(t)
S343分解信号r1(t)+ε1ω1i(t)](i=1,2,…,n),直到得出第一个EMD模态分量,第二个IMF分量的计算如下:
Figure FDA0003590356380000021
S344对于k=1,2,…,K,与S343的计算过程一样,计算第k个余量和第k+1个分量:
rk(t)=rk-1-ck(t)
Figure FDA0003590356380000022
S345将k加1,执行S344,当余量信号不再可能被分解时,即余量的极值点不超过两个,停止分解最终的余量为:
Figure FDA0003590356380000023
式中:K为所有模态分量的数量,分解过程中n取102数量级,ε一般取10-2数量级,
原始孔隙度序列y(t)可被分解为:
Figure FDA0003590356380000024
2.根据权利要求1所述的一种结合深度学习的储层物性参数预测方法,其特征在于:S2包括以下步骤:
S21对于给定的有序对(X,Y),其数据集为D,数据样本大小为n,分别将X,Y按x值和y值划分成x,y维,记为G,数据集D包含两个节点变量X,Y,X和Y的特征矩阵是一个无限矩阵,定义信息系数公式为:
Figure FDA0003590356380000025
式中,I*(X,Y,D,i,j)=maxI(X,Y,D|G,i,j)是G被划分成i×j个网格中X,Y的最大互信息;
S22根据上式,节点变量X,Y的最大信息系数定义为:
Figure FDA0003590356380000026
式中,B(n)=n0.6,i×j<B(n)表示网格G的划分维度的限制;
S23获得测度物性参数与测井曲线之间的非线性相关性的MIC,而由互信息的公式I(X,Y)=H(X)+H(Y)-H(X,Y),可知其依赖于熵
Figure FDA0003590356380000027
而熵H(X)依赖于变量X的分布,是对变量X不确定性的度量,与样本的数值大小无关。
3.根据权利要求1所述的一种结合深度学习的储层物性参数预测方法,其特征在于:S4包括如下步骤,
S41将x(t)组成m维矢量u(i)={x(i),x(i+1),…,x(i+m-1)},其中i=N-m+1,m为嵌入维数,m=1或2,
S42定义时间序列u(i)和u(j)对应元素偏差的最大值为它们之间的距离,记为D[u(i),u(j)],
D[u(i),u(j)]=max|u(i)-u(j)|,(i,j=1,2,…,N-m+1,且j≠i)
S43计算平均模版匹配概率Bm(r),
即对每一个i值统计满足条件D[u(i),u(j)]<r的数目,并计算其与总数N-m+1的比值,记为
Figure FDA0003590356380000031
Figure FDA0003590356380000032
式中:l(·)为计数函数统计满足D[u(i),u(j)]<r条件的次数;r为相似容限,取值范围为r=0.1~0.25SD,SD为序列标准差,则平均模版匹配概率为:
Figure FDA0003590356380000033
S44更新嵌入维数m=m+1,重复步骤S41到S43可得:
Figure FDA0003590356380000034
S45理论上该时间序列的样本熵为:
Figure FDA0003590356380000035
时间序列长度N通常为有限值,因此x(t)的样本熵估计值为:
SE(m,r,N)=-ln[Bm+1(r)/Bm(r)];
S46根据分析结果,将熵值相近的分量序列重组得到新本征模态分量。
4.根据权利要求1所述的一种结合深度学习的储层物性参数预测方法,其特征在于:S5具体包括以下步骤:
S51采用离差标准化方法对重构新分量进行归一化变换处理,进而将模型输入输出变换为[0,1]区间的值,归一化公式如下:
Figure FDA0003590356380000036
式中,y为模型的输入或输出分量,y*为经过归一化处理后的输入或输出分量,ymax和ymin分别为模型输入或输出量的最大值和最小值;
S52按照设定的比例将归一化的数据划分为训练集和测试集。
5.根据权利要求1所述的一种结合深度学习的储层物性参数预测方法,其特征在于:S6包括如下步骤,
S61构造基于深度学习的LSTM循环神经网络模型;
LSTM算法是一种特定形式的循环神经网络,网络的整体结构由输入层、隐状态层和输出层组成,输入层用于数据的输入,隐状态层对输入数据进行处理,由多个判断信息有用与否的LSTM单元组成,输出层输出预测数据,其中,LSTM单元主要由三个门构成,分别是遗忘门、输入门和输出门,
1)遗忘门:自循环的权重由遗忘门(forget gate)fi (t)控制,并通过sigmoid非线性激活函数将权重值设定在[0,1]:
Figure FDA0003590356380000041
其中,xj (t)表示当前的输入,hj (t-1)表示前一时刻隐藏层状态,bi f,Ui f,Wi f分别表示偏置向量、输入权重值以及遗忘门的循环权重;
2)隐藏层状态:LSTM细胞内部状态以如下方式更新:
Figure FDA0003590356380000042
其中,bi,Ui,j,Wi,j分别表示长短时网络细胞中的偏置值、输入权重以及遗忘门的循环权重;
3)输入门:输入门(input gate)
Figure FDA0003590356380000043
的更新表达式为:
Figure FDA0003590356380000044
4)输出门:LSTM细胞的输出
Figure FDA0003590356380000045
也可以由输出门(output gate)
Figure FDA0003590356380000046
关闭:
Figure FDA0003590356380000047
Figure FDA0003590356380000048
其中,bi o
Figure FDA0003590356380000049
分别是偏置、输入权重和遗忘门的循环权重;
S62利用训练数据集训练LSTM循环神经网络模型,优化网络结构;
S63利用训练好的LSTM网络预测模型对各分量物性参数进行预测。
6.根据权利要求5所述的一种结合深度学习的储层物性参数预测方法,其特征在于:S62包括如下步骤,
S621从左到右前向传播时按照前向计算方法计算LSTM细胞的输出值;
S622将模型输出值与实际值进行比较,反向计算每个LSTM细胞的误差项,包括按时序和网络层级两个反向传播方向;
S623根据相应的误差项,计算每个权重的梯度;
S624应用Adam优化算法更新权重,使预测结果向实际值靠近,最终得到满足要求的网络结构;
利用训练数据训练模型,优化网络参数,确定超参数:time_step为20;batch_size为100,input_dim为4,隐含层中LSTM层为2层,隐藏节点数为30,激活函数为Sigmoid函数。
CN201911138179.6A 2019-11-20 2019-11-20 一种结合深度学习的储层物性参数预测方法 Active CN110852527B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911138179.6A CN110852527B (zh) 2019-11-20 2019-11-20 一种结合深度学习的储层物性参数预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911138179.6A CN110852527B (zh) 2019-11-20 2019-11-20 一种结合深度学习的储层物性参数预测方法

Publications (2)

Publication Number Publication Date
CN110852527A CN110852527A (zh) 2020-02-28
CN110852527B true CN110852527B (zh) 2022-05-31

Family

ID=69602656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911138179.6A Active CN110852527B (zh) 2019-11-20 2019-11-20 一种结合深度学习的储层物性参数预测方法

Country Status (1)

Country Link
CN (1) CN110852527B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723526A (zh) * 2020-06-24 2020-09-29 中国地质大学(北京) 动态回归委员会机器测井储层参数预测方法及系统
CN112001115B (zh) * 2020-07-17 2024-04-02 西安理工大学 一种半监督动态软测量网络的软测量建模方法
CN111983722B (zh) * 2020-09-01 2023-06-30 中国石油天然气集团有限公司 一种基于目标偏好编码的储层测井特征参数提取方法
CN112116162B (zh) * 2020-09-26 2022-11-29 国家电网公司华中分部 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法
CN112253087A (zh) * 2020-10-20 2021-01-22 河南理工大学 一种基于多源测井资料的生物扰动储集层物性计算方法
CN112651290A (zh) * 2020-10-22 2021-04-13 国家电网有限公司 一种水电机组振动趋势预测方法和系统
CN112489736A (zh) * 2020-12-09 2021-03-12 中国石油大学(北京) 一种矿物含量分析方法、装置、设备及存储介质
CN112945162B (zh) * 2021-01-26 2022-05-31 山西大学 一种堆积层滑坡位移预测模型及预测方法
CN112836393B (zh) * 2021-03-09 2023-07-18 中国地质大学(北京) 一种基于多尺度熵分析储层非均质性的方法
CN113343564A (zh) * 2021-05-28 2021-09-03 国网江苏省电力有限公司南通供电分公司 一种基于多元经验模态分解的变压器顶层油温预测方法
CN113323676B (zh) * 2021-06-03 2024-03-22 上海市隧道工程轨道交通设计研究院 用主成分分析-长短记忆模型确定盾构机刀盘扭矩的方法
CN113610945B (zh) * 2021-08-10 2023-05-26 西南石油大学 一种基于混合神经网络的地应力曲线预测方法
CN115222019B (zh) * 2022-06-27 2023-07-28 西南石油大学 基于测井数据的深度Transformer迁移学习储层参数预测方法
CN116796890A (zh) * 2023-05-29 2023-09-22 南方电网能源发展研究院有限责任公司 碳排放权代价值预测方法、装置、设备、介质和产品
CN117352094B (zh) * 2023-12-04 2024-03-08 山东恒信科技发展有限公司 一种用于原料油的物性预测分析方法及系统
CN117473305A (zh) * 2023-12-27 2024-01-30 西南石油大学 一种近邻信息增强的储层参数预测方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5251286A (en) * 1992-03-16 1993-10-05 Texaco, Inc. Method for estimating formation permeability from wireline logs using neural networks
WO2009025561A1 (en) * 2007-08-17 2009-02-26 Institutt For Energiteknikk System and method for empirical ensemble-based virtual sensing
CN105372166A (zh) * 2014-08-26 2016-03-02 中国石油天然气股份有限公司 泥质砂岩渗透率的获取方法和装置
CN107704918A (zh) * 2017-09-19 2018-02-16 平安科技(深圳)有限公司 驾驶模型训练方法、驾驶人识别方法、装置、设备及介质
CN108073745A (zh) * 2016-11-18 2018-05-25 中国石油化工股份有限公司 基于三孔隙曲线的砂砾岩岩性物性测井识别方法
CN109611087A (zh) * 2018-12-11 2019-04-12 中国石油大学(北京) 一种火山岩油藏储层参数智能预测方法及系统
CN109919364A (zh) * 2019-02-18 2019-06-21 华南理工大学 基于自适应降噪和集成lstm的多变量时间序列预测方法
CN110135494A (zh) * 2019-05-10 2019-08-16 南京工业大学 基于最大信息系数和基尼指标的特征选择方法
CN110163433A (zh) * 2019-05-21 2019-08-23 上海海事大学 一种船舶流量预测方法
CN110426751A (zh) * 2019-08-09 2019-11-08 中国石油天然气股份有限公司 一种利用测井资料预测横波时差的方法
CN110458316A (zh) * 2019-05-21 2019-11-15 武汉大学 一种基于集合经验模态分解与lstm网络的海上风电功率短期预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105044777B (zh) * 2015-07-01 2017-10-17 中国石油天然气股份有限公司 基于经验模态分解检测地震标志层强反射振幅消除的方法
CN106126896B (zh) * 2016-06-20 2019-03-22 中国地质大学(武汉) 基于经验模态分解和深度学习的混合模型风速预测方法及系统
US11188813B2 (en) * 2017-03-01 2021-11-30 Stc.Unm Hybrid architecture system and method for high-dimensional sequence processing
CN107292453A (zh) * 2017-07-24 2017-10-24 国网江苏省电力公司电力科学研究院 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法
CN109799533B (zh) * 2018-12-28 2021-07-27 中国石油化工股份有限公司 一种基于双向循环神经网络的储层预测方法
CN110322032A (zh) * 2019-04-17 2019-10-11 四川大学 一种基于ceemdan的金融时间序列组合预测方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5251286A (en) * 1992-03-16 1993-10-05 Texaco, Inc. Method for estimating formation permeability from wireline logs using neural networks
WO2009025561A1 (en) * 2007-08-17 2009-02-26 Institutt For Energiteknikk System and method for empirical ensemble-based virtual sensing
CN105372166A (zh) * 2014-08-26 2016-03-02 中国石油天然气股份有限公司 泥质砂岩渗透率的获取方法和装置
CN108073745A (zh) * 2016-11-18 2018-05-25 中国石油化工股份有限公司 基于三孔隙曲线的砂砾岩岩性物性测井识别方法
CN107704918A (zh) * 2017-09-19 2018-02-16 平安科技(深圳)有限公司 驾驶模型训练方法、驾驶人识别方法、装置、设备及介质
CN109611087A (zh) * 2018-12-11 2019-04-12 中国石油大学(北京) 一种火山岩油藏储层参数智能预测方法及系统
CN109919364A (zh) * 2019-02-18 2019-06-21 华南理工大学 基于自适应降噪和集成lstm的多变量时间序列预测方法
CN110135494A (zh) * 2019-05-10 2019-08-16 南京工业大学 基于最大信息系数和基尼指标的特征选择方法
CN110163433A (zh) * 2019-05-21 2019-08-23 上海海事大学 一种船舶流量预测方法
CN110458316A (zh) * 2019-05-21 2019-11-15 武汉大学 一种基于集合经验模态分解与lstm网络的海上风电功率短期预测方法
CN110426751A (zh) * 2019-08-09 2019-11-08 中国石油天然气股份有限公司 一种利用测井资料预测横波时差的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Reservoir physical parameters prediction based on LSTM recurrent neural network :互联网检索,reservoir predict logging curve LSTM;AN Peng等;《Progress in Geophysics》;20191028;第34卷(第5期);第1849-1858页 *
基于微粒群算法的神经网络储层物性参数预测;王文娟等;《西南石油大学学报》;20071215;第29卷(第6期);第31-33+54+205页 *

Also Published As

Publication number Publication date
CN110852527A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
CN110852527B (zh) 一种结合深度学习的储层物性参数预测方法
Pham et al. Missing well log prediction using convolutional long short-term memory network
Chen et al. A committee machine with empirical formulas for permeability prediction
Aïfa et al. Neuro-fuzzy system to predict permeability and porosity from well log data: A case study of Hassi R׳ Mel gas field, Algeria
US20060074825A1 (en) System and method for inferring geological classes
MXPA06011012A (es) Seleccion basada en algoritmo genetico de grupo de redes neurales para el procesamiento de datos de diagrafia.
CN108596780B (zh) 一种基于多元信息的储层类型划分方法及系统
CN110909931A (zh) 基于模态分解重构及深度lstm-rnn模型的测井曲线预测方法
Shi et al. Brittleness index prediction in shale gas reservoirs based on efficient network models
CN113610945B (zh) 一种基于混合神经网络的地应力曲线预测方法
Raj et al. A novel and generalized approach in the inversion of geoelectrical resistivity data using Artificial Neural Networks (ANN)
Akande et al. Investigating the effect of correlation-based feature selection on the performance of neural network in reservoir characterization
CN113687433A (zh) 一种基于Bi-LSTM的大地电磁信号去噪方法及系统
Wong et al. Reservoir characterization using support vector machines
US20220137245A1 (en) Systems and methods for seismic well tie domain conversion and neural network modeling
Pham et al. Missing sonic log prediction using convolutional long short-term memory
Cuddy et al. The application of fuzzy logic and genetic algorithms to reservoir characterization and modeling
Huang et al. Determination of porosity and permeability in reservoir intervals by artificial neural network modelling, offshore eastern Canada
CN114152977A (zh) 基于地质特征约束的储层参数预测方法、装置和存储介质
Malvić et al. Neural networks in petroleum geology as interpretation tools
Srinivas et al. Estimation of subsurface strata of earth using adaptive neuro-fuzzy inference system (ANFIS)
García Benítez et al. Neural networks for defining spatial variation of rock properties in sparsely instrumented media
Sarkar et al. Machine learning approach to mineral deposit grade modelling
Heydari Gholanlo et al. Estimation of cementation factor in carbonate reservoir by using genetic fuzzy inference system
Kumar et al. Synthetic well log modeling with light gradient boosting machine for Assam-Arakan Basin, India

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant