CN112989708B - 一种基于lstm神经网络的测井岩性识别方法及系统 - Google Patents

一种基于lstm神经网络的测井岩性识别方法及系统 Download PDF

Info

Publication number
CN112989708B
CN112989708B CN202110377717.8A CN202110377717A CN112989708B CN 112989708 B CN112989708 B CN 112989708B CN 202110377717 A CN202110377717 A CN 202110377717A CN 112989708 B CN112989708 B CN 112989708B
Authority
CN
China
Prior art keywords
lithology
logging
data
neural network
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110377717.8A
Other languages
English (en)
Other versions
CN112989708A (zh
Inventor
李作进
陈生富
杨庆
冯世霖
史蓝洋
陈智能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Science and Technology
Original Assignee
Chongqing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Science and Technology filed Critical Chongqing University of Science and Technology
Priority to CN202110377717.8A priority Critical patent/CN112989708B/zh
Publication of CN112989708A publication Critical patent/CN112989708A/zh
Application granted granted Critical
Publication of CN112989708B publication Critical patent/CN112989708B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及石油勘探技术领域,具体公开了一种基于LSTM神经网络的测井岩性识别方法及系统,该方法包括步骤:基于LSTM神经网络建立测井岩性识别模型;采用由带标签的测井数据样本组成的数据集对测井岩性识别模型进行训练和测试;将即时测井数据输入测试完成的测井岩性识别模型,得出各类岩性的概率;将概率最大的岩性作为即时测井数据下的岩性。该方法及系统基于LSTM神经网络对多个测井曲线数据进行特征提取,能够有效挖掘数据的本质特征,减少提取特征的时间和成本,并通过逐层特征变化进而解决复杂的分类来预测岩性,其识别准确率和响应速度相比现有方法均有所提高,使岩性识别变得方便快捷且客观可靠。

Description

一种基于LSTM神经网络的测井岩性识别方法及系统
技术领域
本发明涉及石油勘探技术领域,尤其涉及一种基于LSTM神经网络的测井岩性识别方法及系统。
背景技术
地球物理岩性识别作为一种常规的油藏的评价技术,是寻找页岩油气资源、评估页岩油气储量最基础的工作之一。传统的岩性识别方法有交汇图、取岩心和图像识别等方法。但传统的岩性识别方法往往识别精度有限且受人为因素影响较大,因而不利于于广泛实际的运用。
现今随着测井技术的发展,各种测井物理参数获取变得容易,由于测井曲线中包含丰富的岩性信息,不同的测井曲线对于岩性和地层有不同的区分度,但目前传统方法无法综合多类测井数据对岩性进行精准识别。
发明内容
本发明提供一种基于LSTM神经网络的测井岩性识别方法及系统,解决的技术问题在于:如何综合多类测井数据对测井岩性进行较为精准的识别。
为解决以上技术问题,本发明首先提供一种基于LSTM神经网络的测井岩性识别方法,包括步骤:
S1:基于LSTM神经网络建立测井岩性识别模型;
S2:采用由带标签的测井数据样本组成的数据集对所述测井岩性识别模型进行训练和测试;
S3:将即时测井数据输入测试完成的所述测井岩性识别模型,得出各类岩性的概率;
S4:将概率最大的岩性作为所述即时测井数据下的岩性。
本方法采用LSTM神经网络对多个测井曲线数据进行特征提取,可有效挖掘数据的本质特征,减少提取特征的时间和成本,并通过逐层特征变化进而解决复杂的分类来预测岩性,其识别准确率和响应速度相比现有方法均有所提高,使岩性识别变得方便快捷且客观可靠。
进一步地,所述步骤S2对所述测井岩性识别模型进行训练的过程具体包括步骤:
S21:将所获原始测井数据进行标签降维、参数降维以及缺失值插补,得到测井数据样本;
S22:对测井数据样本进行标签编码和数据归一化后划分为训练集和测试集;
S23:将所述训练集输入步骤S1建立的所述测井岩性识别模型进行训练,并反向更新参数,优化神经元权重矩阵,直至参数收敛。
步骤S21对数据样本原始测井数据进行标签降维和数据降维,剔除占比值极低的岩性,对于高度相关的参数和岩性进行降维选取,以及进行缺失值插补,使得到的测井数据样本十分具有典型性和完整性,有助于提高网络训练的效果,提高识别的精度。步骤S22进行标签编码,可解决这些标签数据的离散值问题,便于机器学习。步骤S22进行数据归一化,可以使得不同的特征变量具有相同的尺度,这样目标变量就可以由多个相同尺寸的特征变量进行控制,使得在使用梯度下降法学习参数的时候,不同特征对参数的影响程度一样,能够加速权重参数的收敛。
进一步地,步骤S21中:
进行所述标签降维具体是指:将所获原始测井数据中相近的岩性进行合并以及将低于预设占比的岩性剔除;
进行所述参数降维具体是指:保留互不相关的参数类别,并对高于预设相关度的2个以上参数类别进行降维选取;
进行所述缺失值插补具体是指:对数据缺失处进行多重插补。
这些处理方式可使得到的测井数据样本的保真度和完整性较高,避免因数据样本的冗杂和值的缺失等影响训练的精度和效率。
进一步地,步骤S21中:
进行标签降维后得到的标签包括泥岩、砂岩、页岩、白云岩、砾岩、泥灰岩和泥膏岩这七种岩性;
进行参数降维后得到的参数包括补偿声波、补偿电子、补偿密度、自然伽马和电阻率这五种输入参数;
对数据缺失处进行多重插补的具体过程包括:
1)为每个空值产生一套可能的插补值,并根据这些插补值生成多个插补值集合;
2)对每个插补值集合用针对完整数据集的统计方法进行统计分析;
3)对每个插补值集合的结果,根据评分函数进行选择,产生最终的插补值。
在具体实施时,这些是一些较佳的实施方式。
进一步地,所述步骤S22中:
进行标签编码的过程为:对泥岩、砂岩、页岩、白云岩、砾岩、泥灰岩和泥膏岩这七种岩性进行毒热编码;
进行数据归一化的过程为:将补偿声波、补偿电子、补偿密度、自然伽马和电阻率这五种输入参数进行归一化,使处理后的数据呈现正态分布。
毒热编码和正态分布的归一化是较为优选的实施方式,具有较好的实施效果。
进一步地,所述步骤S21中,进行数据归一化所采用的公式为:
Figure BDA0003011906530000031
其中,x为一输入参数对应的值,μ为该输入参数的总体均值,δ为该输入参数的标准差,Z为该输入参数标准化的值。
进一步地,所述测井岩性识别模型包括LSTM网络结构和Softmax回归层,所述LSTM网络结构包括顺次连接的输入层、隐藏层和输出层;所述隐藏层包括首层隐藏层、中层隐藏层和末层隐藏层,Dropout率分别为0.2、0.4、0.4;所述Softmax回归层连接在所述末层隐藏层和输出层之间。
本发明的测井岩性识别模型除了采用基本的LSTM网络结构以外,还加入了Softmax回归层,Softmax回归层能够将原始输出层的输出映射到(0,1)区域内,把数值变成概率输出。Dropout在每一次神经网络训练中,使隐藏层的神经元按一定概率连接,可只连接其中一部分,这样训练的过程中会形成很多个不同的网络结构,这样可以明显缓解过拟合的现象。
优选地,所述测井岩性识别模型采用Tanh函数作为激活函数,采用Adam优化算法进行优化,采用交叉熵作为损失函数。
Tanh函数也称为双切正切函数,取值范围为[-1,1]。Tanh函数在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。Adam优化算法能让模型训练优化的过程中通过让每个参数获得自适应的学习率,来达到优化质量和速度的双重提升。Softmax回归层把神经网络前向传播的岩性种类变为概率分布,而交叉熵涉及到计算每个类别的概率,故选用交叉熵作为该模型的损失函数。
优选地,所述步骤S22中,采用反向传播通过时间方法进行参数训练。
通过反向传播对比标签岩性和输出岩性来不断优化神经元的权重矩阵,搭建最优岩性分类的模型。
本发明还提供一种基于LSTM神经网络的测井岩性识别系统,其采用上述基于LSTM神经网络的测井岩性识别方法实现建立测井岩性识别模型、对测井岩性识别模型进行训练与/或测试、将训练完成的测井岩性识别模型用于识别即时测井数据中的至少一项,以实现相应的效果。
附图说明
图1是本发明实施例提供的一种基于LSTM神经网络的测井岩性识别方法的步骤流程图;
图2是本发明实施例提供的测井岩性识别模型的网络架构图;
图3是本发明实施例提供的对测井岩性识别模型进行训练和测试的流程图;
图4是本发明实施例提供的测井岩性识别模型在训练、测试中的损失比对图;
图5是本发明实施例提供的测井岩性识别模型在训练、测试中的准确率比对图。
具体实施方式
下面结合附图具体阐明本发明的实施方式,实施例的给出仅仅是为了说明目的,并不能理解为对本发明的限定,包括附图仅供参考和说明使用,不构成对本发明专利保护范围的限制,因为在不脱离本发明精神和范围基础上,可以对本发明进行许多改变。
鉴于现有技术的岩性识别精度低、效率慢并且人为因素影响大,本发明实施例提供一种基于LSTM神经网络的测井岩性识别方法及系统,可以快速划分岩性,提高岩性识别的效率和精度。下面结合附图和实施例,对发明的具体实施方案作进一步详细的描述。
如图1所示,本发明首先提供一种基于LSTM神经网络的测井岩性识别方法,具体包括步骤S1~S4。
S1:基于LSTM神经网络建立测井岩性识别模型。
LSTM神经网络即长短期记忆网络,属于循环神经网络RNN的一种,可以有效地处理序列数据,有门控装置,会选择性地存储信息,可以很好地解决长序列训练过程中的梯度消失和梯度爆炸问题。本例所建测井岩性识别模型就是基于LSTM神经网络。图2为测井岩性识别模型的网络结构,测井岩性识别模型包括LSTM网络结构和Softmax回归层,LSTM网络结构包括顺次连接的输入层、隐藏层和输出层;隐藏层包括首层隐藏层、中层隐藏层和末层隐藏层,Dropout率分别为0.2、0.4、0.4;Softmax回归层连接在末层隐藏层和输出层之间。
LSTM网络结构各神经元的计算公式如下:
it=σ(Wi·[ht-1,xt]+bi)
ft=σ(Wf·[ht-1,xt]+bf)
Ot=σ(Wo·[ht-1,xt]+bo)
Ct=ft*Ct-1+it*tanh(Wc·[ht-1,xt]+bc)
ht=Ot*tanh(Ct)
上式中,it为LSTM的输入门,ft为LSTM的遗忘门,Ot为LSTM的输出门,Ct为长期记忆,ht为短期记忆。σ为Sigmod函数,W和b为对应的权重和偏置。
测井岩性识别模型除了采用基本的LSTM网络结构以外,还加入了Softmax回归层,Softmax回归层能够将原始输出层的输出映射到(0,1)区域内,把数值变成概率输出。隐藏层利用循环神经网络的联想记忆功能,能保持数据中的依赖关系的原理来对数据特征进一步的挖掘,对不同的岩性特征进行联系和划分,以此来充分表示岩性特性。Softmax回归是Logistic回归的泛化版本,Logistic回归只能对二分类问题进行处理,而Softmax回归主要是解决多类别的分类问题。
本例所用识别模型搭建了三层的LSTM隐藏层,第一层LSTM的神经元选择为50个,并Dropout(0.2)。第二层和第三层的LSTM的神经元选择100个,并Dropout(0.4)。Dropout作为每一次神经网络训练,可使隐藏层的神经元按一定概率连接,并可只连接其中一部分,这样训练的过程中会形成很多个不同的网络结构,可以明显地缓解过拟合的现象。
激励函数的作用是能够给神经网络加入一些非线性因素,常用的激活函数有Sigmod激活函数、Relu激活函数和Tanh激活函数。Sigmod激活函数能把一个实数压缩至0到1之间。但Sigmod激活函数在反向传播求误差梯度时很容易会出现梯度消失的情况,从而无法完成对深度神经网络的训练。Relu激活函数,存在神经元死亡问题,当输入接近零或为负时,函数的梯度变为零,网络将无法执行反向传播,也无法学习。本实施例选择Tanh激活函数为神经网络的激励函数。Tanh激活函数也称为双切正切函数,取值范围为[-1,1],其在特征相差明显时的效果会很好,在循环过程中会不断扩大特征效果。其数学表达式为:
Figure BDA0003011906530000061
本发明实施例选择Adam优化算法,该算法能让模型训练优化的过程中通过让每个参数获得自适应的学习率,来达到优化质量和速度的双重提升。本例的测井岩性识别模型搭建于TensorFlow平台,Adam优化算法在该平台的参数配置是learning_rate=0.001,beta1=0.9,beta2=0.999,epsilon=1e-08。
learning_rate:被称为学习速率或步长。较大的值(例如0.3)在速率校正之前会加快初始学习速度。较小的值(例如1.0e-5)在训练期间会降低学习速度;
beta1:第一次估计的指数衰减率;
beta2:第二次估计的指数衰减率。在稀疏梯训度问题上,这个值应该接近1.0;
Epsilon:是一个非常小的数字,可以防止任何在实施中被0划分。
将测井岩性识别模型提取出深层次特征表示为X={θ12,...,θK},θi=[θi0i1,...θin]T,Softmax回归对给定样本X(i),样本属于K的概率为:
Figure BDA0003011906530000071
可以将概率罗列成矩阵形式:
Figure BDA0003011906530000072
其梯度下降的公式为:
Figure BDA0003011906530000073
其中P(y(i)=K|X(i),θ)代表第K个概率下的分类概率,
Figure BDA0003011906530000074
是对概率分布进行归一化。
本发明实施例的测井岩性识别模型用到了Softmax回归,把神经网络前向传播的岩性种类变为概率分布,而交叉熵涉及到计算每个类别的概率,故选用交叉熵作为该模型的损失函数。交叉熵刻画了两个概率分布之间的距离,其定义为:
Figure BDA0003011906530000081
其中p(xi)是真实的概率分布,q(xi)是预测的概率分布。交叉熵最后把经过的神经网络传播测井数据的岩性种类转化成概率进行输出。
S2:采用由带标签的测井数据样本组成的数据集对所述测井岩性识别模型进行训练和测试。
其中,步骤S2对所述测井岩性识别模型进行训练的过程具体包括步骤:
S21:将所获原始测井数据进行标签降维、参数降维以及缺失值插补,得到测井数据样本;
S22:对测井数据样本进行标签编码和数据归一化后划分为训练集和测试集;
S23:将所述训练集输入步骤S1建立的所述测井岩性识别模型进行训练,并反向更新参数,优化神经元权重矩阵,直至参数收敛。
这里的原始测井数据可能包含较多种类的岩性,以某三口井为例,该三口的岩性标签共计有16个,岩性明显过多,在前期数据预处理时需要对相近岩性的标签进行合并,称之为标签降维。标签降维的规则是:将所获原始测井数据中相近的岩性进行合并(例如砂质泥岩可归为泥岩,灰质泥岩也可归为泥岩,以及泥质粉砂岩可归为粉砂岩)以及将低于预设占比的岩性剔除(例如砂岩和粗砂岩出现次数为1和4,占比整个标签极少,可以予以剔除)。这里的预设占比根据实际情况确定。本例最终将标签岩性的划分为七类,分别为泥岩、砂岩、页岩、白云岩、砾岩、泥灰岩和泥膏岩。
进行标签合并后的参数观测值也有较多类别,本例中测井参数数据共有七类,分别为深侧向电阻率、浅侧向电阻率、补偿声波、补偿密度、补偿中子、自然伽马和无铀伽马。测井参数观测值的差异主要取决于岩性,即决定于组成岩石的矿物成分、结构和岩石孔隙中所含流体的性质。对于一些相关性较强的参数类别,可降维选取,其他不相关的类别均保留,称之为参数降维。即参数降维的规则是:保留互不相关的参数类别,并对高于预设相关度的2个以上参数类别进行降维选取,这里的预设相关度根据实际情况确定。在上述7个参数类别中,深侧向电阻率与浅侧向电阻率高度相关,降维可只选一条曲线;补偿声波、补偿密度、补偿中子三条曲线相关性较强,降维可选其中两条曲线;自然伽马、无铀伽马,降维可选自然伽马。所以最终选择的五个参数类别为补偿声波、补偿电子、补偿密度、自然伽马和深测向电阻率。
在各种参数的观测数据中还发现会遇到数据缺失的情况,此时应该对缺失值情况进行检查,并对缺失值进行处理。本例采用的是多重插补方法来对缺失值进行处理。多重插补的步骤主要包括:
1)为每个空值产生一套可能的插补值,并根据这些插补值生成多个插补值集合;
2)对每个插补值集合用针对完整数据集的统计方法进行统计分析;
3)对每个插补值集合的结果,根据评分函数进行选择,产生最终的插补值。
对上述三口井的原始测井数据进行标签降维、参数降维以及缺失值插补后,得到的测井数据样本如表1所示。
表1.测井数据样本
Figure BDA0003011906530000091
紧接着需要对这些数据样本进行标签编码、数据归一化并划分为训练集和测试集。
本发明判别模型在TensorFlow环境下搭建,需要对中文标签进行编码转换,即对岩性种类进行编码。编码方式有独热编码和顺序编码两种方式,本例采用独热编码,具体如表2。
表2独热编码岩性标签
岩性 泥岩 砂岩 页岩 白云岩 砾岩 泥灰岩 泥膏岩
编码值 0000001 0000010 0000100 0001000 0010000 0100000 1000000
为使得不同的特征变量具有相同的尺度,本例还需要对各种观测数据进行归一化处理,这样目标变量就可以由多个相同尺寸的特征变量进行控制,在使用梯度下降法学习参数的时候,不同特征对参数的影响程度一样。在训练神经网络的过程中,通过将数据标准化,能够加速权重参数的收敛。
本例的输入测井数据了采用z-score标准化,其处理后的数据呈正态分布,公式如下:
Figure BDA0003011906530000101
式中:x为某输入参数对应的值,μ为某输入参数的总体均值,δ为某输入参数的标准差,Z为该输入参数标准化的值。
最后,将得到的数据集按照7:3的比例划分为训练集和测试集。
随即进行模型训练,具体是采用反向传播通过时间方法(BPTT)进行参数训练,步骤如下:
1、前向计算每个神经元的输出值,就LSTM来说,分别计算其输入门it、遗忘门ft、输出门Ot、长期记忆Ct和短期记忆ht
2、前向计算每个神经元的误差。BPTT训练算法误差项的反向传播是双向的。一个方向是将误差项传播到下一个层次,以更新连接层中神经元的权重系数矩阵;另一个方向是沿时间轴反向传播,以更新递归层上神经元的权重矩阵;
3、根据误差,计算每个权重的梯度。
通过反向传播对比标签岩性和输出岩性来不断优化神经元的权重矩阵,搭建最优岩性分类的模型。如图3所示,为本发明实施例中循环神经网络的测井岩性识别训练和测试的流程图,主要流程为:
①训练开始;
②训练集输入循环神经网络进行训练;
③对结果用交叉熵巡视计算误差,将预测结果提取出来;
④是否达到预设的迭代次数;
否:预测结果与实际标签对比,反向传播,更新参数。
是:保存最优岩性识别模型(并让测试集输入最优模型,对分类效果进行评估),输出训练集和测试集准确率和损失函数。
⑤训练结束。
其中,本发明的实施例预设的迭代次数为200次,每个批次的尺寸(bach_size)设置为72。
将训练的最优化分类模型保存在设定的文件里,然后用测试集进行测试,对分类的准确率进行评估。并把训练集标签的真实值和预测值导出,以方便查看其分类的岩性种类。
图4为是本发明实施中基于循环神经网络的测井岩性识别的损失曲线,其中,在训练集和测试集的模型训练中,当训练到200次左右,其中训练集损失函数为0.2939,测试集的损失函数为0.5060。损失函数交叉熵趋近于0,交叉熵的平稳过度表明神经网络的结构合理。
图5为是本发明实施中基于循环神经网络的测井岩性识别的Accuracy(准确率)曲线,其训练集和测试集的准确率分别为89.96%和82.93%。
经测试,训练完成的测井岩性识别模型能够满足本发明对准确率的要求,可以将该识别模型用于实际应用,即:
S3:将即时测井数据输入测试完成的所述测井岩性识别模型,得出各类岩性的概率;
S4:将概率最大的岩性作为所述即时测井数据下的岩性。
对应于上述方法,本例还提供一种测井岩性系统,该系统能够实现建立测井岩性识别模型、对测井岩性识别模型进行训练与/或测试、将训练完成的测井岩性识别模型用于识别即时测井数据中的至少一项。
可以见得,本发明区别于传统的岩性分类方法,在对原始测井数据进行预处理(标签降维、参数降维和缺失值插补)后,基于LSTM神经网络对多个测井曲线数据进行特征提取,能够有效挖掘数据的本质特征,减少提取特征的时间和成本,并通过逐层特征变化进而解决复杂的分类来预测岩性,其识别准确率和响应速度相比现有方法均有所提高,使岩性识别变得方便快捷且客观可靠。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种基于LSTM神经网络的测井岩性识别方法,其特征在于,包括步骤:
S1:基于LSTM神经网络建立测井岩性识别模型;
S2:采用由带标签的测井数据样本组成的数据集对所述测井岩性识别模型进行训练和测试;所述步骤S2对所述测井岩性识别模型进行训练的过程具体包括步骤:
S21:将所获原始测井数据进行标签降维、参数降维以及缺失值插补,得到测井数据样本;进行所述标签降维具体是指:将所获原始测井数据中相近的岩性进行合并以及将低于预设占比的岩性剔除;进行所述参数降维具体是指:保留互不相关的参数类别,并对高于预设相关度的2个以上参数类别进行降维选取;进行所述缺失值插补具体是指:对数据缺失处进行多重插补;
S22:对测井数据样本进行标签编码和数据归一化后划分为训练集和测试集;
S23:将所述训练集输入步骤S1建立的所述测井岩性识别模型进行训练,并反向更新参数,优化神经元权重矩阵,直至参数收敛;
S3:将即时测井数据输入测试完成的所述测井岩性识别模型,得出各类岩性的概率;
S4:将概率最大的岩性作为所述即时测井数据下的岩性。
2.如权利要求1所述的一种基于LSTM神经网络的测井岩性识别方法,其特征在于,步骤S21中:
进行标签降维后得到的标签包括泥岩、砂岩、页岩、白云岩、砾岩、泥灰岩和泥膏岩这七种岩性;
进行参数降维后得到的参数包括补偿声波、补偿电子、补偿密度、自然伽马和电阻率这五种输入参数;
对数据缺失处进行多重插补的具体过程包括:
1)为每个空值产生一套可能的插补值,并根据这些插补值生成多个插补值集合;
2)对每个插补值集合用针对完整数据集的统计方法进行统计分析;
3)对每个插补值集合的结果,根据评分函数进行选择,产生最终的插补值。
3.如权利要求2所述的一种基于LSTM神经网络的测井岩性识别方法,其特征在于,所述步骤S22中:
进行所述标签编码的过程为:对泥岩、砂岩、页岩、白云岩、砾岩、泥灰岩和泥膏岩这七种岩性进行毒热编码;
进行所述数据归一化的过程为:将补偿声波、补偿电子、补偿密度、自然伽马和电阻率这五种输入参数进行归一化,使处理后的数据呈现正态分布。
4.如权利要求1所述的一种基于LSTM神经网络的测井岩性识别方法,其特征在于,所述步骤S22中,进行数据归一化所采用的公式为:
Figure FDA0003541941950000021
其中,x为一输入参数对应的值,μ为该输入参数的总体均值,δ为该输入参数的标准差,Z为该输入参数标准化的值。
5.如权利要求1~4任一项所述的一种基于LSTM神经网络的测井岩性识别方法,其特征在于:所述测井岩性识别模型包括LSTM网络结构和Softmax回归层,所述LSTM网络结构包括顺次连接的输入层、隐藏层和输出层;所述隐藏层包括首层隐藏层、中层隐藏层和末层隐藏层,Dropout率分别为0.2、0.4、0.4;所述Softmax回归层连接在所述末层隐藏层和输出层之间。
6.如权利要求5所述的一种基于LSTM神经网络的测井岩性识别方法,其特征在于:所述测井岩性识别模型采用Tanh函数作为激活函数,采用Adam优化算法进行优化,采用交叉熵作为损失函数。
7.如权利要求6所述的一种基于LSTM神经网络的测井岩性识别方法,其特征在于:所述步骤S23中,采用反向传播通过时间方法进行参数训练。
8.一种基于LSTM神经网络的测井岩性识别系统,其特征在于:采用权利要求1~7任一项所述的基于LSTM神经网络的测井岩性识别方法实现建立测井岩性识别模型、对测井岩性识别模型进行训练与/或测试、将训练完成的测井岩性识别模型用于识别即时测井数据中的至少一项。
CN202110377717.8A 2021-04-08 2021-04-08 一种基于lstm神经网络的测井岩性识别方法及系统 Active CN112989708B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110377717.8A CN112989708B (zh) 2021-04-08 2021-04-08 一种基于lstm神经网络的测井岩性识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110377717.8A CN112989708B (zh) 2021-04-08 2021-04-08 一种基于lstm神经网络的测井岩性识别方法及系统

Publications (2)

Publication Number Publication Date
CN112989708A CN112989708A (zh) 2021-06-18
CN112989708B true CN112989708B (zh) 2022-04-19

Family

ID=76339483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110377717.8A Active CN112989708B (zh) 2021-04-08 2021-04-08 一种基于lstm神经网络的测井岩性识别方法及系统

Country Status (1)

Country Link
CN (1) CN112989708B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115506783A (zh) * 2021-06-21 2022-12-23 中国石油化工股份有限公司 一种岩性识别方法
CN114492521A (zh) * 2022-01-21 2022-05-13 成都理工大学 一种基于声振信号的随钻岩性智能识别方法与系统
CN114896468B (zh) * 2022-04-24 2024-02-02 北京月新时代科技股份有限公司 基于神经网络的文件类型匹配方法和数据智能录入方法
CN114708463A (zh) * 2022-05-10 2022-07-05 重庆科技学院 一种岩石标本图像智能识别方法
CN115937568B (zh) * 2022-09-29 2024-05-07 中国地质大学(北京) 一种玄武岩构造背景分类方法、系统、装置及存储介质
CN115393656B (zh) * 2022-10-26 2023-01-24 中石化经纬有限公司 一种用于随钻测井图像地层分类的自动分类方法
CN115749760A (zh) * 2022-11-28 2023-03-07 中海石油(中国)有限公司海南分公司 一种基于测录联合的储层流体性质评价方法
CN115545357B (zh) * 2022-11-30 2023-04-07 深圳市峰和数智科技有限公司 一种提升模型性能的方法、地层岩性预测方法及相关设备
CN115660221B (zh) * 2022-12-07 2023-03-21 西南石油大学 基于混合神经网络的油气藏经济可采储量评估方法及系统
CN115628930B (zh) * 2022-12-16 2023-03-10 太原理工大学 一种基于rbf神经网络的掘进机井下截割工况预测方法
CN116122802B (zh) * 2022-12-23 2023-07-14 中国科学院地质与地球物理研究所 基于Unet双通道输出的钻测录井特征提取方法与系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110895348A (zh) * 2019-12-20 2020-03-20 岭南师范学院 一种地震弹性阻抗低频信息提取方法、系统及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633255B (zh) * 2017-08-11 2021-05-25 天津大学 一种深度学习模式下的岩石岩性自动识别分类方法
CN107607992B (zh) * 2017-08-24 2020-08-18 电子科技大学 基于卷积神经网络的多波匹配方法
CN110119753B (zh) * 2019-01-08 2023-05-23 长江岩土工程有限公司 一种重构纹理识别岩性的方法
CN109828304B (zh) * 2019-03-08 2021-04-27 中国海洋石油集团有限公司 一种基于深度学习的利用地震数据预测岩性序列模型的方法
CN111764369B (zh) * 2020-06-18 2021-08-24 河海大学 一种融合试验与监测数据挖掘的高坝岩体卸荷松弛评价方法
CN112230276B (zh) * 2020-09-30 2023-07-07 兰州石化职业技术学院 裂缝型致密储层流体识别方法、系统、识别仪、介质及应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110895348A (zh) * 2019-12-20 2020-03-20 岭南师范学院 一种地震弹性阻抗低频信息提取方法、系统及存储介质

Also Published As

Publication number Publication date
CN112989708A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN112989708B (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
US5828981A (en) Generating pore types and synthetic capillary pressure curves from wireline logs using neural networks
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN111783825A (zh) 一种基于卷积神经网络学习的测井岩性识别方法
CN110807544B (zh) 一种基于机器学习的油田剩余油饱和度分布的预测方法
Yan et al. A real-time intelligent lithology identification method based on a dynamic felling strategy weighted random forest algorithm
CN111048163B (zh) 一种基于高阶神经网络的页岩油滞留烃量(s1)评价方法
CN112633328A (zh) 一种基于深度学习的致密油藏改造效果评价方法
CN111191741A (zh) 一种岩石识别深度学习模型岩石分类约束继承性损失方法
CN112614021B (zh) 一种基于已建隧道信息智能识别的隧道围岩地质信息预测方法
CN113610945A (zh) 一种基于混合神经网络的地应力曲线预测方法
CN112836802A (zh) 一种半监督学习方法、岩性预测方法及存储介质
CN114723095A (zh) 缺失测井曲线预测方法及装置
CN111058840A (zh) 一种基于高阶神经网络的有机碳含量(toc)评价方法
CN113343574A (zh) 基于神经网络的Mishrif组岩性测井识别方法
CN117236390A (zh) 一种基于交叉注意力扩散模型的储层预测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
CN114091333A (zh) 一种基于机器学习的页岩含气量人工智能预测方法
CN114114414A (zh) 一种页岩储层“甜点”信息人工智能预测方法
CN117473305A (zh) 一种近邻信息增强的储层参数预测方法及系统
Li et al. Lithology classification based on set-valued identification method
Anifowose et al. A functional networks-type-2 fuzzy logic hybrid model for the prediction of porosity and permeability of oil and gas reservoirs
CN115270959A (zh) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN114881171A (zh) 基于卷积神经网络的陆相页岩油岩相类型识别方法及系统
Yu et al. Training image optimization method based on convolutional neural network and its application in discrete fracture network model selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant