CN117272841B - 一种基于混合神经网络的页岩气甜点预测方法 - Google Patents

一种基于混合神经网络的页岩气甜点预测方法 Download PDF

Info

Publication number
CN117272841B
CN117272841B CN202311555722.9A CN202311555722A CN117272841B CN 117272841 B CN117272841 B CN 117272841B CN 202311555722 A CN202311555722 A CN 202311555722A CN 117272841 B CN117272841 B CN 117272841B
Authority
CN
China
Prior art keywords
shale gas
model
data
logging
dessert
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311555722.9A
Other languages
English (en)
Other versions
CN117272841A (zh
Inventor
胥林
石骎旭
李艳
王坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202311555722.9A priority Critical patent/CN117272841B/zh
Publication of CN117272841A publication Critical patent/CN117272841A/zh
Application granted granted Critical
Publication of CN117272841B publication Critical patent/CN117272841B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及非常规油气开采技术领域,具体公开一种基于混合神经网络的页岩气甜点预测方法,包括:获取页岩气井基础数据,生成数据集;基于数据集,确定目标模型特征;构预测模型,该模型包括卷积神经网络模块、长短期记忆网络模块、全连接层和输出转化模块,卷积神经网络模块用于捕捉目标模型特征之间的空间关系,得到第一特征信息;长短期记忆网络模块用于基于第一特征信息,得到包括井深变化影响的第二特征信息;第二特征信息用于供全连接层和输出转化模块生成和输出预测结果;基于数据集、预设损失函数和Adam优化器进行训练以优化模型参数;最后将待测数据输入至模型中得到预测结果。如此,可以大大提高页岩气甜点预测的效率和准确性。

Description

一种基于混合神经网络的页岩气甜点预测方法
技术领域
本发明涉及非常规油气开采技术领域和深度学习领域,特别涉及一种基于混合神经网络的页岩气甜点预测方法。
背景技术
页岩气是一种天然气资源,它存在于页岩岩石中,页岩气的开采对能源行业和经济具有重要意义,它被视为一种替代能源资源,有助于减少对传统煤炭和石油的依赖,并对能源安全和环境可持续性产生积极影响。
页岩气甜点通常指成熟优质烃源岩范围内具有商业价值,且能够在当前经济技术条件下开发的页岩气高产区。页岩气甜点预测的本质主要是通过地质勘探、地质物理分析、工程技术评估等手段,评估和识别潜在的页岩气资源富集区域,这些评估主要基于地层结构、岩石组成、孔隙度、渗透性等测井参数,并结合气体产出数据、开采技术和成本等因素进行综合分析。页岩气甜点预测是页岩气储层建模与评价的重要组成部分,也是建立高质量页岩气开采区的关键一步。
传统的方法主要基于地质勘探、地球物理分析和工程评估,但存在一些缺点。首先,传统方法通常只考虑了单一或简化的因素,如地层结构、孔隙度、渗透性等,忽视了复杂的地质条件对页岩气富集的影响;其次,传统方法在数据处理和分析过程中存在主观性,依赖于专业人员的经验和判断,导致结果的可靠性和一致性有限;此外,传统方法的效率较低,需要投入大量的人力,所以基于传统方法构建的预测模型在时间效率和泛化能力上存在不足。
另一方面,传统方法未能充分利用测井参数资源的丰富性。测井数据是通过钻井过程中获取的各种物理参数和地质信息,如电阻率、自然伽马射线、声波速度等,这些数据提供了地下岩石性质、储层特征和有机质含量等方面的详细信息,然而,传统方法往往未能充分整合和利用这些测井参数,从而制约了模型预测的效果。
发明内容
本发明针对当前页岩气甜点预测的困难性,提出了一种基于混合神经网络的页岩气甜点预测方法,以提高页岩气甜点预测的效率和准确性。
为了实现上述内容,本发明采用如下技术方案:
一种基于混合神经网络的页岩气甜点预测方法,方法包括以下步骤:
步骤1:获取页岩气井基础数据,并基于所述页岩气井基础数据生成数据集;
步骤2:基于所述数据集,确定目标模型特征;
步骤3:构建基于混合神经网络模型的预测模型,其中,所述预测模型包括卷积神经网络模块、长短期记忆网络模块、全连接层和输出转化模块,所述卷积神经网络模块用于捕捉所述目标模型特征之间的空间关系,得到第一特征信息;所述长短期记忆网络模块用于基于所述第一特征信息,得到包括井深变化影响的第二特征信息;所述第二特征信息用于供所述全连接层和所述输出转化模块生成和输出预测结果;
步骤4:基于所述数据集、预设损失函数和预设Adam优化器,对所述预测模型进行训练,得到参数优化后的预测模型;
步骤5:将待测页岩气井数据输入至参数优化后的预测模型,得到预测结果。
进一步地,所述页岩气井基础数据包括页岩气井的甜点类别和测井数据,所述测井数据与测井参数和井深对应;
所述获取页岩气井基础数据,并基于所述页岩气井基础数据生成数据集,包括:
基于所述甜点类别对对应页岩气井进行标记;
基于所述页岩气井的测井数据与页岩气井对应的甜点类别生成所述数据集。
进一步地,所述基于所述数据集,确定目标模型特征,包括:
将所述数据集输入至预设随机森林算法模型中,通过所述随机森林算法模型确定各个所述测井参数对页岩气甜点分类的重要程度;
基于所述重要程度对所述测井参数进行排序;
从排序结果中筛选前预设数量个测井参数,作为所述目标模型特征。
进一步地,所述通过所述随机森林算法模型确定各个所述测井参数对页岩气甜点分类的重要程度,包括:
基于所述测井参数在所述随机森林算法模型中决策树中的使用情况和对应节点的基尼指数的评分,确定所述测井参数对页岩气甜点分类的重要程度。
进一步地,所述目标模型特征包括地质特征和工程特征,所述地质特征包括补偿声波、脆性指数、伽马、渗透率、泊松比、孔隙度、含气量、总有机碳和干酪根含量,所述工程特征包括方位和补偿中子。
进一步地,还包括:对所述测井数据进行预处理;
所述预处理包括缺失值填充或删除、异常值删除和归一化处理。
进一步地,所述基于所述数据集、预设损失函数和预设Adam优化器,对所述预测模型进行训练,得到参数优化后的预测模型,包括:
将所述数据集中与所述目标模型特征对应的测井数据输入至所述卷积神经网络模块中,以通过所述卷积神经网络模块得到包括所述目标模型特征之间空间特征的第一特征信息;
将所述第一特征信息输入至所述长短期记忆网络模块中,以通过所述长短期记忆网络模块得到包括井深变化影响的第二特征信息;
将所述第二特征信息输入至所述全连接层中,以通过所述全连接层基于所述第二特征信息学习所述目标模型特征之间的复杂关系,得到输出结果;
通过所示输出转化模块,将所述输出结果转化为预测结果,其中,所述预测结果包括页岩气井的每一页岩气层对应的页岩气甜点类别的概率值;
基于甜点类别标记结果和所述预测结果,通过Focal_Loss损失函数和Adam优化器,重复训练过程,得到参数优化后的预测模型。
本申请提供一种基于混合神经网络的页岩气甜点预测方法,具体包括:步骤1:获取页岩气井基础数据,并基于所述页岩气井基础数据生成数据集;步骤2:基于所述数据集,确定目标模型特征;步骤3:构建基于混合神经网络模型的预测模型,其中,所述预测模型包括卷积神经网络模块、长短期记忆网络模块、全连接层和输出转化模块,所述卷积神经网络模块用于捕捉所述目标模型特征之间的空间关系,得到第一特征信息;所述长短期记忆网络模块用于基于所述第一特征信息,得到包括井深变化影响的第二特征信息;所述第二特征信息用于供所述全连接层和所述输出转化模块生成和输出预测结果;步骤4:基于所述数据集、预设损失函数和预设Adam优化器,对所述预测模型进行训练,得到参数优化后的预测模型;步骤5:将待测页岩气井数据输入至参数优化后的预测模型,得到预测结果,可以大大提高页岩气甜点预测的效率和准确性。
附图说明
图1为本发明的流程图;
图2为本发明中随机森林算法的结构图;
图3为本发明中混合神经网络的结构图;
图4为本发明的实施例效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚,以下结合附图并列举实施例,对本发明做进一步详细说明。如图1所示,在本实施例中公开了一种基于混合神经网络的页岩气甜点预测方法,所述的方法按照以下步骤执行:
步骤1:获取页岩气井基础数据,并基于页岩气井基础数据生成数据集。
该步骤为数据预处理过程,最终生成数据集。
具体的,首先获取页岩气井基础数据,该基础数据可以通过实际检测得到的完井测井解释报告等中得到,具体的,完井测井解释报告中包含了各页岩气井的解释结论既其甜点类型,通过完井测井解释报告中页岩气井的解释结论对各页岩气井进行甜点类别标记,将被标记的页岩气井的测井数据和对应的页岩气井甜点类别标签整理成一个数据集包含测井数据和甜点类别的数据集。其中,测井数据(具体的数值)是与测井参数(如补偿声波、脆性指数和伽马等)以及井深(同一页岩气井的同一测井参数在不同井深的测井数据也不同)对应的。
需要说明的是,在本申请中,页岩气井每隔0.125米划分为一层,每一层对应一个井深,每层均包括对应的测井数据,而且上述过程对页岩气井进行的甜点类别标注可以是针对每一层即每一个页岩气层进行的。
该步骤还包括了对测井数据进行数据预处理,即:将数据中存在的缺失值进行填充或者删除,对异常值进行删除,最后进行归一化处理。
步骤2:基于数据集,确定目标模型特征。
具体的,将步骤1中的数据集输入随机森林算法模型中,随机森林算法模型会依据目标模型特征(根据本申请下文叙述可知,其与测井参数对应,也即将11种测井参数作为目标模型特征)对页岩气甜点分类影响的重要程度进行排序,通过目标模型特征的重要程度筛选出11种地质工程测井参数作为预测模型的主控参数也即特征变量即上述提到的目标模型特征。
步骤3:构建基于混合神经网络模型的预测模型。
其中,预测模型包括卷积神经网络模块、长短期记忆网络模块、全连接层和输出转化模块,卷积神经网络模块用于捕捉目标模型特征之间的空间关系,得到第一特征信息;长短期记忆网络模块用于基于第一特征信息,得到包括井深变化影响的第二特征信息;第二特征信息用于供全连接层和输出转化模块生成和输出预测结果。
具体的,实际构建和训练过程中,可以将步骤2选取的11种测井参数(作为目标模型特征)对应的测井数据作为卷积神经网络(CNN)的输入,通过CNN捕捉目标模型特征之间的空间关系,得到第一特征信息,然后输入到长短期记忆网络(LSTM)中,再将LSTM提取出的特征向量既第二特征信息传入全连接层中,通过全连接层学习目标模型特征之间的复杂关系,进一步提取和组合特征,最后通过输出转化模块如包括Sigmoid函数的模型,将模型的输出转化为甜点类别的概率值,从而得到预测结果。
步骤4:基于数据集、预设损失函数和预设Adam优化器,对预测模型进行训练,得到参数优化后的预测模型。
该步骤即为模型的调优与测试过程,以优化模型中的参数来优化模型。首先可以将上述得到的数据集划分为训练集和测试集,其次基于步骤3构建的模型,采用Focal_Loss作为损失函数,Adam优化器进行权值更新完成模型的训练与调优,然后利用独立测试集进行测试评估得到参数优化后的预测模型。
步骤5:将待测页岩气井数据输入至参数优化后的预测模型,得到预测结果。
具体的,首先可以对新井的甜点主控参数数据(新井与上述过程中确定的11个测井参数对应的测井数据)既待测页岩气井数据进行预处理,将其输入进参数优化后的预测模型中,即可得到预测结果,完成该井的页岩气甜点分类预测。
进一步地,在本申请一些实施例中,数据预处理具体可以包括:缺失值处理、异常值处理和归一化。
具体的,对于缺失值,在本申请中,针对处在井深上下边缘的测井数据中的缺失值进行的处理时,由于这部分数据使用插值法对实际数据会有影响,所以采取直接删除法删除行记录;其他个别缺失数据分布在井深中部,考虑数据随井深分布,所以在本申请中针对该部分缺失值可以采用缺失值所在列的临近位置上下两个值的平均值进行填充(在本申请中,同一页岩气井的同一测井参数在不同井深的测井数据为一列,同一页岩气井的不同测井参数在不同井深的测井数据形成多列)。
对于异常值,可以使用箱型图来检测异常值,由于异常值与其他数据明显不符以及超出合理范围,使用其他值填充会对结果造成偏差,所以本申请选择删除法来删除异常值,从而保证测井数据的质量和可信度。
归一化处理,考虑到选取的测井数据通常包含多个不同单位和量级的参数,所以本申请使用Z-SCORE方法对测井数据进行归一化处理,使得其中不同的特征具有相同的尺度,便于进行数据的比较与分析。
进一步地,在一些实施例中,步骤2的随机森林算法用来选择页岩气甜点的主控参数即目标模型特征。
具体的,在本申请中,步骤1中处理完成后的数据共对应36种测井参数,包含了复杂的地质参数和工程参数,其中井深不作为影响页岩气甜点分类的重要性特征,而是将其视为数据索引列,其余35种参数用来进行特征重要性评估。页岩气井甜点类别标签作为类别,共两个类别,即:一类页岩气甜点和二类页岩气甜点。
根据完井测井解释报告中的页岩气井解释结论,其中总有机碳含量大于3%、孔隙度含量大于5%、含气量大于3%、脆性指数含量大于0.55%的页岩气被视为一类页岩气甜点,其余则视为二类页岩气甜点。
本申请中,可以将特征重要性评分用VIM来表示,将基尼指数(Gini)用GI来表示,共有35个特征X1,X2,X3,…,X35,2个页岩气甜点类别,则每个特征Xj的基尼指数评分则可表示为VIMj (Gini),即第j个特征在随机森林所有决策树中节点分裂不纯度的平均改变量。节点m的Gini指数GIm的计算公式为:
其中,2表示有两个类别,为样本在节点m属于任意一类的概率估计值。
特征Xj在节点m的重要性,即节点m分枝前后的Gini指数变化量为:
其中,GIm是节点m的Gini指数,GIl和GIr分别表示节点m分枝后两个新节点的Gini指数。
特征Xj在随机森林中的基尼指数评分定义为:
其中n为随机森林中决策树的数量,i表示第i棵树,是特征Xj在第i棵树的基尼指数评分。
本申请利用随机森林算法模型,根据每个测井参数在决策树中的使用情况和对应节点的基尼指数评分来评估参数对于页岩气甜点分类的重要性也即重要程度,重要性较高的测井参数意味着在预测页岩气甜点时具有更大的贡献。即:将整理好的数据集输入进随机森林算法模型进行特征重要性评估,以获得每个测井参数对于页岩气甜点分类的重要性评分,然后将所有参数的评分进行排序,最后通过特征重要程度序列的差分分析,选取差分最大的位置作为阈值分割点,即阈值分割点前的为显著性影响因子。
实验数据显示差分最大位为第十二位,其评分与第十一个测井参数的得分的差距最大,所以选取前十一个测井参数作为对页岩气甜点分类影响最显著的主控参数即目标模型特征,最后规定将上述过程确定的主控参数对应的测井数据作为后续预测模型的输入数据,共计11种地质参数和工程参数,具体包括补偿声波(AC)、脆性指数(BRIT)、伽马(GR)、渗透率(PERM)、泊松比(POIS)、孔隙度(POR)、含气量(QALL)、方位(DAZ)、补偿中子(CNL)、总有机碳(TOC)、干酪根含量(VEKR)。
进一步地,所述步骤3的模型是卷积神经网络结合长短期记忆网络(CNN+LSTM)的组合模型。
CNN有助于捕获输入数据的空间特征和局部模式,例如各个参数之间的相关性和依赖性,这有助于更好地理解测井数据中的空间结构,而LSTM有助于捕获测井数据的井深序列关系(如上述介绍到的,本申请中测井数据对应不同井深,所以本申请中数据集中的测井数据可以看做是井深序列数据),不仅能够从序列数据中提取信息,还能够获取与井深相关的相邻测井参数值之间的信息,在处理测井数据这种具有空间结构和井深序列特征的数据时,将CNN和LSTM结合使用可以提高对复杂序列数据的建模能力,充分利用测井数据中的空间和井深序列信息,从而得到更加立体化的信息,有助于提高页岩气甜点分类预测的效率和精确度。
具体的,将步骤2选取的11种测井参数对应的测井数据作为CNN的输入,CNN中包括多个卷积层和池化层,卷积层通过卷积核对输入的数据进行卷积操作,提取测井数据的空间特征,其中,每个卷积核都会产生一个特征向量,用于捕捉不同尺度和模式的特征。卷积操作(f*g)(t)的数学公式如下:
其中,f是输入序列即本申请上述提到的数据集中的测井数据(例如针对一个页岩气井不同测井参数在不同井深下的序列数据),*表示卷积操作,g是卷积核,t是输出序列的时间步,a为输入序列的时间步,f(a)是输入序列f在时间步a处的值,g(t-a)表示卷积核g在时间步t处对应位置的权重。这个公式的含义是将卷积核g滑动到输入序列f上,每个位置计算卷积核和输入的乘积的累加和,然后再通过池化层对卷积后的特征向量进行降维操作,减少数据维度,同时保留重要的特征信息,经过CNN的处理,得到了一系列具有空间关系的特征向量即第一特征信息,这些特征向量被输入到LSTM模块中,以捕捉数据中的井深序列关系即井深变化影响,得到井深对测井数据的影响信息。
LSTM由一系列LSTM单元组成,每个LSTM单元都具有自己的记忆单元和门控机制,能够有效地处理序列数据,LSTM 的核心是记忆单元(cell state),记忆单元可以存储和传递信息,以捕捉序列中的上下文。LSTM中的遗忘门决定哪些旧的信息应该被遗忘或从记忆中删除,其计算公式如下:
其中ft为遗忘门的输出(在时间步t处),为Sigmoid激活函数,Wf为遗忘门的权重矩阵,ht-1为前一个时间步的隐藏状态,xt为当前时间步的输入,bf为偏置向量。
LSTM的输入门决定哪些新的信息应该被添加到当前的记忆单元,其计算公式如下:
其中it为输入门的输出(在时间步t处),为Sigmoid激活函数,Wi为输入门的权重矩阵,ht-1为前一个时间步的隐藏状态,xt为当前时间步的输入,bi为偏置向量。
LSTM的输出门控制着哪些记忆应该被发送到网络的输出或下一个时间步,其计算公式如下:
其中ot为输出门的输出(在时间步t处),为Sigmoid激活函数,Wo为输出门的权重矩阵,ht-1为前一个时间步的隐藏状态,xt为当前时间步的输入,bo为偏置向量。
在本申请中,将每个样本(对应每个页岩气井或者具体每个页岩气井的页岩气层)的输入数据表示为二维矩阵,其中每行代表一个时间步,每列代表从卷积层提取的特征,这种输入形式使得LSTM能够准确地学习到数据中的井深模式和井深序列依赖关系,即井深变化影响对测井数据的影响也即第二特征信息,将经过LSTM层处理后得到的特征向量即第二特征信息传递给全连接层,全连接层将学习到的特征映射到更高维度的表示空间,并通过线性变换和非线性激活函数的组合,提取出更抽象、更具区分度的特征,最后采用Sigmoid函数,将模型的输出转化为每个类别的概率值。
Sigmoid函数可以将输入其内的结果转化为一个介于0和1之间的输出值,可以理解为将实数值转化为0到1之间的概率值,输出值越接近1,表示样本属于正类的概率越大;输出值越接近0,表示样本属于负类的概率越大,通过设置一个阈值(0.5)来进行分类决策,当输出值大于阈值时,将样本划分为正类,否则划分为负类。其中,一类页岩气甜点设置为正类,二类页岩气甜点设置为负类。
进一步地,在本申请中,所述步骤4的数据集可以采用分层随机抽样的方法划分为训练集和测试集。通过训练集,模型可以调整其参数,以最小化损失函数,使其在训练数据上表现得尽可能好,通过测试集,可以衡量模型在新数据上的表现,检测其泛化能力。
由于测井数据存在严重的页岩气甜点类别不平衡的问题,即:一类页岩气甜点的数量占比约70%,二类页岩气甜点的数量占比约30%,所以本申请针对类别不平衡问题,采用了Focal_Loss作为损失函数。
Focal_Loss 损失函数是一种针对不平衡数据集的特殊损失函数,通过动态调整策略处理不平衡数据集,可以设置超参数α为0.25,根据样本的预测概率和甜点类别标签的标记结果(即样本的真实页岩气井甜点类别),增加误分类的正例和负例样本的权重,其中正例是指目标类别为二类页岩气甜点,负例是指目标类别为一类页岩气甜点,设置超参数gamma为2,用于增加模型对难以分类的样本的关注度,从而消除一类页岩气甜点多于二类页岩气甜点的不平衡问题。权值更新算法可以选用Adam优化器,Adam是一种自适应学习率的梯度下降优化算法,它能够自动调整每个模型参数的学习率,加速模型训练的收敛速度,提高模型的性能,同时具备较好的鲁棒性,有助于防止模型过拟合。
本申请基于“地质工程一体化”的思想,利用测井数据及压裂施工数据,通过随机森林算法对页岩气甜点的主控参数进行分析,筛选出了特征重要性排名高的测井参数作为主控参数即目标模型特征,将筛选出的测井参数对应的测井数据作为混合神经网络(CNN+LSTM)的输入数据,采用Focal_Loss损失函数来解决页岩气甜点类别不均衡的问题,以实现对页岩气甜点的分类预测。 与单一的统计学方法或机器学习方法相比,本发明大大提高了页岩气甜点预测的准确率和稳定性,并有效解决了传统预测方法的局限性,并且通过结合CNN和LSTM两大网络模型,解决了单一模型带来的预测局限性,弥补了彼此的不足,提高了模型的综合性能和泛化能力。根据不同类型页岩气甜点的预测结果,可以做出相应的决策,包括确定投资规模、制定开采计划、评估经济效益等,从而降低风险并提高决策的科学性和可行性。
下面将以一个完整的实施例结合具体实现方式,对上述基于混合神经网络的页岩气甜点预测方法进行介绍,具体如下:
步骤1:数据预处理。
具体的,首先使用测井数据处理软件将原始的测井文件转化为TXT文本文件,再使用Python程序转换成CSV文件,其中第一行为表头,记录了各个测井参数的名称,对于保存在测井业务数据存储系统的数据,将其导出也保存在CSV文件中。
以及根据完井测井解释报告中的页岩气井解释结论对页岩气井进行甜点类别标记,形成一列页岩气井甜点类别标签,其中总有机碳含量大于3%、孔隙度含量大于5%、含气量大于3%、脆性指数含量大于0.55%的页岩气被视为一类页岩气甜点(标记为1),其余则视为二类页岩气甜点(标记为0),将与测井参数对应的测井数据和对应的页岩气井甜点类别标签整理成一个数据集包含测井参数(可作为模型的特征)以及测井数据和甜点类别(可作为模型的目标变量)。
以及在该步骤中,还可以针对数据实际情况进行预处理,例如包括如上述实施例中提到的异常值处理、缺失值处理和归一化处理等,具体可以参考上述实施例中数据预处理的中对应部分进行理解,在此不再进行赘述。
最终得到每个样本对应的行表头为不同测井参数,列表头为不同井深,以及填充对应测井数据的且包含页岩气井或页岩气层甜点类型标记的表格,由所有样本的表格组成数据集。
步骤2:特征选取。
步骤1中处理完成后的数据共有36种测井参数,包含了复杂的地质参数和工程参数,其中包括井深,但在本申请中井深不作为影响页岩气甜点分类的重要性特征,而是将其视为数据索引列,其余35种参数用来进行特征重要性评估,页岩气井甜点类别标签作为类别。
基于随机森林算法的特征选取方法(如图2所示)将决策树的数量设置为1000棵,然后将测井参数以及对应的测井数据和页岩气井甜点类别标签输入到随机森林算法模型中进行训练,将所有测井参数进行评分排序。其中,第十二个测井参数与第十一个测井参数的差分最大,所以选取前十一个测井参数作为是对页岩气甜点分类显著性影响因素作为预测模型的目标模型特征,共计11种地质参数和工程参数,具体包括补偿声波(AC)、脆性指数(BRIT)、伽马(GR)、渗透率(PERM)、泊松比(POIS)、孔隙度(POR)、含气量(QALL)、方位(DAZ)、补偿中子(CNL)、总有机碳(TOC)、干酪根含量(VEKR)。
步骤3:构建基于混合神经网络模型(CNN+LSTM)的页岩气甜点预测模型。
如图3所示。首先使用Convolution1D层创建一个具有64个滤波器和窗口大小为3的卷积层,激活函数为ReLU,输入数据的形状为(11, 1),其中11表示特征数(选取的11种测井参数,这些参数用于描述地下岩层的性质,这些性质将被用来预测页岩气甜点类别),1表示输入的通道数(这里是单通道)。然后,通过MaxPooling1D层(最大池化层)进行最大池化,将每个通道中相邻的2个特征值合并成一个,减少了数据的维度和计算复杂性。接着,再添加一个具有128个滤波器和窗口大小为3的卷积层,激活函数为ReLU,再添加一个MaxPooling1D层进行最大池化。
接下来,添加一个LSTM层,设置64个LSTM单元,并通过Dropout层进行正则化,防止过拟合,再次添加一个LSTM层,设置64个LSTM单元,并通过Dropout层进行正则化。
然后,添加一个全连接层,设置48个神经元,激活函数为ReLU,并通过Dropout层进行正则化。最后,添加一个全连接层,设置1个神经元,激活函数采用Sigmoid,用于输出一类页岩气甜点和二类页岩气甜点对应的概率值。
步骤4:模型调优与测试。
将数据集采用分层随机抽样的方法划分为训练集和测试集。通过训练集训练,模型可以调整其参数,以最小化损失函数,使其在训练数据上表现得尽可能好,通过测试集,可以衡量模型在新数据上的表现,检测其泛化能力。
基于步骤3构建的模型,采用Focal_Loss作为损失函数,Adam优化器进行权值更新完成模型的训练与调优,Focal_Loss 损失函数是一种针对不平衡数据集的特殊损失函数,通过动态调整策略处理不平衡数据集,设置超参数α为0.25,主要根据样本的预测概率和标记的真实页岩气井甜点类别标签,增加误分类的正例和负例样本的权重,其中正例是指目标类别为二类页岩气甜点,负例是指目标类别为一类页岩气甜点,设置超参数gamma为2,用于增加模型对难以分类的样本的关注度,从而消除一类页岩气甜点多于二类页岩气甜点的不平衡问题。Adam是一种自适应学习率的梯度下降优化算法,通过其能够自动调整每个模型参数的学习率,加速模型训练的收敛速度,提高模型的性能,同时具备较好的鲁棒性,防止过拟合。
最后,利用独立测试集来评估训练好的预测模型的性能,以及实际应用中,对新井的甜点主控参数数据进行预处理,然后将其输入进预测模型中即可完成该井的页岩气甜点分类预测。
图4为本发明的实施例效果图,对于一类页岩气甜点和二类页岩气甜点,模型能较好地进行分类预测,原始甜点类别为真实的页岩气甜点分类结果,预测结果为模型的预测结果,在本实施例中,模型取得了卓越的性能表现,其中准确率(Accuracy)高达0.97,综合评价指标F1值(F1-Score)达到了0.98,同时ROC曲线下面积为0.96,这些指标显著性展示了本申请参数优化后的预测模型的分类预测能力。
以上所述,并非对本发明作任何形式上的限制,虽然本发明已通过上述实施例揭示,但是并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,可利用上述揭示的技术内容做出些变动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (5)

1.一种基于混合神经网络的页岩气甜点预测方法,其特征在于,包括:
步骤1:获取页岩气井基础数据,所述页岩气井基础数据包括页岩气井的甜点类别和测井数据,所述测井数据与测井参数和井深对应;基于所述甜点类别对对应页岩气井进行标记;基于所述页岩气井的测井数据与页岩气井对应的甜点类别生成所述数据集;
步骤2:基于所述数据集,确定目标模型特征;
步骤3:构建基于混合神经网络模型的预测模型,其中,所述预测模型包括卷积神经网络模块、长短期记忆网络模块、全连接层和输出转化模块,所述卷积神经网络模块用于捕捉所述目标模型特征之间的空间关系,得到第一特征信息;所述长短期记忆网络模块用于基于所述第一特征信息,得到包括井深变化影响的第二特征信息;所述第二特征信息用于供所述全连接层和所述输出转化模块生成和输出预测结果;
步骤4:将所述数据集中与所述目标模型特征对应的测井数据输入至所述卷积神经网络模块中,以通过所述卷积神经网络模块得到包括所述目标模型特征之间空间特征的第一特征信息;将所述第一特征信息输入至所述长短期记忆网络模块中,以通过所述长短期记忆网络模块得到包括井深变化影响的第二特征信息;将所述第二特征信息输入至所述全连接层中,以通过所述全连接层基于所述第二特征信息学习所述目标模型特征之间的复杂关系,得到输出结果;通过所示输出转化模块,将所述输出结果转化为预测结果,其中,所述预测结果包括页岩气井的每一页岩气层对应的页岩气甜点类别的概率值;基于甜点类别标记结果和所述预测结果,通过Focal_Loss损失函数和Adam优化器,重复训练过程,得到参数优化后的预测模型;
步骤5:将待测页岩气井数据输入至参数优化后的预测模型,得到预测结果。
2.根据权利要求1所述的基于混合神经网络的页岩气甜点预测方法,其特征在于,所述基于所述数据集,确定目标模型特征,包括:
将所述数据集输入至预设随机森林算法模型中,通过所述随机森林算法模型确定各个所述测井参数对页岩气甜点分类的重要程度;
基于所述重要程度对所述测井参数进行排序;
从排序结果中筛选前预设数量个测井参数,作为所述目标模型特征。
3.根据权利要求2所述的基于混合神经网络的页岩气甜点预测方法,其特征在于,所述通过所述随机森林算法模型确定各个所述测井参数对页岩气甜点分类的重要程度,包括:
基于所述测井参数在所述随机森林算法模型中决策树中的使用情况和对应节点的基尼指数的评分,确定所述测井参数对页岩气甜点分类的重要程度。
4.根据权利要求1所述的基于混合神经网络的页岩气甜点预测方法,其特征在于,所述目标模型特征包括地质特征和工程特征,所述地质特征包括补偿声波、脆性指数、伽马、渗透率、泊松比、孔隙度、含气量、总有机碳和干酪根含量,所述工程特征包括方位和补偿中子。
5.根据权利要求1所述的基于混合神经网络的页岩气甜点预测方法,其特征在于,还包括:对所述测井数据进行预处理;
所述预处理包括缺失值填充或删除、异常值删除和归一化处理。
CN202311555722.9A 2023-11-21 2023-11-21 一种基于混合神经网络的页岩气甜点预测方法 Active CN117272841B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311555722.9A CN117272841B (zh) 2023-11-21 2023-11-21 一种基于混合神经网络的页岩气甜点预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311555722.9A CN117272841B (zh) 2023-11-21 2023-11-21 一种基于混合神经网络的页岩气甜点预测方法

Publications (2)

Publication Number Publication Date
CN117272841A CN117272841A (zh) 2023-12-22
CN117272841B true CN117272841B (zh) 2024-01-26

Family

ID=89219944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311555722.9A Active CN117272841B (zh) 2023-11-21 2023-11-21 一种基于混合神经网络的页岩气甜点预测方法

Country Status (1)

Country Link
CN (1) CN117272841B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117851928A (zh) * 2024-03-07 2024-04-09 特雷西能源科技股份有限公司 基于cnn-lstm模型预测页岩油产量的方法及系统

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268860A (zh) * 2018-02-09 2018-07-10 重庆科技学院 一种基于卷积神经网络的天然气集输站设备图像分类方法
CN108301823A (zh) * 2018-01-19 2018-07-20 北京捷贝通石油技术股份有限公司 一种识别储层油气甜点的方法
KR101975436B1 (ko) * 2018-10-25 2019-05-07 동아대학교 산학협력단 머신러닝 기법을 이용한 천이 유동 영역의 셰일가스정에 대한 생산성 예측 장치 및 방법
CN111324990A (zh) * 2020-03-19 2020-06-23 长江大学 基于多层长短期记忆神经网络模型的孔隙度预测方法
CN111461386A (zh) * 2019-12-27 2020-07-28 中国地质调查局成都地质调查中心 基于bp神经网络的页岩气甜点预测方法
CN112712025A (zh) * 2020-12-29 2021-04-27 东北石油大学 一种基于长短期记忆神经网络的复杂岩性识别方法
CN114091883A (zh) * 2021-11-16 2022-02-25 中海石油(中国)有限公司 井漏风险层位钻前预测方法、装置、介质及设备
CN114114414A (zh) * 2021-11-18 2022-03-01 电子科技大学长三角研究院(湖州) 一种页岩储层“甜点”信息人工智能预测方法
CN114638300A (zh) * 2022-03-16 2022-06-17 长江大学 一种识别页岩油气藏“甜点”的方法、装置及存储介质
CN114757446A (zh) * 2022-05-18 2022-07-15 中国石油大学(北京) 陆相页岩油综合甜点的预测方法、装置及计算机存储介质
CN115199240A (zh) * 2022-08-25 2022-10-18 西南石油大学 一种页岩气井产量预测方法、装置及存储介质
CN116168172A (zh) * 2023-04-19 2023-05-26 武汉中旺亿能科技发展有限公司 页岩油气甜点预测方法、装置、设备及存储介质
CN116433059A (zh) * 2021-12-31 2023-07-14 中国石油天然气股份有限公司 一种页岩油甜点智能评价方法及装置
CN116719081A (zh) * 2023-04-10 2023-09-08 中国矿业大学(北京) 一种基于机器学习的海陆过渡相页岩气评价方法
CN116927771A (zh) * 2023-07-18 2023-10-24 成都理工大学 一种预测页岩储层总有机碳数据的方法、装置、设备及介质
CN116992757A (zh) * 2023-07-17 2023-11-03 西南石油大学 基于深度学习和滚动优化的井口压力预测方法和装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108301823A (zh) * 2018-01-19 2018-07-20 北京捷贝通石油技术股份有限公司 一种识别储层油气甜点的方法
CN108268860A (zh) * 2018-02-09 2018-07-10 重庆科技学院 一种基于卷积神经网络的天然气集输站设备图像分类方法
KR101975436B1 (ko) * 2018-10-25 2019-05-07 동아대학교 산학협력단 머신러닝 기법을 이용한 천이 유동 영역의 셰일가스정에 대한 생산성 예측 장치 및 방법
CN111461386A (zh) * 2019-12-27 2020-07-28 中国地质调查局成都地质调查中心 基于bp神经网络的页岩气甜点预测方法
CN111324990A (zh) * 2020-03-19 2020-06-23 长江大学 基于多层长短期记忆神经网络模型的孔隙度预测方法
CN112712025A (zh) * 2020-12-29 2021-04-27 东北石油大学 一种基于长短期记忆神经网络的复杂岩性识别方法
CN114091883A (zh) * 2021-11-16 2022-02-25 中海石油(中国)有限公司 井漏风险层位钻前预测方法、装置、介质及设备
CN114114414A (zh) * 2021-11-18 2022-03-01 电子科技大学长三角研究院(湖州) 一种页岩储层“甜点”信息人工智能预测方法
CN116433059A (zh) * 2021-12-31 2023-07-14 中国石油天然气股份有限公司 一种页岩油甜点智能评价方法及装置
CN114638300A (zh) * 2022-03-16 2022-06-17 长江大学 一种识别页岩油气藏“甜点”的方法、装置及存储介质
CN114757446A (zh) * 2022-05-18 2022-07-15 中国石油大学(北京) 陆相页岩油综合甜点的预测方法、装置及计算机存储介质
CN115199240A (zh) * 2022-08-25 2022-10-18 西南石油大学 一种页岩气井产量预测方法、装置及存储介质
CN116719081A (zh) * 2023-04-10 2023-09-08 中国矿业大学(北京) 一种基于机器学习的海陆过渡相页岩气评价方法
CN116168172A (zh) * 2023-04-19 2023-05-26 武汉中旺亿能科技发展有限公司 页岩油气甜点预测方法、装置、设备及存储介质
CN116992757A (zh) * 2023-07-17 2023-11-03 西南石油大学 基于深度学习和滚动优化的井口压力预测方法和装置
CN116927771A (zh) * 2023-07-18 2023-10-24 成都理工大学 一种预测页岩储层总有机碳数据的方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于机器学习的深层页岩有利储集层预测方法及实践;程冰洁 等;石油勘探与开发;第49卷(第5期);918-928 *

Also Published As

Publication number Publication date
CN117272841A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN110346831B (zh) 一种基于随机森林算法的智能化地震流体识别方法
CN112989708B (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
CN110619353B (zh) 一种基于深度学习的多尺度测井曲线自动识别方法
CN107356958A (zh) 一种基于地质信息约束的河流相储层分步地震相预测方法
CN108897975A (zh) 基于深度信念网络的煤层气测井含气量预测方法
CN117272841B (zh) 一种基于混合神经网络的页岩气甜点预测方法
CN111191741A (zh) 一种岩石识别深度学习模型岩石分类约束继承性损失方法
CN109613623B (zh) 一种基于残差网络的岩性预测方法
CN113033648A (zh) 一种使用机器学习算法实现测井解释的方法
CN114117881A (zh) 一种出砂风险预测方法及系统
Shirazy et al. K-means clustering and general regression neural network methods for copper mineralization probability in Chahar-Farsakh, Iran
Ye et al. Drilling formation perception by supervised learning: Model evaluation and parameter analysis
Rong et al. Machine learning method for TOC prediction: Taking wufeng and longmaxi shales in the Sichuan Basin, Southwest China as an example
Akinyokun et al. Well log interpretation model for the determination of lithology and fluid
Alameedy et al. Evaluating machine learning techniques for carbonate formation permeability prediction using well log data
CN114638300A (zh) 一种识别页岩油气藏“甜点”的方法、装置及存储介质
CN117473305A (zh) 一种近邻信息增强的储层参数预测方法及系统
CN110118994B (zh) 一种基于地震反演和机器学习的陆相烃源岩定量预测方法
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
Anifowose et al. A functional networks-type-2 fuzzy logic hybrid model for the prediction of porosity and permeability of oil and gas reservoirs
CN115936234A (zh) 一种基于深度学习的薄储层空间分布预测方法
CN111753871B (zh) 基于xgboost算法与特征工程的岩性及流体类型识别方法
CN115809411A (zh) 一种基于测井数据的改进型决策树岩性识别方法
Zhou et al. Lithology classification system for well logging based on bidirectional gated recurrent unit
Yuan et al. Application of Active Learning in Carbonate Lithologic Identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant