CN116167195A - 基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统 - Google Patents

基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统 Download PDF

Info

Publication number
CN116167195A
CN116167195A CN202111406115.7A CN202111406115A CN116167195A CN 116167195 A CN116167195 A CN 116167195A CN 202111406115 A CN202111406115 A CN 202111406115A CN 116167195 A CN116167195 A CN 116167195A
Authority
CN
China
Prior art keywords
lithology
features
feature
relative
layer thickness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111406115.7A
Other languages
English (en)
Inventor
赵向原
游瑜春
曾大乾
尚墨翰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Exploration and Production Research Institute
Original Assignee
China Petroleum and Chemical Corp
Sinopec Exploration and Production Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Exploration and Production Research Institute filed Critical China Petroleum and Chemical Corp
Priority to CN202111406115.7A priority Critical patent/CN116167195A/zh
Publication of CN116167195A publication Critical patent/CN116167195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明提供了一种基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统,该方法通过选取合理的优势层厚区间并设置平滑窗口,进而根据平滑窗口决策满足要求的多尺度相对特征,利用XGBoost算法训练构建多尺度相对特征识别模型,针对待识别的井段,根据录井、测井作业时的测量数据选取关联的岩石物理参数,作为岩层属性特征,进而将岩层属性特征输入预先构建的多尺度相对特征识别模型中,得到岩性标签识别结果。采用该方案,综合考虑了地质非均质性特点导致的不同井点处特征分布差异性,针对沉积、构造、成岩差异带来的弹性特征混叠和单一尺度特征对岩性刻画能力不足问题,有效开展井周岩性分布识别,相对于传统识别技术能够显著提高岩性识别的准确性。

Description

基于XGBoost算法的综合多尺度相对特征识别岩性的方法及 系统
技术领域
本发明涉及油气田勘探及开发技术领域,主要涉及油气田勘探或开发作业过程中利用测井数据对地下钻遇地层的岩性的识别,尤其涉及一种基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统。
背景技术
在含油气性评价、油藏描述等方面的研究中,岩性作为油藏分布的前提条件,在圈定有利层位和标定油层方面起着关键作用。基于此,地球物理测井岩性识别技术指的是利用测井数据对井壁周围岩性的判断;如果岩性识别不准确,在此基础上标定的岩性测井响应将产生错误的信息,并造成基于测井分析的地震岩性识别有偏差。
岩性的测井响应信息受多方面及多项因素的影响,呈现为同一岩性在不同深度段,在不同地质区域表现为不同的特征分布,而不同岩性之间的特征分布也可能具有较大的重合度,因此要进行地球物理测井岩性识别具有较大难度。
目前,利用测井资料进行地层岩性识别的方法主要有交会图法、统计学法等。例如CN110805435A公开的一种基于测井资料识别复杂岩性的方法及系统,通过根据岩心资料与测井资料确定模板岩性的多个测井特征值,进而对模板岩性每个测井特征值的最小值和最大值进行标准化,然后在同一图版内,分别绘制标准化后最小值和最大值的特征图形,获得岩性识别图版;将标准化的待识别测井特征值投影到岩性识别图版上以识别岩性。
上述传统的储层岩性识别技术识别精度低、效率慢,受人为因素影响大,难以处理高维度信息,不利于广泛实际利用。近年来,利用机器学习方法进行岩性自动识别的方法得到广泛应用,这类方法借助机器学习模型,如支持向量机、随机森林、梯度提升树和多种神经网络,学习多维度的特征信息到岩性标签的复杂非线性映射关系,进而根据待预测样本的特征判断其岩性类别。
而在上述利用机器学习进行测井岩性识别的方法中,往往忽视对岩性相关数据特征的关注,当研究区块地质情况较为复杂时会存在以下问题:
①待预测井的测井岩石物理响应特征与训练井的特征分布范围存在差异,模型预测结果出现偏差。如当研究区块构造起伏大,或沉积相、岩相等因素发生变化时,不同部位井的参数特征分布范围可能存在差异,当训练井中样本的特征多样性不能覆盖预测井的情况时,由训练样本得到的机器学习模型则难于正确的识别待预测井的岩性;
②不同岩性的特征分布重合度高,对岩性的区分能力有限。如当目的层为沉积压实效应明显的浅-中层地层时,浅层特征和深层特征混合在一起,导致不同岩性特征的规律被模糊,增加了岩性识别的难度;
③低维度单尺度特征难以对岩性进行全面的有效的刻画。岩石的复杂多样性综合体现在多种特征的差异上,利用有限的少量特征往往不能全面的表征岩性之间的区别,而单一尺度的数据特征只能聚焦在特定的范围内,对更大或更小尺度的岩性特点不能进行更合适的表示。
针对上述问题,若缺少对数据特征的关注与挖掘,将限制算法对真正映射关系的学习表示,有可能导致利用机器学习进行岩性预测带来错误的岩性识别结果。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成己为本领域技术人员所公知的现有技术。
发明内容
为解决上述问题,本发明提供了一种基于XGBoost算法的综合多尺度相对特征识别岩性的方法,在一个实施例中,所述方法包括:
待识别特征获取步骤、根据当前井段录井、测井作业时的测量数据选取与岩性识别关联的岩石物理参数,作为当前井段岩层的岩层属性特征;
岩性标签识别步骤、将所述岩层属性特征输入预先构建的多尺度相对特征识别模型中,得到输出的岩性标签数据,作为当前井段岩层的岩性识别结果;
其中,所述多尺度相对特征识别模型是按照设定策略选取的优势层厚区间基于其设置平滑窗口,进而根据所设的平滑窗口决策满足要求的多尺度相对特征,利用XGBoost算法优化训练构建的。
优选地,构建所述多尺度相对特征识别模型的过程中,通过以下操作选取所述优势层厚区间:
步骤A1、统计设定周期内所选已有井中出现次数达到设定条件的所有岩层厚度区间数据,将统计的各个对象按照出现频次进行排序,以出现频次最大为优选准则选取若干岩层厚度区间作为第一备选层厚区间;
步骤A2、以层厚奖励大为优选准则,选取若干岩层厚度区间作为第二备选层厚区间;
步骤A3、将所述第一优势层厚区间与第二优势层厚区间作并集运算,得到的若干层厚区间为目标优势层厚区间。
进一步地,一个实施例中,按照以下逻辑根据选取的优势层厚区间设置平滑窗口:
w=v2/s
式中,w为当前优势层厚区间[v1,v2)对应的合理平滑窗口大小,所述S表示测井采样间隔,m。
具体地,一个实施例中,构建所述多尺度相对特征识别模型的过程中,通过以下操作根据所设的平滑窗口决策得到多尺度相对特征:
步骤B1、围绕所选的每口已有井分别获取其岩层的岩层属性特征作为原特征;
步骤B2、采用滑动平均法根据各项滑动窗口针对已有井的每一项原特征得到对应的多项平滑特征,将每一项原特征减去平滑特征得到匹配的多项相对特征,并与所属已有井关联记录。
一个优选的实施例中,构建所述多尺度相对特征识别模型的过程中,为减少特征冗余,还包括特征优选步骤,通过执行以下操作选取目标相对特征集合:
步骤C1、以同一平滑窗口的相对特征为一组,分别测试各个平滑窗口的相对特征对岩性识别的贡献能力;
步骤C2、基于贡献能力测试结果将这些平滑窗口的特征按能力由高到低的次序依次加入到由原特征形成的特征集合中;特征集合每次更新后,测试当前更新后特征集合相对于更新前特征集合对岩性的识别效果,若识别效果有提高,则执行步骤C2进一步将下个平滑窗口对应的一组特征加入当前的特征集合中;若识别效果无提高,执行步骤C3;
步骤C3、停止特征的加入,将当前的特征集合作为目标相对特征集合。
进一步地,一个实施例中,在所述步骤C1中,通过XGBoost算法结合交叉验证方法应用于所有相对特征数据得到各个平滑窗口的相对特征对岩性识别的贡献能力,其中,以平均F1score作为其评价指标。
具体地,一个实施例中,构建所述多尺度相对特征识别模型的过程中,按照以下操作得到多尺度相对特征识别模型的关系函数:
按照设定的需求选取若干已知井段作为训练井,获取训练井的岩层属性特征;
分别以各训练井的岩层属性特征结合优选后的对应目标相对特征综合作为XGBoost梯度提升树算法的输入,以对应的岩性识别标签为标准输出,结合设定的参数调优策略使XGBoost算法拟合得到输入与标准输出之间的最佳映射关系,该关系函数则为最终的多尺度相对特征识别模型。
一个可选的实施例中,所述岩层属性特征包括:纵波速度、横波速度、密度、自然伽马、孔隙度以及电阻率参数。
基于上述任意一个或多个实施例中所述方法的其他方面,本发明还提供一种存储介质,该存储介质上存储有可实现如上述任意一个或多个实施例中所述方法的程序代码。
基于上述任意一个或多个实施例中所述方法的执行方面,本发明还提供一种基于XGBoost算法的综合多尺度相对特征识别岩性的系统,该系统执行如上述任意一个或多个实施例中所述的方法。
与最接近的现有技术相比,本发明还具有如下有益效果:
本发明提供的一种基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统,该方法通过选取合理的优势层厚区间并设置平滑窗口,进而根据所设的平滑窗口决策满足要求的多尺度相对特征,利用XGBoost算法训练构建多尺度相对特征识别模型,应用时,针对待识别的井段,根据录井、测井作业时的测量数据选取关联的岩石物理参数,作为岩层属性特征,输入预先构建的多尺度相对特征识别模型中即可得到岩性标签识别结果。采用该方案,深度挖掘岩层特征的多尺度性能,综合考虑了地质非均质性特点导致的不同井点处特征分布差异性,针对沉积、构造、成岩差异带来的弹性特征混叠和单一尺度特征对岩性刻画能力不足问题,有效开展井周岩性分布识别,相对于传统识别技术能够显著提高岩性识别的准确性,得到符合地下真实岩性发育状况的岩性分布数据,而且对薄层的岩性识别更为有效。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一实施例所提供基于XGBoost算法的综合多尺度相对特征识别岩性的方法的流程示意图;
图2为本发明另一实施例所提供综合多尺度相对特征识别岩性的方法中构建识别模型的流程示意图。
图3为研究区五口井使用原特征识别和使用本发明一实施例中综合多尺度相对特征识别两种方法的岩性预测结果的F1 score比较示意图。
图4为实施例中研究区某口井真实岩性(Label)、使用原特征的岩性预测结果(Original Features)以及使用本发明实施例综合多尺度相对特征识别方法的岩性预测结果(Original+Relative Features)示意图。
图5为研究区五口井使用本发明实施例综合多尺度相对特征识别方法岩性预测结果相比使用原特征的岩性预测结果在相应层厚上的准确率变化示意图。
图6是本发明一实施例提供的基于XGBoost算法的综合多尺度相对特征识别岩性的系统的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此本发明的实施人员可以充分理解本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程并依据上述实现过程具体实施本发明。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。各项操作的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
计算机设备包括用户设备与网络设备。其中,用户设备或客户端包括但不限于电脑、智能手机、PDA等;网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云。计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制,使用这些术语仅仅是为了将一个单元与另一个单元进行区分。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
在含油气性评价、油藏描述等方面的研究中,岩性作为油藏分布的前提条件,在圈定有利层位和标定油层方面起着关键作用;实际施工过程中,如果岩性识别不准确,在此基础上标定的岩性测井响应将产生错误的信息,并造成基于测井分析的地震岩性识别有偏差。
岩性的测井响应信息受多方面及多项因素的影响,呈现为同一岩性在不同深度段,在不同地质区域表现为不同的特征分布,而不同岩性之间的特征分布也可能具有较大的重合度,因此要进行地球物理测井岩性识别具有较大难度。
目前,利用测井资料进行地层岩性识别的方法主要有交会图法、统计学法等。例如以下技术成果:[1]Jian Z,Fu-hong G A O.Application of crossplots based on welllog data in identifying volcanic lithology[J].Global Geology,2003,22(2):136-140;[2]胡东风,郭旭升,王燕,等.基于测井资料识别复杂岩性的方法及系统,CN110805435A[P].2020;根据岩心资料与测井资料确定模板岩性的多个测井特征值,进而对模板岩性每个测井特征值的最小值和最大值进行标准化,然后在同一图版内,分别绘制标准化后最小值和最大值的特征图形,获得岩性识别图版;将标准化的待识别测井特征值投影到岩性识别图版上以识别岩性。[3]田玉昆,周辉,袁三一.基于马尔科夫随机场的岩性识别方法[J].地球物理学报,2013,56(4):1360-1368。
上述传统的储层岩性识别技术识别精度低、效率慢,受人为因素影响大,难以处理高维度信息,不利于广泛实际利用。近年来,利用机器学习方法进行岩性自动识别的方法得到广泛应用,这类方法借助机器学习模型,如支持向量机、随机森林、梯度提升树和多种神经网络,学习多维度的特征信息到岩性标签的复杂非线性映射关系,进而根据待预测样本的特征判断其岩性类别。具体成果可见:[4]Mou D,Wang Z W.A comparison of binaryand multiclass support vector machine models for volcanic lithologyestimation using geophysical log data from Liaohe Basin,China[J].ExplorationGeophysics,2015,47(2):145-149;[5]Cracknell M J,Reading A M.The upside ofuncertainty:Identification of lithology contact zones from airbornegeophysics and satellite data using random forests and support vectormachines[J].Geophysics,2013,78(3):WB113-WB126;[6]Benaouda D,Wadge G,WhitmarshR B,et al.Inferring the lithology of borehole rocks by applying neuralnetwork classifiers to downhole logs:an example from the Ocean DrillingProgram[J].Geophysical Journal International,1999,136;[7]Yxa B,Cz C,Wen Z B,et al.Evaluation of machine learning methods for formation lithologyidentification:A comparison of tuning processes and model performances[J].Journal of Petroleum Science and Engineering,2018,160:182-193。
而在上述利用机器学习进行测井岩性识别的方法中,往往忽视对岩性相关数据特征的关注,当研究区块地质情况较为复杂时会存在以下问题:
①待预测井的测井岩石物理响应特征与训练井的特征分布范围存在差异,模型预测结果出现偏差。如当研究区块构造起伏大,或沉积相、岩相等因素发生变化时,不同部位井的参数特征分布范围可能存在差异,当训练井中样本的特征多样性不能覆盖预测井的情况时,由训练样本得到的机器学习模型则难于正确的识别待预测井的岩性;
②特征分布重合度高,对岩性的区分能力有限。如当目的层为沉积压实效应明显的浅-中层地层时,浅层特征和深层特征混合在一起,导致不同岩性特征的规律被模糊,增加了岩性识别的难度;
③低维度单尺度特征难以对岩性进行全面的有效的刻画。岩石的复杂多样性综合体现在多种特征的差异上,利用有限的少量特征往往不能全面的表征岩性之间的区别,而单一尺度的数据特征只能聚焦在特定的范围内,对更大或更小尺度的岩性特点不能进行更合适的表示。
显然的,针对上述问题,若缺少对数据特征的关注与挖掘,将限制算法对真正映射关系的学习表示,有可能导致利用机器学习进行岩性预测带来错误的岩性识别结果。
为解决上述问题,本发明提供一种基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统,主要涉及钻井过程中利用测井数据对地下钻遇地层的岩性的精准识别,为进一步进行地层评价、油藏描述和求解储层参数奠定基础。
本发明研究人员考虑到复杂地质构造区块的岩石的弹性特征及物理特征具有多样性,其测井响应模式呈现出随空间位置及深度变化的特点,势必造成不同岩性的特征分布重叠,单一尺度的测井数据对岩性的刻画能力有限。针对以上技术研究,本发明提出一种使用XGBoost算法和多尺度相对岩石物理特征识别岩性的方法,通过该方法能够得到符合地下实际岩性发育状况的岩性分布,并有效提高了薄岩层的岩性识别预测效果。
本发明利用录井、测井标定的岩性和测井数据获得不同尺度的相对岩石物理特征,通过基于机器学习方法XGBoost训练的多尺度相对特征识别模型围绕岩石物理特征对测井岩性进行识别,提升预测准确率的同时提高对薄层的识别能力。
接下来基于附图详细描述本发明实施例的方法的详细流程,附图的流程图中示出的步骤可以在包含诸如一组计算机可执行指令的计算机系统中执行。虽然在流程图中示出了各步骤的逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一
图1示出了本发明实施例一提供的基于XGBoost算法的综合多尺度相对特征识别岩性的方法的流程示意图,参照图1可知,该方法包括如下步骤。
待识别特征获取步骤、根据当前井段在录井、测井作业时的测量数据选取与岩性识别关联的岩石物理参数,作为当前井段岩层的岩层属性特征;所述岩层属性特征至少包括:纵波速度、横波速度、密度、自然伽马、孔隙度以及电阻率参数。所述井段包括具有研究需求的任意油气井或区间井段。
岩性标签识别步骤、将所述岩层属性特征输入预先构建的多尺度相对特征识别模型中,得到输出的岩性标签数据,作为当前井段岩层的岩性识别结果;
其中,所述多尺度相对特征识别模型是按照设定策略选取的优势层厚区间基于其设置平滑窗口,进而根据所设的平滑窗口决策满足要求的多尺度相对特征,利用XGBoost算法优化训练构建的。
本发明为了提升识别模型多尺度相对特征的关注,在构建所述多尺度相对特征识别模型的过程中,不仅仅获取已知井段的岩层属性特征,还通过选取合理的岩层厚度区间决策平滑窗口,进而基于原始特征和相应的平滑特征决策一系列的多尺度相对特征,用于训练识别模型的辅助输入参数;其中,优势层厚范围的选取采用以下两个原则:1)层厚频率大,即该厚度岩层在已有井中出现次数最多;2)层厚奖励大,即如果该厚度地层识别正确,能够很大程度的提升预测准确率。
图2示出了本发明实施例所提供综合多尺度相对特征识别岩性的方法中构建识别模型的流程示意图。如图2所示,一个优选的实施例中,构建所述多尺度相对特征识别模型的过程中,通过以下操作选取所述优势层厚区间:
步骤A1、统计设定周期内所选已有井中出现次数达到设定条件的所有岩层厚度区间数据,将统计的各个对象按照出现频次进行排序,以出现频次最大为优选准则选取若干岩层厚度区间作为第一备选层厚区间;
步骤A2、以层厚奖励大为优选准则,选取若干岩层厚度区间作为第二备选层厚区间;
步骤A3、将所述第一优势层厚区间与第二优势层厚区间作并集运算,得到的若干层厚区间为目标优势层厚区间。
基于上述实施例所述的策略选取优势层厚区间,优势层厚区间将作为后续获取相对特征时确定平滑窗口大小的依据。其中,层厚定义为同一岩性连续分布的岩性采样点总长。以测井采样间隔s为一个单位区间,统计已有井的层厚分布并选取优势层厚区间。基于以上原则,选取频率最大的N1个层厚区间和奖励最大的N2个层厚区间,求两者的并集获得M个优势区间。为发挥相对特征的作用同时防止特征冗余,往往按需设置N1及N2小于或等于5。
针对步骤A2,其目的是选取奖励较大的层厚区间,即如果某个层厚区间的识别正确,将为整体准确率带来更大的提升,考虑的是厚度*频率。举例说明,对一段总厚度为500m的地层,0.1m为一个采样间隔,则总共有5000个采样点。
如果10m厚的地层(即有100个采样点)能识别准确的话(假设100%准确),准确率将提升100*n/5000,其中n表示有n段10m厚的地层。
如果2m厚的地层(即20个采样点)识别准确的话,准确率将提高20*k/5000,k表示有k段2m厚的地层。
当k/n>5时,即2m厚地层的数量比10m厚地层多五倍时,提升2m厚的地层对整体准确率的提高才比10m厚地层更高。因此,层厚奖励大,即代表如果该厚度地层识别正确,能够很大程度的提升预测准确率。
进一步地,根据优势区间确定平滑窗口(w),一个可选的实施例中,按照以下逻辑根据选取的优势层厚区间设置平滑窗口:
w=v2/s
式中,w为当前优势层厚区间[v1,v2)对应的合理平滑窗口大小,所述s表示测井采样间隔,m。
一个可选的实施例中,构建所述多尺度相对特征识别模型的过程中,进一步根据平滑窗口获得相对特征。对每口井的每个特征采用滑动平均法得到平滑特征(sf),将原特征(f)减去平滑特征(sf)得到相对特征(relf),具体地,通过以下操作根据上述方案中所设的平滑窗口决策得到多尺度相对特征:
步骤B1、将获取的所选的每口已有井的岩层属性特征作为原特征;实际应用中,选取根据测井数据获得的岩石物理参数作为特征。如纵波速度(Vp)、横波速度(Vs)、密度(Den)、自然伽马(Gr)、孔隙度(CNC)和电阻率(RD)等。
步骤B2、采用滑动平均法根据各项滑动窗口针对已有井的每一项原特征得到对应的多项平滑特征,按照下式将每一项原特征减去平滑特征得到匹配的多项相对特征,并与所属已有井关联记录;
relf=f-sf
针对每一项原特征,在多个平滑窗口下,得到相应的多个相对特征。
为减少特征冗余,构建所述多尺度相对特征识别模型的过程中,还包括特征优选步骤,对获得的相对特征进行优选。为减少特征冗余,划分训练-验证集,以同一窗口的相对特征为一组别进行训练,分别在验证集上测试基于各个窗口的相对特征的模型对岩性的识别能力,并将这些窗口的特征按能力高低依次加入到由原特征形成的特征集合中。若在当前特征集合中加入新的特征而模型对岩性的识别效果不再提高时,便保留当前特征集合中的相对特征作为优选的相对特征。因此,一个优选的实施例中,通过执行以下操作选取目标相对特征集合:
步骤C1、以同一平滑窗口的相对特征为一组,分别测试各个平滑窗口的相对特征对岩性识别的贡献能力;
步骤C2、基于贡献能力测试结果将这些平滑窗口的特征按能力由高到低的次序依次加入到由原特征形成的特征集合中;特征集合每次更新后,测试当前更新后特征集合相对于更新前特征集合对岩性的识别效果,若识别效果有提高,则执行步骤C2进一步将下个平滑窗口对应的一组特征加入当前的特征集合中;若识别效果无提高,执行步骤C3;
步骤C3、停止特征的加入,将当前的特征集合作为目标相对特征集合。
具体地,一个实施例中,在所述步骤C1中,通过XGBoost算法结合交叉验证方法应用于所有相对特征数据得到各个平滑窗口的相对特征对岩性识别的贡献能力,以表征特征对岩性的识别能力,其中,以平均F1score作为其评价指标。
XGBoost是一种优化的梯度提升树算法,该方法将多棵决策树的结果进行集成,适用于处理中小型结构数据或表格数据;选择确定目标的相对特征集合后,本发明利用XGBoost算法训练得到基于多尺度相对岩石物理特征的多尺度相对特征识别模型,用于针对待识别的井段岩层实现高效精确的岩性识别;
因此,一个实施例中,构建所述多尺度相对特征识别模型的过程中,按照以下操作得到多尺度相对特征识别模型的关系函数:
按照设定的需求选取若干已知井段作为训练井,获取训练井的岩层属性特征;
分别以各训练井的岩层属性特征结合优选后的目标相对特征综合作为XGBoost梯度提升树算法的输入,以对应的岩性识别标签为标准输出,结合设定的参数调优策略使XGBoost算法拟合得到输入与标准输出之间的最佳映射关系,该关系函数则为最终的多尺度相对特征识别模型。
上述实施例中,将前文步骤中优选的多尺度的相对特征结合训练井段的原岩层属性特征作为模型的输入,将岩性形成的标签作为模型的输出,在参数调优下使XGBoost算法拟合得到输入与输出之间的最佳映射关系,该关系即为最终的岩性识别模型,XGBoost是一种优化的梯度提升树算法,该方法将多棵决策树的结果进行集成,适用于处理中小型结构数据或表格数据。
本发明上述实施例中所述的岩性识别逻辑,综合考虑了目标区块的地质特征非均质性特点导致的不同井点处特征分布多样性及差异性,沉积、构造、成岩等差异带来的弹性特征混叠和单一尺度特征对岩性刻画能力不足的特点,结合测井观测数据和层厚分布区间,提出一种综合XGBoost算法计算优势和多尺度相对岩石物理特征辅助的测井岩性精确识别方法,该方法能够有效开展井周岩性分布识别,能够大幅度提高岩性识别的准确性,同时对薄层的岩性识别更为有效。
案例示例:
以某气田P为例,针对该气田开展岩性的识别,气田P的区块分布有五口井,主要岩性为A、B和C三中类型。测井获得纵波速度(Vp)、横波速度(Vs)、密度(Den)、自然伽马(Gr)、孔隙度(CNC),电阻率(RD)六项岩石物理参数,测井采样间隔s为0.1m。将自然伽马、孔隙度,电阻率和计算得到的纵波阻抗(Ip)、纵横波速度比(Vp/Vs)作为用于岩性识别的特征。
分析统计五口井的层厚分布后,分别选取5个层厚频率大的层厚区间依次为[0.9m,1m),[1.9m,2m),[1.1m,1.2m),[1.3m,1.4m),[0.7m,0.8m);
选取奖励大的5个层厚区间依次为[29.9m,30m),[1.9m,2m),[0.9m,1m),[2.9m,3m),[7.5m,7.6m);
进而求并集得到8个优势层厚区间为[0.7m,0.8m),[0.9m,1m),[1.1m,1.2m),[1.3m,1.4m),[1.9m,2.0m),[2.9m,3m),[7.5m,7.6m),[29.9m,30m);
决策相应的平滑窗口大小为8点、10点、12点、14点、20点、30点、76点和300点。基于以上8个平滑窗口,每个特征得到8个相对特征(以纵波阻抗为例,得到的8个相对特征为relIP8,relIP10,relIP12,relIP14,relIP20,relIP30,relIP76,relIP300),即构建得到40个特征。
分别测试各个窗口的相对特征对岩性的识别能力,并最终优选基于8点、12点、20点、76点、300点窗口平滑下得到的目标相对特征。
基于XGBoost算法轮流预测每口井的岩性,即轮流用四口井的数据训练模型,预测剩余一口井的岩性。比较使用结合相对特征(包括相对特征和原特征共30个特征作为输入)和仅使用原特征(5个特征)的岩性预测效果和对薄层识别的能力,图3为两种情况在F1score上的比较。需要特别说明的是,对于w1井,由于其所在沉积相不同,导致该井的岩石物理参数分布范围不同于其他四口井,因此对该井仅使用构建的25个相对特征进行预测。使用了相对特征以后,五口井的岩性预测更为准确,在F1 score上分别有0.0677,0.0492,0.0147,0.0484,0.0270的提升,图4示出了实施例中研究区某口井真实岩性(Label)、使用原特征的岩性预测结果(Original Features)、使用原特征结合相对特征分别对应的岩性预测结果(Original+Relative Features);在附图3所示的井岩性柱数据上也有所体现。
上述实施例中,本发明将多尺度的相对特征引入到岩性识别的应用中,实际场景中,应用主要分两种情况:
1.多数应用场景为:训练和预测对象是相似的(特征分布范围重叠/相近),如w2,w3,w4,w5,基于这样数据的训练和预测,只使用原特征能够得到较好的预测准确率,使用原特征结合相对特征能进一步提升预测准确率。
2.少部分应用场景为:训练和预测对象是不相似的,如在预测w1井时,其特征/岩石物理参数布范围不同于其他井(几乎不重合/少部分重合),这时需要注意,仅使用相对特征,而不应结合原特征。该部分操作会很大程度的影响预测结果。
在实际应用中,进行岩性预测前往往会进行岩石物理分析的工作,通过岩石物理分析的结果能够有效判断特征分布范围是否重叠/相近,其中,以岩石物理参数的数据分布范围判断是否重叠/相近。例如,井的沉积相和井位深度是已有的,但是这两项不构成最终的判断标准,而是以数据分布的范围是否重叠/相近为最主要参考。
图5详细给出了使用结合相对特征相比仅仅使用原特征对具体层厚段的改善效果,图中主要表示的是识别率的变化,比如厚度为[1.7,1.8)米区间的地层,原识别准确率为15%,现在为90%,则提升了75%,图中所示即为75%(黑色),如果下降,则为75%(灰色)。
准确率的计算方式为:总共有m个属于[1.7,1.8)米地层的样本点(0.1m为一个样本点),原特征下识别正确的样本点为i个,在多尺度相对特征下为j个,则识别准确率分别为i/m,j/m。根据图5中透露的信息可以明显看出,采用本发明的多尺度相对特征识别模型进行岩性数据预测在薄层段(0-10m)岩性预测的准确率有所提升。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
需要指出的是,在本发明的其他实施例中,该方法还可以通过将上述实施例中的某一个或某几个进行结合来得到新的油气井储层岩性识别方法,以实现对井段勘探数据和开发数据的精确分析。
需要说明的是,基于本发明上述任意一个或多个实施例中的方法,本发明还提供一种存储介质,该存储介质上存储有可实现如述任意一个或多个实施例中所述方法的程序代码,该代码被操作系统执行时能够实现如上所述的基于XGBoost算法的综合多尺度相对特征识别岩性的方法。
实施例二
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置或系统实现,因此基于上述任意一个或多个实施例中所述方法的其他方面,本发明还提供一种基于XGBoost算法的综合多尺度相对特征识别岩性的系统,该系统用于执行上述任意一个或多个实施例中所述的基于XGBoost算法的综合多尺度相对特征识别岩性的方法。下面给出具体的实施例进行详细说明。
具体地,图6中示出了本发明实施例中提供的基于XGBoost算法的综合多尺度相对特征识别岩性的系统的结构示意图,如图6所示,该系统包括:
待识别特征获取模块,其配置为根据当前井段录井、测井作业时的测量数据选取与岩性识别关联的岩石物理参数,作为当前井段岩层的岩层属性特征;
岩性标签识别模块,其配置为将所述岩层属性特征输入预先构建的多尺度相对特征识别模型中,得到输出的岩性标签数据,作为当前井段岩层的岩性识别结果;
识别模型构建模块,其配置为按照设定策略选取的优势层厚区间基于其设置平滑窗口,进而根据所设的平滑窗口决策满足要求的多尺度相对特征,利用XGBoost算法优化训练构建所述多尺度相对特征识别模型。
一个优选的实施例中,所述识别模型构建模块通过以下操作选取所述优势层厚区间:
步骤A1、统计设定周期内所选已有井中出现次数达到设定条件的所有岩层厚度区间数据,将统计的各个对象按照出现频次进行排序,以出现频次最大为优选准则选取若干岩层厚度区间作为第一备选层厚区间;
步骤A2、以层厚奖励大为优选准则,选取若干岩层厚度区间作为第二备选层厚区间;
步骤A3、将所述第一优势层厚区间与第二优势层厚区间作并集运算,得到的若干层厚区间为目标优势层厚区间。
进一步地,一个实施例中,所述识别模型构建模块按照以下逻辑根据选取的优势层厚区间设置平滑窗口:
w=v2/s
式中,w为当前优势层厚区间[v1,v2)对应的合理平滑窗口大小,所述S表示测井采样间隔,m。
具体地,一个实施例中,所述识别模型构建模块通过以下操作根据所设的平滑窗口决策得到多尺度相对特征:
步骤B1、将获取的所选的每口已有井的岩层属性特征作为原特征;
步骤B2、采用滑动平均法根据各项滑动窗口针对已有井的每一项原特征得到对应的多项平滑特征,将每一项原特征减去平滑特征得到匹配的多项相对特征,并与所属已有井关联记录。
为减少特征冗余,一个优选的实施例中,所述识别模型构建模块通过执行以下操作选取目标相对特征集合:
步骤C1、以同一平滑窗口的相对特征为一组,分别测试各个平滑窗口的相对特征对岩性识别的贡献能力;
步骤C2、基于贡献能力测试结果将这些平滑窗口的特征按能力由高到低的次序依次加入到由原特征形成的特征集合中;特征集合每次更新后,测试当前更新后特征集合相对于更新前特征集合对岩性的识别效果,若识别效果有提高,则执行步骤C2进一步将下个平滑窗口对应的一组特征加入当前的特征集合中;若识别效果无提高,执行步骤C3;
步骤C3、停止特征的加入,将当前的特征集合作为目标相对特征集合。
进一步地,所述识别模型构建模块在所述步骤C1中,通过XGBoost算法结合交叉验证方法应用于所有相对特征数据得到各个平滑窗口的相对特征对岩性识别的贡献能力,其中,以平均F1score作为其评价指标。
一个实施例中,所述识别模型构建模块,进一步按照以下操作得到多尺度相对特征识别模型的关系函数:
按照设定的需求选取若干已知井段作为训练井,获取训练井的岩层属性特征;
分别以各训练井的岩层属性特征结合优选后的目标相对特征综合作为XGBoost梯度提升树算法的输入,以对应的岩性识别标签为标准输出,结合设定的参数调优策略使XGBoost算法拟合得到输入与标准输出之间的最佳映射关系,该关系函数则为最终的多尺度相对特征识别模型。
本发明实施例提供的基于XGBoost算法的综合多尺度相对特征识别岩性的系统中,各个模块或单元结构可以根据实际识别和运算需求独立运行或组合运行,以实现相应的技术效果。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构、处理步骤或材料,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而不意味着限制。
说明书中提到的“一实施例”意指结合实施例描述的特定特征、结构或特征包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一实施例”并不一定均指同一个实施例。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种基于XGBoost算法的综合多尺度相对特征识别岩性的方法,其特征在于,所述方法包括:
待识别特征获取步骤、根据当前井段录井、测井作业时的测量数据选取与岩性识别关联的岩石物理参数,作为当前井段岩层的岩层属性特征;
岩性标签识别步骤、将所述岩层属性特征输入预先构建的多尺度相对特征识别模型中,得到输出的岩性标签数据,作为当前井段岩层的岩性识别结果;
其中,所述多尺度相对特征识别模型是按照设定策略选取的优势层厚区间基于其设置平滑窗口,进而根据所设的平滑窗口决策满足要求的多尺度相对特征,利用XGBoost算法优化训练构建的。
2.根据权利要求1所述的方法,其特征在于,构建所述多尺度相对特征识别模型的过程中,通过以下操作选取所述优势层厚区间:
步骤A1、统计设定周期内所选已有井中出现次数达到设定条件的所有岩层厚度区间数据,将统计的各个对象按照出现频次进行排序,以出现频次最大为优选准则选取若干岩层厚度区间作为第一备选层厚区间;
步骤A2、以层厚奖励大为优选准则,选取若干岩层厚度区间作为第二备选层厚区间;
步骤A3、将所述第一优势层厚区间与第二优势层厚区间作并集运算,得到的若干层厚区间为目标优势层厚区间。
3.根据权利要求1所述的方法,其特征在于,按照以下逻辑根据选取的优势层厚区间设置平滑窗口:
w=v2/s
式中,w为当前优势层厚区间[v1,v2)对应的合理平滑窗口大小,所述S表示测井采样间隔,m。
4.根据权利要求1所述的方法,其特征在于,构建所述多尺度相对特征识别模型的过程中,通过以下操作根据所设的平滑窗口决策得到多尺度相对特征:
步骤B1、围绕所选的每口已有井分别获取其岩层的岩层属性特征作为原特征;
步骤B2、采用滑动平均法根据各项滑动窗口针对已有井的每一项原特征得到对应的多项平滑特征,将每一项原特征减去平滑特征得到匹配的多项相对特征,并与所属已有井关联记录。
5.根据权利要求1所述的方法,其特征在于,构建所述多尺度相对特征识别模型的过程中,为减少特征冗余,还包括特征优选步骤,通过执行以下操作选取目标相对特征集合:
步骤C1、以同一平滑窗口的相对特征为一组,分别测试各个平滑窗口的相对特征对岩性识别的贡献能力;
步骤C2、基于贡献能力测试结果将这些平滑窗口的特征按能力由高到低的次序依次加入到由原特征形成的特征集合中;特征集合每次更新后,测试当前更新后特征集合相对于更新前特征集合对岩性的识别效果,若识别效果有提高,则执行步骤C2进一步将下个平滑窗口对应的一组特征加入当前的特征集合中;若识别效果无提高,执行步骤C3;
步骤C3、停止特征的加入,将当前的特征集合作为目标相对特征集合。
6.根据权利要求5所述的方法,其特征在于,在所述步骤C1中,通过XGBoost算法结合交叉验证方法应用于所有相对特征数据得到各个平滑窗口的相对特征对岩性识别的贡献能力,其中,以平均F1score作为其评价指标。
7.根据权利要求1所述的方法,其特征在于,构建所述多尺度相对特征识别模型的过程中,按照以下操作得到多尺度相对特征识别模型的关系函数:
按照设定的需求选取若干已知井段作为训练井,获取训练井的岩层属性特征;
分别以各训练井的岩层属性特征结合优选后的目标相对特征综合作为XGBoost梯度提升树算法的输入,以对应的岩性识别标签为标准输出,结合设定的参数调优策略使XGBoost算法拟合得到输入与标准输出之间的最佳映射关系,该关系函数则为最终的多尺度相对特征识别模型。
8.根据权利要求4所述的方法,其特征在于,所述岩层属性特征包括:纵波速度、横波速度、密度、自然伽马、孔隙度以及电阻率参数。
9.一种存储介质,其特征在于,所述存储介质上存储有可实现如权利要求1~8中任一项所述方法的程序代码。
10.一种基于XGBoost算法的综合多尺度相对特征识别岩性的系统,其特征在于,所述系统执行如权利要求1~8中任意一项所述的方法。
CN202111406115.7A 2021-11-24 2021-11-24 基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统 Pending CN116167195A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111406115.7A CN116167195A (zh) 2021-11-24 2021-11-24 基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111406115.7A CN116167195A (zh) 2021-11-24 2021-11-24 基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统

Publications (1)

Publication Number Publication Date
CN116167195A true CN116167195A (zh) 2023-05-26

Family

ID=86410076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111406115.7A Pending CN116167195A (zh) 2021-11-24 2021-11-24 基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统

Country Status (1)

Country Link
CN (1) CN116167195A (zh)

Similar Documents

Publication Publication Date Title
CN109709603B (zh) 地震层位识别与追踪方法、系统
US11636240B2 (en) Reservoir performance system
RU2573746C2 (ru) Система и способы для прогнозирования поведения скважины
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN111596978A (zh) 用人工智能进行岩相分类的网页显示方法、模块和系统
US20190353811A1 (en) Method for detecting geological objects in a seismic image
CN106372402A (zh) 一种大数据环境下模糊区域卷积神经网络的并行化方法
CN112784980B (zh) 一种智能化测井层位划分方法
CN114529110A (zh) 一种基于深度神经网络模型的岩相反演方法及系统
CN113534261A (zh) 基于智能优化集成网络的储层含气性检测方法及装置
CN106446514A (zh) 一种基于模糊理论和神经网络的测井相识别方法
WO2021226613A1 (en) Structured representations of subsurface features for hydrocarbon system and geological reasoning
CN114488311A (zh) 基于ssa-elm算法的横波时差预测方法
CN116427915A (zh) 基于随机森林的常规测井曲线裂缝密度预测方法及系统
Ye et al. Drilling formation perception by supervised learning: Model evaluation and parameter analysis
Sarkheil et al. The fracture network modeling in naturally fractured reservoirs using artificial neural network based on image loges and core measurements
US20230141334A1 (en) Systems and methods of modeling geological facies for well development
Chen et al. A geospatial case‐based reasoning model for oil–gas reservoir evaluation
Zhu et al. Seismic Facies Analysis Using the Multiattribute SOM‐K‐Means Clustering
CN116167195A (zh) 基于XGBoost算法的综合多尺度相对特征识别岩性的方法及系统
US11208886B2 (en) Direct hydrocarbon indicators analysis informed by machine learning processes
CN112987091A (zh) 储层检测方法、装置、电子设备和存储介质
CN115880455A (zh) 基于深度学习的三维智能插值方法
CN114239937B (zh) 储层含油气性预测方法、装置、计算机设备及存储介质
Zhang et al. A convolutional neural network approach for stratigraphic interface detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination