CN116070767A - 一种基于胶囊神经网络的钻井液漏失层位预测方法 - Google Patents

一种基于胶囊神经网络的钻井液漏失层位预测方法 Download PDF

Info

Publication number
CN116070767A
CN116070767A CN202310121463.2A CN202310121463A CN116070767A CN 116070767 A CN116070767 A CN 116070767A CN 202310121463 A CN202310121463 A CN 202310121463A CN 116070767 A CN116070767 A CN 116070767A
Authority
CN
China
Prior art keywords
neural network
data
leakage
drilling fluid
capsule neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310121463.2A
Other languages
English (en)
Other versions
CN116070767B (zh
Inventor
许成元
马成林
康毅力
陈明君
白英睿
汤历平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202310121463.2A priority Critical patent/CN116070767B/zh
Publication of CN116070767A publication Critical patent/CN116070767A/zh
Application granted granted Critical
Publication of CN116070767B publication Critical patent/CN116070767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于胶囊神经网络的钻井液漏失层位预测方法,包括:获取初始数据,并进行预处理;获取初始数据中影响钻井液漏失的关键因素;选取多个现有的胶囊神经网络模型并建立PR曲线,并根据PR曲线获得最佳的胶囊神经网络模型;对获得的胶囊神经网络模型进行训练,同时训练过程中利用测试集进行测试,以较佳的训练次数;将待测层位的漏失数据输入到测试完成的胶囊神经网络模型中,根据计算结果判断该层位是否发生漏失。本发明提供的方法能够从影响漏失的因素出发,综合了地层地质资料、钻井液性能参数、钻井施工参数,系统的考虑漏失层段的地质情况及漏失情况,因此能够较好的对现场漏失情况进行预测,可为现场的堵漏作业提供指导。

Description

一种基于胶囊神经网络的钻井液漏失层位预测方法
技术领域
本发明属于漏失预测技术领域,尤其涉及一种基于胶囊神经网络的钻井液漏失层位预测方法。
背景技术
钻井液漏失是制约钻井工程的关键技术难题,随着勘探开发逐步走向深层超深层,井漏近年来呈加剧趋势。井漏导致非生产时间增加,延长了建井周期,增加了井控风险的不确定性,且井漏消耗大量钻井液和堵漏材料,造成重大经济损失,还可能引起井塌、卡钻、井喷等一系列复杂情况与事故。多年来,防漏堵漏一直是钻井工程中的研究热点与难点,一次堵漏成功率低,防漏堵漏效果差,这很大程度上归因于漏层位置难以确定,准确判断漏层位置是成功堵漏的关键,有利于缩短堵漏时间,降低钻井综合成本。
作为补充,漏失层位预测是解决钻井液漏失的主要手段,只有对漏失发生的层位有一个精准的定位,才能更好的进行防漏堵漏作业,有助于精准堵漏作业的进行。现场一般采用仪器测试法寻找漏层位置,此方法成本高且专业性强,同时花费时间较长,容易耽搁堵漏时间;或根据工作人员的经验通过试堵法来判断漏层位置,其精确性较差,无法准确的找到漏层位置。
发明内容
为了解决上述技术问题,本发明提供了一种基于胶囊神经网络的钻井液漏失层位预测方法,对深层裂缝性地层钻井液漏失层位进行预测,为钻井作业中判断漏层位置提供依据。
本发明所采用的技术方案是:一种基于胶囊神经网络的钻井液漏失层位预测方法,包括以下步骤:
步骤1:获取影响钻井液漏失的初始数据,并对初始数据进行预处理;
步骤2:采用多因素方差分析法和随机森林算法,获取初始数据中影响钻井液漏失的关键因素,将关键因素和与关键因素对应的漏失结果组成数据集,并将数据集分为训练集和测试集;
步骤3:选取多个现有的胶囊神经网络模型并建立PR曲线,并根据PR曲线对胶囊神经网络模型结构进行选择,获得最佳的胶囊神经网络模型;
步骤4:采用训练集对步骤4所选择的胶囊神经网络模型进行训练,同时训练过程中利用测试集进行测试,并采用准确度、召回率和F1得分对测试结果进行评估;
步骤5:将待测层位的漏失数据输入到测试完成的胶囊神经网络模型中,根据计算结果判断该层位是否发生漏失。
本发明的一种实施方式在于,所述步骤1中原始漏失数据包括但不限于地层地质资料、钻井作业参数、钻井液性能参数,地层地质资料包括地层岩性、地层破裂压力、孔隙压力、单轴抗压强度;钻井作业参数包括深度、钻压、转速、扭矩、立管压力、排量;钻井液性能参数包括钻井液密度、粘度、固相含量、静切力。
本发明的一种实施方式在于,预处理方式包括均值移除、范围缩放、归一化中的至少一种。
本发明的一种实施方式在于,步骤2中采用多因素方差分析法的P值和随机森林算法的特征重要性来确定影响漏失的关键因素。
本发明的一种实施方式在于,步骤2中,数据集由关键因素和漏失结果组成,随机挑选数据集中80%的数据组成训练集,20%的数据组成测试集。
本发明的一种实施方式在于,步骤3中,通过构建不同深度、不同卷积层数、不同池化层数的方式构建多个胶囊神经网络。
本发明的一种实施方式在于,步骤3中,将训练集的数据输入不同胶囊神经网络中,并通过计算得到不同胶囊神经网络的PR曲线,胶囊神经网络模型对应的PR曲线的面积越大,则其结果越优。
本发明的一种实施方式在于,步骤4中,训练一定次数后,带入测试集进行计算,随后采用准确度、召回率和F1得分对测试结果进行评价,并根据评价结果选择最佳训练次数。
本发明的一种实施方式在于,步骤5当中所述的使用F1得分、准确度、召回率对预测结果进行评估,其计算公式如下所示:
Figure BDA0004080085660000021
Figure BDA0004080085660000022
Figure BDA0004080085660000023
式中,F1 Score表示F1得分,Accuracy表示准确度,Recall表示召回率;TP表示真阳性,即真实分类为正,模型预测也为正;TN表示真阴性,即真实分类为反,模型预测也为反;FP表示假阳性,即真实分类为反,模型预测为正;FN表示假阴性,即真实分类为正,模型预测为反。
对于现有漏失层位预测技术,采用上述技术方案所产生的有益效果在于:
本发明提供的方法能够从影响漏失的因素出发,综合了地层地质资料、钻井液性能参数、钻井施工参数,系统的考虑漏失层段的地质情况及漏失情况,最终获得的胶囊神经网络具有良好的稳定性好,收敛速度快,需要的训练数据量较少,对输入数据的微小变化较为敏感,不易受多类别重叠的干扰,因此能够较好的对现场漏失情况进行预测,可为现场的堵漏作业提供指导。
附图说明
图1为本发明实施例的流程图;
图2为不同胶囊神经网络的PR曲线图;
图3为优选出的胶囊神经网络结构图;
图4为优选出的胶囊神经网络的训练过程图;
图5为实施例中胶囊神经网络模型各指标评价结果图。
具体实施方式
为了方便本领域普通技术人员理解和实施本发明,下面结合图及实施例对本发明作进一步的详细描述,应当理解,此处所述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供的一种基于胶囊神经网络的钻井液漏失层位预测方法,如图1所示,包括以下步骤:
步骤1:获取影响钻井液漏失的初始数据,并对初始数据进行预处理;
本实施例的研究数据来自于M区块,该区块主要勘探目标是奥陶系碳酸盐,储层特征为埋藏深、温度高、压力大,受挤压构造运动影响,地层破碎、裂缝发育。该区块地质构造复杂,钻井过程中频繁发生井漏,面临的技术难题之一是严重的反复恶性漏失,这对该区块油田高效开发产生了不可忽视的影响。钻井实践统计,该区块漏失概率高达68%,失返性漏失引发的阻卡复杂严重阻碍了油田的安全生产。通过对该区块井史资料当中漏失数据的采集与整理,共整理出105组漏失相关的数据,其中包含29个数据特征,作为后续数据分析与漏失特征重要性选择的基础。数据特征见表1。
表1原始漏失数据
Figure BDA0004080085660000031
Figure BDA0004080085660000041
整理的漏失数据当中包含很多的噪声数据,需要去除不相关的数据,提高数据质量。有些数据质量不足以直接使用,如包含过多的缺失值,需要进行缺失值处理;对于地层岩性数据和漏失结果数据来说,数据字段不能够直接使用,需要进行标签编码,派生新的字段,以更好地进行进一步的数据挖掘。通过对漏失数据的预处理能够很好的对数据有初步的认识和理解,同时可以避免无效数据对模型预测结果的影响。使用python编程语言,结合jupyter-notebook环境,运用sklearn第三方库,对采集到的数据进行预处理。
漏失数据来源复杂,主要包括钻井作业参数、地层地质资料、钻井液性质资料等,这些数据往往维度高,大多为非线性关系,难以有效利用,且由于各种设备故障与人为操作失误等因素的影响,数据往往存在异常值,为后续的漏层诊断带来了困扰,因此有必要对漏失数据进行清洗,对多维数据进行降维,识别并剔除异常值,进行数据补全,提供高质量的数据,使训练的模型更加精确、可靠。
数据清洗首先需要剔除同一深度的漏失数据,如果同一深度存在不同的漏失结果,会严重影响训练模型的精度,通过对原始漏失数据的整理,剔除重复数据10组,剩余95组数据。原始漏失数据当中存在地层岩性数据和高温高压(HTHP)特征数据,进行参数选择时相应的算法无法识别,需要对其进行标签编码,根据字符串形式的特征值在特征序列中的位置,为其指定一个数字标签,用于提供给基于数值算法的学习模型。
此外,不同类型的原始数据数值存在巨大差异,在构建神经网络模型时,具有较大的特征数据量级将显着影响模型的性能,从而“吞下”较小的模型,并且还会导致训练时收敛慢甚至不收敛的问题。所以需要对做完标签编码的数据标准化,消除指标之间的量纲与取值范围差异的影响,将数据按照比例进行缩放,使漏失数据均匀分布在固定范围内。
标准化常用的方式有均值移除、范围缩放、归一化等方式:均值移除可以让样本矩阵中的每一列的平均值为0,标准差为1;范围缩放可以将数据均匀分布在固定范围内,计算公式如所示;归一化是用每个样本的每个特征值除以该样本各个特征值绝对值的总和,变换后的样本矩阵,每个样本的特征值绝对值之和为1。
Figure BDA0004080085660000051
其中,xmax为样本数据的最大值,xmin为样本数据的最小值,xmax-xmin为极差。
步骤2:采用多因素方差分析法和随机森林算法,获取初始数据中影响钻井液漏失的关键因素,将关键因素和与关键因素对应的漏失结果组成数据集,并将数据集分为训练集和测试集。
多因素方差分析是有多个因素会对结果产生影响,分为两种:一种是有交互作用的(各参数之间有影响),另外一种是没有交互作用的(各参数之间无影响),漏失层位预测属于有交互作用的多因素方差分析,主要有以下几个步骤:
1)提出假设。假设原始漏失数据中29个参数对漏失结果有影响;
2)控制变量交互作用的影响。指多个控制变量相互搭配后对漏失结果产生的影响;
3)计算相伴概率P值。计算29个影响因素与漏失结果之间的P值;多因素方差分析采用的检验统计量为F统计量,如果有A、B两个控制变量,通常对应三个F检验统计量:
Figure BDA0004080085660000052
式中:k为第i控制变量的水平数;r为第j控制变量的水平数;xijk为控制变量A第i个水平和控制变量B第j个水平下第k样本值;ni为控制变量A第i水平和控制变量B第j个水平下样本个数;x为观测变量均值。
Figure BDA0004080085660000053
式中,nij为控制变量A第i个水平和控制变量B第j个水平下样本观测值个数,
Figure BDA0004080085660000054
为控制变量A第i个水平下观测变量的均值。
Figure BDA0004080085660000055
式中,
Figure BDA0004080085660000056
为控制变量B第j水平下观测变量的均值。
Figure BDA0004080085660000061
式中,
Figure BDA0004080085660000062
为控制变量A、B在i、j水平下观测变量的均值。
SSAB=SST-SSA-SSB-SSE
Figure BDA0004080085660000063
Figure BDA0004080085660000064
Figure BDA0004080085660000065
依据公式计算F统计量,并依据F分布表给出相伴概率P值;
4)给定显著性水平α,并作出决策,选择对漏失结果显著的参数作为胶囊神经网络的输入参数,通常来说多因素分析的P值中α取0.05或0.1,本文为了尽可能考虑到更多的漏失影响因素,取α为0.1,如果计算的P值小于0.1,就将该参数作为对漏失结果影响显著的参数。
随机森林首先为样本矩阵中的样本随机分配初始权重,由此构建一棵带有权重的决策树,在由该决策树提供预测输出时,通过加权平均或者加权投票的方式产生预测值。将训练样本代入模型,预测其输出,对那些预测值与实际值不同的样本,提高其权重,由此形成第二棵决策树。重复以上过程,构建出不同权重的若干棵决策树。根据划分子表时选择特征的顺序标志了该特征的重要程度,此即为该特征重要性指标。
随机森林在自助聚合(每次从总样本矩阵中以有放回抽样的方式随机抽取部分样本构建决策树,这样形成多棵包含不同训练样本的决策树,以削弱某些强势样本对模型预测结果的影响,提高模型的泛化特性)的基础上,每次构建决策树模型时,不仅随机选择部分样本,而且还随机选择部分特征,这样的集合算法,不仅规避了强势样本对预测结果的影响,而且也削弱了强势特征的影响,使模型的预测能力更加泛化。
主要步骤如下:
(1)一个样本容量为N的样本,有放回的抽取N次,每次抽取1个,最终形成了N个样本。选择好了的N个样本用来训练一个决策树,作为决策树根节点处的样本;
(2)当每个样本有M个属性时,在决策树的每个节点需要分裂时,随机从这M个属性中选取出m个属性,满足条件m<M。然后从这m个属性中选择1个属性作为该节点的分裂属性;
(3)决策树形成过程中每个节点都要按照步骤2来分裂(如果下一次该节点选出来的那一个属性是刚刚其父节点分裂时用过的属性,则该节点已经达到了叶子节点,无须继续分裂了),一直到不能够再分裂为止。按照步骤1~3建立大量的决策树,这样就构成了随机森林了。
利用jupyter-notebook对清洗后的漏失数据进行多因素方差分析与随机森林算法,将深度、钻压、转速等29个特征数据定义为自变量,漏失结果定义为因变量。通常来说多因素分析的P值中α取0.05或0.1,本文为了尽可能考虑到更多的漏失影响因素,取α为0.1。最终选定对漏失结果影响较大的13个参数作为神经网络的输入参数,分别为:深度、岩性、钻压、转速、排量、钻井液密度、塑性粘度、初切力、终切力、
Figure BDA0004080085660000071
失水量、PH值,参数选择结果如表2所示。然后将预处理过后得到的数据集划分训练集与测试集,将整个数据集打乱,其中80%的数据用来训练模型,20%的数据用来测试。
表2参数选择结果
Figure BDA0004080085660000072
Figure BDA0004080085660000081
步骤3:选取多个现有的胶囊神经网络模型并建立PR曲线,并根据PR曲线对胶囊神经网络模型结构进行选择,获得最佳的胶囊神经网络模型。
PR曲线中的P代表的是precision(查准率),R代表的是recall(召回率),其代表的是查准率与召回率的关系,一般情况下,将recall设置为横坐标,precision设置为纵坐标。较合理的P-R曲线应该是曲线的初始点为点(0,1),且该曲线在前期的预测都是对的,全是正例,因此初始情况下precision一直是1,后面随着预测错误结果的出现,precision逐渐下降,但总的来说,PR曲线的面积越接近1越好,因此可以选择PR曲线对应面积最大的胶囊神经网络模型。
胶囊神经网络通常由卷积层、激活层、池化层和动态路由层构成。通常来讲,由于漏失问题是一个二分类问题,同时所采用的数据量相对较少,因此,所采用的模型的深度不宜太深,包括胶囊层在内,其深度通常不超过10层,因为发明人发现,当其深度过大,则容易产生过拟合现象,从而导致最终的预测效果变差。
同时,对于卷积核大小来讲,由于本发明实施例的漏失预测问题来讲,其初始数据为一维数据,因此仅需要进行二维卷积即可,同时结合常规卷积核的大小,将本发明实施例的卷积核大小设置为3x1。
对于卷积核数量来讲,其可根据经验设定一个初始值,后根据具体的实验效果进行微调,本发明实施例中,针对选择的胶囊神经网络,其前两个卷积层选择16个卷积核,后两个卷积层选择了64个卷积核。在其余的实施例中,可以根据实际情况选择不同数量的卷积核。
对于池化窗口来讲,由于本发明实施例所采用的数据相对较少,因此,为了更好的提取原始数据中的信息,选择池化窗口的大小为2,步长为1。
本实施例中,对比了六种不同的胶囊神经网络结构,对其卷积层和池化层的设计分别如下:conv+pool、(conv+pool)x2、(conv+pool)x3、conv+conv+pool、(conv+conv+pool)x2、(conv+conv+pool)x3。代入训练集后,经过计算得到如图2所示的PR曲线,由PR曲线可知,(conv+conv+pool)x2曲线的面积最大,根据PR曲线确定胶囊神经网络的结构如下:
第一层input:接受输入的样本数据。需要将数据预处理阶段得到的漏失数据从一维变换到二维,将变换后的二维漏失数据作为胶囊神经网络的输入数据;
第二层conv_1:卷积操作,提取漏失数据的特征。使用了16个卷积核,卷积核的大小为3,采用双曲正切函数来进行激活;
第二层conv_2:卷积操作,同样使用了16个大小为3的卷积核,激活函数同样使用双曲正切函数;
第三层average_pool:池化操作,使用的池化窗口大小为2,步长为1;
第四层conv_3:卷积操作,使用了64个大小为3的卷积核,激活函数使用relu;
第五层conv_4:卷积操作,使用了64个大小为3的卷积核,激活函数使用relu;
第六层Flatten:Flatten层用来将输入“压平”,即把多维的输入一维化;
第七层DigitCaps:主胶囊层,存储高级别特征的向量,输出是否发生漏失的概率;
最终构建的胶囊神经网络的结构如图3所示。
步骤4:采用训练集对步骤3获得的胶囊神经网络模型进行训练,同时训练过程中利用测试集进行测试,并采用准确度、召回率和F1得分对测试结果进行评估。
步骤3中所述的胶囊神经网络训练过程如图4所示。
同时,在每经过一段次数的训练后,将测试集输入到训练后的胶囊神经网络模型中,并获得测试结果的F1得分(F1score)、准确度(accuracy)、召回率(recall),并采用F1得分(F1score)、准确度(accuracy)、召回率(recall)对预测结果进行评估,F1得分、准确度、召回率的计算结果如图5所示。
Figure BDA0004080085660000091
Figure BDA0004080085660000092
Figure BDA0004080085660000093
Figure BDA0004080085660000094
式中,TP对应真阳性,真实分类为正,模型预测也为正;TN对应真阴性,真实分类为反,模型预测也为反;FP对应假阳性,真实分类为反,模型预测为正;FN对应假阴性,真实分类为正,模型预测为反。
根据图4来看,综合训练次数、预测精度等,最终选择模型的训练次数为500次。
从表3可以看出,6080(m)处预测错误,其他漏失结果都预测准确,漏失精度达94.74%。从图5可以看出,F1得分、准确度、召回率的值均较高,说明利用本发明实施例的方法优选出的胶囊神经网络的预测结果准确度较高。
表3胶囊神经网络模型漏层预测结果
Figure BDA0004080085660000095
Figure BDA0004080085660000101
步骤5:待测层位的漏失数据输入到测试完成的胶囊神经网络模型中,根据计算结果判断该层位是否发生漏失。
从上可知,本发明将胶囊神经网络应用到钻井液漏失层位预测方法当中,并采用相应的方法优选出较优的胶囊神经网络,并对胶囊神经网络中动态路由的计算进行了优化,本方法鲁棒性好,准确率高,收敛速度快,需要的样本数据量较少,对输入数据的微小变化较为敏感,不易受多类别重叠的干扰,为钻井现场防漏堵漏提供依据,有助于防漏堵漏方案的制订,减少了因钻井液漏失造成的经济损失和堵漏的时间成本。
以上所述,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (9)

1.一种基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,包括以下步骤:
步骤1:获取影响钻井液漏失的初始数据,并对初始数据进行预处理;
步骤2:采用多因素方差分析法和随机森林算法,获取初始数据中影响钻井液漏失的关键因素,将关键因素和与关键因素对应的漏失结果组成数据集,并将数据集分为训练集和测试集;
步骤3:构建多个胶囊神经网络模型并建立PR曲线,并根据PR曲线对胶囊神经网络模型结构进行选择,获得最佳的胶囊神经网络模型;
步骤4:采用训练集对步骤3获得的胶囊神经网络模型进行训练,同时训练过程中利用测试集进行测试,并采用准确度、召回率和F1得分对测试结果进行评估;
步骤5:将待测层位的漏失数据输入到测试完成的胶囊神经网络模型中,根据计算结果判断该层位是否发生漏失。
2.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,所述步骤1中原始漏失数据包括但不限于地层地质资料、钻井作业参数、钻井液性能参数,地层地质资料包括地层岩性、地层破裂压力、孔隙压力、单轴抗压强度;钻井作业参数包括深度、钻压、转速、扭矩、立管压力、排量;钻井液性能参数包括钻井液密度、粘度、固相含量、静切力。
3.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,预处理方式包括均值移除、范围缩放、归一化中的至少一种。
4.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,步骤2中采用多因素方差分析法的P值和随机森林算法的特征重要性来确定影响漏失的关键因素。
5.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,步骤2中,数据集由关键因素和漏失结果组成,随机挑选数据集中80%的数据组成训练集,20%的数据组成测试集。
6.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,步骤3中,通过构建不同深度、不同卷积层数、不同池化层数的方式构建多个胶囊神经网络。
7.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,步骤3中,将训练集的数据输入不同胶囊神经网络中,并通过计算得到不同胶囊神经网络的PR曲线,胶囊神经网络模型对应的PR曲线的面积越大,则其结果越优。
8.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,其特征在于,步骤4中,训练一定次数后,带入测试集进行计算,随后采用准确度、召回率和F1得分对测试结果进行评价,并根据评价结果选择最佳训练次数。
9.根据权利要求1所述的基于胶囊神经网络的钻井液漏失层位预测方法,步骤4当中所述的使用F1得分、准确度、召回率对预测结果进行评估,其计算公式如下所示:
Figure FDA0004080085650000021
Figure FDA0004080085650000022
Figure FDA0004080085650000023
式中,F1 Score表示F1得分,Accuracy表示准确度,Recall表示召回率;TP表示真阳性,即真实分类为正,模型预测也为正;TN表示真阴性,即真实分类为反,模型预测也为反;FP表示假阳性,即真实分类为反,模型预测为正;FN表示假阴性,即真实分类为正,模型预测为反。
CN202310121463.2A 2023-02-14 2023-02-14 一种基于胶囊神经网络的钻井液漏失层位预测方法 Active CN116070767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310121463.2A CN116070767B (zh) 2023-02-14 2023-02-14 一种基于胶囊神经网络的钻井液漏失层位预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310121463.2A CN116070767B (zh) 2023-02-14 2023-02-14 一种基于胶囊神经网络的钻井液漏失层位预测方法

Publications (2)

Publication Number Publication Date
CN116070767A true CN116070767A (zh) 2023-05-05
CN116070767B CN116070767B (zh) 2024-04-02

Family

ID=86181835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310121463.2A Active CN116070767B (zh) 2023-02-14 2023-02-14 一种基于胶囊神经网络的钻井液漏失层位预测方法

Country Status (1)

Country Link
CN (1) CN116070767B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191660A (zh) * 2019-12-30 2020-05-22 浙江工业大学 一种基于多通道协同胶囊网络的直肠癌病理学图像分类方法
CN111291097A (zh) * 2020-05-08 2020-06-16 西南石油大学 一种基于决策树数据挖掘的钻井漏层位置实时预测方法
US20200285934A1 (en) * 2017-10-27 2020-09-10 Google Llc Capsule neural networks
CN113343558A (zh) * 2021-05-19 2021-09-03 东北石油大学 一种基于模糊神经网络的钻井参数优化方法
CN114320279A (zh) * 2021-12-29 2022-04-12 西南石油大学 深层裂缝性地层钻井液漏失层位预测方法
CN114357887A (zh) * 2022-01-06 2022-04-15 中国地质大学(北京) 一种基于bp神经网络的复杂井况钻前泥浆漏失预测方法
CN114970326A (zh) * 2022-05-08 2022-08-30 东北石油大学 一种基于改进胶囊神经网络的油井故障诊断方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200285934A1 (en) * 2017-10-27 2020-09-10 Google Llc Capsule neural networks
CN111191660A (zh) * 2019-12-30 2020-05-22 浙江工业大学 一种基于多通道协同胶囊网络的直肠癌病理学图像分类方法
CN111291097A (zh) * 2020-05-08 2020-06-16 西南石油大学 一种基于决策树数据挖掘的钻井漏层位置实时预测方法
CN113343558A (zh) * 2021-05-19 2021-09-03 东北石油大学 一种基于模糊神经网络的钻井参数优化方法
CN114320279A (zh) * 2021-12-29 2022-04-12 西南石油大学 深层裂缝性地层钻井液漏失层位预测方法
CN114357887A (zh) * 2022-01-06 2022-04-15 中国地质大学(北京) 一种基于bp神经网络的复杂井况钻前泥浆漏失预测方法
CN114970326A (zh) * 2022-05-08 2022-08-30 东北石油大学 一种基于改进胶囊神经网络的油井故障诊断方法

Also Published As

Publication number Publication date
CN116070767B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
CN109635461B (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
CN108388921B (zh) 一种基于随机森林的溢流漏失实时识别方法
CN107194524B (zh) 一种基于rbf神经网络的煤与瓦斯突出预测方法
CN110674841B (zh) 一种基于聚类算法的测井曲线识别方法
CN105760673B (zh) 一种河流相储层地震敏感参数模板分析方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN112989708A (zh) 一种基于lstm神经网络的测井岩性识别方法及系统
CN109779604B (zh) 用于诊断井漏的建模方法及诊断井漏的方法
CN104809069A (zh) 一种基于集成神经网络的源代码漏洞检测方法
CN108952699B (zh) 一种复杂地质钻进过程地层岩性智能识别方法
CN101266299A (zh) 利用地震数据体结构特征预测油气的方法
CN117150875A (zh) 基于深度学习的钻前测井曲线预测方法
CN114564886A (zh) 一种基于地质参数量化的盾构掘进参数预测方法
CN116070767B (zh) 一种基于胶囊神经网络的钻井液漏失层位预测方法
Al-anazi et al. Innovative data-driven permeability prediction in a heterogeneous reservoir
CN113323676A (zh) 用主成分分析-长短记忆模型确定盾构机刀盘扭矩的方法
CN115860582B (zh) 一种基于自适应提升算法的冲击危险性智能预警方法
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
CN110348510A (zh) 一种基于深水油气钻井过程阶段性特征的数据预处理方法
CN116432855A (zh) 一种基于掘进数据的隧道塌方情况的预测方法
CN113946790A (zh) 一种导水裂隙带高度预测方法、系统、设备及终端
US20240125959A1 (en) Method for predicting the size range of lost circulation channel based on deep learning (dl)
CN110674868A (zh) 一种基于高维钻进参数信息的地层岩性识别系统及其方法
CN116822971B (zh) 一种井壁风险等级预测方法
CN116956754B (zh) 一种结合深度学习的裂缝型漏失压力计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant