CN108388921A - 一种基于随机森林的溢流漏失实时识别方法 - Google Patents

一种基于随机森林的溢流漏失实时识别方法 Download PDF

Info

Publication number
CN108388921A
CN108388921A CN201810179878.4A CN201810179878A CN108388921A CN 108388921 A CN108388921 A CN 108388921A CN 201810179878 A CN201810179878 A CN 201810179878A CN 108388921 A CN108388921 A CN 108388921A
Authority
CN
China
Prior art keywords
drilling
overflow
time
data
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810179878.4A
Other languages
English (en)
Other versions
CN108388921B (zh
Inventor
史肖燕
周英操
蒋宏伟
刘伟
付加胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Petroleum Corp
CNPC Engineering Technology R&D Co Ltd
Beijing Petroleum Machinery Co Ltd
Original Assignee
CNPC Engineering Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CNPC Engineering Technology Research Institute Co Ltd filed Critical CNPC Engineering Technology Research Institute Co Ltd
Priority to CN201810179878.4A priority Critical patent/CN108388921B/zh
Publication of CN108388921A publication Critical patent/CN108388921A/zh
Application granted granted Critical
Publication of CN108388921B publication Critical patent/CN108388921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B47/00Survey of boreholes or wells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Artificial Intelligence (AREA)
  • Mining & Mineral Resources (AREA)
  • Pure & Applied Mathematics (AREA)
  • Geology (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Geophysics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Fluid Mechanics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Earth Drilling (AREA)

Abstract

本发明提供了一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:①溢流、漏失原始数据集的自动生成;②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;④采用CART算法,为每个子数据集创建分类树;⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。本发明的方法根据钻井实时数据,自动判断钻井状态,计算预期井口流量并与测量的井口流量进行比较,因此可对不同钻井状态下发生的溢流、漏失进行实时判断;基于随机森林的溢流、漏失实时判断方法,建模方法更加简单,对事故的预测更为准确。

Description

一种基于随机森林的溢流漏失实时识别方法
技术领域
本发明涉及钻井工程技术领域,特别是涉及钻井过程中溢流和漏失事故的实时识别方法。
背景技术
钻井是勘探开发石油天然气的重要手段,在钻井施工作业中,钻井复杂情况和事故自始至终威胁着钻井的整个过程,严重影响着钻井速度、建井质量和勘探开发效益。其中,井漏和溢流是影响钻井施工安全最为常见的两种井下复杂事故。井漏和溢流不仅会带来严重的储层损害,增加勘探开发投入成本,造成油气开发效率低下,而且一旦控制不力,还会诱发卡钻、井塌、井喷等重大恶性事故,造成损失及负面社会影响。因此,钻井过程中溢流、漏失的实时识别判断具有重要意义。
目前,国内外在溢流、漏失监测方面展开了较多研究,取得了丰硕的成果,形成的技术有:井口监测技术、井下随钻监测技术、人工智能监测技术。井口监测技术成熟,能比较准确地监测出溢流,但这种方法只适应井控要求较低的环境,而且监测结果存在滞后性,不能很好地解决高压气井、深水钻井等特殊环境下的井下溢流、漏失监测问题。井下随钻监测方法的出现解决了这一问题,近钻头随钻测量技术能够快速、早期监测到溢流和漏失,目前井下随钻监测以PWD监测或LWD监测的方法为主;但井下随钻监测技术成本较高,并且随钻测量仪器存在失效的风险。近些年,随着信息技术和人工智能理论的飞速发展,国内外钻井研究人员在利用现有的溢流监测设备的基础上,引入人工智能技术对测量数据进行综合分析和判断,从而使溢流监测结果更加准确。Hargreaves(2001年)采用贝叶斯概率对深海钻井溢流进行了监测,其通过分析声波数据采用贝叶斯模型对溢流发生的概率进行计算,得出可能发生溢流的概率。Nybo(2008年)采用邻井钻井施工数据,通过构建BP神经网络预测模型,预测出一条当前钻井的基于时间序列上的出口流量曲线,通过和正钻井的实际出口流量数据进行对比,对溢流情况进行实时预警。此方法采用静态神经网络进行计算,并没有对数据进行实时动态计算。Kamyab(2010年)提出一种动态神经网络溢流预警方法,该方法采用聚焦时间延迟动态神经网络进行溢流早期的实时监测,通过对动态钻井参数的神经网络实时计算来监测溢流。这些人工智能的方法建模较为复杂,推广较难。
如申请号为CN201310398400.8的发明公开了一种油气井钻井过程中溢流在线综合监测与预警方法,选择现场可获取的溢流特征参数,当判断系统中有训练好的贝叶斯模型可用时,将溢流特征参数输入训练好的贝叶斯模型进行溢流判别;若没有,则用基于事先确定好判别规则的专家系统进行溢流判别;以概率的形式给出最终的溢流判别结果并显示;若判断有溢流发生,则将相应的特征向量写入溢流特征数据库,对贝叶斯模型进行训练,更新贝叶斯模型。上述发明采用贝叶斯模型经过多次训练才能获取溢流概率数据,溢流监测与识别存在的实时性及可靠性较差的问题。申请号为CN201610817774.2的发明提供了一种基于多信息融合的钻井漏失层位识别方法,属于钻井勘探领域,能够根据漏失发生必备条件能够准确确定漏失发生层位及计算漏层性质参数。本发明的基于多信息融合的钻井漏失层位识别方法,具体步骤包括:(一)根据钻井液总结和录井综合记录资料,锁定漏失发生的深度范围及在其深度范围内地层所发育的岩性;(二)利用测井、地质资料对上述步骤中锁定的漏失发生的深度范围内岩性、物性参数进行解释及计算;(三)利用测井及工程资料计算钻井液当量循环密度、地层孔隙压力当量密度及地层破裂压力当量密度;(四)根据上述步骤(一)-(三)获得的数据整理绘制得综合成果图,通过综合成果图进行漏失层位识别,分析漏失机理。该申请采用传统的资料解释和计算方法,并以综合成果图的形式呈现计算结果,监测结果存在滞后性,不能很好地解决高压气井、深水钻井等特殊环境下的井下溢流、漏失监测问题。
随机森林是由Breiman提出的一种基于CART决策树的组合分类器,具有预测精度高、泛化误差可控、收敛速度快、调节参数少等优点,可有效避免“过拟合”现象,尤其适用于高维数据的运算。该机器学习算法已在国外的生物、医学、经济、管理等众多领域得到了广泛应用,其优越的性能也使其可应用到钻井领域中。
发明内容
针对现有溢流、漏失监测识别方法存在的问题,本发明提供了一种基于随机森林的机器学习算法,对钻井历史数据进行学习,并利用机器学习所生成的一系列决策树,通过投票方式对新样本数据进行溢流、漏失实时识别的方法。本发明解决前述技术问题所采用的技术方案是,一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:
①溢流、漏失原始数据集的自动生成;
②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;
③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;
④采用CART(Classification and Regression Tree)算法,为每个子数据集创建分类树;
⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。
优选的是,步骤①进一步包括,提取以文本方式存储的钻井井史数据中溢流和漏失事故的信息,根据事故发生时间和类别,将其转化成以时间为索引的钻井实时数据格式,并综合录井数据和控压数据,生成溢流、漏失原始数据集。
上述任一方案优选的是,生成的溢流、漏失原始数据集是以时间为索引的多维数据,原始数据集的分类结果为离散值:0代表无事故发生,1代表有溢流发生,2代表有漏失发生,3代表溢流、漏失同时发生。
上述任一方案优选的是,溢流、漏失原始数据集属性包括,入口流量、出口流量、PWD环空压力、环空温度、大钩载荷、井深、钻头深度、总池体积,立管压力,钻速,钻井液出口密度,钻井液出口温度。
上述任一方案优选的是,原始的每口井的钻井实时数据是以时间先后为顺序排列的数据集,很难直接用于溢流漏失的实时识别,因此需要对原始的实时数据集进行预处理。步骤②数据的预处理进一步包括,
a钻井状态的计算:根据井深(HDEP)、钻头深度(BDEP)、大钩载荷(HKLD)数据,计算每个时间点对应的钻井状态;
b预期出口流量的计算:对于每一口井,根据钻井状态、钻头深度的变化、入口流量以及下入或起出钻杆直径和壁厚信息,计算期望的出口流量;
c计算各维度的钻井实时数据在ΔT时间内的均值;
d计算各维度钻井实时数据的变化量。
上述任一方案优选的是,步骤a所述钻井状态包括:钻进、起钻、下钻、接单根和其他。
上述任一方案优选的是,步骤a中,钻井状态计算方法为,
在时间Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)>HDEP(Ti-1),HKLD(Ti)>0,则钻井状态DS(Ti)为钻进;
在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)>BDEP(Ti-1),则钻井状态DS(Ti)为下钻;
在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)<BDEP(Ti-1),则钻井状态DS(Ti)为起钻;
在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)=0则钻井状态DS(Ti)为接单根;
在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)>0,DS(Ti-1)为接单根,则钻井状态DS(Ti)为接单根;
在时间Ti,钻井状态不为上述几种状态,则为其他。
上述任一方案优选的是,步骤b中,预期出口流量的计算方法为,
钻井状态为钻进时,
钻井状态为起钻时,
钻井状态为下钻时,
钻井状态为接单跟和其他时,
ExpFlowOut(Ti)=FlowIn(Ti)
其中:ExpFlowOut(Ti)为Ti时间点,预期的井口流出量,单位为L/s;
FlowIn(Ti)为Ti时间点,入口泥浆流量,单位为L/s;
DrillTime(Ti)为Ti时间点的钻时,单位为min/m;
HoleDia为井直径,单位为m;
DPDia1为钻杆外直径,单位为m;
DPDia2为钻杆内直径,单位为m;
BVEL(Ti)为Ti时刻,大钩速度,单位为m/s。
上述任一方案优选的是,步骤c中,为降低实时数据中噪声数据的干扰,把每口井的原始数据按时间段ΔT取均值,生成计算过后的实时数据;具体算法为
其中多维钻井实时数据中的某一维数据。
以PWD数据为例,算法为:
上述任一方案优选的是,步骤d中,钻井实时数据变化量的计算,根据均值化后的数据曲线,计算对应的数据变化量,具体算法为
其中A代表多维钻井实时数据中的某一维数据;
以PWD数据为例,具体算法为:
对于出口流量的变化量用期望的出口流量和实测的出口流量计算获得,即FlowOut_V(Ti)=(ExpFlowOut(Ti)–FlowOut(Ti))/ExpFlowOut(Ti),其中FlowOut(Ti)为Ti时刻的出口流量实测量,FlowOut_V(Ti)为Ti时刻的出口流量变化量。
上述任一方案优选的是,预处理之后的溢流、漏失数据训练集属性包括,PWD环空压力的变化量,立管压力的变化量,出口流量的变化量,总池体积的变化量,大钩载荷的变化量,钻速的变化量,钻井液出口密度变化量,钻井液出口温度的变化量。
上述任一方案优选的是,步骤③进一步包括采用Bootstrap有放回的采样技术,从预处理后的数据集中抽取n个子数据集,每个子数集的大小为原始数据集的2/3。此处的子数据集(训练集)是用来训练随机森林的,它是预处理数据的一个子集,含有2/3的预处理数据
上述任一方案优选的是,步骤④进一步包括,在每棵分类树的创建过程中,从M个属性中,随机抽取m个属性,进行节点分裂。
上述任一方案优选的是,用于分类决策树生成的钻井M个实时属性数据有:PWD环空压力的变化量,立管压力的变化量,出口流量的变化量,总池体积的变化量,大钩载荷的变化量,钻速的变化量,钻井液出口密度变化量,钻井液出口温度的变化量。
上述任一方案优选的是,在每个节点分裂时,计算不同属性和不同阈值相对应的GINI指数值,选择最小的GINI指数对应的属性和阈值,对特征空间进行二元分裂。
上述任一方案优选的是,GINI指数的计算公式为
其中:pj为类别j在样本T中出现的频率,
nj为样本T中类别j的个数,
S为T中样本的个数,
S1为T1中样本的个数,
S2为T2中样本的个数。
与现有技术相比,本发明的有益效果是:根据钻井实时数据,自动判断钻井状态,计算预期井口流量并与测量的井口流量进行比较,因此可对不同钻井状态下(例如:钻进、起钻、下钻等),发生的溢流、漏失进行实时判断;基于随机森林的溢流、漏失实时判断方法,建模方法与现有技术的建模方法相比更加简单,对事故的预测更为准确。
附图说明
图1为本发明的基于随机森林的溢流漏失实时识别方法一优选实施例的流程图。
具体实施方式
为了更进一步了解本发明的内容,下面将结合具体实施例对本发明作更为详细的描述,实施例只对本发明具有示例性作用,而不具有任何限制性的作用;任何本领域技术人员在本发明的基础上作出的非实质性修改,都应属于本发明保护的范围。
如图1所示,一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:
①溢流、漏失原始数据集的自动生成;
②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;
③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;
④采用CART(Classification and Regression Tree)算法,为每个子数据集创建分类树;
⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。
在本实施例中,步骤①进一步包括,提取以文本方式存储的钻井井史数据中溢流和漏失事故的信息,根据事故发生时间和类别,将其转化成以时间为索引的钻井实时数据格式,即对应井的钻井实时数据中加一列事故数据,该列数据为离散值,0代表无事故发生,1代表有溢流发生,2代表有漏失发生,3代表溢流、漏失同时发生;综合录井数据和控压数据,生成溢流、漏失原始数据集。溢流、漏失原始数据集属性包括,入口流量、出口流量、PWD环空压力、环空温度、大钩载荷、井深、钻头深度、总池体积,立管压力,钻速,钻井液出口密度,钻井液出口温度。
以H井钻井过程中,溢流、漏失实时识别的具体实施方式为例,对本发明作进一步详细说明。由于建模过程中,所用数据量过于庞大,因此在此实施例里,对数据进行了简化。
本实施例中,收集H井邻近H1已钻井的实时采集数据,所用钻具数据,井身结构数据以及事故数据。
邻井H1,钻具数据如下表所示:
根数 单根总长(m) 内径(mm) 外径(mm) 接头长度(m) 接头内径(mm) 接头外径(mm)
1 0.27 70 168.28 0 0 0
1 6.32 54 127 0 0 0
1 7.64 57.15 120.7 0 0 0
1 9.3 70.21 88.9 0 0 0
33 9.6126 52.4 88.9 0.79 50 127
356 9.6126 76 88.9 0.51 50 127
井身结构数据如下表所示:
底深(m) 内径(mm) 扩大率
5938 179.9 1
6300 168.28 1.02
事故数据如下所示:
钻井实时采集数据如下所示
读取每一邻井的井史数据中事故的时间和类别,将其转化为对应井的实时采集数据中的一列,该列数据用离散值表示在相应时间点的事故类别。本实施例中对于邻井H1,把以文本类型记录的事故类别转换成用离散值表示的以时间为索引的数据序列,转换后的实时数据表如下所示:
在本实施例中,步骤②数据的预处理进一步包括,
a钻井状态的计算:根据井深(HDEP)、钻头深度(BDEP)、大钩载荷(HKLD)数据,计算每个时间点对应的钻井状态;
b预期出口流量的计算:对于每一口井,根据钻井状态、钻头深度的变化、入口流量以及下入或起出钻杆直径和壁厚信息,计算期望的出口流量;
c计算各维度的钻井实时数据在ΔT时间内的均值;
d计算各维度钻井实时数据的变化量。
上述任一方案优选的是,步骤a所述钻井状态包括:钻进、起钻、下钻、接单根和其他。钻井状态计算方法为,
在时间Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)>HDEP(Ti-1),HKLD(Ti)>0,则钻井状态DS(Ti)为钻进;
在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)>BDEP(Ti-1),则钻井状态DS(Ti)为下钻;
在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)<BDEP(Ti-1),则钻井状态DS(Ti)为起钻;
在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)=0则钻井状态DS(Ti)为接单根;
在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)>0,DS(Ti-1)为接单根,则
钻井状态DS(Ti)为接单根;
在时间Ti,钻井状态不为上述几种状态,则为其他。
上述任一方案优选的是,步骤b中,预期出口流量的计算方法为,
钻井状态为钻进时,
钻井状态为起钻时,
钻井状态为下钻时,
钻井状态为接单跟和其他时,
ExpFlowOut(Ti)=FlowIn(Ti)
其中:ExpFlowOut(Ti)为Ti时间点,预期的井口流出量,单位为L/s;
FlowIn(Ti)为Ti时间点,入口泥浆流量,单位为L/s;
DrillTime(Ti)为Ti时间点的钻时,单位为min/m;
HoleDia为井直径,单位为m;
DPDia1为钻杆外直径,单位为m;
DPDia2为钻杆内直径,单位为m;
BVEL(Ti)为Ti时刻,大勾速度,单位为m/s。
步骤c中,为降低实时数据中噪声数据的干扰,把每口井的原始数据按时间段ΔT取均值,生成计算过后的实时数据;具体算法为
其中A代表多维钻井实时数据中的一维。
以PWD数据为例,算法为:
步骤d中,钻井实时数据变化量的计算,根据均值化后的数据曲线,计算对应的数据变化量,具体算法为
其中A代表多维钻井实时数据中的某一维数据。
以PWD数据为例,具体算法为:
对于出口流量的变化量用期望的出口流量和实测的出口流量计算获得,即FlowOut_V(Ti)=(ExpFlowOut(Ti)–FlowOut(Ti))/ExpFlowOut(Ti)。。
按照上述算法对溢流、漏失原始数据集进行预处理,预处理之后的溢流、漏失数据训练集属性包括,PWD环空压力的变化量,立管压力的变化量,出口流量的变化量,总池体积的变化量,大钩载荷的变化量。对邻井H1的实时数据预处理之后的数据如下表所示:
步骤③进一步包括采用Bootstrap有放回的采样技术,从预处理后的数据集中抽取n个子数据集,每个子数集的大小为原始数据集的2/3。此处的子数据集(训练集)是用来训练随机森林的,它是预处理数据的一个子集,含有2/3的预处理数据
步骤④进一步包括,在每棵分类树的创建过程中,从M个属性中,随机抽取m个属性,进行节点分裂。分类决策树生成的钻井实时属性数据有:PWD环空压力的变化量,立管压力的变化量,出口流量的变化量,总池体积的变化量,大钩载荷的变化量,钻速的变化量,钻井液出口密度变化量,钻井液出口温度的变化量。在每个节点分裂时,计算不同属性和不同阈值相对应的GINI指数值,选择最小的GINI指数对应的属性和阈值,对特征空间进行二元分裂。GINI指数的计算公式为
其中:pj为类别j在样本T中出现的频率,
nj为样本T中类别j的个数,
S为T中样本的个数,
S1为T1中样本的个数,
S2为T2中样本的个数。
按照上述算法,本实施例中的步骤③和步骤④用Python语言中提供的scikit-learn包中的Random Forest Classifier方法实现,在实现过程中需对参数进行调试设置,其中关键的参数为随机森林中树的数量(本实施例中选取10),在每个节点分裂时和特征量的选取(本实施例选取5)。
步骤⑤,对于正钻井,根据钻井现场最新采集到的数据,对其进行预处理,把预处理后的数据作为新样本,输入到n棵树进行分类决策;那棵树的投票结果即为对应时间点的溢流、漏失判断结果。
在本实施例中,对于正钻井,以时间点T1和T2为例,对这两点的实时数据进行预处理,所得的样本数据如下所示:
把这两个时间点的数据输入到步骤④生成的随机森林中,得到对应的溢流、漏失判断结果,分别为1和0,即溢流和正常。
本实施例中的基于随机森林的溢流漏失事实辨别方法,可以根据钻井实时数据,自动判断钻井状态,计算预期井口流量并与测量的井口流量进行比较,因此可对不同钻井状态下(例如:钻进、起钻、下钻等),发生的溢流、漏失进行实时判断;基于随机森林的溢流、漏失实时判断方法,建模方法与现有技术的建模方法相比更加简单,对事故的预测更为准确。
尽管具体地参考其优选实施例来示出并描述了本发明,但本领域的技术人员可以理解,可以作出形式和细节上的各种改变而不脱离所附权利要求书中所述的本发明的范围。以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。

Claims (10)

1.一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:
①溢流、漏失原始数据集的自动生成;
②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;
③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;
④采用CART算法,为每个子数据集创建分类树;
⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。
2.根据权利要求1所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤①进一步包括,提取以文本方式存储的钻井井史数据中溢流和漏失事故的信息,根据事故发生时间和类别,将其转化成以时间为索引的钻井实时数据格式,并综合录井数据和控压数据,生成溢流、漏失原始数据集。
3.根据权利要求2所述的基于随机森林的溢流漏失实时识别方法,其特征在于:生成的溢流、漏失原始数据集是以时间为索引的多维数据,原始数据集的分类结果为离散值:0代表无事故发生,1代表有溢流发生,2代表有漏失发生,3代表溢流、漏失同时发生。
4.根据权利要求3所述的基于随机森林的溢流漏失实时识别方法,其特征在于:溢流、漏失原始数据集属性包括,入口流量、出口流量、PWD环空压力、环空温度、大钩载荷、井深、钻头深度、总池体积,立管压力,钻速,钻井液出口密度,钻井液出口温度,大钩速度。
5.根据权利要求1所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤②数据的预处理进一步包括,
a钻井状态的计算:根据井深(HDEP)、钻头深度(BDEP)、大钩载荷(HKLD)数据,计算每个时间点对应的钻井状态;
b预期出口流量的计算:对于每一口井,根据钻井状态、钻头深度的变化、入口流量以及下入或起出钻杆直径和壁厚信息,计算期望的出口流量;
c计算各维度的钻井实时数据在ΔT时间内的均值;
d计算各维度钻井实时数据的变化量。
6.根据权利要求5所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤a所述钻井状态包括:钻进、起钻、下钻、接单根和其他。
7.根据权利要求6所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤a中,钻井状态计算方法为,
在时间Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)>HDEP(Ti-1),HKLD(Ti)>0,则钻井状态DS(Ti)为钻进;
在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)>BDEP(Ti-1),则钻井状态DS(Ti)为下钻;
在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)<BDEP(Ti-1),则钻井状态DS(Ti)为起钻;
在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)=0则钻井状态DS(Ti)为接单根;
在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)>0,DS(Ti-1)为接单根,则钻井状态DS(Ti)为接单根;
在时间Ti,钻井状态不为上述几种状态,则为其他。
8.根据权利要求5所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤b中,预期出口流量的计算方法为,
钻井状态为钻进时,
钻井状态为起钻时,
钻井状态为下钻时,
钻井状态为接单跟和其他时,
ExpFlowOut(Ti)=FlowIn(Ti)
其中:ExpFlowOut(Ti)为Ti时间点,预期的井口流出量,单位为L/s;
FlowIn(Ti)为Ti时间点,入口泥浆流量,单位为L/s;
DrillTime(Ti)为Ti时间点的钻时,单位为min/m;
HoleDia为井直径,单位为m;
DPDia1为钻杆外直径,单位为m;
DPDia2为钻杆内直径,单位为m;
BVEL(Ti)为Ti时刻,大钩速度,单位为m/s。
9.根据权利要求5所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤c中,为降低实时数据中噪声数据的干扰,把每口井的原始数据按时间段ΔT取均值,生成计算过后的实时数据;具体算法为其中A代表多维钻井实时数据中的某一维数据。
10.根据权利要求5所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤d中,钻井实时数据变化量的计算,根据均值化后的数据曲线,计算对应的数据变化量;具体算法为其中A代表多维钻井实时数据中的某一维数据;对于出口流量的变化量用期望的出口流量和实测的出口流量计算获得,即FlowOut_V(Ti)=(ExpFlowOut(Ti)–FlowOut(Ti))/ExpFlowOut(Ti)。
CN201810179878.4A 2018-03-05 2018-03-05 一种基于随机森林的溢流漏失实时识别方法 Active CN108388921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810179878.4A CN108388921B (zh) 2018-03-05 2018-03-05 一种基于随机森林的溢流漏失实时识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810179878.4A CN108388921B (zh) 2018-03-05 2018-03-05 一种基于随机森林的溢流漏失实时识别方法

Publications (2)

Publication Number Publication Date
CN108388921A true CN108388921A (zh) 2018-08-10
CN108388921B CN108388921B (zh) 2021-06-18

Family

ID=63069853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810179878.4A Active CN108388921B (zh) 2018-03-05 2018-03-05 一种基于随机森林的溢流漏失实时识别方法

Country Status (1)

Country Link
CN (1) CN108388921B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109322660A (zh) * 2018-08-13 2019-02-12 中国石油集团工程技术研究院有限公司 一种水平主地应力方向随钻测量系统信号激励装置
CN109472285A (zh) * 2018-09-29 2019-03-15 北京中油瑞飞信息技术有限责任公司 井漏识别方法、装置及计算机设备
CN109779604A (zh) * 2018-12-17 2019-05-21 中国石油大学(北京) 用于诊断井漏的建模方法及诊断井漏的方法
CN110134113A (zh) * 2019-05-20 2019-08-16 中国石油大学(华东) 一种海洋石油井控装备安全保障方法及系统
CN110795853A (zh) * 2019-11-01 2020-02-14 西南石油大学 一种油气钻井过程中早期溢流层位随钻识别方法
CN111396025A (zh) * 2020-03-19 2020-07-10 成都维泰油气能源技术有限公司 控压钻井智能钻进控制、钻进异常识别和处理方法及系统
CN111652253A (zh) * 2019-03-04 2020-09-11 中石化石油工程技术服务有限公司 一种基于大数据的井漏事故检测预警方法
CN111827982A (zh) * 2019-04-17 2020-10-27 中国石油天然气集团有限公司 钻井溢流漏失工况预测方法及装置
CN111853555A (zh) * 2020-07-07 2020-10-30 杭州电子科技大学 一种基于动态过程的供水管网暗漏识别方法
CN112329804A (zh) * 2020-06-30 2021-02-05 中国石油大学(北京) 基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置
CN112926839A (zh) * 2021-02-05 2021-06-08 中国石油大学(华东) 一种用于油气井钻井过程的溢漏风险协同监测方法及系统
CN113417588A (zh) * 2021-07-29 2021-09-21 雷彪 一种油气钻井过程中溢流情况评价方法
CN113449417A (zh) * 2021-06-17 2021-09-28 中国海洋石油集团有限公司 一种注水井溢流层段预测方法
CN113482595A (zh) * 2021-08-04 2021-10-08 中海石油(中国)有限公司 一种钻井溢流预警方法、系统、设备和存储介质
CN113919422A (zh) * 2021-09-30 2022-01-11 西南石油大学 一种使用综合模式识别增强井涌检测的方法
CN114184154A (zh) * 2021-11-29 2022-03-15 浙江大学 一种基于随机森林和直流磁场的油气井套管内径检测方法
CN114897225A (zh) * 2022-04-22 2022-08-12 清能艾科(深圳)能源技术有限公司 钻井作业的事故预测方法和装置、电子设备、存储介质
CN114943361A (zh) * 2022-03-15 2022-08-26 水利部交通运输部国家能源局南京水利科学研究院 一种估算缺资料地区参考作物蒸散量的方法
WO2024001061A1 (zh) * 2022-06-29 2024-01-04 中国石油天然气集团有限公司 一种溢流识别处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101696627A (zh) * 2009-10-30 2010-04-21 湖北工业大学 一种钻井过程事故监测方法
CN103470202A (zh) * 2013-05-10 2013-12-25 中国石油大学(华东) 油气井钻井过程中溢流在线综合监测与预警方法
WO2016209230A1 (en) * 2015-06-25 2016-12-29 Tde Petroleum Data Solutions, Inc. Method for standardized evaluation of drilling unit performance
CN106382102A (zh) * 2016-11-24 2017-02-08 西南石油大学 一种基于聚类算法的溢流早期预警方法
CN106761699A (zh) * 2017-03-13 2017-05-31 中国石油集团钻井工程技术研究院 一种用于控压钻井的井漏实时检测系统
CN106837310A (zh) * 2016-12-15 2017-06-13 中法渤海地质服务有限公司 基于质量流量综合检测的石油井涌井漏预报方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101696627A (zh) * 2009-10-30 2010-04-21 湖北工业大学 一种钻井过程事故监测方法
CN103470202A (zh) * 2013-05-10 2013-12-25 中国石油大学(华东) 油气井钻井过程中溢流在线综合监测与预警方法
WO2016209230A1 (en) * 2015-06-25 2016-12-29 Tde Petroleum Data Solutions, Inc. Method for standardized evaluation of drilling unit performance
CN106382102A (zh) * 2016-11-24 2017-02-08 西南石油大学 一种基于聚类算法的溢流早期预警方法
CN106837310A (zh) * 2016-12-15 2017-06-13 中法渤海地质服务有限公司 基于质量流量综合检测的石油井涌井漏预报方法及装置
CN106761699A (zh) * 2017-03-13 2017-05-31 中国石油集团钻井工程技术研究院 一种用于控压钻井的井漏实时检测系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIANG HAIBO 等: "Application of an intelligent early-warning method based on DBSCAN clustering for drilling overflow accident", 《CLUSTER COMPUTING,》 *
孙合辉 等: "基于录井参数的溢流预警模型研究", 《录井工程》 *
张钰 等: "随机森林在滚动轴承故障诊断中的应用", 《计算机工程与应用》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109322660A (zh) * 2018-08-13 2019-02-12 中国石油集团工程技术研究院有限公司 一种水平主地应力方向随钻测量系统信号激励装置
CN109472285A (zh) * 2018-09-29 2019-03-15 北京中油瑞飞信息技术有限责任公司 井漏识别方法、装置及计算机设备
CN109472285B (zh) * 2018-09-29 2020-12-22 北京中油瑞飞信息技术有限责任公司 井漏识别方法、装置及计算机设备
CN109779604A (zh) * 2018-12-17 2019-05-21 中国石油大学(北京) 用于诊断井漏的建模方法及诊断井漏的方法
US11360235B2 (en) 2018-12-17 2022-06-14 China University Of Petroleum (Beijing) Modeling method and method for diagnosing lost circulation
CN111652253A (zh) * 2019-03-04 2020-09-11 中石化石油工程技术服务有限公司 一种基于大数据的井漏事故检测预警方法
CN111827982A (zh) * 2019-04-17 2020-10-27 中国石油天然气集团有限公司 钻井溢流漏失工况预测方法及装置
CN110134113B (zh) * 2019-05-20 2021-11-02 中国石油大学(华东) 一种海洋石油井控装备安全保障方法及系统
CN110134113A (zh) * 2019-05-20 2019-08-16 中国石油大学(华东) 一种海洋石油井控装备安全保障方法及系统
CN110795853A (zh) * 2019-11-01 2020-02-14 西南石油大学 一种油气钻井过程中早期溢流层位随钻识别方法
CN111396025B (zh) * 2020-03-19 2022-11-01 成都维泰油气能源技术有限公司 控压钻井智能钻进控制、钻进异常识别和处理方法及系统
CN111396025A (zh) * 2020-03-19 2020-07-10 成都维泰油气能源技术有限公司 控压钻井智能钻进控制、钻进异常识别和处理方法及系统
CN112329804A (zh) * 2020-06-30 2021-02-05 中国石油大学(北京) 基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置
CN111853555A (zh) * 2020-07-07 2020-10-30 杭州电子科技大学 一种基于动态过程的供水管网暗漏识别方法
CN112926839A (zh) * 2021-02-05 2021-06-08 中国石油大学(华东) 一种用于油气井钻井过程的溢漏风险协同监测方法及系统
CN113449417A (zh) * 2021-06-17 2021-09-28 中国海洋石油集团有限公司 一种注水井溢流层段预测方法
CN113417588A (zh) * 2021-07-29 2021-09-21 雷彪 一种油气钻井过程中溢流情况评价方法
CN113482595A (zh) * 2021-08-04 2021-10-08 中海石油(中国)有限公司 一种钻井溢流预警方法、系统、设备和存储介质
CN113482595B (zh) * 2021-08-04 2023-08-08 中海石油(中国)有限公司 一种钻井溢流预警方法、系统、设备和存储介质
CN113919422A (zh) * 2021-09-30 2022-01-11 西南石油大学 一种使用综合模式识别增强井涌检测的方法
CN114184154A (zh) * 2021-11-29 2022-03-15 浙江大学 一种基于随机森林和直流磁场的油气井套管内径检测方法
CN114184154B (zh) * 2021-11-29 2022-12-20 浙江大学 一种基于随机森林和直流磁场的油气井套管内径检测方法
CN114943361A (zh) * 2022-03-15 2022-08-26 水利部交通运输部国家能源局南京水利科学研究院 一种估算缺资料地区参考作物蒸散量的方法
CN114897225A (zh) * 2022-04-22 2022-08-12 清能艾科(深圳)能源技术有限公司 钻井作业的事故预测方法和装置、电子设备、存储介质
WO2024001061A1 (zh) * 2022-06-29 2024-01-04 中国石油天然气集团有限公司 一种溢流识别处理方法及装置

Also Published As

Publication number Publication date
CN108388921B (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN108388921A (zh) 一种基于随机森林的溢流漏失实时识别方法
CN113723838B (zh) 基于卷积神经网络的随钻安全风险智能识别方法
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
AU2011371570B2 (en) Apparatus and methods of analysis of pipe and annulus in a wellbore
CN113537585B (zh) 基于随机森林和梯度提升决策树的油田增产措施推荐方法
Aljubran et al. Deep learning and time-series analysis for the early detection of lost circulation incidents during drilling operations
Wang et al. Downhole working conditions analysis and drilling complications detection method based on deep learning
US20230212937A1 (en) Automated electric submersible pump (esp) failure analysis
CN117035197B (zh) 一种代价最低化的井漏智能预测方法
CN115438823A (zh) 一种井壁失稳机制分析与预测方法及系统
Liang et al. Overflow warning and remote monitoring technology based on improved random forest
Purbey et al. Machine learning and data mining assisted petroleum reservoir engineering: a comprehensive review
Li et al. Identification of downhole conditions in geological drilling processes based on quantitative trends and expert rules
CN116070767B (zh) 一种基于胶囊神经网络的钻井液漏失层位预测方法
CN117648573A (zh) 基于元素录井数据和综合录井数据的地层可钻性预测方法
CN110674868A (zh) 一种基于高维钻进参数信息的地层岩性识别系统及其方法
CN116432855A (zh) 一种基于掘进数据的隧道塌方情况的预测方法
Feder Machine-learning approach determines spatial variation in shale decline curves
Gu et al. Deep-Learning-Based Production Decline Curve Analysis in the Gas Reservoir through Sequence Learning Models [J]
CN114169558B (zh) 一种用于预测钻井井涌风险的方法及系统
Partington A digital approach to the management of brownfields
Amirlatifi et al. Well Performance in New Frontiers: Reducing Risk and Uncertainty through Large Scale Data Analytics
CN112443319B (zh) 一种井涌监测方法
US20240060405A1 (en) Method and system for generating predictive logic and query reasoning in knowledge graphs for petroleum systems
CN118551322A (zh) 一种钻井多工况在线监测方法、设备、介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210315

Address after: 100120 Xicheng District six paw Kang in Beijing City

Applicant after: CHINA NATIONAL PETROLEUM Corp.

Applicant after: CNPC ENGINEERING TECHNOLOGY R & D Co.,Ltd.

Address before: Building 1, yard 5, Huanghe street, Changping District, Beijing

Applicant before: CNPC ENGINEERING TECHNOLOGY R & D Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221221

Address after: 100120 Xicheng District six paw Kang in Beijing City

Patentee after: CHINA NATIONAL PETROLEUM Corp.

Patentee after: CNPC ENGINEERING TECHNOLOGY R & D Co.,Ltd.

Patentee after: BEIJING PETROLEUM MACHINERY Co.,Ltd.

Address before: 100120 Xicheng District six paw Kang in Beijing City

Patentee before: CHINA NATIONAL PETROLEUM Corp.

Patentee before: CNPC ENGINEERING TECHNOLOGY R & D Co.,Ltd.

TR01 Transfer of patent right