CN112529341A - 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 - Google Patents

一种基于朴素贝叶斯算法的钻井漏失机率预测方法 Download PDF

Info

Publication number
CN112529341A
CN112529341A CN202110177884.8A CN202110177884A CN112529341A CN 112529341 A CN112529341 A CN 112529341A CN 202110177884 A CN202110177884 A CN 202110177884A CN 112529341 A CN112529341 A CN 112529341A
Authority
CN
China
Prior art keywords
probability
drilling
characteristic
class
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110177884.8A
Other languages
English (en)
Other versions
CN112529341B (zh
Inventor
苏俊霖
张爱
赵洋
罗平亚
黄进军
李方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202110177884.8A priority Critical patent/CN112529341B/zh
Publication of CN112529341A publication Critical patent/CN112529341A/zh
Application granted granted Critical
Publication of CN112529341B publication Critical patent/CN112529341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Agronomy & Crop Science (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于钻井漏失预测领域和人工智能机器学习领域,具体涉及一种基于朴素贝叶斯算法的钻井漏失机率预测方法。所述方法为:从某油藏开发区的油藏井史数据库中提取油藏历史开发数据并进行预处理,创建样本集与测试集,从样本数据中确定特征属性与输出类别空间,根据样本集钻井漏失参数数据统计各特征属性取值先验概率,采用先验概率学习计算条件概率,当特征属性取值为连续值和离散值时分别采用不同的条件概率计算,选择两两特征组合的方式计算相应的条件概率提高模型的泛化性能,由先验概率联合计算后验概率,建立朴素贝叶斯模型分类器,采用验证集进行验证,将实时钻井参数数据输入模型获取相应的漏失机率大小。

Description

一种基于朴素贝叶斯算法的钻井漏失机率预测方法
技术领域
本发明属于钻井漏失预测领域和人工智能机器学习领域,具体涉及一种基于朴素贝叶斯算法的钻井漏失机率预测方法。
背景技术
井漏是钻井过程中的一种复杂而常见的工况,会对钻采工业造成严重危害与经济损失。钻井过程中许多钻井参数都会对井漏产生影响,比如井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷等。这些钻井参数在钻井过程中的参数大小的变化都有可能使得钻井液液柱压力大于地层岩石破裂压力,从而形成诱导裂缝,或使得地层闭合裂缝重新开启,造成井漏的难题,导致钻井工程时间,材料和人力的浪费,通过及时掌握钻井施工时的这些数据变化情况,采取合理的井漏预测方法判断出井漏发生的概率,从而合理设计井身结构,降低钻井液环空压耗等措施可以使井漏现象做到真正有效的预防。
基于人工智能机器学习领域对井漏进行预测的一种方法是采用支持向量机,基于其统计学习理论和结构风险最小原理对导致井漏的大量有效数据进行整合,从而构建针对井漏的有效预警系统。随着近年来经济的快速发展,对能源的需求也越来越高,因此各种深井、复杂结构井以及非常规井的数量开始逐年增加,对这些井的开发也使得井漏发生的机率随之增加,一个有效的井漏预警方法对防范钻井过程中出现的井漏风险,确保钻井安全,降低钻井成本以及提高钻井效率具有重要意义。
利用数据挖掘技术对油气工业进行信息提取和学习,从而辅助石油的开发是当前油气工业,尤其是钻井开发行业研究的热点。朴素贝叶斯方法发源于古典理论,是数据挖掘和机器学习的重要方法之一,该方法对数据的处理学习效率高,且对数据缺失不敏感,通过该方法对测井数据处理从而进行井漏预测具有良好的应用前景。
发明内容
为了克服现有井漏预测方法的不足与局限性,造成井场技术人员无法对相应的漏失参数进行控制,使得漏失难以控制、反复发生的问题,同时丰富利用钻井参数对井漏进行预测的方法,本发明提出了一种基于朴素贝叶斯算法的钻井漏失机率预测方法。该方法通过获取实时钻井参数值作为特征输入,以建立的朴素贝叶斯模型分类计算出的钻井漏失概率作为特征输出进行判断,在进行堵漏决策时具有较好的现实指导意义。
为了实现上述目的,基于朴素贝叶斯算法的钻井漏失机率预测方法具体实施步骤如下:1)收集样本数据,从某油藏开发区的油藏井史数据库中提取油藏历史开发数据并进行预处理,创建样本集与测试集;
2)从样本数据中确定特征属性与输出类别空间:
2-1)确定的特征属性为钻井漏失参数数据,包括井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,温度,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷;
2-2)根据确定的特征属性,依次将以上特征属性的取值记为xi,井深记为x1,层位记为x2,岩性记为x3,钻压记为x4,扭矩记为x5,钻速记为x6,立压记为x7,入口流量记为x8,出口流量记为x9,温度记为x10,孔隙度记为x11,渗透率记为x12,钻井液密度记为x13,钻井液固相含量记为x14,杨氏模量记为x15,钻头类型记为x16,钻头尺寸记为x17,大钩负荷记为x18,确定特征属性的取值为该朴素贝叶斯模型的特征输入,以上确定的特征属性取值记为向量X=(x1,x2,x3…x17,x18);
2-3)确定以特征属性取值相应计算得到的钻井漏失概率为该朴素贝叶斯模型的特征输出,用Y表征输出类别训练元组,记为Y=(c1,c2),其中c1表示未发生漏失,c2表示发生井漏,用|ck,Y|表示Y中类ck的训练个数;
3)利用训练集进行监督学习训练,建立朴素贝叶斯学习模型:
3-1)根据训练集中的样本统计计算各特征属性取值的先验概率P(X=xi)(i=1,2…18)和分类类别的先验概率P(Y=ck)(k=1,2),类的先验概率可以采用下式求得:
Figure 49999DEST_PATH_IMAGE002
其中|ck,Y|是Y中类ck的训练元组数,|Y|为输出类别总的训练元组数;
3-2)学习计算条件概率P(X=x|Y=ck);
3-3)计算每个特征属性的联合概率P(Y=ck|X=xi):
Figure 763878DEST_PATH_IMAGE004
其中,P(Y|X)为漏失机率类别的后验概率,P(Y=ck)为类ck的先验概率,P(X)为特征概率,P(X|Y=ck)表示ck类别中X的条件概率;
4)采用验证集对训练结果进行验证;
5)模型的实际运用获取井场实际钻井参数数据输入该朴素贝叶斯模型,获取相应的钻井漏失机率;
由朴素贝叶斯算法模型,可以计算以钻井漏失与否的概率作为特征输出的后验概率,将后续油藏开发区新钻井的实时钻井参数数据输入该模型进行预测分析:
5-1)获取实时测井钻井参数资料输入模型,计算每个类的P(X|ck)P(ck),则基于特征漏失参数xi分类到ck的条件如下:
Figure 605932DEST_PATH_IMAGE006
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
Figure 532299DEST_PATH_IMAGE008
也就是说基于特征漏失参数X被划分到P(X|ck)P(ck)机率较大的类ck
上述技术方案的进一步特征在于,所述步骤1)中的样本收集方法,获取油藏开发区的井史数据库数据并对其进行预处理,将预处理后的钻井参数数据进行随机分层抽样,按照预设比例10:1形成样本集与测试集;
上述技术方案的进一步特征在于,所述步骤2)中从样本集中确定18个特征属性,并将特征属性的取值记为xi,将井深记为x1,层位为x2,岩性为x3,钻压为x4,扭矩为x5,钻速为x6,立压为x7,入口流量为x8,出口流量x9,温度为x10,孔隙度x11,渗透率x12,钻井液密度x13,钻井液固相含量x14,杨氏模量x15,钻头类型x16,钻头尺寸x17,大钩负荷x18
上述技术方案的进一步特征在于,所述步骤3)中计算条件概率P(X|Y)时,当特征属性值xi为连续型特征值,在实例中通常取xi的先验概率为正态分布,此时P(xi=xi test|Y=ck)的条件分布为:
Figure 81092DEST_PATH_IMAGE010
其中μk和σk 2是特征属性取值满足正态分布的期望和方差,μk为样本类别ck中,所有xi的平均值,σk 2为样本类别ck中,所有xi的方差,xi test为样本集中特征输入取值;
当特征属性取值xi为离散值,如特征属性为岩性时,则条件概率P(xi|ck):
Figure 700292DEST_PATH_IMAGE012
其中|Yxi,k test|是样本集中Y元组属性xi的ck类的训练个数,|Yck|为 Y中ck类的训练个数;
上述技术方案的进一步特征在于,所述步骤3)中计算条件概率P(X|Y)时,除了区分特征属性属于离散值还是连续值外,由于钻井参数之间可相互产生影响,在本说明实施方案中,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,两两特征组合又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的漏失机理分类器的泛化性能;
由此当特征属性为离散值时的组合特征联合条件概率为:
Figure 701747DEST_PATH_IMAGE014
其中,|Yxi,k test,xj,k test|为漏失类别ck中第i号和第j号特征取值的训练个数,|Yck|为 Y中ck类的训练个数;
当特征属性取值为连续值时:
Figure 697384DEST_PATH_IMAGE016
其中x为满足特征属性i号和j号的取值区间,μk和σk 2是特征属性取值x满足正态分布的期望和方差,μk为样本类别ck中,所有x的平均值,σk 2为样本类别ck中,所有x的方差;
上述技术方案的进一步特征在于,所述步骤3)中在一个可选的实例中,由朴素贝叶斯模型得到的各特征属性的联合概率因为分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是相对独立的,所以其联合概率可简化为计算:
Figure 897422DEST_PATH_IMAGE018
当上述两两特征组合的方法求取条件概率,则相应的后验概率为简化计算:
Figure 625206DEST_PATH_IMAGE020
由该朴素贝叶斯算法模型,可以计算以钻井漏失概率作为特征输出的后验概率,将后续油藏开发区新钻井的实时钻井参数数据输入该朴素贝叶斯模型进行预测分析,得到新钻井基于确定的钻井漏失参数的实时井漏发生机率,根据相应的漏失机率实时调整钻井参数取值,采取合理的堵漏决策降低钻井液环空压耗和钻井液动压力,从而指导钻井的继续开发。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
图1是油藏井史数据预处理框图;
图2是基于朴素贝叶斯算法的钻井漏失概率预测流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
1)图1为本发明技术方案中的油藏历史钻井数据预处理框图,如图1所示,在本说明书的实施方案中,可用于进行钻井漏失机理预测的油藏历史开发数据都储存在测井软件数据库中。在用朴素贝叶斯算法建立分类模型从而对测井数据进行挖掘与学习之前,需要对测井数据进行数据预处理;
在本说明书的实施方案中,上述的数据预处理包括:
1-1)对历史测井数据进行ETL清洗(即数据的抽取,转换,集成),将其处理为可供机器学习模型(即朴素贝叶斯算法)处理的结构化数据;
1-2)采用噪声数据平滑技术对数据进行去噪处理,数据平滑去噪采用按平均值平滑的方法,即对同一箱值中的数据求平均值,用平均值替代该箱子中的所有数据,减少噪声数据对数据的干扰影响;
1-3)数据预处理的归一化处理,本发明方案采用z-score标准化,z-score方法使得数据标准统一化,提高数据的可比性,削弱数据的解释性,在后续应用中可以提高模型的收敛速度与精度。z-score通过将多组数据转化为无单位的z-score分值,适用于属性的最大值或最小值未知的情况,即将属性的原始数据通过z-score标准化为
Figure 176273DEST_PATH_IMAGE022
1-4)在本说明实施方案中,基于钻井漏失参数采用朴素贝叶斯算法的钻井漏失机率预测模型是一个监督学习的过程。为避免数据划分带来的额外误差而对最终的分类结果准确性产生影响,划分数据应注意保持数据分布的一致性,同时为了保证数据的代表性,划分数据采用随机分层抽样的方式划分为训练集和测试集,将上述预处理后的钻井漏失参数数据进行随机分层抽样,并按照预设比例10:1划分成训练集和测试集;
2)图2是基于朴素贝叶斯算法的钻井漏失概率预测流程图,如图2所示,在本发明方案的具体实施案例中,数据收集与预处理后的钻井数据参数包含18个可用特征属性,包括井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,温度,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷,输出类别空间Y包含两个输出类别,即未发生漏失和发生井漏;
2-1)将特征属性的取值记为xi,依次将井深记为x1,层位为x2,岩性为x3,钻压为x4,扭矩记为x5,钻速记为x6,立压记为x7,入口流量记为x8,出口流量记为x9,温度记为x10,孔隙度记为x11,渗透率记为x12,钻井液密度记为x13,钻井液固相含量记为x14,杨氏模量记为x15,钻头类型记为x16,钻头尺寸记为x17,大钩负荷记为x18,将确定的特征属性取值依次记为向量X=(x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16,x17,x18);
3)利用训练集进行监督学习训练,建立朴素贝叶斯学习模型:
3-1)根据样本集钻井漏失参数数据统计各特征属性取值的先验概率P(xi);
3-2)用ck表征输出类别,记为Y=(c1,c2),其中c1表示未发生漏失,c2表示发生井漏,类的先验概率可以采用
Figure 647706DEST_PATH_IMAGE024
求得,其中|ck,Y|是Y中类ck的训练个数,|Y|为总的输出类别训练个数;
3-3)计算条件概率,当特征属性值xi为连续型特征值,在实例中通常取xi的先验概率为正态分布,此时P(xi=xi test|Y=ck)的条件分布为:
Figure 967829DEST_PATH_IMAGE026
其中μk和σk 2是特征属性取值满足正态分布的期望和方差,μk为样本类别ck中,所有xi的平均值,σk 2为样本类别ck中,所有xi的方差,xi test为样本集中特征输入取值;
当特征属性取值xi为离散值,如特征属性为岩性时,则条件概率P(xi test|ck):
Figure 132094DEST_PATH_IMAGE028
其中|Yxi,k test |是样本集中Y元组属性xi的ck类的元组数,|Yck|为 Y中ck类元组数;
3-5)由于钻井参数之间会产生相互作用共同对井漏产生影响,,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,两两特征组合又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的漏失机理分类器的泛化性能;
由此当特征属性为离散值时的组合特征联合条件概率为:
Figure 170457DEST_PATH_IMAGE030
其中,|Yxi,k test,xj,k test|为漏失类别ck中第i号和第j号特征取值的个数,|Yck|为Y中ck类的训练个数;
当特征属性取值为连续值时:
Figure 180001DEST_PATH_IMAGE032
其中x为满足特征属性i号和j号的取值区间,μk和σk 2是特征属性取值x满足正态分布的期望和方差,μk为样本类别ck中,所有x的平均值,σk 2为样本类别ck中,所有x的方差;
3-6)根据处理好的样本集建立朴素贝叶斯模型,采用样本集数据进行学习训练。采用计算好的先验概率计算特征属性的联合概率P(Y=ck|X):
Figure 620210DEST_PATH_IMAGE034
因为上式分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是假设相对独立的,所以可以简化为计算:
Figure 689797DEST_PATH_IMAGE036
若采用基于上述两两特征组合的方式计算相应的联合条件概率则为:
Figure 215456DEST_PATH_IMAGE038
3-7)在本说明实施方案中,基于先验概率和条件概率构建目标函数(即后验概率),并基于朴素贝叶斯算法对所述目标函数进行求解的过程即为训练过程,从而生成了基于朴素贝叶斯算法的井漏漏失机率预测分类器。
4)采用测试集测试该钻井漏失机率预测分类器;
5)利用该钻井漏失机率预测分类器对新钻井目标工区内进行井漏漏失概率预测识别。
5-1)获取实时测井钻井参数资料输入模型,计算每个类的P(X|ck)P(ck),则基于特征漏失参数xi分类到ck的条件如下:
Figure 28692DEST_PATH_IMAGE040
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
Figure 323407DEST_PATH_IMAGE042
在本说明的实施方案中,将目标工区内待预测的实时测井钻井数据输入钻井漏失机率预测分类器中,通过比较钻井漏失与否的概率大小,即可获得相应的井漏发生预测结果以及漏失概率大小,从而指导钻井过程的堵漏决策。
以上所述具体技术方案仅用以说明本发明,并不用于限制本发明;尽管参照上述具体技术方案对本发明进行了详细的说明,本领域的普通技术人员应当理解。凡是基于本发明的精神和原则之内,所做的任何修改和等同替换均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于朴素贝叶斯算法的钻井漏失机率预测方法,其特征在于,包括如下步骤:
S1、收集样本数据,从某油藏开发区的油藏井史数据库中提取油藏历史开发数据并进行预处理,创建样本集与测试集;
S2、从样本数据中确定特征属性,确定特征属性的取值为该朴素贝叶斯模型的特征输入,确定输出类别,建立向量组;
S3、利用训练集进行监督学习训练,建立朴素贝叶斯学习模型;
S4、利用验证集对训练结果进行验证;
S5、该朴素贝叶斯模型的实际运用,获取井场实际钻井参数数据输入该朴素贝叶斯模型,获取相应的钻井漏失机率。
2.根据权利要求1所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,所述S1中预处理包括:数据的ETL清洗,数据平滑去噪,数据的归一化处理。
3.根据权利要求2所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,将预处理后的钻井参数数据进行随机分层抽样,按照预设比例10:1形成样本集与测试集。
4.根据权利要求1所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,所述S2具体为:
确定钻井漏失参数数据为特征属性,包括井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,温度,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷,确定以特征属性的取值为特征输入,确定以相应特征属性取值计算的钻井漏失概率为特征输出,根据确定的特征属性,依次将上述18个特征取值分别记为xi,以上确定的特征属性取值记为向量X=(x1,x2,x3,x4…x17,x18);用Y表征输出类别训练元组,记Y=(c1,c2),其中c1表示未发生漏失,c2表示发生井漏,用|ck,Y|表示Y中类ck的训练个数。
5.根据权利要求1所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,所述S3具体为:
S31、根据训练集中的样本统计各特征属性取值的先验概率P(X=xi)(i=1,2,3…18);
S32、根据训练集中的样本统计计算分类类别的先验概率P(Y=ck)(k=1,2):
Figure 324919DEST_PATH_IMAGE002
式中|ck,Y|是Y中类ck的训练个数,|Y|为总的输出类别训练个数。
6.根据权利要求5所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,将上述先验概率联合学习计算条件概率P(X=x|Y=ck);
特征属性值为连续型特征值,所述的条件概率根据以下公式计算,
Figure 814806DEST_PATH_IMAGE004
其中μk和σk 2是特征属性取值满足正态分布的期望和方差,μk为样本类别ck中,所有xi的平均值,σk 2为样本类别ck中,所有xi的方差,xi test为样本集中特征输入取值;
特征属性取值为离散值,所述的条件概率根据以下公式计算:
Figure 141882DEST_PATH_IMAGE006
其中|Yxi,k test|是样本集中Y元组属性xi的ck类的元组数,|Yck|为Y中ck类元组数。
7.根据权利要求6所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,特征属性为离散值时的组合特征联合条件概率根据以下公式计算:
Figure 691812DEST_PATH_IMAGE008
|Yxi,k test,xj,k test|为漏失类别ck中第i号和第j号特征取值的个数,|Yck|为Y中ck类的训练个数;
特征属性取值为连续值时的组合特征联合条件概率根据以下公式计算;
Figure 369918DEST_PATH_IMAGE010
其中x为满足特征属性i号和j号的取值区间,μk和σk 2是特征属性取值x满足正态分布的期望和方差,其中,μk为样本类别ck中,所有x的平均值,σk 2为样本类别ck中,所有x的方差;
采用计算好的先验概率和条件概率计算特征属性的联合后验概率P(Y=ck|X),即计算P(X|Y=ck)P(Y=ck):
Figure 929075DEST_PATH_IMAGE012
8.根据权利要求1所述的基于朴素贝叶斯算法的钻井漏失概率预测方法,其特征在于,所述S5具体为:
获取井场实时测井得到的钻井参数资料并输入该朴素贝叶斯模型,计算每个类的P(X|Y=ck)P(Y=ck),通过弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合的方式计算每个类的后验概率,通过比较两个类别的后验概率,判断出基于特征漏失参数X被划分到P(X|Y=ck)P(Y=ck))较大的类ck,并求出了相应的类ck的发生概率。
CN202110177884.8A 2021-02-09 2021-02-09 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 Active CN112529341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110177884.8A CN112529341B (zh) 2021-02-09 2021-02-09 一种基于朴素贝叶斯算法的钻井漏失机率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110177884.8A CN112529341B (zh) 2021-02-09 2021-02-09 一种基于朴素贝叶斯算法的钻井漏失机率预测方法

Publications (2)

Publication Number Publication Date
CN112529341A true CN112529341A (zh) 2021-03-19
CN112529341B CN112529341B (zh) 2021-07-23

Family

ID=74975720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110177884.8A Active CN112529341B (zh) 2021-02-09 2021-02-09 一种基于朴素贝叶斯算法的钻井漏失机率预测方法

Country Status (1)

Country Link
CN (1) CN112529341B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569699A (zh) * 2021-07-22 2021-10-29 上汽通用五菱汽车股份有限公司 注意力分析方法、车辆及存储介质
CN114662390A (zh) * 2022-03-22 2022-06-24 西南石油大学 一种基于svr算法的钻井漏失压力预测方法
CN115062479A (zh) * 2022-06-24 2022-09-16 西南石油大学 一种基于贝叶斯网络的直井环空岩屑浓度修正方法
CN115680645A (zh) * 2022-09-27 2023-02-03 成都理工大学 基于多源随钻信息融合的岩体特征实时预测方法和系统
WO2023059345A1 (en) * 2021-10-08 2023-04-13 Landmark Graphics Corporation Determining characteristics of fluid loss in a wellbore
CN116629409A (zh) * 2023-05-06 2023-08-22 南昌大学 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法
CN116957363A (zh) * 2023-09-19 2023-10-27 中国科学院地质与地球物理研究所 深地油气精准导航砂泥岩地层构造评价方法与系统
CN117932474A (zh) * 2024-03-22 2024-04-26 山东核电有限公司 一种通信缺失数据确定模型的训练方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443488A (zh) * 2019-07-31 2019-11-12 中国石油大学(华东) 基于卷积神经网络的钻井溢漏风险识别方法、系统及设备
CN111738620A (zh) * 2020-07-17 2020-10-02 西南石油大学 一种基于关联规则的井漏风险预测与堵漏决策系统及方法
CN111832636A (zh) * 2020-06-30 2020-10-27 中国石油大学(北京) 基于特征组合的朴素贝叶斯岩相分类方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443488A (zh) * 2019-07-31 2019-11-12 中国石油大学(华东) 基于卷积神经网络的钻井溢漏风险识别方法、系统及设备
CN111832636A (zh) * 2020-06-30 2020-10-27 中国石油大学(北京) 基于特征组合的朴素贝叶斯岩相分类方法及装置
CN111738620A (zh) * 2020-07-17 2020-10-02 西南石油大学 一种基于关联规则的井漏风险预测与堵漏决策系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
岳炜杰: ""三高"油气井溢流先兆在线监测与预警系统设计与开发", 《中国优秀硕士学位论文全文数据库 工程科技I辑》 *
罗鸣: "一种基于朴素贝叶斯的银行卡批量业务预测方法", 《微型电脑应用》 *
菅小艳: "《贝叶斯网基础及应用》", 31 May 2019 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569699A (zh) * 2021-07-22 2021-10-29 上汽通用五菱汽车股份有限公司 注意力分析方法、车辆及存储介质
CN113569699B (zh) * 2021-07-22 2024-03-08 上汽通用五菱汽车股份有限公司 注意力分析方法、车辆及存储介质
WO2023059345A1 (en) * 2021-10-08 2023-04-13 Landmark Graphics Corporation Determining characteristics of fluid loss in a wellbore
US11629562B1 (en) 2021-10-08 2023-04-18 Landmark Graphics Corporation Determining characteristics of fluid loss in a wellbore
CN114662390A (zh) * 2022-03-22 2022-06-24 西南石油大学 一种基于svr算法的钻井漏失压力预测方法
CN114662390B (zh) * 2022-03-22 2023-09-29 西南石油大学 一种基于svr算法的钻井漏失压力预测方法
CN115062479A (zh) * 2022-06-24 2022-09-16 西南石油大学 一种基于贝叶斯网络的直井环空岩屑浓度修正方法
CN115680645A (zh) * 2022-09-27 2023-02-03 成都理工大学 基于多源随钻信息融合的岩体特征实时预测方法和系统
CN116629409A (zh) * 2023-05-06 2023-08-22 南昌大学 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法
CN116957363A (zh) * 2023-09-19 2023-10-27 中国科学院地质与地球物理研究所 深地油气精准导航砂泥岩地层构造评价方法与系统
CN116957363B (zh) * 2023-09-19 2023-12-01 中国科学院地质与地球物理研究所 深地油气精准导航砂泥岩地层构造评价方法与系统
CN117932474A (zh) * 2024-03-22 2024-04-26 山东核电有限公司 一种通信缺失数据确定模型的训练方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112529341B (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN112529341B (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
CN109635461B (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
CN107122860B (zh) 基于网格搜索和极限学习机的冲击地压危险等级预测方法
CN113807570B (zh) 基于XGBoost的水库大坝风险等级评估方法及系统
CN103473540B (zh) 智能交通系统车辆轨迹增量式建模与在线异常检测方法
CN110110740B (zh) 基于多时间尺度特征和神经网络的钻进过程工况识别方法
CN103617147A (zh) 一种矿井突水水源层识别方法
CN112682273B (zh) 基于代价敏感轻量级梯度提升机的风电机组故障检测方法
CN109594967A (zh) 一种基于录井大数据的卡钻事故检测预警方法
Qin et al. Evaluation of goaf stability based on transfer learning theory of artificial intelligence
Liang et al. Overflow warning and remote monitoring technology based on improved random forest
CN117093922A (zh) 一种基于改进svm的不平衡样本油藏复杂流体识别方法
CN109886421B (zh) 基于集成学习的群智能采煤机切割模式识别系统
CN116992522A (zh) 深基坑围护结构变形预测方法、装置、设备及存储介质
Li et al. Cross-oilfield reservoir classification via multi-scale sensor knowledge transfer
Liaghat et al. Ore grade prediction using informative features of MWD data
CN113887049A (zh) 一种基于机器学习的石油钻井的钻速预测方法及系统
CN114818493A (zh) 一种隧道岩体完整程度定量评价的方法
CN113431557A (zh) 一种基于人工智能的井下井眼轨迹跟踪方法
CN115438090A (zh) 基于掉块图像特征的井壁失稳类型分析及预测方法及系统
CN115438823A (zh) 一种井壁失稳机制分析与预测方法及系统
CN110674868A (zh) 一种基于高维钻进参数信息的地层岩性识别系统及其方法
CN109614584B (zh) 一种资源测井数据的重建方法
Shaohu et al. Prediction of drilling plug operation parameters based on incremental learning and CNN-LSTM
Cao et al. Study on inferring interwell connectivity of injection-production system based on decision tree

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant