CN112529341B - 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 - Google Patents
一种基于朴素贝叶斯算法的钻井漏失机率预测方法 Download PDFInfo
- Publication number
- CN112529341B CN112529341B CN202110177884.8A CN202110177884A CN112529341B CN 112529341 B CN112529341 B CN 112529341B CN 202110177884 A CN202110177884 A CN 202110177884A CN 112529341 B CN112529341 B CN 112529341B
- Authority
- CN
- China
- Prior art keywords
- probability
- drilling
- characteristic
- class
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005553 drilling Methods 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 31
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000011161 development Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000012795 verification Methods 0.000 claims abstract description 3
- 238000012549 training Methods 0.000 claims description 35
- 239000012530 fluid Substances 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 239000007787 solid Substances 0.000 claims description 7
- 230000035699 permeability Effects 0.000 claims description 6
- 230000003313 weakening effect Effects 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Agronomy & Crop Science (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于钻井漏失预测领域和人工智能机器学习领域,具体涉及一种基于朴素贝叶斯算法的钻井漏失机率预测方法。所述方法为:从某油藏开发区的油藏井史数据库中提取油藏历史开发数据并进行预处理,创建样本集与测试集,从样本数据中确定特征属性与输出类别空间,根据样本集钻井漏失参数数据统计各特征属性取值先验概率,采用先验概率学习计算条件概率,当特征属性取值为连续值和离散值时分别采用不同的条件概率计算,选择两两特征组合的方式计算相应的条件概率提高模型的泛化性能,由先验概率联合计算后验概率,建立朴素贝叶斯模型分类器,采用验证集进行验证,将实时钻井参数数据输入模型获取相应的漏失机率大小。
Description
技术领域
本发明属于钻井漏失预测领域和人工智能机器学习领域,具体涉及一种基于朴素贝叶斯算法的钻井漏失机率预测方法。
背景技术
井漏是钻井过程中的一种复杂而常见的工况,会对钻采工业造成严重危害与经济损失。钻井过程中许多钻井参数都会对井漏产生影响,比如井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷等。这些钻井参数在钻井过程中的参数大小的变化都有可能使得钻井液液柱压力大于地层岩石破裂压力,从而形成诱导裂缝,或使得地层闭合裂缝重新开启,造成井漏的难题,导致钻井工程时间,材料和人力的浪费,通过及时掌握钻井施工时的这些数据变化情况,采取合理的井漏预测方法判断出井漏发生的概率,从而合理设计井身结构,降低钻井液环空压耗等措施可以使井漏现象做到真正有效的预防。
基于人工智能机器学习领域对井漏进行预测的一种方法是采用支持向量机,基于其统计学习理论和结构风险最小原理对导致井漏的大量有效数据进行整合,从而构建针对井漏的有效预警系统。随着近年来经济的快速发展,对能源的需求也越来越高,因此各种深井、复杂结构井以及非常规井的数量开始逐年增加,对这些井的开发也使得井漏发生的机率随之增加,一个有效的井漏预警方法对防范钻井过程中出现的井漏风险,确保钻井安全,降低钻井成本以及提高钻井效率具有重要意义。
利用数据挖掘技术对油气工业进行信息提取和学习,从而辅助石油的开发是当前油气工业,尤其是钻井开发行业研究的热点。朴素贝叶斯方法发源于古典理论,是数据挖掘和机器学习的重要方法之一,该方法对数据的处理学习效率高,且对数据缺失不敏感,通过该方法对测井数据处理从而进行井漏预测具有良好的应用前景。
发明内容
为了克服现有井漏预测方法的不足与局限性,造成井场技术人员无法对相应的漏失参数进行控制,使得漏失难以控制、反复发生的问题,同时丰富利用钻井参数对井漏进行预测的方法,本发明提出了一种基于朴素贝叶斯算法的钻井漏失机率预测方法。该方法通过获取实时钻井参数值作为特征输入,以建立的朴素贝叶斯模型分类计算出的钻井漏失概率作为特征输出进行判断,在进行堵漏决策时具有较好的现实指导意义。
为了实现上述目的,基于朴素贝叶斯算法的钻井漏失机率预测方法具体实施步骤如下:1)收集样本数据,从某油藏开发区的油藏井史数据库中提取油藏历史开发数据并进行预处理,创建样本集与测试集;
2)从样本数据中确定特征属性与输出类别空间:
2-1)确定的特征属性为钻井漏失参数数据,包括井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,温度,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷;
2-2)根据确定的特征属性,依次将以上特征属性的取值记为xi,井深记为x1,层位记为x2,岩性记为x3,钻压记为x4,扭矩记为x5,钻速记为x6,立压记为x7,入口流量记为x8,出口流量记为x9,温度记为x10,孔隙度记为x11,渗透率记为x12,钻井液密度记为x13,钻井液固相含量记为x14,杨氏模量记为x15,钻头类型记为x16,钻头尺寸记为x17,大钩负荷记为x18,确定特征属性的取值为该朴素贝叶斯模型的特征输入,以上确定的特征属性取值记为向量X=(x1,x2,x3…x17,x18);
2-3)确定以特征属性取值相应计算得到的钻井漏失概率为该朴素贝叶斯模型的特征输出,用Y表征输出类别训练元组,记为Y=(c1,c2),其中c1表示未发生漏失,c2表示发生井漏,用表示Y中类ck的训练个数;
3)利用训练集进行监督学习训练,建立朴素贝叶斯学习模型:
3-1)根据训练集中的样本统计计算各特征属性取值的先验概率P(X=xi)(i=1,2…18)和分类类别的先验概率P(Y=ck)(k=1,2),类的先验概率可以采用下式求得:
3-2)学习计算条件概率P(X=x|Y=ck);
3-3)计算每个特征属性的联合概率P(Y=ck|X=xi):
其中,P(Y|X)为漏失机率类别的后验概率,P(Y=ck)为类ck的先验概率,P(X)为特征概率,P(X|Y=ck)表示ck类别中X的条件概率;
4)采用验证集对训练结果进行验证;
5)模型的实际运用获取井场实际钻井参数数据输入该朴素贝叶斯模型,获取相应的钻井漏失机率;
由朴素贝叶斯算法模型,可以计算以钻井漏失与否的概率作为特征输出的后验概率,将后续油藏开发区新钻井的实时钻井参数数据输入该模型进行预测分析:
5-1)获取实时测井钻井参数资料输入模型,计算每个类的P(X|ck)P(ck),则基于特征漏失参数xi分类到ck的条件如下:
P(X|ck)P(ck)>P(X|cm)P(cm) (k≠m)
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
也就是说基于特征漏失参数X被划分到P(X|ck)P(ck)机率较大的类ck。
上述技术方案的进一步特征在于,所述步骤1)中的样本收集方法,获取油藏开发区的井史数据库数据并对其进行预处理,将预处理后的钻井参数数据进行随机分层抽样,按照预设比例10:1形成样本集与测试集;
上述技术方案的进一步特征在于,所述步骤2)中从样本集中确定18个特征属性,并将特征属性的取值记为xi,将井深记为x1,层位为x2,岩性为x3,钻压为x4,扭矩为x5,钻速为x6,立压为x7,入口流量为x8,出口流量x9,温度为x10,孔隙度x11,渗透率x12,钻井液密度x13,钻井液固相含量x14,杨氏模量x15,钻头类型x16,钻头尺寸x17,大钩负荷x18;
上述技术方案的进一步特征在于,所述步骤3)中计算条件概率P(X|Y)时,当特征属性值xi为连续型特征值,在实例中通常取xi的先验概率为正态分布,此时P(xi=xi test|Y=ck)的条件分布为:
其中μk和σk 2是特征属性取值满足正态分布的期望和方差,μk为样本类别ck中,所有xi的平均值,σk 2为样本类别ck中,所有xi的方差,xi test为样本集中特征输入取值;
当特征属性取值xi为离散值,如特征属性为岩性时,则条件概率P(xi|ck):
其中|Yxi,k test|是样本集中Y元组属性xi的ck类的训练个数,|Yck|为Y中ck类的训练个数;
上述技术方案的进一步特征在于,所述步骤3)中计算条件概率P(X|Y)时,除了区分特征属性属于离散值还是连续值外,由于钻井参数之间可相互产生影响,在本说明实施方案中,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,两两特征组合又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的漏失机理分类器的泛化性能;
由此当特征属性为离散值时的组合特征联合条件概率为:
其中,|Yxi,k test,xj,k test|为漏失类别ck中第i号和第j号特征取值的训练个数,|Yck|为Y中ck类的训练个数;
当特征属性取值为连续值时:
其中x为满足特征属性i号和j号的取值区间,μk和σk 2是特征属性取值x满足正态分布的期望和方差,μk为样本类别ck中,所有x的平均值,σk 2为样本类别ck中,所有x的方差;
上述技术方案的进一步特征在于,所述步骤3)中在一个可选的实例中,由朴素贝叶斯模型得到的各特征属性的联合概率因为分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是相对独立的,所以其联合概率可简化为计算:
当上述两两特征组合的方法求取条件概率,则相应的后验概率为简化计算:
由该朴素贝叶斯算法模型,可以计算以钻井漏失概率作为特征输出的后验概率,将后续油藏开发区新钻井的实时钻井参数数据输入该朴素贝叶斯模型进行预测分析,得到新钻井基于确定的钻井漏失参数的实时井漏发生机率,根据相应的漏失机率实时调整钻井参数取值,采取合理的堵漏决策降低钻井液环空压耗和钻井液动压力,从而指导钻井的继续开发。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
图1是油藏井史数据预处理框图;
图2是基于朴素贝叶斯算法的钻井漏失概率预测流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
1)图1为本发明技术方案中的油藏历史钻井数据预处理框图,如图1所示,在本说明书的实施方案中,可用于进行钻井漏失机理预测的油藏历史开发数据都储存在测井软件数据库中。在用朴素贝叶斯算法建立分类模型从而对测井数据进行挖掘与学习之前,需要对测井数据进行数据预处理;
在本说明书的实施方案中,上述的数据预处理包括:
1-1)对历史测井数据进行ETL清洗(即数据的抽取,转换,集成),将其处理为可供机器学习模型(即朴素贝叶斯算法)处理的结构化数据;
1-2)采用噪声数据平滑技术对数据进行去噪处理,数据平滑去噪采用按平均值平滑的方法,即对同一箱值中的数据求平均值,用平均值替代该箱子中的所有数据,减少噪声数据对数据的干扰影响;
1-3)数据预处理的归一化处理,本发明方案采用z-score标准化,z-score方法使得数据标准统一化,提高数据的可比性,削弱数据的解释性,在后续应用中可以提高模型的收敛速度与精度。z-score通过将多组数据转化为无单位的z-score分值,适用于属性的最大值或最小值未知的情况,即将属性的原始数据x通过z-score标准化为x′;
1-4)在本说明实施方案中,基于钻井漏失参数采用朴素贝叶斯算法的钻井漏失机率预测模型是一个监督学习的过程。为避免数据划分带来的额外误差而对最终的分类结果准确性产生影响,划分数据应注意保持数据分布的一致性,同时为了保证数据的代表性,划分数据采用随机分层抽样的方式划分为训练集和测试集,将上述预处理后的钻井漏失参数数据进行随机分层抽样,并按照预设比例10:1划分成训练集和测试集;
2)图2是基于朴素贝叶斯算法的钻井漏失概率预测流程图,如图2所示,在本发明方案的具体实施案例中,数据收集与预处理后的钻井数据参数包含18个可用特征属性,包括井深,层位,岩性,钻压,扭矩,钻速,立压,入口流量,出口流量,温度,孔隙度,渗透率,钻井液密度,钻井液固相含量,杨氏模量,钻头类型,钻头尺寸,大钩负荷,输出类别空间Y包含两个输出类别,即未发生漏失和发生井漏;
2-1)将特征属性的取值记为xi,依次将井深记为x1,层位为x2,岩性为x3,钻压为x4,扭矩记为x5,钻速记为x6,立压记为x7,入口流量记为x8,出口流量记为x9,温度记为x10,孔隙度记为x11,渗透率记为x12,钻井液密度记为x13,钻井液固相含量记为x14,杨氏模量记为x15,钻头类型记为x16,钻头尺寸记为x17,大钩负荷记为x18,将确定的特征属性取值依次记为向量X=(x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16,x17,x18);
3)利用训练集进行监督学习训练,建立朴素贝叶斯学习模型:
3-1)根据样本集钻井漏失参数数据统计各特征属性取值的先验概率P(xi);
3-2)用ck表征输出类别,记为Y=(c1,c2),其中c1表示未发生漏失,c2表示发生井漏,类的先验概率可以采用
3-3)计算条件概率,当特征属性值xi为连续型特征值,在实例中通常取xi的先验概率为正态分布,此时P(xi=xi test|Y=ck)的条件分布为:
其中μk和σk 2是特征属性取值满足正态分布的期望和方差,μk为样本类别ck中,所有xi的平均值,σk 2为样本类别ck中,所有xi的方差,xi test为样本集中特征输入取值;
当特征属性取值xi为离散值,如特征属性为岩性时,则条件概率P(xi test|ck):
其中|Yxi,k test|是样本集中Y元组属性xi的ck类的元组数,|Yck|为Y中类ck的训练个数。
3-5)由于钻井参数之间会产生相互作用共同对井漏产生影响,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,两两特征组合又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的漏失机理分类器的泛化性能;
由此当特征属性为离散值时的组合特征联合条件概率为:
其中,|Yxi,k test,xj,k test|为漏失类别ck中第i号和第j号特征取值的个数,|Yck|为Y中ck类的训练个数;
当特征属性取值为连续值时:
其中x为满足特征属性i号和j号的取值区间,μk和σk 2是特征属性取值x满足正态分布的期望和方差,μk为样本类别ck中,所有x的平均值,σk 2为样本类别ck中,所有x的方差;
3-6)根据处理好的样本集建立朴素贝叶斯模型,采用样本集数据进行学习训练。采用计算好的先验概率计算特征属性的联合概率P(Y=ck|X):
因为上式分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是假设相对独立的,所以可以简化为计算:
若采用基于上述两两特征组合的方式计算相应的联合条件概率则为:
3-7)在本说明实施方案中,基于先验概率和条件概率构建目标函数(即后验概率),并基于朴素贝叶斯算法对所述目标函数进行求解的过程即为训练过程,从而生成了基于朴素贝叶斯算法的井漏漏失机率预测分类器。
4)采用测试集测试该钻井漏失机率预测分类器;
5)利用该钻井漏失机率预测分类器对新钻井目标工区内进行井漏漏失概率预测识别。
5-1)获取实时测井钻井参数资料输入模型,计算每个类的P(X|ck)P(ck),则基于特征漏失参数xi分类到ck的条件如下:
P(X|ck)P(ck)>P(X|cm)P(cm) (k≠m)
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
在本说明的实施方案中,将目标工区内待预测的实时测井钻井数据输入钻井漏失机率预测分类器中,通过比较钻井漏失与否的概率大小,即可获得相应的井漏发生预测结果以及漏失概率大小,从而指导钻井过程的堵漏决策。
以上所述具体技术方案仅用以说明本发明,并不用于限制本发明;尽管参照上述具体技术方案对本发明进行了详细的说明,本领域的普通技术人员应当理解。凡是基于本发明的精神和原则之内,所做的任何修改和等同替换均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于朴素贝叶斯算法的钻井漏失机率预测方法,其特征在于,包括如下步骤:
S1、收集样本数据,从某油藏开发区的油藏井史数据库中提取油藏历史开发数据并进行预处理,创建样本集与测试集;
S2、从样本数据中确定特征属性,确定特征属性的取值为该朴素贝叶斯模型的特征输入,确定输出类别,建立向量组;
S3、利用训练集进行监督学习训练,建立朴素贝叶斯学习模型;
由于钻井参数之间会产生相互作用共同对井漏产生影响,选择两两特征组合的方式计算相应的条件概率,当特征属性为离散值时的组合特征联合条件概率根据以下公式计算:
当特征属性取值为连续值时的组合特征联合条件概率根据以下公式计算;
采用基于上述两两特征组合的方式计算相应的后验概率则为:
基于朴素贝叶斯算法对所述后验概率求解的过程即为训练过程,生成基于朴素贝叶斯算法的井漏漏失机率预测分类器;
S4、利用验证集对训练结果进行验证;
S5、该朴素贝叶斯模型的实际运用,获取井场实际钻井参数数据输入该朴素贝叶斯模型,获取相应的钻井漏失机率;
获取井场实时测井得到的钻井参数资料并输入该朴素贝叶斯模型,计算每个类的P(X|Y=ck)P(Y=ck),通过弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合的方式计算每个类的后验概率,通过比较两个类别的后验概率,判断出基于特征漏失参数X被划分到P(X|Y=ck)P(Y=ck))较大的类ck,并求出了相应的类ck的发生概率。
2.根据权利要求1所述的基于朴素贝叶斯算法的钻井漏失机率预测方法,其特征在于,所述S1中预处理包括:数据的ETL清洗,数据平滑去噪,数据的归一化处理。
3.根据权利要求2所述的基于朴素贝叶斯算法的钻井漏失机率预测方法,其特征在于,将预处理后的钻井参数数据进行随机分层抽样,按照预设比例10:1形成样本集与测试集。
4.根据权利要求1所述的基于朴素贝叶斯算法的钻井漏失机率预测方法,其特征在于,所述S2具体为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110177884.8A CN112529341B (zh) | 2021-02-09 | 2021-02-09 | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110177884.8A CN112529341B (zh) | 2021-02-09 | 2021-02-09 | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112529341A CN112529341A (zh) | 2021-03-19 |
CN112529341B true CN112529341B (zh) | 2021-07-23 |
Family
ID=74975720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110177884.8A Active CN112529341B (zh) | 2021-02-09 | 2021-02-09 | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112529341B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569699B (zh) * | 2021-07-22 | 2024-03-08 | 上汽通用五菱汽车股份有限公司 | 注意力分析方法、车辆及存储介质 |
US11629562B1 (en) * | 2021-10-08 | 2023-04-18 | Landmark Graphics Corporation | Determining characteristics of fluid loss in a wellbore |
CN114662390B (zh) * | 2022-03-22 | 2023-09-29 | 西南石油大学 | 一种基于svr算法的钻井漏失压力预测方法 |
CN115034301A (zh) * | 2022-06-07 | 2022-09-09 | 长江大学 | 一种深水钻井井下溢流智能识别方法 |
CN115062479A (zh) * | 2022-06-24 | 2022-09-16 | 西南石油大学 | 一种基于贝叶斯网络的直井环空岩屑浓度修正方法 |
CN115680645A (zh) * | 2022-09-27 | 2023-02-03 | 成都理工大学 | 基于多源随钻信息融合的岩体特征实时预测方法和系统 |
CN116629409A (zh) * | 2023-05-06 | 2023-08-22 | 南昌大学 | 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 |
CN116957363B (zh) * | 2023-09-19 | 2023-12-01 | 中国科学院地质与地球物理研究所 | 深地油气精准导航砂泥岩地层构造评价方法与系统 |
CN117932474A (zh) * | 2024-03-22 | 2024-04-26 | 山东核电有限公司 | 一种通信缺失数据确定模型的训练方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443488A (zh) * | 2019-07-31 | 2019-11-12 | 中国石油大学(华东) | 基于卷积神经网络的钻井溢漏风险识别方法、系统及设备 |
CN111832636B (zh) * | 2020-06-30 | 2024-04-12 | 中国石油大学(北京) | 基于特征组合的朴素贝叶斯岩相分类方法及装置 |
CN111738620B (zh) * | 2020-07-17 | 2020-12-25 | 西南石油大学 | 一种基于关联规则的井漏风险预测与堵漏决策系统及方法 |
-
2021
- 2021-02-09 CN CN202110177884.8A patent/CN112529341B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112529341A (zh) | 2021-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112529341B (zh) | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 | |
CN109635461B (zh) | 一种应用随钻参数来自动识别围岩级别的方法和系统 | |
CN107122860B (zh) | 基于网格搜索和极限学习机的冲击地压危险等级预测方法 | |
CN102289585B (zh) | 基于数据挖掘的公共建筑能耗实时监测方法 | |
WO2023142424A1 (zh) | 基于gru-lstm神经网络的电力金融业务风控方法及系统 | |
CN113807570B (zh) | 基于XGBoost的水库大坝风险等级评估方法及系统 | |
CN111222683A (zh) | 一种基于pca-knn的tbm施工围岩综合分级预测方法 | |
CN112682273B (zh) | 基于代价敏感轻量级梯度提升机的风电机组故障检测方法 | |
CN116011234B (zh) | 一种融合地质力学和贝叶斯的压前套变风险等级判识方法 | |
CN109594967A (zh) | 一种基于录井大数据的卡钻事故检测预警方法 | |
CN116628592A (zh) | 一种基于改进型生成式对抗网络的动设备故障诊断方法 | |
CN111652253A (zh) | 一种基于大数据的井漏事故检测预警方法 | |
CN115438823A (zh) | 一种井壁失稳机制分析与预测方法及系统 | |
Bajolvand et al. | Optimization of controllable drilling parameters using a novel geomechanics-based workflow | |
CN113946790B (zh) | 一种导水裂隙带高度预测方法、系统、设备及终端 | |
CN116307010A (zh) | 一种基于随机森林算法的钻井工况识别方法 | |
CN116822971B (zh) | 一种井壁风险等级预测方法 | |
CN115438090A (zh) | 基于掉块图像特征的井壁失稳类型分析及预测方法及系统 | |
CN109886421B (zh) | 基于集成学习的群智能采煤机切割模式识别系统 | |
CN114662390B (zh) | 一种基于svr算法的钻井漏失压力预测方法 | |
CN113431557B (zh) | 一种基于人工智能的井下井眼轨迹跟踪方法 | |
CN113887049A (zh) | 一种基于机器学习的石油钻井的钻速预测方法及系统 | |
CN114818493A (zh) | 一种隧道岩体完整程度定量评价的方法 | |
CN109614584B (zh) | 一种资源测井数据的重建方法 | |
CN117540277A (zh) | 一种基于WGAN-GP-TabNet算法的井漏预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |