CN116822971A - 一种井壁风险等级预测方法 - Google Patents
一种井壁风险等级预测方法 Download PDFInfo
- Publication number
- CN116822971A CN116822971A CN202311104072.6A CN202311104072A CN116822971A CN 116822971 A CN116822971 A CN 116822971A CN 202311104072 A CN202311104072 A CN 202311104072A CN 116822971 A CN116822971 A CN 116822971A
- Authority
- CN
- China
- Prior art keywords
- characteristic parameter
- drilling characteristic
- value
- drilling
- discretized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005553 drilling Methods 0.000 claims abstract description 171
- 238000012549 training Methods 0.000 claims abstract description 47
- 239000013598 vector Substances 0.000 claims abstract description 40
- 208000037466 short stature, oligodontia, dysmorphic facies, and motor delay Diseases 0.000 claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims abstract description 17
- 238000009826 distribution Methods 0.000 claims abstract description 12
- 238000005070 sampling Methods 0.000 claims description 57
- 230000008569 process Effects 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 6
- 239000012530 fluid Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000005299 abrasion Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Agronomy & Crop Science (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种井壁风险等级预测方法,通过SOFM神经网络对连续型钻井特征参数进行离散,无需预先标记训练数据,通过调整权重向量和邻域来适应输入数据的分布和特点,最大程度保留原始数据的信息;以及通过属性重要性中的信息增益来提取特征参数,显著减少了模型输入参数的数量并提高了预测效果。
Description
技术领域
本发明涉及石油勘探领域,更具体地,涉及一种井壁风险等级预测方法。
背景技术
在石油勘探开发过程中,保持井壁的稳定状态对于安全钻井和生产具有至关重要的意义。在实际中,由于地层复杂性、钻头磨损等因素的影响,往往会出现井壁失稳等问题,它不仅会影响钻井速度还会造成严重的安全事故。对井壁稳定性进行预测和分析,可以更好地制定钻井方案,从而降低钻井风险并提高采油效率。
井径扩大率是判断井壁失稳比较直观的参数,当井壁失稳时,井眼周围的岩石会发生塑性变形或破裂,导致井径扩大率急剧增加。因此,通过预测井径扩大率的变化来分析井壁的失稳情况。
在预测井壁稳定性的方法中,经验公式法易受限于地质条件和岩石类型,无法考虑到不同地区和层位之间的差异;数值模拟方法需要大量的参数和复杂的计算,其结果还会受模型误差的影响。在深部地层中,影响井壁稳定的参数较多,且各参数之间存在复杂的非线性关系,而机器学习方法解决多目标非线性复杂问题的效果较好,可以充分发掘钻井数据与井壁稳定性之间隐藏的潜在关系,实现对井壁稳定性的准确预测。
发明内容
本发明针对现有技术中存在的技术问题,提供一种井壁风险等级预测方法,解决现有技术中井壁稳定性预测存在的地质条件限制和模型误差的问题,该预测方法包括:
获取目标地层连续型的钻井特征参数和井径扩大率数据;
根据所述井径扩大率数据的统计分布情况,将所述井径扩大率数据进行离散化,获得井径扩大率的离散化值,所述井径扩大率的离散化值表征井壁的风险等级值;
基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化,获取每一个钻井特征参数的离散化值;
将每一个钻井特征参数的离散化值和井径扩大率的离散化值对应组合,组成决策表;
计算每一个钻井特征参数对决策表的信息增益,选取信息增益较大的多个钻井特征参数;
获取训练集,所述训练集中包括多个训练样本,每一个训练样本包括信息增益较大的多个钻井特征参数的离散化值和对应的井径扩大率的离散化值;
基于训练集对预测模型进行训练;
将待测的多个钻井特征参数的离散化值输出训练后的预测模型中,输出井壁的风险等级值。
本发明提供的一种井壁风险等级预测方法,通过神经网络对连续型钻井特征参数进行离散,无需预先标记训练数据,通过调整权重向量和邻域来适应输入数据的分布和特点,最大程度保留原始数据的信息;以及通过属性重要性中的信息增益来提取特征参数,显著减少了模型输入参数的数量并提高了预测效果。
附图说明
图1为本发明提供的一种井壁风险等级预测方法的流程示意图;
图2为对预测模型进行训练的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
图1为本发明提供的一种井壁风险等级预测方法流程图,如图1所示,方法包括:
步骤1,获取目标地层连续型的钻井特征参数和井径扩大率数据。
可理解的是,获取的目标地层的钻井特征参数和井径扩大率数据均为连续型的数据,每一个钻井特征参数包括n个采样点数据,组成连续型的钻井特征参数,同样的,井径扩大率数据也包括n个采样点数据。本发明中获取的钻井特征参数包括14个。
对所有的钻井特征参数进行预处理,首先,对所有钻井特征参数,剔除异常值和空缺值。
其次,对钻井特征参数进行归一化预处理,采用最大、最小标准化法将特征数据的原始值映射到区间[0,1]之间。
;
式中,为钻井特征参数;/>和/>分别为所有钻井特征参数中的最大值和最小值;Xi为归一化后的钻井特征参数。
步骤2,根据所述井径扩大率数据的统计分布情况,将所述井径扩大率数据进行离散化,获得井径扩大率的离散化值,所述井径扩大率的离散化值表征井壁的风险等级值。
可理解的是,获取到连续的井径扩大率数据后,对根据连续型的井径扩大率的统计分布情况,将连续型的井径扩大率按照等距离划分为多个区间,对每一个区间按照不同风险等级编码赋值,获取每一个区间的井径扩大率对应的风险等级编码值,即为离散化值。比如,井径扩大率的100个采样点数据为1,2,3,....,100,将其划分为10个区间,1~10为一个区间,11~20一个区间,....,91~100一个区间,那么在1~10之内的采样点数据均离散化为1,在11~20区间的采样点数据被离散化为2,以此类推,得到井径扩大率的每一个采样点数据的离散化值,其中,离散化值代表井壁风险等级。
步骤3,基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化,获取每一个钻井特征参数的离散化值。
可理解的是,步骤2对井径扩大率数据进行了离散化,该步骤对每一个钻井特征参数进行离散化。其中,影响井壁稳定性的连续型变量有井斜角、方位角、狗腿度、钻井液密度、漏斗粘度、钻速、泵压、钻压、转速、排量、立管压力、钻头压降、环空压耗和喷射速度共14个钻井参数,对连续型变量的离散化按(1)-(2)步骤进行。
(1)初始离散。
作为实施例,所述基于SOFM神经网络将连续型的每一个钻井特征参数进行离散化,获取每一个钻井特征参数的离散化值,包括:
A、初始化每一个钻井特征参数对应的离散化值的数目H0、初始化SOFM神经网络的学习率和邻域Nc(0)、设置学习次数T以及初始化每一个钻井特征参数的每一个离散化值的权值向量wj,其中,j为离散化值编号,j=1,2...,H0。
可理解的是,将每一个钻井特征参数的离散化值的数目均初始化为H0,设置SOFM神经网络的初始学习率和初始邻域Nc(0)以及学习次数T,对每个离散化值的权值向量wj赋予[0,1]范围内的随机值作为权值向量的初始值。令/>,为每一个钻井特征参数X中的采样点数据,n为采样点个数。
对各个参数初始化后,对于每一个钻井特征参数均执行后续的步骤B。
B、对于任一个钻井特征参数包括的连续的多个采样点数据,计算任一个采样点数据与每一个离散化值的权值向量wj之间的距离,并获取最小距离的权值向量wm。
作为实施例,所述B中,对于任一个钻井特征参数包括的连续的多个采样点数据,计算任一个采样点数据与每一个离散化值的权值向量wj之间的距离,并获取最小距离的权值向量wm,包括:
对于每一个钻井特征参数,每个离散化值的归一化权值向量wj为:;
式中,为/>神经元权值,e为神经元个数,H0为离散化值的初始数目。
计算所述任一个钻井特征参数中采样点数据xi与各个离散化值的权重向量wj之间的距离dij:
;
其中,所述任一个钻井特征参数中包括采样点数据(x1,x2,...,xi...,xn),n为采样点个数,j=1,2,...,H0,i=1,2,...,n;
获取dij中最小距离dim,并获取对应的权值向量wm,m=1,2,...,H0。
可理解的是,对于每一个钻井特征参数中的每一个采样点数据,需要确定采样点数据对应的离散化值。在步骤1中初始化的离散化值的数量为H0,其对应的权值向量也包括H0个,也就是每一个离散化值的权值向量wj,j=1,2,...,H0。
计算采样点数据与每一个权值向量之间的距离,获取与采样点数据距离最小的权值向量wm。
C、在下一次迭代过程中,对最小距离的权值向量wm进行迭代更新,其它的权值向量不变,以及对SOFM神经网络的学习率和邻域进行迭代更新。
可理解的是,本发明是通过迭代求解每一个采样点数据对应的离散化值的,因此,在下一次迭代的过程中,对上一次迭代过程中产生的距离最小的权值向量进行更新,并且对SOFM神经网络的学习率和邻域进行更新。
所述C、在下一次迭代过程中,对最小距离的权值向量wm以及SOFM神经网络的学习率和邻域进行迭代更新,包括:
;
其中,
;
;
其中,t为当前迭代次数。
D、重复执行A、B和C,直到迭代更新的次数达到设置的学习次数T,获取与所述任一个采样点数据之间距离最小的权值向量wm',则权值向量wm'对应的离散化值为所述任一个采样点数据的离散化值。
基于更新后的权值向量、SOFM神经网络的学习率和邻域,重复执行A、B和C步骤,不断进行迭代更新,直到迭代次数达到设置的学习次数T,获取此时与采样点数据的距离最小的权值向量,该权值向量对应的离散化值为采样点数据的初始离散化值。此时,需要说明的是,之所有称为初始离散化值,是指当初始离散化值的数目为H0时,采样点数据对应的离散化值,如果离散化值的数目变化时,那么采样点数据对应的离散化值也会变化。
E、对每一个钻井特征参数的每一个采样点数据,均执行A、B、C和D,得到每一个钻井特征参数的每一个采样点数据的初始离散化值。
可理解的是,对于每一个钻井特征参数中的每一个采样点数据均采用相同的方法获取对应的初始离散化值。
作为实施例,在E之后还包括:F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值,确定每一个钻井特征参数对应的离散化值的最优数目;G、基于每一个钻井特征参数对应的离散化值的最优数目更新A中初始化的每一个钻井特征参数对应的离散化值的数目H0,执行A、B、C和D,得到每一个钻井特征参数的每一个采样点数据的离散化值。
可理解的是,每一个钻井特征参数对应的离散化值的数目对钻井特征参数的离散化的效果会有影响,进而对后续井壁风险等级的预测也有一定的影响,因此,需要确定每一个钻井特征参数的离散化值的最优数目。
作为实施例,所述F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值,确定每一个钻井特征参数对应的离散化值的最优数目,包括:根据初始离散化值确定每个钻井特征参数对井壁风险等级的依赖度;确定依赖度最大值/>对应的钻井特征参数Xp,并通过迭代计算钻井特征参数Xp对应的离散化值的最优数量H1;按照依赖度/>从大到小的顺序依次对H1减1确定每一个钻井特征参数的离散化值的最优数目。
其中,根据钻井特征参数不同的数据分布和重要性,由初始离散后的数据确定每个钻井特征参数对井壁风险等级的依赖度,确定依赖度最大值/>对应的钻井参数Xp。
依赖度计算式如下:
;
式中,为钻井参数Xp对井壁风险等级D的依赖度,/>为D的Xp正域,|U|为钻井特征参数个数。
作为实施例,所述确定依赖度最大值对应的钻井特征参数Xp,并通过迭代计算钻井特征参数Xp对应的离散化值的最优数量H1,包括:
A’,基于每一个钻井特征参数对应的离散化值的初始数目H0,生成钻井特征参数Xp的H0个初始聚类中心。
可理解的是,设钻井特征参数Xp=(xp1,xp1,...,xpn),n为采样点的个数,选择H0个初始聚类中心,其中/>为1维向量,表示第j个聚类中心位置。
B’,计算采样点数据xpn到每一个聚类中心的距离,获取与采样点数据xpn的距离最近的聚类中心,将采样点数据xpn归类到该簇中。
其中,采样点数据xpn到每个聚类中心的距离dnj为:
;
xpn的聚类中心为:
式中,j为样本xpn的类别。
C’,遍历每一个采样点数据,将每一个采样点数据归类到不同的簇中。
根据上述公式将每一个采样点数据归类到对应的簇中。
其中,根据每一个簇中的所有采样点数据重新计算该簇的聚类中心:
;
其中,|cj|为簇cj中采样点数据的个数,为cj内所有采样点数据的特征向量总和。
D’,基于每一个簇中的所有采样点数据,重新计算簇中心,利用簇中心更新初始聚类中心。
E’,基于更新后的聚类中心,计算所有簇中所有采样点数据与对应聚类中心的误差平方和SSE。
根据每一个簇的更新后的聚类中心以及簇中所有采样点数据,计算所有采样点数据到对应聚类中心的误差平方和SSE:
式中,H0为初始聚类数,xj是第j类聚类中心的第j个数据点,cj为第个聚类中心,为xj到对应聚类中心cj的距离,xm为cj所在簇中的采样点数据的个数。
F’,在下一次迭代过程中,更新钻井特征参数对应的离散化值的初始数目H0,并执行A’、B’、C’、D’和E’,计算每一次迭代后的误差平方和SSE,直到计算出的误差平方和SSE不发生变化时,获取此次迭代后的钻井特征参数Xp对应的离散化值的最优数目H1。
根据依赖度确定不同钻井特征参数离散化值的数目,/>越大离散化值的数目越大,反之则越小。由于/>对应钻井特征参数Xp对应的离散化值的数目为H1,则比/>较小的/>对应的钻井特征参数的离散化值的数目H2为:
;
随着的逐级减小,对应钻井特征参数离散化值的数目也随之递减,根据每一个钻井特征参数的依赖度,其对应的离散化值的数量依次减1。根据确定的每个钻井特征参数的离散化值的最优数目,重新执行A、B、C、D和E步骤,对所有钻井特征参数分别进行离散并编码赋值。
步骤4,将每一个钻井特征参数的离散化值和井径扩大率的离散化值对应组合,组成决策表。
可理解的是,将离散后的井径扩大率数据与钻井特征参数的编码数据进行组合,构成决策表L,也就是每一个钻井特征参数的离散化值组合对应的井径扩大率的离散化值,组成决策表L,决策表L中的每一行可表示为(X1,X2,....,X14,D),X1,X2,....,X14表示14个钻井特征参数,D表示井壁风险等级。
步骤5,计算每一个钻井特征参数对决策表的信息增益,选取信息增益较大的多个钻井特征参数。
其中,钻井特征参数Xh对决策表的信息增益为:
;
式中,Gain(Xh)表示钻井特征参数Xh对决策表L的信息增益;
其中,决策表L的信息熵Entropy(L)为:
;
式中,p(a)为决策表L中井径扩大率的离散化值a的概率;
钻井特征参数Xh对Entropy(L)的条件期望为:
;
式中,Lv为在钻井参数Xh上离散化值为v的子集,|Lv|为子集Lv的采样点数,|L|为决策表L的样本总数。
通过上式计算出每一个钻井特征参数对决策表L的信息增益Gain,由于钻井特征参数的信息增益越大,则该钻井特征参数对于井壁风险等级的贡献越大,属性的重要性越高。因此选取Gain较大的多个钻井特征参数为井壁风险等级预测模型的输入参数。
步骤6,获取训练集,所述训练集中包括多个训练样本,每一个训练样本包括信息增益较大的多个钻井特征参数的离散化值对应的井径扩大率的离散化值。
可理解的是,步骤5中选取了信息增益较大的g个钻井特征参数,其与对应的井径扩大率构成一个训练样本,多个训练样本构成训练集。
其中,训练集可表示为,其中包括M’个训练样本,其中训练样本SM’中包括信息增益较大的g个钻井特征参数,yM’为井壁风险等级。
步骤7,基于训练集对预测模型进行训练。
可理解的是,基于训练集对预测模型进行训练,包括:
基于训练集训练CatBooat模型建立井壁风险等级预测模型,其中,通过贝叶斯算法优化目标函数寻找/>模型的最佳超参数集,优化目标函数/>的表达式为:
;
式中,N为训练样本数量,y为井壁实际风险等级,为模型输出的井壁预测风险等级,/>为样本Si是否属于第/>类,/>为样本Si属于第/>类的概率,j是第i个样本的实际类别标签,T为井壁风险等级的最大类别数,/>是正则化系数。
以步骤6提取的训练样本为输入,采交叉验证法划分数据集,输入井壁风险等级预测模型进行训练和测试。
通过一对多感受性曲线来评价预测模型对每个风险等级的预测效果,曲线下面积/>为/>曲线所覆盖的区域面积,/>越大分类效果越好。采用正确预测率、分类准确率和风险识别率三类指标对训练后的井壁风险等级预测模型进行评价,计算公式为:
正确预测率;
分类准确率;
风险识别率;
其中,以0级风险等级为正例,1、2、3级风险等级为负例。则,RO,正确预测为0级风险等级的个数;AO,错误预测为0级风险等级的个数;AE,错误预测为1、2、3级风险等级的个数;RE,正确预测为1、2、3级风险等级的个数。
步骤8,将待测的多个钻井特征参数的离散化值输出训练后的预测模型中,输出井壁的风险等级值。
可理解的是,基于步骤7训练后的预测模型对井壁风险等级进行预测,将待测的多个增益较大的钻井特征参数的离散化值输出训练后的预测模型中,输出井壁的风险等级值。
下面以一个具体的算例对本发明提供的井壁风险等级预测方法进行说明。
1、获取目标地层的特征参数和目标参数数据;
从现场钻井资料中,根据井史情况确定舒善河层组的井深范围,在该范围内选择14个钻井特征参数和1个目标参数的数据,钻井特征参数X1到X14分别为井斜角、方位角、狗腿度、钻井液密度、漏斗粘度、钻速、泵压、钻压、转速、排量、立管压力、钻头压降、环空压耗和喷射速度,目标参数为井径扩大率。
2、对特征参数和目标参数进行预处理;
剔除钻井特征参数中异常值和空缺值,进行归一化处理。
表1 钻井参数数据集
3、构建井壁风险等级决策表;
目标参数离散化:根据井径扩大率分布情况,按照等距离将分布区间划分为四个等级,对每一个区间编码赋值,分别为0、1、2、3。
钻井特征参数离散化:
初始离散:设置SOFM神经网络的学习率为0.1,邻域值为1,训练步数为400,离散类别数H0为5,对所有钻井特征参数进行离散;
确定依赖度对应的钻井特征参数为井斜角和漏斗粘度;确定井斜角和漏斗粘度离散划分的最优离散化值数目H1为10;
确定每个钻井特征参数对井壁风险等级的依赖度,根据/>大小对钻井特征参数进行排序,分别为井斜角、漏斗粘度、转速、钻速、钻压、立管压力、方位角、泵压、钻头压降、喷射速度、排量、狗腿度、环空压耗、钻井液密度。
重新确定每个钻井特征参数的离散化值数目,其中井斜角和漏斗粘度离散的类别为10,转速离散的类别为9,钻速、钻压和立管压力离散的类别为8,方位角、泵压、钻头压降和喷射速度离散的类别为7,排量离散的类别为6,狗腿度和环空压耗离散的类别为5,钻井液密度离散的类别为4。
利用SOFM神经网络对每个钻井特征参数分别进行离散并编码赋值,将离散后的钻井特征参数和离散的井径扩大率数据组合,构建井壁风险等级决策表L。
表2 井壁风险等级决策表L
4、提取特征参数:
计算各钻井特征参数与井壁风险等级之间的信息增益,提取其中信息增益较大的钻井特征参数,分别为钻速、排量、立管压力、转速、喷射速度、钻井液密度、方位角。
表3 信息增益计算结果
5、建立预测模型;
以提取的钻速、排量、立管压力、转速、喷射速度、钻井液密度、方位角为输入参数,不同的井壁风险等级为输出参数建立井壁风险等级预测模型。
采用5折交叉验证法划分数据集,利用贝叶斯优化算法对CatBoost模型的超参数进行寻优,得到的最佳超参数集如下。
表4 井壁风险等级预测模型最优超参数集
6、训练模型;
将最优超参数集带入CatBoost模型,采用5折交叉验证法划分数据集,由公式23到25,采用正确预测率、分类准确率和风险识别率三类指标对训练后的井壁风险等级预测模型进行验证和评价。
例如,对新疆某油田采集的数据样本进行训练和测试,预测效果较好,表明该模型具有较高的预测准确率和较好的泛化效果。
表5 预测效果
7、井壁风险等级预测
基于训练后的预测模型对井壁风险等级进行预测。
本发明实施例提供的一种井壁风险等级预测方法,具有以下有益效果:
(1)本发明通过依赖度来确定不同钻井特征参数的离散类别数,并通过SOFM神经网络方法对连续型特征参数进行离散,无需预先标记训练数据,通过调整权重向量和邻域来适应输入数据的分布和特点,最大程度保留原始数据的信息。
(2)本发明通过属性重要性中的信息增益来提取特征参数,显著减少了模型输入参数的数量并提高了预测效果。
(3)本发明通过井径扩大率的大小来表征不同的井壁风险等级,较力学模型而言极大的简化了预测过程,实现过程非常简捷。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.一种井壁风险等级预测方法,其特征在于,包括:
获取目标地层连续型的钻井特征参数和井径扩大率数据;
根据所述井径扩大率数据的统计分布情况,将所述井径扩大率数据进行离散化,获得井径扩大率的离散化值,所述井径扩大率的离散化值表征井壁的风险等级值;
基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化,获取每一个钻井特征参数的离散化值;
将每一个钻井特征参数的离散化值和井径扩大率的离散化值对应组合,组成决策表;
计算每一个钻井特征参数对决策表的信息增益,选取信息增益较大的多个钻井特征参数;
获取训练集,所述训练集中包括多个训练样本,每一个训练样本包括信息增益较大的多个钻井特征参数的离散化值和对应的井径扩大率的离散化值;
基于训练集对预测模型进行训练;
将待测的多个钻井特征参数的离散化值输出训练后的预测模型中,输出井壁的风险等级值。
2.根据权利要求1所述的井壁风险等级预测方法,其特征在于,根据所述井径扩大率数据的统计分布情况,将所述井径扩大率数据进行离散化,获得井径扩大率的离散化值,所述井径扩大率的离散化值表征井壁的风险等级值,包括:
根据连续型的井径扩大率的统计分布情况,将连续型的井径扩大率按照等距离划分为多个区间,对每一个区间按照不同风险等级编码赋值,获取每一个区间的井径扩大率对应的风险等级编码值,即为离散化值。
3.根据权利要求1所述的井壁风险等级预测方法,其特征在于,所述基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化,获取每一个钻井特征参数的离散化值,包括:
A、初始化每一个钻井特征参数对应的离散化值的数目H0、初始化SOFM神经网络的学习率和邻域Nc(0)、设置学习次数T以及初始化每一个钻井特征参数的每一个离散化值的权值向量wj,其中,j为离散化值编号,j=1,2...,H0;
B、对于任一个钻井特征参数包括的连续的多个采样点数据,计算任一个采样点数据与每一个离散化值的权值向量wj之间的距离,并获取最小距离的权值向量wm;
C、在下一次迭代过程中,对最小距离的权值向量wm以及SOFM神经网络的学习率和邻域进行迭代更新;
D、重复执行A、B和C,直到迭代更新的次数达到设置的学习次数T,获取与所述任一个采样点数据之间距离最小的权值向量wm',则权值向量wm'对应的离散化值为所述任一个采样点数据的离散化值;
E、对每一个钻井特征参数的每一个采样点数据,均执行A、B、C和D,得到每一个钻井特征参数的每一个采样点数据的初始离散化值。
4.根据权利要求3所述的井壁风险等级预测方法,其特征在于,所述B中,对于任一个钻井特征参数包括的连续的多个采样点数据,计算任一个采样点数据与每一个离散化值的权值向量wj之间的距离,并获取最小距离的权值向量wm,包括:
计算所述任一个钻井特征参数中采样点数据xi与各个离散化值的权重向量wj之间的距离dij:
;
其中,所述任一个钻井特征参数包括采样点数据(x1,x2,...,xi,...,xn),n为采样点个数,j=1,2,...,H0,i=1,2,...,n;
获取dij中最小距离dim,并获取对应的权值向量wm,m=1,2,...,H0。
5.根据权利要求4所述的井壁风险等级预测方法,其特征在于,
所述C、在下一次迭代过程中,对最小距离的权值向量以及SOFM神经网络的学习率和邻域进行迭代更新,包括:
;
其中,
;
;
其中,t为当前迭代次数。
6.根据权利要求3所述的井壁风险等级预测方法,其特征在于,所述E之后还包括:
F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值,确定每一个钻井特征参数对应的离散化值的最优数目;
G、基于每一个钻井特征参数对应的离散化值的最优数目更新A中初始化的每一个钻井特征参数对应的离散化值的数目H0,执行A、B、C和D,得到每一个钻井特征参数的每一个采样点数据的离散化值。
7.根据权利要求6所述的井壁风险等级预测方法,其特征在于,所述F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值,确定每一个钻井特征参数对应的离散化值的最优数目,包括:
根据初始离散化值确定每个钻井特征参数对井壁风险等级的依赖度;
确定依赖度最大值对应的钻井特征参数Xp,并通过迭代计算钻井特征参数Xp对应的离散化值的最优数量H1;
按照依赖度从大到小的顺序依次对H1减1确定每一个钻井特征参数的离散化值的最优数目。
8.根据权利要求7所述的井壁风险等级预测方法,其特征在于,所述确定依赖度最大值对应的钻井特征参数Xp,并通过迭代计算钻井特征参数Xp对应的离散化值的最优数量H1,包括:
A’,基于每一个钻井特征参数对应的离散化值的初始数目H0,生成钻井特征参数Xp的H0个初始聚类中心;
B’,设钻井特征参数Xp=(xp1,xp1,...,xpn),n为采样点的个数,计算采样点数据xpn到每一个聚类中心的距离,获取与采样点数据xpn的距离最近的聚类中心,将采样点数据xpn归类到该簇中;
C’,遍历每一个采样点数据,将每一个采样点数据归类到不同的簇中;
D’,基于每一个簇中的所有采样点数据,重新计算簇中心,利用簇中心更新初始聚类中心;
E’,基于更新后的聚类中心,计算所有簇中所有采样点数据与对应聚类中心的误差平方和SSE;
F’,在下一次迭代过程中,更新钻井特征参数对应的离散化值的初始数目H0,并执行A’、B’、C’、D’和E’,计算每一次迭代后的误差平方和SSE,直到计算出的误差平方和SSE不发生变化时,获取此次迭代后的钻井特征参数Xp对应的离散化值的最优数目H1。
9.根据权利要求1所述的井壁风险等级预测方法,其特征在于,所述计算每一个钻井特征参数对决策表的信息增益,包括:
钻井特征参数Xh对决策表的信息增益为:
;
式中,Gain(Xh)表示钻井特征参数Xh对决策表L的信息增益;
其中,决策表L的信息熵Entropy(L)为:
;
式中,p(a)为决策表L中井径扩大率的离散化值a的概率;
钻井特征参数Xh对Entropy(L)的条件期望为:
;
式中,Lv为在钻井参数Xh上离散化值为v的子集,|Lv|为子集Lv的采样点数,|L|为决策表L的样本总数。
10.根据权利要求1所述的井壁风险等级预测方法,其特征在于,所述获取训练集,包括:
获取训练集,其中包括M’个训练样本,其中训练样本SM’中包括信息增益较大的g个钻井特征参数,yM’为井壁风险等级;
所述基于训练集对预测模型进行训练,包括:
基于训练集训练CatBooat模型建立井壁风险等级预测模型,其中,通过贝叶斯算法优化目标函数寻找/>模型的最佳超参数集,优化目标函数/>的表达式为:
;
式中,N为训练样本数量,y为井壁实际风险等级,为模型输出的井壁预测风险等级,为样本Si是否属于第/>类,/>为样本Si属于第/>类的概率,j是第i个样本的实际类别标签,T为井壁风险等级的最大类别数,/>是正则化系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311104072.6A CN116822971B (zh) | 2023-08-30 | 2023-08-30 | 一种井壁风险等级预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311104072.6A CN116822971B (zh) | 2023-08-30 | 2023-08-30 | 一种井壁风险等级预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116822971A true CN116822971A (zh) | 2023-09-29 |
CN116822971B CN116822971B (zh) | 2023-11-14 |
Family
ID=88120714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311104072.6A Active CN116822971B (zh) | 2023-08-30 | 2023-08-30 | 一种井壁风险等级预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116822971B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7066019B1 (en) * | 1999-06-23 | 2006-06-27 | Schlumberger Technology Corporation | Cavity stability prediction method for wellbores |
CN109356567A (zh) * | 2018-05-04 | 2019-02-19 | 中国石油集团海洋工程有限公司 | 深水浅部地层井壁稳定性预测方法 |
CN110259443A (zh) * | 2019-07-12 | 2019-09-20 | 西南石油大学 | 一种基于3dec离散元的煤层井壁稳定性预测方法 |
CN110795888A (zh) * | 2019-09-12 | 2020-02-14 | 四川宏华电气有限责任公司 | 一种石油钻井风险预测方法 |
US20210017857A1 (en) * | 2019-07-15 | 2021-01-21 | Saudi Arabian Oil Company | Wellbore Stability Prediction |
CN113239577A (zh) * | 2021-06-16 | 2021-08-10 | 西南石油大学 | 一种复杂地层钻井井壁失稳风险定量评价方法 |
CN113468646A (zh) * | 2021-07-07 | 2021-10-01 | 常州大学 | 基于地质力学模型和机器学习检测地热井风险的方法 |
CN114444823A (zh) * | 2020-10-16 | 2022-05-06 | 中国石油化工股份有限公司 | 一种预测钻井作业过程中井漏风险的方法及系统 |
CN114635684A (zh) * | 2021-09-09 | 2022-06-17 | 中国石油天然气集团有限公司 | 井壁稳定评价方法、井壁坍塌压力的计算方法及系统 |
CN115238861A (zh) * | 2022-07-11 | 2022-10-25 | 西南石油大学 | 一种基于井壁垮塌程度约束的安全钻井液密度确定方法 |
CN115324571A (zh) * | 2022-08-02 | 2022-11-11 | 西南石油大学 | 基于钻录井信息的复杂地层井壁垮塌定量预测方法与装置 |
CN115438090A (zh) * | 2021-06-02 | 2022-12-06 | 中国石油化工股份有限公司 | 基于掉块图像特征的井壁失稳类型分析及预测方法及系统 |
CN115438823A (zh) * | 2021-06-02 | 2022-12-06 | 中国石油化工股份有限公司 | 一种井壁失稳机制分析与预测方法及系统 |
CN115586086A (zh) * | 2022-09-29 | 2023-01-10 | 中国石油天然气集团有限公司 | 一种基于大数据的井壁失稳分析方法 |
CN115640526A (zh) * | 2022-09-08 | 2023-01-24 | 中国石油天然气集团有限公司 | 钻井风险识别模型及建立方法、识别方法和计算机设备 |
CN116168224A (zh) * | 2021-11-23 | 2023-05-26 | 中国石油化工股份有限公司 | 基于成像砾石含量的机器学习岩相自动识别方法 |
US20230266500A1 (en) * | 2020-07-31 | 2023-08-24 | Hamed Soroush | Geomechanics and wellbore stability modeling using drilling dynamics data |
-
2023
- 2023-08-30 CN CN202311104072.6A patent/CN116822971B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7066019B1 (en) * | 1999-06-23 | 2006-06-27 | Schlumberger Technology Corporation | Cavity stability prediction method for wellbores |
CN109356567A (zh) * | 2018-05-04 | 2019-02-19 | 中国石油集团海洋工程有限公司 | 深水浅部地层井壁稳定性预测方法 |
CN110259443A (zh) * | 2019-07-12 | 2019-09-20 | 西南石油大学 | 一种基于3dec离散元的煤层井壁稳定性预测方法 |
US20210017857A1 (en) * | 2019-07-15 | 2021-01-21 | Saudi Arabian Oil Company | Wellbore Stability Prediction |
CN110795888A (zh) * | 2019-09-12 | 2020-02-14 | 四川宏华电气有限责任公司 | 一种石油钻井风险预测方法 |
US20230266500A1 (en) * | 2020-07-31 | 2023-08-24 | Hamed Soroush | Geomechanics and wellbore stability modeling using drilling dynamics data |
CN114444823A (zh) * | 2020-10-16 | 2022-05-06 | 中国石油化工股份有限公司 | 一种预测钻井作业过程中井漏风险的方法及系统 |
CN115438823A (zh) * | 2021-06-02 | 2022-12-06 | 中国石油化工股份有限公司 | 一种井壁失稳机制分析与预测方法及系统 |
CN115438090A (zh) * | 2021-06-02 | 2022-12-06 | 中国石油化工股份有限公司 | 基于掉块图像特征的井壁失稳类型分析及预测方法及系统 |
CN113239577A (zh) * | 2021-06-16 | 2021-08-10 | 西南石油大学 | 一种复杂地层钻井井壁失稳风险定量评价方法 |
CN113468646A (zh) * | 2021-07-07 | 2021-10-01 | 常州大学 | 基于地质力学模型和机器学习检测地热井风险的方法 |
CN114635684A (zh) * | 2021-09-09 | 2022-06-17 | 中国石油天然气集团有限公司 | 井壁稳定评价方法、井壁坍塌压力的计算方法及系统 |
CN116168224A (zh) * | 2021-11-23 | 2023-05-26 | 中国石油化工股份有限公司 | 基于成像砾石含量的机器学习岩相自动识别方法 |
CN115238861A (zh) * | 2022-07-11 | 2022-10-25 | 西南石油大学 | 一种基于井壁垮塌程度约束的安全钻井液密度确定方法 |
CN115324571A (zh) * | 2022-08-02 | 2022-11-11 | 西南石油大学 | 基于钻录井信息的复杂地层井壁垮塌定量预测方法与装置 |
CN115640526A (zh) * | 2022-09-08 | 2023-01-24 | 中国石油天然气集团有限公司 | 钻井风险识别模型及建立方法、识别方法和计算机设备 |
CN115586086A (zh) * | 2022-09-29 | 2023-01-10 | 中国石油天然气集团有限公司 | 一种基于大数据的井壁失稳分析方法 |
Non-Patent Citations (3)
Title |
---|
刘其明;温真桃;李文哲;: "高庙子气田井壁稳定性研究及钻井技术对策", 钻采工艺, no. 05 * |
王怡;陈军海;项根苍;张建龙;: "一种考虑合理井筒破损的气体钻井井壁力学稳定性分析方法", 钻采工艺, no. 03 * |
蒋晓红;刘其明;衡俊鹏;: "川西大邑地区气体钻井井壁稳定性评价研究", 石油地质与工程, no. 02 * |
Also Published As
Publication number | Publication date |
---|---|
CN116822971B (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108388921B (zh) | 一种基于随机森林的溢流漏失实时识别方法 | |
CN112529341B (zh) | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 | |
CN111783825A (zh) | 一种基于卷积神经网络学习的测井岩性识别方法 | |
CN107122860B (zh) | 基于网格搜索和极限学习机的冲击地压危险等级预测方法 | |
CN105760673B (zh) | 一种河流相储层地震敏感参数模板分析方法 | |
US11748644B2 (en) | System and method for oil and gas predictive analytics | |
CN108280289B (zh) | 基于局部加权c4.5算法的冲击地压危险等级预测方法 | |
CN114723095A (zh) | 缺失测井曲线预测方法及装置 | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
CN110633868A (zh) | 遗传算法优化神经网络进行探井试油层油气性质预测方法 | |
Liang et al. | Research and application of element logging intelligent identification model based on data mining | |
US10954766B2 (en) | Methods, systems, and computer-readable media for evaluating service companies, identifying candidate wells and designing hydraulic refracturing | |
CN116663203B (zh) | 钻进参数优化方法及装置 | |
CN116822971B (zh) | 一种井壁风险等级预测方法 | |
CN115809411A (zh) | 一种基于测井数据的改进型决策树岩性识别方法 | |
CN115438823A (zh) | 一种井壁失稳机制分析与预测方法及系统 | |
CN115438090A (zh) | 基于掉块图像特征的井壁失稳类型分析及预测方法及系统 | |
Liu et al. | Optimizing construction parameters for fractured horizontal wells in shale oil | |
Roustazadeh | Estimating oil and gas recovery factor via machine learning | |
CN117035197B (zh) | 一种代价最低化的井漏智能预测方法 | |
Roustazadeh et al. | Estimating oil recovery factor using machine learning: applications of XGBoost classification | |
Feder | Machine-learning approach determines spatial variation in shale decline curves | |
Galicia et al. | Candidate wells selection and ranking based on data mining and multi-criteria decision analysis techniques | |
Roustazadeh et al. | Estimating oil and gas recovery factors via machine learning: Database-dependent accuracy and reliability | |
CN113095398B (zh) | 一种基于遗传算法优化的bp神经网络的压裂数据清洗方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |