CN116822971A

CN116822971A - 一种井壁风险等级预测方法

Info

Publication number: CN116822971A
Application number: CN202311104072.6A
Authority: CN
Inventors: 杨明合; 许楷; 李博志; 蔡旭龙; 何清旖
Original assignee: Wuhan Campus Of Changjiang University
Current assignee: Wuhan Campus Of Changjiang University
Priority date: 2023-08-30
Filing date: 2023-08-30
Publication date: 2023-09-29
Anticipated expiration: 2043-08-30
Also published as: CN116822971B

Abstract

本发明提供一种井壁风险等级预测方法，通过SOFM神经网络对连续型钻井特征参数进行离散，无需预先标记训练数据，通过调整权重向量和邻域来适应输入数据的分布和特点，最大程度保留原始数据的信息；以及通过属性重要性中的信息增益来提取特征参数，显著减少了模型输入参数的数量并提高了预测效果。

Description

一种井壁风险等级预测方法

技术领域

本发明涉及石油勘探领域，更具体地，涉及一种井壁风险等级预测方法。

背景技术

在石油勘探开发过程中，保持井壁的稳定状态对于安全钻井和生产具有至关重要的意义。在实际中，由于地层复杂性、钻头磨损等因素的影响，往往会出现井壁失稳等问题，它不仅会影响钻井速度还会造成严重的安全事故。对井壁稳定性进行预测和分析，可以更好地制定钻井方案，从而降低钻井风险并提高采油效率。

井径扩大率是判断井壁失稳比较直观的参数，当井壁失稳时，井眼周围的岩石会发生塑性变形或破裂，导致井径扩大率急剧增加。因此，通过预测井径扩大率的变化来分析井壁的失稳情况。

在预测井壁稳定性的方法中，经验公式法易受限于地质条件和岩石类型，无法考虑到不同地区和层位之间的差异；数值模拟方法需要大量的参数和复杂的计算，其结果还会受模型误差的影响。在深部地层中，影响井壁稳定的参数较多，且各参数之间存在复杂的非线性关系，而机器学习方法解决多目标非线性复杂问题的效果较好，可以充分发掘钻井数据与井壁稳定性之间隐藏的潜在关系，实现对井壁稳定性的准确预测。

发明内容

本发明针对现有技术中存在的技术问题，提供一种井壁风险等级预测方法，解决现有技术中井壁稳定性预测存在的地质条件限制和模型误差的问题，该预测方法包括：

获取目标地层连续型的钻井特征参数和井径扩大率数据；

根据所述井径扩大率数据的统计分布情况，将所述井径扩大率数据进行离散化，获得井径扩大率的离散化值，所述井径扩大率的离散化值表征井壁的风险等级值；

基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化，获取每一个钻井特征参数的离散化值；

将每一个钻井特征参数的离散化值和井径扩大率的离散化值对应组合，组成决策表；

计算每一个钻井特征参数对决策表的信息增益，选取信息增益较大的多个钻井特征参数；

获取训练集，所述训练集中包括多个训练样本，每一个训练样本包括信息增益较大的多个钻井特征参数的离散化值和对应的井径扩大率的离散化值；

基于训练集对预测模型进行训练；

将待测的多个钻井特征参数的离散化值输出训练后的预测模型中，输出井壁的风险等级值。

本发明提供的一种井壁风险等级预测方法，通过神经网络对连续型钻井特征参数进行离散，无需预先标记训练数据，通过调整权重向量和邻域来适应输入数据的分布和特点，最大程度保留原始数据的信息；以及通过属性重要性中的信息增益来提取特征参数，显著减少了模型输入参数的数量并提高了预测效果。

附图说明

图1为本发明提供的一种井壁风险等级预测方法的流程示意图；

图2为对预测模型进行训练的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。另外，本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合，以形成可行的技术方案，这种结合不受步骤先后次序和/或结构组成模式的约束，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时，应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

图1为本发明提供的一种井壁风险等级预测方法流程图，如图1所示，方法包括：

步骤1，获取目标地层连续型的钻井特征参数和井径扩大率数据。

可理解的是，获取的目标地层的钻井特征参数和井径扩大率数据均为连续型的数据，每一个钻井特征参数包括n个采样点数据，组成连续型的钻井特征参数，同样的，井径扩大率数据也包括n个采样点数据。本发明中获取的钻井特征参数包括14个。

对所有的钻井特征参数进行预处理，首先，对所有钻井特征参数，剔除异常值和空缺值。

其次，对钻井特征参数进行归一化预处理，采用最大、最小标准化法将特征数据的原始值映射到区间[0,1]之间。

；

式中，为钻井特征参数；/>和/>分别为所有钻井特征参数中的最大值和最小值；X_i为归一化后的钻井特征参数。

步骤2，根据所述井径扩大率数据的统计分布情况，将所述井径扩大率数据进行离散化，获得井径扩大率的离散化值，所述井径扩大率的离散化值表征井壁的风险等级值。

可理解的是，获取到连续的井径扩大率数据后，对根据连续型的井径扩大率的统计分布情况，将连续型的井径扩大率按照等距离划分为多个区间，对每一个区间按照不同风险等级编码赋值，获取每一个区间的井径扩大率对应的风险等级编码值，即为离散化值。比如，井径扩大率的100个采样点数据为1,2,3，....，100，将其划分为10个区间，1~10为一个区间，11~20一个区间，....，91~100一个区间，那么在1~10之内的采样点数据均离散化为1，在11~20区间的采样点数据被离散化为2，以此类推，得到井径扩大率的每一个采样点数据的离散化值，其中，离散化值代表井壁风险等级。

步骤3，基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化，获取每一个钻井特征参数的离散化值。

可理解的是，步骤2对井径扩大率数据进行了离散化，该步骤对每一个钻井特征参数进行离散化。其中，影响井壁稳定性的连续型变量有井斜角、方位角、狗腿度、钻井液密度、漏斗粘度、钻速、泵压、钻压、转速、排量、立管压力、钻头压降、环空压耗和喷射速度共14个钻井参数，对连续型变量的离散化按（1）-（2）步骤进行。

（1）初始离散。

作为实施例，所述基于SOFM神经网络将连续型的每一个钻井特征参数进行离散化，获取每一个钻井特征参数的离散化值，包括：

A、初始化每一个钻井特征参数对应的离散化值的数目H₀、初始化SOFM神经网络的学习率和邻域N_c（0）、设置学习次数T以及初始化每一个钻井特征参数的每一个离散化值的权值向量w_j，其中，j为离散化值编号，j=1,2...，H₀。

可理解的是，将每一个钻井特征参数的离散化值的数目均初始化为H₀，设置SOFM神经网络的初始学习率和初始邻域N_c（0）以及学习次数T，对每个离散化值的权值向量w_j赋予[0,1]范围内的随机值作为权值向量的初始值。令/>，为每一个钻井特征参数X中的采样点数据,n为采样点个数。

对各个参数初始化后，对于每一个钻井特征参数均执行后续的步骤B。

B、对于任一个钻井特征参数包括的连续的多个采样点数据，计算任一个采样点数据与每一个离散化值的权值向量w_j之间的距离，并获取最小距离的权值向量w_m。

作为实施例，所述B中，对于任一个钻井特征参数包括的连续的多个采样点数据，计算任一个采样点数据与每一个离散化值的权值向量w_j之间的距离，并获取最小距离的权值向量w_m，包括：

对于每一个钻井特征参数，每个离散化值的归一化权值向量w_j为：；

式中，为/>神经元权值，e为神经元个数，H₀为离散化值的初始数目。

计算所述任一个钻井特征参数中采样点数据x_i与各个离散化值的权重向量w_j之间的距离d_ij：

；

其中，所述任一个钻井特征参数中包括采样点数据（x₁，x₂，...，x_i...，x_n），n为采样点个数，j=1,2，...，H₀，i=1,2，...，n；

获取d_ij中最小距离d_im，并获取对应的权值向量w_m，m=1,2，...，H₀。

可理解的是，对于每一个钻井特征参数中的每一个采样点数据，需要确定采样点数据对应的离散化值。在步骤1中初始化的离散化值的数量为H₀，其对应的权值向量也包括H₀个，也就是每一个离散化值的权值向量w_j，j=1,2，...，H₀。

计算采样点数据与每一个权值向量之间的距离，获取与采样点数据距离最小的权值向量w_m。

C、在下一次迭代过程中，对最小距离的权值向量w_m进行迭代更新，其它的权值向量不变，以及对SOFM神经网络的学习率和邻域进行迭代更新。

可理解的是，本发明是通过迭代求解每一个采样点数据对应的离散化值的，因此，在下一次迭代的过程中，对上一次迭代过程中产生的距离最小的权值向量进行更新，并且对SOFM神经网络的学习率和邻域进行更新。

所述C、在下一次迭代过程中，对最小距离的权值向量w_m以及SOFM神经网络的学习率和邻域进行迭代更新，包括：

；

其中，

；

其中，t为当前迭代次数。

D、重复执行A、B和C，直到迭代更新的次数达到设置的学习次数T，获取与所述任一个采样点数据之间距离最小的权值向量w_m'，则权值向量w_m'对应的离散化值为所述任一个采样点数据的离散化值。

基于更新后的权值向量、SOFM神经网络的学习率和邻域，重复执行A、B和C步骤，不断进行迭代更新，直到迭代次数达到设置的学习次数T，获取此时与采样点数据的距离最小的权值向量，该权值向量对应的离散化值为采样点数据的初始离散化值。此时，需要说明的是，之所有称为初始离散化值，是指当初始离散化值的数目为H₀时，采样点数据对应的离散化值，如果离散化值的数目变化时，那么采样点数据对应的离散化值也会变化。

E、对每一个钻井特征参数的每一个采样点数据，均执行A、B、C和D，得到每一个钻井特征参数的每一个采样点数据的初始离散化值。

可理解的是，对于每一个钻井特征参数中的每一个采样点数据均采用相同的方法获取对应的初始离散化值。

作为实施例，在E之后还包括：F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值，确定每一个钻井特征参数对应的离散化值的最优数目；G、基于每一个钻井特征参数对应的离散化值的最优数目更新A中初始化的每一个钻井特征参数对应的离散化值的数目H₀，执行A、B、C和D，得到每一个钻井特征参数的每一个采样点数据的离散化值。

可理解的是，每一个钻井特征参数对应的离散化值的数目对钻井特征参数的离散化的效果会有影响，进而对后续井壁风险等级的预测也有一定的影响，因此，需要确定每一个钻井特征参数的离散化值的最优数目。

作为实施例，所述F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值，确定每一个钻井特征参数对应的离散化值的最优数目，包括：根据初始离散化值确定每个钻井特征参数对井壁风险等级的依赖度；确定依赖度最大值/>对应的钻井特征参数X_p，并通过迭代计算钻井特征参数X_p对应的离散化值的最优数量H₁；按照依赖度/>从大到小的顺序依次对H₁减1确定每一个钻井特征参数的离散化值的最优数目。

其中，根据钻井特征参数不同的数据分布和重要性，由初始离散后的数据确定每个钻井特征参数对井壁风险等级的依赖度，确定依赖度最大值/>对应的钻井参数X_p。

依赖度计算式如下：

；

式中，为钻井参数X_p对井壁风险等级D的依赖度，/>为D的X_p正域，|U|为钻井特征参数个数。

作为实施例，所述确定依赖度最大值对应的钻井特征参数X_p，并通过迭代计算钻井特征参数X_p对应的离散化值的最优数量H₁，包括：

A’，基于每一个钻井特征参数对应的离散化值的初始数目H₀，生成钻井特征参数X_p的H₀个初始聚类中心。

可理解的是，设钻井特征参数X_p=（x_p1,x_p1,...，x_pn），n为采样点的个数，选择H₀个初始聚类中心，其中/>为1维向量，表示第j个聚类中心位置。

B’，计算采样点数据x_pn到每一个聚类中心的距离，获取与采样点数据x_pn的距离最近的聚类中心，将采样点数据x_pn归类到该簇中。

其中，采样点数据x_pn到每个聚类中心的距离d_nj为：

；

x_pn的聚类中心为：

式中，j为样本x_pn的类别。

C’，遍历每一个采样点数据，将每一个采样点数据归类到不同的簇中。

根据上述公式将每一个采样点数据归类到对应的簇中。

其中，根据每一个簇中的所有采样点数据重新计算该簇的聚类中心：

；

其中,|c_j|为簇c_j中采样点数据的个数，为c_j内所有采样点数据的特征向量总和。

D’，基于每一个簇中的所有采样点数据，重新计算簇中心，利用簇中心更新初始聚类中心。

E’，基于更新后的聚类中心，计算所有簇中所有采样点数据与对应聚类中心的误差平方和SSE。

根据每一个簇的更新后的聚类中心以及簇中所有采样点数据，计算所有采样点数据到对应聚类中心的误差平方和SSE：

式中，H₀为初始聚类数，x_j是第j类聚类中心的第j个数据点，c_j为第个聚类中心，为x_j到对应聚类中心c_j的距离，x_m为c_j所在簇中的采样点数据的个数。

F’，在下一次迭代过程中，更新钻井特征参数对应的离散化值的初始数目H₀，并执行A’、B’、C’、D’和E’，计算每一次迭代后的误差平方和SSE，直到计算出的误差平方和SSE不发生变化时，获取此次迭代后的钻井特征参数X_p对应的离散化值的最优数目H₁。

根据依赖度确定不同钻井特征参数离散化值的数目，/>越大离散化值的数目越大，反之则越小。由于/>对应钻井特征参数X_p对应的离散化值的数目为H₁，则比/>较小的/>对应的钻井特征参数的离散化值的数目H₂为：

；

随着的逐级减小，对应钻井特征参数离散化值的数目也随之递减，根据每一个钻井特征参数的依赖度，其对应的离散化值的数量依次减1。根据确定的每个钻井特征参数的离散化值的最优数目，重新执行A、B、C、D和E步骤，对所有钻井特征参数分别进行离散并编码赋值。

步骤4，将每一个钻井特征参数的离散化值和井径扩大率的离散化值对应组合，组成决策表。

可理解的是，将离散后的井径扩大率数据与钻井特征参数的编码数据进行组合，构成决策表L，也就是每一个钻井特征参数的离散化值组合对应的井径扩大率的离散化值，组成决策表L，决策表L中的每一行可表示为（X₁，X₂，....，X₁₄，D），X₁，X₂，....，X₁₄表示14个钻井特征参数，D表示井壁风险等级。

步骤5，计算每一个钻井特征参数对决策表的信息增益，选取信息增益较大的多个钻井特征参数。

其中，钻井特征参数X_h对决策表的信息增益为：

；

式中,Gain（X_h）表示钻井特征参数X_h对决策表L的信息增益；

其中，决策表L的信息熵Entropy（L）为：

；

式中,p（a）为决策表L中井径扩大率的离散化值a的概率；

钻井特征参数X_h对Entropy（L）的条件期望为：

；

式中，L_v为在钻井参数X_h上离散化值为v的子集，|L_v|为子集L_v的采样点数，|L|为决策表L的样本总数。

通过上式计算出每一个钻井特征参数对决策表L的信息增益Gain，由于钻井特征参数的信息增益越大，则该钻井特征参数对于井壁风险等级的贡献越大，属性的重要性越高。因此选取Gain较大的多个钻井特征参数为井壁风险等级预测模型的输入参数。

步骤6，获取训练集，所述训练集中包括多个训练样本，每一个训练样本包括信息增益较大的多个钻井特征参数的离散化值对应的井径扩大率的离散化值。

可理解的是，步骤5中选取了信息增益较大的g个钻井特征参数，其与对应的井径扩大率构成一个训练样本，多个训练样本构成训练集。

其中，训练集可表示为，其中包括M’个训练样本，其中训练样本S_M’中包括信息增益较大的g个钻井特征参数，y_M’为井壁风险等级。

步骤7，基于训练集对预测模型进行训练。

可理解的是，基于训练集对预测模型进行训练，包括：

基于训练集训练CatBooat模型建立井壁风险等级预测模型，其中，通过贝叶斯算法优化目标函数寻找/>模型的最佳超参数集，优化目标函数/>的表达式为：

；

式中,N为训练样本数量，y为井壁实际风险等级，为模型输出的井壁预测风险等级，/>为样本S_i是否属于第/>类，/>为样本S_i属于第/>类的概率，j是第i个样本的实际类别标签，T为井壁风险等级的最大类别数，/>是正则化系数。

以步骤6提取的训练样本为输入，采交叉验证法划分数据集，输入井壁风险等级预测模型进行训练和测试。

通过一对多感受性曲线来评价预测模型对每个风险等级的预测效果，曲线下面积/>为/>曲线所覆盖的区域面积，/>越大分类效果越好。采用正确预测率、分类准确率和风险识别率三类指标对训练后的井壁风险等级预测模型进行评价，计算公式为：

正确预测率；

分类准确率；

风险识别率;

其中，以0级风险等级为正例，1、2、3级风险等级为负例。则，RO，正确预测为0级风险等级的个数；AO，错误预测为0级风险等级的个数；AE，错误预测为1、2、3级风险等级的个数；RE，正确预测为1、2、3级风险等级的个数。

步骤8，将待测的多个钻井特征参数的离散化值输出训练后的预测模型中，输出井壁的风险等级值。

可理解的是，基于步骤7训练后的预测模型对井壁风险等级进行预测，将待测的多个增益较大的钻井特征参数的离散化值输出训练后的预测模型中，输出井壁的风险等级值。

下面以一个具体的算例对本发明提供的井壁风险等级预测方法进行说明。

1、获取目标地层的特征参数和目标参数数据；

从现场钻井资料中，根据井史情况确定舒善河层组的井深范围，在该范围内选择14个钻井特征参数和1个目标参数的数据，钻井特征参数X₁到X₁₄分别为井斜角、方位角、狗腿度、钻井液密度、漏斗粘度、钻速、泵压、钻压、转速、排量、立管压力、钻头压降、环空压耗和喷射速度，目标参数为井径扩大率。

2、对特征参数和目标参数进行预处理；

剔除钻井特征参数中异常值和空缺值，进行归一化处理。

表1 钻井参数数据集

3、构建井壁风险等级决策表；

目标参数离散化：根据井径扩大率分布情况，按照等距离将分布区间划分为四个等级，对每一个区间编码赋值，分别为0、1、2、3。

钻井特征参数离散化：

初始离散：设置SOFM神经网络的学习率为0.1，邻域值为1，训练步数为400，离散类别数H₀为5，对所有钻井特征参数进行离散；

确定依赖度对应的钻井特征参数为井斜角和漏斗粘度；确定井斜角和漏斗粘度离散划分的最优离散化值数目H₁为10；

确定每个钻井特征参数对井壁风险等级的依赖度，根据/>大小对钻井特征参数进行排序，分别为井斜角、漏斗粘度、转速、钻速、钻压、立管压力、方位角、泵压、钻头压降、喷射速度、排量、狗腿度、环空压耗、钻井液密度。

重新确定每个钻井特征参数的离散化值数目，其中井斜角和漏斗粘度离散的类别为10，转速离散的类别为9，钻速、钻压和立管压力离散的类别为8，方位角、泵压、钻头压降和喷射速度离散的类别为7，排量离散的类别为6，狗腿度和环空压耗离散的类别为5，钻井液密度离散的类别为4。

利用SOFM神经网络对每个钻井特征参数分别进行离散并编码赋值，将离散后的钻井特征参数和离散的井径扩大率数据组合，构建井壁风险等级决策表L。

表2 井壁风险等级决策表L

4、提取特征参数：

计算各钻井特征参数与井壁风险等级之间的信息增益，提取其中信息增益较大的钻井特征参数，分别为钻速、排量、立管压力、转速、喷射速度、钻井液密度、方位角。

表3 信息增益计算结果

5、建立预测模型；

以提取的钻速、排量、立管压力、转速、喷射速度、钻井液密度、方位角为输入参数，不同的井壁风险等级为输出参数建立井壁风险等级预测模型。

采用5折交叉验证法划分数据集，利用贝叶斯优化算法对CatBoost模型的超参数进行寻优，得到的最佳超参数集如下。

表4 井壁风险等级预测模型最优超参数集

6、训练模型；

将最优超参数集带入CatBoost模型，采用5折交叉验证法划分数据集，由公式23到25，采用正确预测率、分类准确率和风险识别率三类指标对训练后的井壁风险等级预测模型进行验证和评价。

例如，对新疆某油田采集的数据样本进行训练和测试，预测效果较好，表明该模型具有较高的预测准确率和较好的泛化效果。

表5 预测效果

7、井壁风险等级预测

基于训练后的预测模型对井壁风险等级进行预测。

本发明实施例提供的一种井壁风险等级预测方法，具有以下有益效果：

（1）本发明通过依赖度来确定不同钻井特征参数的离散类别数，并通过SOFM神经网络方法对连续型特征参数进行离散，无需预先标记训练数据，通过调整权重向量和邻域来适应输入数据的分布和特点，最大程度保留原始数据的信息。

（2）本发明通过属性重要性中的信息增益来提取特征参数，显著减少了模型输入参数的数量并提高了预测效果。

（3）本发明通过井径扩大率的大小来表征不同的井壁风险等级，较力学模型而言极大的简化了预测过程，实现过程非常简捷。

需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其它实施例的相关描述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包括这些改动和变型在内。

Claims

1.一种井壁风险等级预测方法，其特征在于，包括：

获取目标地层连续型的钻井特征参数和井径扩大率数据；

基于训练集对预测模型进行训练；

2.根据权利要求1所述的井壁风险等级预测方法，其特征在于，根据所述井径扩大率数据的统计分布情况，将所述井径扩大率数据进行离散化，获得井径扩大率的离散化值，所述井径扩大率的离散化值表征井壁的风险等级值，包括：

根据连续型的井径扩大率的统计分布情况，将连续型的井径扩大率按照等距离划分为多个区间，对每一个区间按照不同风险等级编码赋值，获取每一个区间的井径扩大率对应的风险等级编码值，即为离散化值。

3.根据权利要求1所述的井壁风险等级预测方法，其特征在于，所述基于自组织特征映射SOFM神经网络将连续型的每一个钻井特征参数进行离散化，获取每一个钻井特征参数的离散化值，包括：

A、初始化每一个钻井特征参数对应的离散化值的数目H₀、初始化SOFM神经网络的学习率和邻域N_c（0）、设置学习次数T以及初始化每一个钻井特征参数的每一个离散化值的权值向量w_j，其中，j为离散化值编号，j=1,2...，H₀；

B、对于任一个钻井特征参数包括的连续的多个采样点数据，计算任一个采样点数据与每一个离散化值的权值向量w_j之间的距离，并获取最小距离的权值向量w_m；

C、在下一次迭代过程中，对最小距离的权值向量w_m以及SOFM神经网络的学习率和邻域进行迭代更新；

D、重复执行A、B和C，直到迭代更新的次数达到设置的学习次数T，获取与所述任一个采样点数据之间距离最小的权值向量w_m'，则权值向量w_m'对应的离散化值为所述任一个采样点数据的离散化值；

4.根据权利要求3所述的井壁风险等级预测方法，其特征在于，所述B中，对于任一个钻井特征参数包括的连续的多个采样点数据，计算任一个采样点数据与每一个离散化值的权值向量w_j之间的距离，并获取最小距离的权值向量w_m，包括：

；

其中，所述任一个钻井特征参数包括采样点数据（x₁，x₂，...，x_i，...，x_n），n为采样点个数，j=1,2，...，H₀，i=1,2，...，n；

5.根据权利要求4所述的井壁风险等级预测方法，其特征在于，

所述C、在下一次迭代过程中，对最小距离的权值向量以及SOFM神经网络的学习率和邻域进行迭代更新，包括：

；

其中，

；

其中，t为当前迭代次数。

6.根据权利要求3所述的井壁风险等级预测方法，其特征在于，所述E之后还包括：

F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值，确定每一个钻井特征参数对应的离散化值的最优数目；

G、基于每一个钻井特征参数对应的离散化值的最优数目更新A中初始化的每一个钻井特征参数对应的离散化值的数目H₀，执行A、B、C和D，得到每一个钻井特征参数的每一个采样点数据的离散化值。

7.根据权利要求6所述的井壁风险等级预测方法，其特征在于，所述F、基于每一个钻井特征参数的每一个采样点数据的初始离散化值，确定每一个钻井特征参数对应的离散化值的最优数目，包括：

根据初始离散化值确定每个钻井特征参数对井壁风险等级的依赖度；

确定依赖度最大值对应的钻井特征参数X_p，并通过迭代计算钻井特征参数X_p对应的离散化值的最优数量H₁；

按照依赖度从大到小的顺序依次对H₁减1确定每一个钻井特征参数的离散化值的最优数目。

8.根据权利要求7所述的井壁风险等级预测方法，其特征在于，所述确定依赖度最大值对应的钻井特征参数X_p，并通过迭代计算钻井特征参数X_p对应的离散化值的最优数量H₁，包括：

A’，基于每一个钻井特征参数对应的离散化值的初始数目H₀，生成钻井特征参数X_p的H₀个初始聚类中心；

B’，设钻井特征参数X_p=（x_p1,x_p1,...，x_pn），n为采样点的个数，计算采样点数据x_pn到每一个聚类中心的距离，获取与采样点数据x_pn的距离最近的聚类中心，将采样点数据x_pn归类到该簇中；

C’，遍历每一个采样点数据，将每一个采样点数据归类到不同的簇中；

D’，基于每一个簇中的所有采样点数据，重新计算簇中心，利用簇中心更新初始聚类中心；

E’，基于更新后的聚类中心，计算所有簇中所有采样点数据与对应聚类中心的误差平方和SSE；

9.根据权利要求1所述的井壁风险等级预测方法，其特征在于，所述计算每一个钻井特征参数对决策表的信息增益，包括：

钻井特征参数X_h对决策表的信息增益为：

；

式中，Gain（X_h）表示钻井特征参数X_h对决策表L的信息增益；

其中，决策表L的信息熵Entropy（L）为：

；

式中，p（a）为决策表L中井径扩大率的离散化值a的概率；

钻井特征参数X_h对Entropy（L）的条件期望为：

；

10.根据权利要求1所述的井壁风险等级预测方法，其特征在于，所述获取训练集，包括：

获取训练集，其中包括M’个训练样本，其中训练样本S_M’中包括信息增益较大的g个钻井特征参数，y_M’为井壁风险等级；

所述基于训练集对预测模型进行训练，包括：

；

式中,N为训练样本数量，y为井壁实际风险等级，为模型输出的井壁预测风险等级，为样本S_i是否属于第/>类，/>为样本S_i属于第/>类的概率，j是第i个样本的实际类别标签，T为井壁风险等级的最大类别数，/>是正则化系数。