CN115099357A

CN115099357A - 一种基于多核支持向量机的致密砂岩储层分类方法

Info

Publication number: CN115099357A
Application number: CN202210809396.9A
Authority: CN
Inventors: 卢学飞; 董凤娟; 邢鑫; 马儇龙; 王勋涛
Original assignee: Xian Shiyou University
Current assignee: Xian Shiyou University
Priority date: 2022-07-11
Filing date: 2022-07-11
Publication date: 2022-09-23
Anticipated expiration: 2042-07-11
Also published as: CN115099357B

Abstract

一种基于多核支持向量机的致密砂岩储层分类方法，对影响储层品质的微观孔隙结构特征参数进行无监督学习，通过优化模型超参数，获得最优决策函数，将致密砂岩储层进行分类，并对分类结果进行验证。结果表明所提出的储层分类方法准确率高，能有效降低时间损耗、节省人力成本；对多分类问题分类效果明显，可以有效处理油田实际应用中最常见的多参数、小样本问题；该方法的使用可以实现对致密油气藏开发的深入认识和精细评价提供客观高效的指导，在数据量需求方面具有独特优势和完善的理论。

Description

一种基于多核支持向量机的致密砂岩储层分类方法

技术领域

本发明涉及石油勘探领域的致密砂岩储层的分类技术，特别涉及一种基于多核支持向量机的致密砂岩储层分类方法。

技术背景

致密油的巨大资源潜力和产量的快速增长使其成为当今最热门的石油勘探领域之一。致密砂岩油藏具有物性差、孔隙喉道细小、微观非均质性强等特征，导致资源品质较差，开发利用经济敏感性强，需要在经济与技术策略相对一致的情况下分阶段、分类型开发。

储层分类是按照储层优劣等级对研究区储层进行排序，是开发选区、井位部署、产能预测以及开发方案制定的重要依据。一方面，评价参数由孔隙度、渗透率、有效砂体厚度及含油饱和度等储层宏观特征参数，逐渐发展到基于恒速压汞、高压压汞及核磁共振等新方法所得到的微观孔隙结构特征参数；另一方面，随着人工智能的迅猛发展，神经网络、支持向量机、贝叶斯分类、随机森林等机器学习方法日益完善、泛化性强、实际应用过程中方便快捷，相较于传统方法优势明显，逐渐在油气田地质与开发领域得到广泛应用。

实际应用中发现，机器学习方法的预测效果对数据本身的依赖性很强，不同机器学习方法的适应条件不同。例如，BP神经网络模型对地区的依赖性较强，不完善的数据样本会大大影响预测结果的可信度；随机森林模型对于多维特征的数据集分类有很高的效率，但是在数据噪音比较大的分类或回归问题上会过拟合，产出的属性权值是不可信的。因此，由于致密砂岩油藏微观非均质性强，储层品质主控微观因素较难确定，导致优势储层难以判别，需要开发新的储层判别方法。

发明内容

为了克服上述现有技术的缺陷，本发明的目的在于提供一种基于多核支持向量机的致密砂岩储层分类方法，对影响储层品质的微观孔隙结构特征参数进行无监督学习，通过优化模型超参数，获得最优决策函数，将致密砂岩储层进行分类，并对分类结果进行验证。结果表明所提出的储层分类方法准确率高，能有效降低时间损耗、节省人力成本；对多分类问题分类效果明显，可以有效处理油田实际应用中最常见的多参数、小样本问题；该方法的使用可以实现对致密油气藏开发的深入认识和精细评价提供客观高效的指导，在数据量需求方面具有独特优势和完善的理论。

为了达到上述目的，本发明的技术方案为：

一种基于多核支持向量机的致密砂岩储层分类方法，包括以下步骤：

步骤一：在以结构渗流系数、排驱压力、最大孔喉半径、中值压力、中值半径、均值系数、分选系数、歪度系数、最大进汞饱和度、变异系数、未饱和汞饱和度、均值系数、残余汞饱和度、退汞饱和度、退出效率、孔喉比为致密砂岩岩样的微观空隙结构特征参数的基础上，利用lasso的L1正则化实现数据的降维；最终选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的6个特征参数；

Lasso回归函数为：

其中，N为样本个数，w为回归系数，k为回归系数个数，x为样本，y为样本对应的标签，第一个累加的计算结果为模型回归的损失函数，第二个累加为正则化项，其中λ为收缩因子，|w|为L₁范数；

步骤二：将步骤一获取的降维后的6个致密砂岩岩样微观空隙结构特征参数表征的样本数据按照(70-80)：(30-20)的比例分为两组，一组作为训练样本，一组作为测试样本；

步骤三：将支持向量机(简称SVM)模型常见的核函数，线性核函数(linearkernel)、多项式核函数(polynomial kernel)、多元二次核函数(multiquadric kernel)、Sigmoid核函数(sigmoid kernel)、幂指数核函数(exponential kernel)、高斯径向基核函数(rbf kernel)、拉普拉斯核函数(laplacian kernel)的线性组合作为待选的多核支持向量机模型的核函数，简称MK-SVM模型的核函数；

高斯径向基核函数Gaussian radial basis kernel function

(γ₁为RBF中的超参数) (2)

幂指数核函数Exponential Kernel function

(γ₂为幂指核函数中的超参数) (3)

拉普拉斯核函数Laplacian kernel function

(γ₃为laplacian核函数中的超参数) (4)

多元二次核函数Multiquadric kernel function

(C₁为多元二次核函数中的超参数) (5)

线性核函数Linear kernel function

K(x,x_i)＝x*x_i+C₂(C₂为线性核函数中的超参数) (6)

多项式核函数Polynomial kernel function

K(x,x_i)＝[(x*x_i)+C₃]^d(C₃,d为多项式核函数中的超参数) (7)

Sigmoid核函数分别如下式所示：

K(x,x_i)＝tanh(αx^Tx_i)+C₄)(α,C₄为Sigmoid核函数中的超参数) (8)

其中，x,x_i为样本空间中的两个任意样本。

对每个核函数赋以不同的权值系数，从而构造一个线性组合的核函数，其表达式为：

其中，x,x_i为样本空间中的样本向量，N为样本向量中的向量个数，α为权向量，y为输入样本对应的标签，b为偏置；M为核函数的个数，β为各个核函数的权系数，且

为构造的几类核函数的线性组合；多核的约束优化(ConstrainedOptimization)函数表示为：

其中，α,β如上所述，α_i为向量α中的第i个分量，C为惩罚参数。

步骤四：将步骤三列出的核函数的线性组合，代入MK-SVM模型中，将训练样本输入到模型中进行训练，最终得到训练结果；

所述的步骤四的训练方法如下：

MK-SVM模型的训练过程中，模型的训练误差精度为0.0001，训练的最大迭代次数为2000次，训练采用3折交叉验证保证训练结果的可靠性。

步骤五：根据步骤四的训练结果，将线性核函数Linear Kernel、多项式核函数polynomial Kernel、多元二次核函数multiquadric kernel、拉普拉斯核函数LaplacianKernel这四种核函数的线性组合作为MK-SVM模型的核函数；

从而得到优化后的核函数公式：

步骤六：在MK-SVM模型训练完毕之后，将测试样本输入到训练好的MK-SVM模型得到预测的分类结果，利用预测的分类结果和测试样本真实的分类结果计算出机器学习常见的准确率(Accuracy)、宏观精确率(Macro_Precision)和宏观F1分数(Macro_F1_Score)三个评价模型性能的指标，该指标作为评价MK-SVM模型的分类性能的标准。

本发明的有益效果是：本发明利用lasso的L1正则化选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的微观孔隙结构特征参数，选择核函数Linear Kernel、polynomial Kernel、multiquadric kernel、LaplacianKernel的线性组合作为MK-SVM模型作为核函数，将致密砂岩岩样的微观空隙结构特征参数作为特征参数实现致密砂岩储层的分类方法。这种方法操作简便，结果一致客观，可以有效降低时间损耗、节省人力成本，可以作为致密砂岩储层分类的可靠依据。

附图说明

图1为MK-SVM模型的示意图；

图2是本发明中的MK-SVM模型与极端随机树(Extra-Trees)分类模型、PolynomialSVM模型、RBF SVM四类模型的比较示意图。

图3是Lasso降维后的各个特征参数的相关性热图。

图4是选取五类核函数组合实验训练结果图。

图5是ID号为4，11，17，23的五类核函数组合实验结果图。

图6是选取四类核函数组合实验训练结果图。

图7是ID号为29，35，42，47的四类核函数组合实验结果图；

图8是选取三类核函数组合实验训练结果图；

图9是ID号为56，63，65，66的三类核函数组合实验结果图。

图10是三类(63号)、四类(42号)、五类(23号)核函数组合比较结果图。

图11是不同类型储层的毛管压力曲线特征。

图12是不同类型储层的孔隙度与渗透率之间关系。

图13是不同类型储层储集空间。

具体实施方式

下面以列举实施例的方式对本发明的技术方案进一步做出具体的阐述，但本发明不限于以下所列举的实施例。

步骤一：将研究区长6储层25块岩样微观孔隙结构特征参数作为样本数据，利用最大最小归一化(Min-Max scal ing)进行预处理，然后利用lasso的L1正则化实现数据的降维。最终选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的特征参数；降维后各特征参数的相关性热图见图3。由图3可知，结构渗流系数与排驱压力呈负相关；中值半径与结构渗流系数呈正相关；孔喉比与结构渗流系数、退汞效率与排驱压力近乎线性无关。其中，

为结构渗流系数、p_d为排驱压力、r₅₀为中值半径、α为均值系数、W_e为退汞效率、η为孔喉比。

Lasso降维方法是以缩小变量集，即降阶为思想的压缩估计方法。它通过构造一个惩罚函数，可以将变量的系数进行压缩并使某些回归系数变为0，从而达到变量选择的目的。Lasso回归函数为：

其中，N为样本个数，w为回归系数，k为回归系数个数，x为样本，y为样本对应的标签，第一个累加的计算结果为模型回归的损失函数，第二个累加为正则化项，其中λ为收缩因子，|w|为L₁范数。

如图1所示，将致密砂岩样本的参数：结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比输入到模型，模型选取部分核函数：线性核函数、多项式核函数、多元二次核函数、Sigmoid核函数、幂指数核函数、高斯径向基核函数、拉普拉斯核函数进行线性组合构成一系列多核核函数，再利用最优的多核核函数实现致密砂岩样本的分类。

步骤二：将研究区长6储层25块岩样微观孔隙结构特征参数作为样本数据在步骤一获取的降维后的6个致密砂岩岩样微观空隙结构特征参数表征的样本数据按照75：25的比例分为两组，一组作为训练样本，一组作为测试样本；

步骤三：将SVM模型常见的核函数，线性核函数(linear kernel)、多项式核函数(polynomial kernel)、多元二次核函数(multiquadric kernel)、Sigmoid核函数(sigmoidkernel)、幂指数核函数(exponential kernel)、高斯径向基核函数(rbf kernel)、拉普拉斯核函数(laplacian kernel)的线性组合作为待选的MK-SVM模型的核函数；

高斯径向基核函数Gaussian radial basis kernel function

(γ₁为RBF中的超参数) (2)幂指数核函数ExponentialKernel function

(γ₂为幂指核函数中的超参数) (3)

拉普拉斯核函数Laplacian kernel function

(γ₃为laplacian核函数中的超参数) (4)

多元二次核函数Multiquadric kernel function

(C₁为多元二次核函数中的超参数) (5)

线性核函数Linear kernel function

K(x,x_i)＝x*x_i+C₂(C₂为线性核函数中的超参数) (6)

多项式核函数Polynomial kernel function

K(x,x_i)＝[(x*x_i)+C₃]^d(C₃,d为多项式核函数中的超参数) (7)

Sigmoid核函数分别如下式所示：

K(x,x_i)＝tanh(αx^Tx_i)+C₄)(α,C₄为Sigmoid核函数中的超参数) (8)

其中，x,x_i为样本空间中的两个任意样本。

其中，x,x_i为样本空间中的样本向量，N为样本向量中的向量个数，α为权向量，y为输入样本对应的标签，b为偏置；M为核函数的个数，本发明中取5，β为各个核函数的权系数，且

步骤四：将步骤三列出的核函数的线性组合，分别是五类核函数的线性组合、四类核函数的线性组合、三类核函数的线性组合，依次代入MK-SVM模型中，将训练样本输入到模型中进行训练，从而使模型获得可以准确划分训练样本的超平面，最终得到训练结果；

所述步骤四的训练方法如下：

1.选取5类核函数线性组合的实验

在图4中，横坐标表示该组核函数组合在不同超参数下对应的ID号。图4(a)中的纵坐标对应指标Macro Precision、(b)对应Macro F1 score。图中橙色实线表示10次实验结果的中位数，蓝色虚线表示10次试验结果中的均值；菱形表示异常值；由中位数所处的位置可以判断10次试验结果中数据的分布情况；由均值的位置可以判断试验结果平均水平；由箱体的长度可以判断模型的收敛性和稳定性。箱子的中间一条线，是数据的中位数，代表了样本数据的平均水平；箱子的上下限，分别是数据的上四分位数和下四分位数。这意味着箱子包含了50％的数据。因此，箱子的宽度在一定程度上反映了数据的波动程度。

其中，ID号为1-7的核函数组合是linear kernel、polynomial kernel、multiquadrickernel、sigmoid kernel、exponential kernel五类核函数的线性组合；ID号为14-19的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、sigmoid kernel、laplacian kernel这五类核函数的线性组合；ID号为8-13的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、sigmoid kernel、Gaussiankernel五类核函数的线性组合；ID号为20-25的核函数组合是linear kernel、polynomialkernel、Gaussian kernel、sigmoid kernel、laplacian kernel五类核函数的组合。

由图4可知，4号ID代表的核函数组合在图4(a)中虽然在均值、中位数以及箱体上下所表示的上下四分位数与3号和5号接近，但是其上下边缘所表示的最大最小值相对3号5号更接近箱体，即4号核函数对应的MK-SVM模型对于F1score指标而言波动程度更小，结合4号在图4(b)中的中位数以及均值的位置可知4号具有一定优势。同理可以判断，17号，11号，23号核函数对应的MK-SVM模型，其Macro Precision的均值及中位数相较于其他核函数模型，优势明显；且由图4(b)可知，17号，11号，23号核函数对应的MK-SVM模型在均值、中位数、F1 score的结果波动程度等指标较其他核函数模型优势明显。因此，ID号为04号，17号，11号，23号的核函数具有优势。

将图4中得到的优势核函数的组合，即ID号为4，11,17,23的核函数组合进行比较，结果如图5和表1：

表1五类核函数10次实验对应的性能指标结果均值

由图5和表1可知，选取ID号为4，11,17,23的核函数组合进行10次实验对应的性能指标结果均值标明，在MK_SVM模型中选择ID号为23号的核函数组合进行计算,对储层进行分类的Accuracy可达到86％，Macro_Precision可以达到88.8％，Macro_F1_scscore可达到0.846.

2.选取4类核函数线性组合的实验

在图6中，ID号为45-51的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、exponential kernel四类核函数的组合；ID号为39-44的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、laplacian kernel四类核函数的组合；ID号为26-32的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、sigmoid kernel四类核函数的组合；ID号为33-38的核函数组合是linear kernel、polynomial kernel、Gaussian kernel、sigmoid kernel四类核函数的组合。

由图6可知，选择ID号为：29,35,42,47号的核函数，代入MK_SVM中进行计算，根据前文所述的判断方法，优势比较明显。通过对29号、35号、42号、47号核函数组合进行性能比较,结果如图7和表2：

表2四类核函数10次实验对应的性能指标结果均值

由图7和表2可知，选取ID号为29,35,42,47的核函数组合进行10次实验对应的性能指标结果均值标明，在MK_SVM模型中选择ID号为42号的核函数组合进行计算,对储层进行分类的Accuracy可达到86％，Macro_Precision可以达到88.8％，Macro_F1_score可达到0.848.

3选取3类核函数线性组合的实验

选取3类核函数的线性组合实验如图8所示，其中，ID号为52-58的核函数组合是linear kernel、polynomial kernel、Gaussian kernel三类核函数的组合，ID号为59-64的核函数组合是linear kernel、polynomial kernel、multiquadric kernel

三类核函数的组合.

由图8可知，选择ID号为：56,63号的核函数，代入MK_SVM中进行计算，根据前文所述的判断方法，优势比较明显。由于65,66号核函数组合无法拟合，所以没有进行超参数调整。对56号、63号、65号、66号核函数组合进行性能比较,结果如图9和表3：

表3三类核函数10次实验对应的性能指标结果均值

由表3和图9可知，选取ID号为56,63,65,66的核函数组合进行10次实验对应的性能指标结果均值标明，在MK_SVM模型中选择ID号为63号的核函数组合进行计算,对储层进行分类的Accuracy达到84.5％，Macro_Precision可以达到87.6％，Macro_F1_score可达到0.826.

4.三种类别的MK-SVM比较

表4三种类别核函数10次实验对应的性能指标结果均值

由图10和表4可知，选取ID号为23,42,63的核函数组合进行10次实验对应的性能指标结果均值表明：42号的上下四分位数差值更小，收敛性较23，63号更优，所以42号更具优势，在MK_SVM模型中选择ID号为42号的核函数组合进行计算,对储层进行分类的Accuracy达到86％，Macro_Precision可以达到88.8％，Macro_F1_score可达到0.848.

步骤五：通过一系列实验，最终将核函数Linear Kernel、polynomial Kernel、multiquadric kernel、Laplacian Kernel的线性组合作为MK-SVM模型的核函数。

由上述实验得，在MK-SVM模型中选取ID号为42号的核函数进行计算，核函数中各个单核函数对应的系数在10次实验中的结果见表5.由表5可知：42号多核核函数中，线性核的系数为0.2558746，多项式核的系数为0.2630193，多元二次核的系数为0.2508263，拉普拉斯核的系数为0.2302798。优化后的核函数公式如(12)所述。

表5 42号核函数中各单核函数对应的的系数在10次实验中的结果

结论验证

1、将MK-SVM模型与极端随机树(Extra-Trees)分类模型、Polynomial SVM模型、RBF SVM模型进行比较，结果如图2和表6；

在图2中，横坐标表示四种预测方法。图2(a)中的纵坐标对应指标MacroPrecision、(b)对应Macro F1 score。图中橙色实线表示10次实验结果的中位数，蓝色虚线表示10次试验结果中的均值；菱形表示异常值；由中位数所处的位置可以判断10次试验结果中数据的分布情况；由均值的位置可以判断试验结果平均水平；由箱体的长度可以判断模型的收敛性和稳定性。箱子的中间一条线，是数据的中位数，代表了样本数据的平均水平；箱子的上下限，分别是数据的上四分位数和下四分位数。这意味着箱子包含了50％的数据。因此，箱子的宽度在一定程度上反映了数据的波动程度。

表6四类模型的10次实验对应的性能指标结果

Model	Accuracy(％)	Macro_Precision(％)	Macro_F1_score
				Polynomial SVM	81.5	83.1	0.807
RBF SVM	80.0	85.1	0.790
				MK-SVM	86.0	88.8	0.848
Extra Trees	78.5	82.2	0.777

结合图2(a)和表6可知，本文提出的MK-SVM模型相较于其他对比模型中性能较优的RBF-SVM模型其Macro Precision提高了3.7％，且本文提出的MK-SVM模型中MacroPrecision的数据波形程度较RBF-SVM模型降低了75.26％；由图2(b)和表6可知，本文提出的MK-SVM模型相较于其他对比模型中性能较优的Polynomial SVM模型，其F1_score提高了4.1％，且本文提出的MK-SVM模型中F1 score的数据波动程度较Polynomial SVM模型降低了76.54％。由表1可知，本文提出的MK-SVM模型的准确率(Accuracy)相较于其他对比模型中性能较优的polynomial SVM模型，其Accuracy提高了4.5％。因此，本发明提出的基于微观孔隙结构特征参数的MK-SVM模型，对致密储层进行分类，其结果准确率可以达到86.0％。

2、基于研究区25块岩样的高压压汞实验数据及其降维结果，采用PolynomialSVM、RBF SVM、MKL和Extra Trees四种预测型将储层分为I、II、III类，其毛管压力(进汞)曲线特征如图11所示。

从图11可以看出，MK-SVM储层综合评价预测模型得到的3类储层毛管压力曲线分界最为明显，储层分类结果非常适合于研究区长6致密砂岩储层分类评价。

3、通过不同类型储层微观孔隙结构特征，来验证采用一种基于MK-SVM的致密储层分类方法的预测准确性。

(1)孔隙度与渗透率之间的关系

基于纳米孔在致密储层中占比最大，对储层物性的影响十分重要。为了进一步验证MK-SVM储层综合评价预测模型的准确性，分别深入分析I、II、III类储层的孔隙度与渗透率之间关系

从图12可知，I、II、III类储层的孔隙度与渗透率之间具有明显的正相关关系，相关系数(R²)均大于0.85。说明在同类储层中，孔隙的微观发育程度对储层的渗流能力具有极强的控制作用。进一步证明了该模型的精度足以提供可靠的预测结果。

(2)储集空间

本次研究的样品均采自鄂尔多斯盆地吴起地区延长组长6储层。通过实测样品的孔隙度与渗透率并结合前人研究表明，该储层是较为典型的低渗、特低渗致密砂岩储层，岩性以长石砂岩为主，碎屑颗粒分选较好，磨圆度为次棱角状，胶结类型多为孔隙-薄膜、薄膜、加大-孔隙型胶结，孔隙类型主要为残余粒间孔、长石溶孔、岩屑溶孔。不同类型储层储集空间差异，见图13。分析图13可知，I、II、III类储层的孔隙发育程度、连通性依次变差。

(3)微观孔隙结构特征

基于高压压汞实验数据，采用MK-SVM预测型将储层分为I、II、III类。不同类型储层(25块岩样)的毛细管压力曲线、微观孔隙结构特征参数，见表7。

表7不同类型储层物性与微观孔隙结构特征参数

I类储层毛细管压力曲线偏向左下，排驱压力相对较低，为0.287～0.722MPa，平均值为0.421MPa，中值半径平均值为0.209μm。进汞初期，曲线平缓，说明此时的毛细管压力所对应的相对大喉道控制的孔隙数量较多，孔喉连通性较好。II类储层毛细管压力曲线排驱压力较高，为0.293～0.744MPa之间，平均值为0.599MPa。中值半径平均值为0.111μm，均值系数较大，表示孔喉分布比较均匀，喉道半径分布集中，孔喉连通性较好，在压汞曲线显示出较长的平缓段。III类储层毛细管压力曲线排驱压力值最高，为1.134～1.169MPa，平均值为1.149MPa。中值半径较小，平均值为0.061μm，表示各量级喉道所控制的孔隙空间均差别不大，大孔隙不发育。

从研究区长6致密砂岩储层的分类结果可以看出，基于MK-SVM的致密砂岩储层综合评价预测模型的精度高于86.0％，说明该方法是一种致密砂岩储层分类评价行之有效的方法。不同类型储层物性、储集空间、毛管压力曲线以及微观孔隙结构特征存在明显差异。I、II、III类储层的孔隙发育程度与连通性、物性依次变差；而排驱压力、均值系数与孔喉比在I、II、III类储层中依次增大。

Claims

1.一种基于多核支持向量机的致密砂岩储层分类方法，其特征在于，包括以下步骤：

Lasso回归函数为：

步骤三：将支持向量机模型的核函数，即SVM的核函数，包括：线性核函数linearkernel、多项式核函数polynomial kernel、多元二次核函数multiquadric kernel、Sigmoid核函数sigmoid kernel、幂指数核函数exponentialkernel、高斯径向基核函数rbfkernel、拉普拉斯核函数laplacian kernel的线性组合作为待选的多核支持向量机模型的核函数，简称MK-SVM模型的核函数；

从而得到优化后的核函数公式：