CN115099357A - 一种基于多核支持向量机的致密砂岩储层分类方法 - Google Patents
一种基于多核支持向量机的致密砂岩储层分类方法 Download PDFInfo
- Publication number
- CN115099357A CN115099357A CN202210809396.9A CN202210809396A CN115099357A CN 115099357 A CN115099357 A CN 115099357A CN 202210809396 A CN202210809396 A CN 202210809396A CN 115099357 A CN115099357 A CN 115099357A
- Authority
- CN
- China
- Prior art keywords
- kernel
- kernel function
- function
- sample
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 14
- 230000006870 function Effects 0.000 claims abstract description 180
- 239000011148 porous material Substances 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims description 33
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 claims description 20
- 229910052753 mercury Inorganic materials 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 17
- 239000011435 rock Substances 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 238000006073 displacement reaction Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 10
- 238000009825 accumulation Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 150000002730 mercury Chemical class 0.000 claims description 2
- 239000011800 void material Substances 0.000 claims description 2
- 238000011161 development Methods 0.000 abstract description 10
- 238000011156 evaluation Methods 0.000 abstract description 8
- 230000000694 effects Effects 0.000 abstract description 4
- 238000002474 experimental method Methods 0.000 description 21
- 238000011160 research Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000003921 oil Substances 0.000 description 6
- 230000035699 permeability Effects 0.000 description 6
- 230000000704 physical effect Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 239000010433 feldspar Substances 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于多核支持向量机的致密砂岩储层分类方法,对影响储层品质的微观孔隙结构特征参数进行无监督学习,通过优化模型超参数,获得最优决策函数,将致密砂岩储层进行分类,并对分类结果进行验证。结果表明所提出的储层分类方法准确率高,能有效降低时间损耗、节省人力成本;对多分类问题分类效果明显,可以有效处理油田实际应用中最常见的多参数、小样本问题;该方法的使用可以实现对致密油气藏开发的深入认识和精细评价提供客观高效的指导,在数据量需求方面具有独特优势和完善的理论。
Description
技术领域
本发明涉及石油勘探领域的致密砂岩储层的分类技术,特别涉及一种基于多核支持向量机的致密砂岩储层分类方法。
技术背景
致密油的巨大资源潜力和产量的快速增长使其成为当今最热门的石油勘探领域之一。致密砂岩油藏具有物性差、孔隙喉道细小、微观非均质性强等特征,导致资源品质较差,开发利用经济敏感性强,需要在经济与技术策略相对一致的情况下分阶段、分类型开发。
储层分类是按照储层优劣等级对研究区储层进行排序,是开发选区、井位部署、产能预测以及开发方案制定的重要依据。一方面,评价参数由孔隙度、渗透率、有效砂体厚度及含油饱和度等储层宏观特征参数,逐渐发展到基于恒速压汞、高压压汞及核磁共振等新方法所得到的微观孔隙结构特征参数;另一方面,随着人工智能的迅猛发展,神经网络、支持向量机、贝叶斯分类、随机森林等机器学习方法日益完善、泛化性强、实际应用过程中方便快捷,相较于传统方法优势明显,逐渐在油气田地质与开发领域得到广泛应用。
实际应用中发现,机器学习方法的预测效果对数据本身的依赖性很强,不同机器学习方法的适应条件不同。例如,BP神经网络模型对地区的依赖性较强,不完善的数据样本会大大影响预测结果的可信度;随机森林模型对于多维特征的数据集分类有很高的效率,但是在数据噪音比较大的分类或回归问题上会过拟合,产出的属性权值是不可信的。因此,由于致密砂岩油藏微观非均质性强,储层品质主控微观因素较难确定,导致优势储层难以判别,需要开发新的储层判别方法。
发明内容
为了克服上述现有技术的缺陷,本发明的目的在于提供一种基于多核支持向量机的致密砂岩储层分类方法,对影响储层品质的微观孔隙结构特征参数进行无监督学习,通过优化模型超参数,获得最优决策函数,将致密砂岩储层进行分类,并对分类结果进行验证。结果表明所提出的储层分类方法准确率高,能有效降低时间损耗、节省人力成本;对多分类问题分类效果明显,可以有效处理油田实际应用中最常见的多参数、小样本问题;该方法的使用可以实现对致密油气藏开发的深入认识和精细评价提供客观高效的指导,在数据量需求方面具有独特优势和完善的理论。
为了达到上述目的,本发明的技术方案为:
一种基于多核支持向量机的致密砂岩储层分类方法,包括以下步骤:
步骤一:在以结构渗流系数、排驱压力、最大孔喉半径、中值压力、中值半径、均值系数、分选系数、歪度系数、最大进汞饱和度、变异系数、未饱和汞饱和度、均值系数、残余汞饱和度、退汞饱和度、退出效率、孔喉比为致密砂岩岩样的微观空隙结构特征参数的基础上,利用lasso的L1正则化实现数据的降维;最终选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的6个特征参数;
Lasso回归函数为:
其中,N为样本个数,w为回归系数,k为回归系数个数,x为样本,y为样本对应的标签,第一个累加的计算结果为模型回归的损失函数,第二个累加为正则化项,其中λ为收缩因子,|w|为L1范数;
步骤二:将步骤一获取的降维后的6个致密砂岩岩样微观空隙结构特征参数表征的样本数据按照(70-80):(30-20)的比例分为两组,一组作为训练样本,一组作为测试样本;
步骤三:将支持向量机(简称SVM)模型常见的核函数,线性核函数(linearkernel)、多项式核函数(polynomial kernel)、多元二次核函数(multiquadric kernel)、Sigmoid核函数(sigmoid kernel)、幂指数核函数(exponential kernel)、高斯径向基核函数(rbf kernel)、拉普拉斯核函数(laplacian kernel)的线性组合作为待选的多核支持向量机模型的核函数,简称MK-SVM模型的核函数;
高斯径向基核函数Gaussian radial basis kernel function
幂指数核函数Exponential Kernel function
拉普拉斯核函数Laplacian kernel function
多元二次核函数Multiquadric kernel function
线性核函数Linear kernel function
K(x,xi)=x*xi+C2(C2为线性核函数中的超参数) (6)
多项式核函数Polynomial kernel function
K(x,xi)=[(x*xi)+C3]d(C3,d为多项式核函数中的超参数) (7)
Sigmoid核函数分别如下式所示:
K(x,xi)=tanh(αxTxi)+C4)(α,C4为Sigmoid核函数中的超参数) (8)
其中,x,xi为样本空间中的两个任意样本。
对每个核函数赋以不同的权值系数,从而构造一个线性组合的核函数,其表达式为:
其中,x,xi为样本空间中的样本向量,N为样本向量中的向量个数,α为权向量,y为输入样本对应的标签,b为偏置;M为核函数的个数,β为各个核函数的权系数,且为构造的几类核函数的线性组合;多核的约束优化(ConstrainedOptimization)函数表示为:
其中,α,β如上所述,αi为向量α中的第i个分量,C为惩罚参数。
步骤四:将步骤三列出的核函数的线性组合,代入MK-SVM模型中,将训练样本输入到模型中进行训练,最终得到训练结果;
所述的步骤四的训练方法如下:
MK-SVM模型的训练过程中,模型的训练误差精度为0.0001,训练的最大迭代次数为2000次,训练采用3折交叉验证保证训练结果的可靠性。
步骤五:根据步骤四的训练结果,将线性核函数Linear Kernel、多项式核函数polynomial Kernel、多元二次核函数multiquadric kernel、拉普拉斯核函数LaplacianKernel这四种核函数的线性组合作为MK-SVM模型的核函数;
从而得到优化后的核函数公式:
步骤六:在MK-SVM模型训练完毕之后,将测试样本输入到训练好的MK-SVM模型得到预测的分类结果,利用预测的分类结果和测试样本真实的分类结果计算出机器学习常见的准确率(Accuracy)、宏观精确率(Macro_Precision)和宏观F1分数(Macro_F1_Score)三个评价模型性能的指标,该指标作为评价MK-SVM模型的分类性能的标准。
本发明的有益效果是:本发明利用lasso的L1正则化选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的微观孔隙结构特征参数,选择核函数Linear Kernel、polynomial Kernel、multiquadric kernel、LaplacianKernel的线性组合作为MK-SVM模型作为核函数,将致密砂岩岩样的微观空隙结构特征参数作为特征参数实现致密砂岩储层的分类方法。这种方法操作简便,结果一致客观,可以有效降低时间损耗、节省人力成本,可以作为致密砂岩储层分类的可靠依据。
附图说明
图1为MK-SVM模型的示意图;
图2是本发明中的MK-SVM模型与极端随机树(Extra-Trees)分类模型、PolynomialSVM模型、RBF SVM四类模型的比较示意图。
图3是Lasso降维后的各个特征参数的相关性热图。
图4是选取五类核函数组合实验训练结果图。
图5是ID号为4,11,17,23的五类核函数组合实验结果图。
图6是选取四类核函数组合实验训练结果图。
图7是ID号为29,35,42,47的四类核函数组合实验结果图;
图8是选取三类核函数组合实验训练结果图;
图9是ID号为56,63,65,66的三类核函数组合实验结果图。
图10是三类(63号)、四类(42号)、五类(23号)核函数组合比较结果图。
图11是不同类型储层的毛管压力曲线特征。
图12是不同类型储层的孔隙度与渗透率之间关系。
图13是不同类型储层储集空间。
具体实施方式
下面以列举实施例的方式对本发明的技术方案进一步做出具体的阐述,但本发明不限于以下所列举的实施例。
步骤一:将研究区长6储层25块岩样微观孔隙结构特征参数作为样本数据,利用最大最小归一化(Min-Max scal ing)进行预处理,然后利用lasso的L1正则化实现数据的降维。最终选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的特征参数;降维后各特征参数的相关性热图见图3。由图3可知,结构渗流系数与排驱压力呈负相关;中值半径与结构渗流系数呈正相关;孔喉比与结构渗流系数、退汞效率与排驱压力近乎线性无关。其中,为结构渗流系数、pd为排驱压力、r50为中值半径、α为均值系数、We为退汞效率、η为孔喉比。
Lasso降维方法是以缩小变量集,即降阶为思想的压缩估计方法。它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,从而达到变量选择的目的。Lasso回归函数为:
其中,N为样本个数,w为回归系数,k为回归系数个数,x为样本,y为样本对应的标签,第一个累加的计算结果为模型回归的损失函数,第二个累加为正则化项,其中λ为收缩因子,|w|为L1范数。
如图1所示,将致密砂岩样本的参数:结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比输入到模型,模型选取部分核函数:线性核函数、多项式核函数、多元二次核函数、Sigmoid核函数、幂指数核函数、高斯径向基核函数、拉普拉斯核函数进行线性组合构成一系列多核核函数,再利用最优的多核核函数实现致密砂岩样本的分类。
步骤二:将研究区长6储层25块岩样微观孔隙结构特征参数作为样本数据在步骤一获取的降维后的6个致密砂岩岩样微观空隙结构特征参数表征的样本数据按照75:25的比例分为两组,一组作为训练样本,一组作为测试样本;
步骤三:将SVM模型常见的核函数,线性核函数(linear kernel)、多项式核函数(polynomial kernel)、多元二次核函数(multiquadric kernel)、Sigmoid核函数(sigmoidkernel)、幂指数核函数(exponential kernel)、高斯径向基核函数(rbf kernel)、拉普拉斯核函数(laplacian kernel)的线性组合作为待选的MK-SVM模型的核函数;
步骤三:将支持向量机(简称SVM)模型常见的核函数,线性核函数(linearkernel)、多项式核函数(polynomial kernel)、多元二次核函数(multiquadric kernel)、Sigmoid核函数(sigmoid kernel)、幂指数核函数(exponential kernel)、高斯径向基核函数(rbf kernel)、拉普拉斯核函数(laplacian kernel)的线性组合作为待选的多核支持向量机模型的核函数,简称MK-SVM模型的核函数;
高斯径向基核函数Gaussian radial basis kernel function
拉普拉斯核函数Laplacian kernel function
多元二次核函数Multiquadric kernel function
线性核函数Linear kernel function
K(x,xi)=x*xi+C2(C2为线性核函数中的超参数) (6)
多项式核函数Polynomial kernel function
K(x,xi)=[(x*xi)+C3]d(C3,d为多项式核函数中的超参数) (7)
Sigmoid核函数分别如下式所示:
K(x,xi)=tanh(αxTxi)+C4)(α,C4为Sigmoid核函数中的超参数) (8)
其中,x,xi为样本空间中的两个任意样本。
对每个核函数赋以不同的权值系数,从而构造一个线性组合的核函数,其表达式为:
其中,x,xi为样本空间中的样本向量,N为样本向量中的向量个数,α为权向量,y为输入样本对应的标签,b为偏置;M为核函数的个数,本发明中取5,β为各个核函数的权系数,且为构造的几类核函数的线性组合;多核的约束优化(ConstrainedOptimization)函数表示为:
其中,α,β如上所述,αi为向量α中的第i个分量,C为惩罚参数。
步骤四:将步骤三列出的核函数的线性组合,分别是五类核函数的线性组合、四类核函数的线性组合、三类核函数的线性组合,依次代入MK-SVM模型中,将训练样本输入到模型中进行训练,从而使模型获得可以准确划分训练样本的超平面,最终得到训练结果;
所述步骤四的训练方法如下:
1.选取5类核函数线性组合的实验
在图4中,横坐标表示该组核函数组合在不同超参数下对应的ID号。图4(a)中的纵坐标对应指标Macro Precision、(b)对应Macro F1 score。图中橙色实线表示10次实验结果的中位数,蓝色虚线表示10次试验结果中的均值;菱形表示异常值;由中位数所处的位置可以判断10次试验结果中数据的分布情况;由均值的位置可以判断试验结果平均水平;由箱体的长度可以判断模型的收敛性和稳定性。箱子的中间一条线,是数据的中位数,代表了样本数据的平均水平;箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。因此,箱子的宽度在一定程度上反映了数据的波动程度。
其中,ID号为1-7的核函数组合是linear kernel、polynomial kernel、multiquadrickernel、sigmoid kernel、exponential kernel五类核函数的线性组合;ID号为14-19的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、sigmoid kernel、laplacian kernel这五类核函数的线性组合;ID号为8-13的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、sigmoid kernel、Gaussiankernel五类核函数的线性组合;ID号为20-25的核函数组合是linear kernel、polynomialkernel、Gaussian kernel、sigmoid kernel、laplacian kernel五类核函数的组合。
由图4可知,4号ID代表的核函数组合在图4(a)中虽然在均值、中位数以及箱体上下所表示的上下四分位数与3号和5号接近,但是其上下边缘所表示的最大最小值相对3号5号更接近箱体,即4号核函数对应的MK-SVM模型对于F1score指标而言波动程度更小,结合4号在图4(b)中的中位数以及均值的位置可知4号具有一定优势。同理可以判断,17号,11号,23号核函数对应的MK-SVM模型,其Macro Precision的均值及中位数相较于其他核函数模型,优势明显;且由图4(b)可知,17号,11号,23号核函数对应的MK-SVM模型在均值、中位数、F1 score的结果波动程度等指标较其他核函数模型优势明显。因此,ID号为04号,17号,11号,23号的核函数具有优势。
将图4中得到的优势核函数的组合,即ID号为4,11,17,23的核函数组合进行比较,结果如图5和表1:
表1五类核函数10次实验对应的性能指标结果均值
由图5和表1可知,选取ID号为4,11,17,23的核函数组合进行10次实验对应的性能指标结果均值标明,在MK_SVM模型中选择ID号为23号的核函数组合进行计算,对储层进行分类的Accuracy可达到86%,Macro_Precision可以达到88.8%,Macro_F1_scscore可达到0.846.
2.选取4类核函数线性组合的实验
在图6中,ID号为45-51的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、exponential kernel四类核函数的组合;ID号为39-44的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、laplacian kernel四类核函数的组合;ID号为26-32的核函数组合是linear kernel、polynomial kernel、multiquadric kernel、sigmoid kernel四类核函数的组合;ID号为33-38的核函数组合是linear kernel、polynomial kernel、Gaussian kernel、sigmoid kernel四类核函数的组合。
由图6可知,选择ID号为:29,35,42,47号的核函数,代入MK_SVM中进行计算,根据前文所述的判断方法,优势比较明显。通过对29号、35号、42号、47号核函数组合进行性能比较,结果如图7和表2:
表2四类核函数10次实验对应的性能指标结果均值
由图7和表2可知,选取ID号为29,35,42,47的核函数组合进行10次实验对应的性能指标结果均值标明,在MK_SVM模型中选择ID号为42号的核函数组合进行计算,对储层进行分类的Accuracy可达到86%,Macro_Precision可以达到88.8%,Macro_F1_score可达到0.848.
3选取3类核函数线性组合的实验
选取3类核函数的线性组合实验如图8所示,其中,ID号为52-58的核函数组合是linear kernel、polynomial kernel、Gaussian kernel三类核函数的组合,ID号为59-64的核函数组合是linear kernel、polynomial kernel、multiquadric kernel
三类核函数的组合.
由图8可知,选择ID号为:56,63号的核函数,代入MK_SVM中进行计算,根据前文所述的判断方法,优势比较明显。由于65,66号核函数组合无法拟合,所以没有进行超参数调整。对56号、63号、65号、66号核函数组合进行性能比较,结果如图9和表3:
表3三类核函数10次实验对应的性能指标结果均值
由表3和图9可知,选取ID号为56,63,65,66的核函数组合进行10次实验对应的性能指标结果均值标明,在MK_SVM模型中选择ID号为63号的核函数组合进行计算,对储层进行分类的Accuracy达到84.5%,Macro_Precision可以达到87.6%,Macro_F1_score可达到0.826.
4.三种类别的MK-SVM比较
表4三种类别核函数10次实验对应的性能指标结果均值
由图10和表4可知,选取ID号为23,42,63的核函数组合进行10次实验对应的性能指标结果均值表明:42号的上下四分位数差值更小,收敛性较23,63号更优,所以42号更具优势,在MK_SVM模型中选择ID号为42号的核函数组合进行计算,对储层进行分类的Accuracy达到86%,Macro_Precision可以达到88.8%,Macro_F1_score可达到0.848.
步骤五:通过一系列实验,最终将核函数Linear Kernel、polynomial Kernel、multiquadric kernel、Laplacian Kernel的线性组合作为MK-SVM模型的核函数。
由上述实验得,在MK-SVM模型中选取ID号为42号的核函数进行计算,核函数中各个单核函数对应的系数在10次实验中的结果见表5.由表5可知:42号多核核函数中,线性核的系数为0.2558746,多项式核的系数为0.2630193,多元二次核的系数为0.2508263,拉普拉斯核的系数为0.2302798。优化后的核函数公式如(12)所述。
表5 42号核函数中各单核函数对应的的系数在10次实验中的结果
步骤六:在MK-SVM模型训练完毕之后,将测试样本输入到训练好的MK-SVM模型得到预测的分类结果,利用预测的分类结果和测试样本真实的分类结果计算出机器学习常见的准确率(Accuracy)、宏观精确率(Macro_Precision)和宏观F1分数(Macro_F1_Score)三个评价模型性能的指标,该指标作为评价MK-SVM模型的分类性能的标准。
结论验证
1、将MK-SVM模型与极端随机树(Extra-Trees)分类模型、Polynomial SVM模型、RBF SVM模型进行比较,结果如图2和表6;
在图2中,横坐标表示四种预测方法。图2(a)中的纵坐标对应指标MacroPrecision、(b)对应Macro F1 score。图中橙色实线表示10次实验结果的中位数,蓝色虚线表示10次试验结果中的均值;菱形表示异常值;由中位数所处的位置可以判断10次试验结果中数据的分布情况;由均值的位置可以判断试验结果平均水平;由箱体的长度可以判断模型的收敛性和稳定性。箱子的中间一条线,是数据的中位数,代表了样本数据的平均水平;箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。因此,箱子的宽度在一定程度上反映了数据的波动程度。
表6四类模型的10次实验对应的性能指标结果
Model | Accuracy(%) | Macro_Precision(%) | Macro_F1_score |
Polynomial SVM | 81.5 | 83.1 | 0.807 |
RBF SVM | 80.0 | 85.1 | 0.790 |
MK-SVM | 86.0 | 88.8 | 0.848 |
Extra Trees | 78.5 | 82.2 | 0.777 |
结合图2(a)和表6可知,本文提出的MK-SVM模型相较于其他对比模型中性能较优的RBF-SVM模型其Macro Precision提高了3.7%,且本文提出的MK-SVM模型中MacroPrecision的数据波形程度较RBF-SVM模型降低了75.26%;由图2(b)和表6可知,本文提出的MK-SVM模型相较于其他对比模型中性能较优的Polynomial SVM模型,其F1_score提高了4.1%,且本文提出的MK-SVM模型中F1 score的数据波动程度较Polynomial SVM模型降低了76.54%。由表1可知,本文提出的MK-SVM模型的准确率(Accuracy)相较于其他对比模型中性能较优的polynomial SVM模型,其Accuracy提高了4.5%。因此,本发明提出的基于微观孔隙结构特征参数的MK-SVM模型,对致密储层进行分类,其结果准确率可以达到86.0%。
2、基于研究区25块岩样的高压压汞实验数据及其降维结果,采用PolynomialSVM、RBF SVM、MKL和Extra Trees四种预测型将储层分为I、II、III类,其毛管压力(进汞)曲线特征如图11所示。
从图11可以看出,MK-SVM储层综合评价预测模型得到的3类储层毛管压力曲线分界最为明显,储层分类结果非常适合于研究区长6致密砂岩储层分类评价。
3、通过不同类型储层微观孔隙结构特征,来验证采用一种基于MK-SVM的致密储层分类方法的预测准确性。
(1)孔隙度与渗透率之间的关系
基于纳米孔在致密储层中占比最大,对储层物性的影响十分重要。为了进一步验证MK-SVM储层综合评价预测模型的准确性,分别深入分析I、II、III类储层的孔隙度与渗透率之间关系
从图12可知,I、II、III类储层的孔隙度与渗透率之间具有明显的正相关关系,相关系数(R2)均大于0.85。说明在同类储层中,孔隙的微观发育程度对储层的渗流能力具有极强的控制作用。进一步证明了该模型的精度足以提供可靠的预测结果。
(2)储集空间
本次研究的样品均采自鄂尔多斯盆地吴起地区延长组长6储层。通过实测样品的孔隙度与渗透率并结合前人研究表明,该储层是较为典型的低渗、特低渗致密砂岩储层,岩性以长石砂岩为主,碎屑颗粒分选较好,磨圆度为次棱角状,胶结类型多为孔隙-薄膜、薄膜、加大-孔隙型胶结,孔隙类型主要为残余粒间孔、长石溶孔、岩屑溶孔。不同类型储层储集空间差异,见图13。分析图13可知,I、II、III类储层的孔隙发育程度、连通性依次变差。
(3)微观孔隙结构特征
基于高压压汞实验数据,采用MK-SVM预测型将储层分为I、II、III类。不同类型储层(25块岩样)的毛细管压力曲线、微观孔隙结构特征参数,见表7。
表7不同类型储层物性与微观孔隙结构特征参数
I类储层毛细管压力曲线偏向左下,排驱压力相对较低,为0.287~0.722MPa,平均值为0.421MPa,中值半径平均值为0.209μm。进汞初期,曲线平缓,说明此时的毛细管压力所对应的相对大喉道控制的孔隙数量较多,孔喉连通性较好。II类储层毛细管压力曲线排驱压力较高,为0.293~0.744MPa之间,平均值为0.599MPa。中值半径平均值为0.111μm,均值系数较大,表示孔喉分布比较均匀,喉道半径分布集中,孔喉连通性较好,在压汞曲线显示出较长的平缓段。III类储层毛细管压力曲线排驱压力值最高,为1.134~1.169MPa,平均值为1.149MPa。中值半径较小,平均值为0.061μm,表示各量级喉道所控制的孔隙空间均差别不大,大孔隙不发育。
从研究区长6致密砂岩储层的分类结果可以看出,基于MK-SVM的致密砂岩储层综合评价预测模型的精度高于86.0%,说明该方法是一种致密砂岩储层分类评价行之有效的方法。不同类型储层物性、储集空间、毛管压力曲线以及微观孔隙结构特征存在明显差异。I、II、III类储层的孔隙发育程度与连通性、物性依次变差;而排驱压力、均值系数与孔喉比在I、II、III类储层中依次增大。
Claims (3)
1.一种基于多核支持向量机的致密砂岩储层分类方法,其特征在于,包括以下步骤:
步骤一:在以结构渗流系数、排驱压力、最大孔喉半径、中值压力、中值半径、均值系数、分选系数、歪度系数、最大进汞饱和度、变异系数、未饱和汞饱和度、均值系数、残余汞饱和度、退汞饱和度、退出效率、孔喉比为致密砂岩岩样的微观空隙结构特征参数的基础上,利用lasso的L1正则化实现数据的降维;最终选择结构渗流系数、排驱压力、中值半径、均值系数、退汞效率、孔喉比为表征致密砂岩岩样的6个特征参数;
Lasso回归函数为:
其中,N为样本个数,w为回归系数,k为回归系数个数,x为样本,y为样本对应的标签,第一个累加的计算结果为模型回归的损失函数,第二个累加为正则化项,其中λ为收缩因子,|w|为L1范数;
步骤二:将步骤一获取的降维后的6个致密砂岩岩样微观空隙结构特征参数表征的样本数据按照(70-80):(30-20)的比例分为两组,一组作为训练样本,一组作为测试样本;
步骤三:将支持向量机模型的核函数,即SVM的核函数,包括:线性核函数linearkernel、多项式核函数polynomial kernel、多元二次核函数multiquadric kernel、Sigmoid核函数sigmoid kernel、幂指数核函数exponentialkernel、高斯径向基核函数rbfkernel、拉普拉斯核函数laplacian kernel的线性组合作为待选的多核支持向量机模型的核函数,简称MK-SVM模型的核函数;
步骤四:将步骤三列出的核函数的线性组合,代入MK-SVM模型中,将训练样本输入到模型中进行训练,最终得到训练结果;
步骤五:根据步骤四的训练结果,将线性核函数Linear Kernel、多项式核函数polynomial Kernel、多元二次核函数multiquadric kernel、拉普拉斯核函数LaplacianKernel这四种核函数的线性组合作为MK-SVM模型的核函数;
从而得到优化后的核函数公式:
步骤六:在MK-SVM模型训练完毕之后,将测试样本输入到训练好的MK-SVM模型得到预测的分类结果,利用预测的分类结果和测试样本真实的分类结果计算出机器学习的准确率、宏观精确率和宏观F1分数三个评价模型性能的指标,该指标作为评价MK-SVM模型的分类性能的标准。
2.根据权利要求1所述的一种基于多核支持向量机的致密砂岩储层分类方法,其特征在于,包括以下步骤:
步骤三所述的核函数,具体为:
高斯径向基核函数Gaussian radial basis kernel function
幂指数核函数Exponential Kernel function
拉普拉斯核函数Laplacian kernel function
多元二次核函数Multiquadric kernel function
线性核函数Linear kernel function
K(x,xi)=x*xi+C2,C2为线性核函数中的超参数 (6)
多项式核函数Polynomial kernel function
K(x,xi)=[(x*xi)+C3]d,C3,d为多项式核函数中的超参数 (7)
Sigmoid核函数分别如下式所示:
K(x,xi)=tanh(αxTxi)+C4),α,C4为Sigmoid核函数中的超参数 (8)
其中,x,xi为样本空间中的两个任意样本;
对每个核函数赋以不同的权值系数,从而构造一个线性组合的核函数,其表达式为:
其中,x,xi为样本空间中的样本向量,N为样本向量中的向量个数,α为权向量,y为输入样本对应的标签,b为偏置;M为核函数的个数,β为各个核函数的权系数,且为构造的几类核函数的线性组合;多核的约束优化(ConstrainedOptimization)函数表示为:
其中,α,β如上所述,αi为向量α中的第i个分量,C为惩罚参数。
3.根据权利要求1所述的一种基于多核支持向量机的致密砂岩储层分类方法,其特征在于,包括以下步骤:
所述的步骤四的训练方法如下:
MK-SVM模型的训练过程中,模型的训练误差精度为0.0001,训练的最大迭代次数为2000次,训练采用3折交叉验证保证训练结果的可靠性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210809396.9A CN115099357A (zh) | 2022-07-11 | 2022-07-11 | 一种基于多核支持向量机的致密砂岩储层分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210809396.9A CN115099357A (zh) | 2022-07-11 | 2022-07-11 | 一种基于多核支持向量机的致密砂岩储层分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115099357A true CN115099357A (zh) | 2022-09-23 |
Family
ID=83296844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210809396.9A Pending CN115099357A (zh) | 2022-07-11 | 2022-07-11 | 一种基于多核支持向量机的致密砂岩储层分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115099357A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117828488A (zh) * | 2024-03-05 | 2024-04-05 | 华北电力大学 | 一种基于随机森林与稳健回归的太阳辐射度预测方法 |
-
2022
- 2022-07-11 CN CN202210809396.9A patent/CN115099357A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117828488A (zh) * | 2024-03-05 | 2024-04-05 | 华北电力大学 | 一种基于随机森林与稳健回归的太阳辐射度预测方法 |
CN117828488B (zh) * | 2024-03-05 | 2024-05-28 | 华北电力大学 | 一种基于随机森林与稳健回归的太阳辐射度预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105760673B (zh) | 一种河流相储层地震敏感参数模板分析方法 | |
CN112613536B (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN107292350A (zh) | 大规模数据的异常检测方法 | |
CN110751101B (zh) | 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法 | |
CN112557034A (zh) | 一种基于pca_cnns的轴承故障诊断方法 | |
CN101984340A (zh) | 一种基于人工智能的软性磨粒两相湍流流型识别方法 | |
CN113420795B (zh) | 一种基于空洞卷积神经网络的矿物光谱分类方法 | |
CN115099357A (zh) | 一种基于多核支持向量机的致密砂岩储层分类方法 | |
CN112395763B (zh) | 一种自动历史拟合方法 | |
CN113379256A (zh) | 一种Kmeans-随机森林的储层评价预测方法 | |
CN112289391A (zh) | 一种基于机器学习的阳极铝箔性能预测系统 | |
CN112364899A (zh) | 一种基于虚拟图像与迁移学习的磨粒铁谱图像智能识别方法 | |
Kumar et al. | Comparative analysis of SOM neural network with K-means clustering algorithm | |
CN116562174A (zh) | 一种配注水量确定方法及装置 | |
Devanta | Optimization of the K-Means Clustering Algorithm Using Davies Bouldin Index in Iris Data Classification | |
CN113159225A (zh) | 多变量工业过程故障分类方法 | |
CN111832951A (zh) | 用于评价小断块特低渗储层油藏开发价值的方法和系统 | |
CN116127398B (zh) | 一种基于机理模型与多源数据融合的液压泵故障诊断方法 | |
CN114638147A (zh) | 一种油气藏压裂工艺参数确定方法 | |
CN116257765A (zh) | 基于相似度计算模型的调剖调驱参数类比推荐方法和装置 | |
CN116303626A (zh) | 一种基于特征优化和在线学习的固井泵压预测方法 | |
CN113627640B (zh) | 一种针对缝洞型油藏油气井的产能试井预测方法及系统 | |
CN113657441A (zh) | 基于加权皮尔逊相关系数并结合特征筛选的分类算法 | |
CN112308160A (zh) | 一种k—均值聚类人工智能优化算法 | |
CN117407841B (zh) | 一种基于优化集成算法的页岩层理缝预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |