CN113807021A

CN113807021A - 一种基于指标分析及多模型融合的气井产能等级预测方法

Info

Publication number: CN113807021A
Application number: CN202111152813.9A
Authority: CN
Inventors: 杨兆中; 赵治钢; 李小刚; 闵超; 贺宇廷
Original assignee: Southwest Petroleum University
Current assignee: Southwest Petroleum University
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2021-12-17
Anticipated expiration: 2041-09-29
Also published as: CN113807021B

Abstract

本发明公开一种基于指标分析及多模型融合的气井产能等级预测方法，包括获取目标储层数据；并计算出各历史井层的产能等级；确定出影响无阻流量的q个参数；对各参数进行偏相关系数排序；对各参数进行灰色关联系数排序；确定参数的最终排序结果，选取模型准确度最高的参数作为模型的指标参数；建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测，将三种分类器的结果通过投票法进行融合，及取预测结果的众数作为最终的结果；如果没有众数，则找出所有与预测结果相同等级的历史井数据组成历史分析数据库；如果有多个众数，则找出与众数预测结果相同等级的历史井数据组成历史分析数据库；通过对比目标井层与历史井层最相似的结果作为最终结果。

Description

一种基于指标分析及多模型融合的气井产能等级预测方法

技术领域

本发明涉及一种基于指标分析及多模型融合的气井产能等级预测方法。

背景技术

致密低渗气藏在开发过程中，为了获得工业气流，需要对气藏采取适当的压裂增产措施。在压裂施工结束后，储层产能评价与预测对于气田的开发有着重要的意义，它既能评价压裂施工的效果，判断增产措施的有效性，又可以为后期的单井陪产、井网部署等生产规划提供依据。

压裂施工后的产能是地质数据、施工数据等多因素影响的结果，目前常用的方法是产能试井，通过多次改变气井的工作制度，测量在各个不同工作制度下的稳定产量与井底压力，从而确定气井的产能。这种测试方法需要改变工作制度，容易伤害储层，引起储层出砂。同时测试时间较长，增加测试费用。

发明内容

为了克服现有技术中的问题，本发明提供一种基于指标分析及多模型融合的气井产能等级预测方法。

本发明解决上述技术问题所提供的技术方案是：一种基于指标分析及多模型融合的气井产能等级预测方法，包括以下步骤：

步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数；

步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S，并计算出各历史井层的产能等级；

当a≥0.5S时，该历史井层的产能等级为4；当0.5S＞a≥0.25S时，该历史井层的产能等级为3；当0.25S＞a≥0.125S时，该历史井层的产能等级为2；当a＜0.125S时，该历史井层的产能等级为1；

步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数；

步骤S4、将q个参数进一步计算出Pearson相关系数矩阵，并做出相关系数矩阵热力图，得到各影响参数之间的相关系数；

步骤S5、通过比较各参数两两之间相关系数的大小，筛选出参数之间相关系数大于0.8的参数组成一组，最终得到n组共m个参数，并将剩下的q-m个数据组成一组；保留筛选出的n组中每一组与无阻流量相关系数最大的参数，其余参数全部删掉，得到n个参数，并将这n个参数放入之前q-m个数据中，共q-m+n个参数；

步骤S6、将q-m+n个参数在Pearson相关分析的基础上，对影响无阻流量的因素进行偏相关分析，得到各参数与无阻流量的偏相关系数，并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序；

步骤S7、将q-m+n个参数再在Pearson相关分析的基础上，对影响无阻流量的因素进行灰色关联分析，得到各参数与无阻流量的灰色关联系数，并根据灰色关联系数对各参数进行灰色关联系数排序；

步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果；

步骤S9、根据参数的最终排序结果，首先选取排在前面的5个参数作为初始输入参数，将参数输入SVM模型，记录模型准确度，然后根据排序结果依次递增参数个数，记录模型准确度；对比分析参数个数对模型准确度的影响，选取模型准确度最高的参数作为模型的指标参数；

步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测，再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级，将三种分类器的结果通过投票法进行融合，及取预测结果的众数作为最终的结果；如果没有众数，则找出所有与预测结果相同等级的历史井数据组成历史分析数据库；如果有多个众数，则找出与众数预测结果相同等级的历史井数据组成历史分析数据库；通过对比目标井层与历史井层最相似的结果作为最终结果。

进一步的技术方案是，所述储层参数包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度；所述施工参数包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量。

进一步的技术方案是，所述步骤S3中首先定性分析影响无阻流量的参数，做出各参数与无阻流量的散点图，并画出数据趋势线，分析各参数对无阻流量的影响，选取与无阻流量有变化趋势的参数为影响无阻流量的q个参数。

进一步的技术方案是，所述步骤S6中各参数与无阻流量的偏相关系数的计算过程为：

将q-m+n个参数再一次计算Pearson相关系数，得到新的Pearson相关系数矩阵R；

对新的Pearson相关系数矩阵R求逆；

再计算出各参数与无阻流量的偏相关系数；

式中：c_ij为参数与无阻流量的偏相关系数。

进一步的技术方案是，所述步骤S7中各参数与无阻流量的灰色关联系数的计算过程为：

将q-m+n个参数组成一个原始序列；该原始序列中无阻流量为参考数列，除无阻流量外的其他参数构成比较数列，其数列分别表示为：

x₀＝{x₀(1),x₀(2),x₀(3),…,x₀(n)}

x_i＝{x_i(1),x_i(2),x_i(3),…,x_i(n)}(i＝1,2,…,m)

式中：x₀为参考数列；x_i为比较数列；i为比较数列的序号；m为数列中数据样品的个数；n为自变量因素的个数；

通过数据归一化方法将原始数据进行无量纲化处理；

根据下式计算各参数与无阻流量的灰色关联系数；

Δ_oi(k)＝|Y_i(k)-Y₀(k)|

式中：ρ为分辨系数，通常取0.5。

进一步的技术方案是，所述步骤S8中的具体过程为：将偏相关系数排序和灰色关联系数排序中都排在前面的参数也排在前面，将两者排序相差较大的指标以灰色关联系数排序的结果作为结论，得到各参数的最终排序结果。

进一步的技术方案是，所述步骤S10中通过对比目标井层与历史井层最相似的结果作为最终结果的具体过程为：

分别根据支持向量机、K近邻、随机森林三个分类器的预测产能等级确定出相同预测产能等级的历史井层数据；

再根据下式分别计算目标井层与支持向量机、K近邻、随机森林三个分类器相同预测产能等级的历史井层的差异；

r＝(r₁,r₂,…,r_n)

X＝(X₁,X₂,…,X_n)

L＝(L₁,L₂,…,L_n)

式中：σ为井层间的差异；

选取差异最小对应的预测产能等级为最终结果。

本发明具有以下有益效果：提出了一种基于指标筛选及多模型融合的气井产能等级预测方法。综合考虑多种指标分析的结果，提高了单一指标筛选方法的可靠性，通过多模型的融合，在单一模型的基础上提高了模型的准确度。同时该方法预测气井产能时不需要进行产能试井，规避了产能试井对储层带来的伤害，降低了产能试井成本。并基于本发明，选取实例某气田的井层进行应用，通过验证发现本模型的准确度与单一模型准确度相比提高了7％，说明了该方法的有效性。

附图说明

图1为地质参数与无阻流量的关系图；

图2为部分地质参数与无阻流量的关系图；

图3为测井参数与无阻流量的关系图；

图4为不同烃含量水平段长度与无阻流量的关系图；

图5为施工参数与无阻流量的关系图；

图6为相关系数热力图；

图7为指标个数与准确度图关系图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的一种基于指标分析及多模型融合的气井产能等级预测方法，包括以下步骤：

1)储层参数

储层参数表征了地层的油气含量和油气渗流条件，包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度等。有效厚度、含气饱和度和平均全烃越大，说明储层油气含量越多，更容易获得工业产能。渗透率、孔隙度说明了油气渗流条件，越大越有利于油气的流动。温度影响着油气的粘度，粘度的大小也影响着油气渗流。水平段长度，一方面可以表征油气的含量，同时还能表示油气的渗流面积。各影响因素与无阻流量的关系如图1和2所示：

从图1和2中可以看出气测显示砂岩段长度、含气饱额度、水平段长度、砂岩长度等参数与无阻流量成正相关。砂岩长度、气测显示砂岩长度、含气饱合度都可以表示烃含量的大小，这些参数越大，烃含量就越多；水平段长度越长可以增加井筒与地层的接触面积。同时泥岩长度与无阻流量成负相关，因为泥岩越长砂岩越短。

除此之外GR(自然伽马)、AC(声波时差)、CNL(补偿中子)、DEN(补偿密度)、LLD(深感应电阻率)也表征了储层的特征。GR可以分析地层的岩性；AC可以分析地层孔隙度、地层岩性和判断气层；CNL可用于分析储层的孔隙度等参数；DEN可用于储层划分和孔隙度确定等；LLD可分析地层流体性质，用于确定油气饱和度。各影响因素与无阻流量的关系如图3所示：

从图3中分析，这些测井参数似乎与无阻流量的关系不大，但这些测井参数也可以反映储层特征，因此可以用来分析无阻流量。

最后根据147口水平井的录井数据，分析了近5000个与全烃有关的数据，统计出全烃含量大于等于10％、全烃含量大于等于20％、全烃含量大于等于30％、全烃含量大于等于40％对应的水平段长，与无阻流量的关系如图4所示：

从图4可以发现，因为这一参数与烃含量直接相关，因此也会影响无阻流量。但是这四个参数具有线性关系，在下一步分析中可以删去一些参数。

2)施工参数

施工参数表征了地下裂缝的发展情况，说明了油气渗流环境的改善条件，包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量等。各影响因素与无阻流量间的关系如图5所示：

压裂段数、总液量、液氮用量、总砂量、平均每段加砂量与无阻流量正相关。压裂段数越多总液量总砂量等参数越大，越可能形成有效的支撑裂缝，无阻流量也就越高，同时返排液量与无阻流量成负相关，当返排液少时，留在地层中的流体可能对地层造成伤害。

将上一步确定的q个影响因素进行Pearson相关分析，Pearson相关用于评估两个连续变量之间的线性关联强度，其目的是剔除彼此之间线性关系较高的参数，降低数据的维度。设X、Y为样本数据，其计算公式为：

式中：Cov(X,Y)为X，Y的协方差，D(X)，D(Y)分别为X，Y的方差。

上式可写为：

式中：X_i,Y_i分别为第i个样本元素X和Y的值，

分别为所有样本元素X和Y的均值。

计算出Pearson相关系数矩阵后，做出相关系数矩阵热力图，可直观的看到各参数之间的相关系数大小。通过比较各参数两两之间相关系数的大小，筛选出影响因素之间相关系数大于0.8的参数组成一组，最终得到n组共m个参数(m>n),并将剩下的q-m个数据组成一组。保留筛选出的n组中每一组与无阻流量相关系数最大的参数，其余参数全部删掉，得到n个参数，并将这n个参数放入之前q-m个数据中，共q-m+n个参数，准备下一步分析，完成指标的初次筛选。

得到相关系数热力图如图6所示：

通过分析相关系数结果发现，有效厚度与砂厚之间；水平段长度、砂岩长度之间；平均全烃、全烃最大值、全烃含量大于30％长度、全烃含量大于40％长度之间；泥岩长度、砂岩长度、气测显示砂岩长度、全烃含量大于10％长度之间；总砂量与平均每段加砂量、总液量、压裂段数、液氮用量之间有较高的线性相关性。储层砂岩越厚则有效厚度也就越大，同样的，水平段长度越长，砂岩长度也就越长。平均全烃、全烃最大值、全烃含量大于30％长度、全烃含量大于40％长度都是反映的烃含量，因此也有线性关系。而全烃含量大于10％长度与气测显示砂岩长度相差不大，因此具有线性关系。平均每段加砂量、总液量、压裂段数、液氮用量越大则泵入地层的砂量越大，因此线性相关。通过对比这些线性参数与无阻流量相关性的大小，最终删除砂厚、平均每段加砂量、总液量、压裂段数、液氮用量、水平段长度、泥岩长度、全烃最大值11个参数。另外孔隙度与AC的相关性较高，而且孔隙度与AC存在联系，因此删除AC。

偏相关分析

Pearson相关分析在计算变量间相关程度过程中，只考虑所涉及的两个变量之间的关系。如果实际的问题模型仅有两个变量，那么通过这种方法可以获得代表他们之间相关程度的数值。但是对于一个包含多个变量的问题模型，由于任意两个变量间都可能存在不同程度的相关性，如果只考虑所涉及两个变量间的简单相关系数往往不能确切地反映他们之间的关系。因为两个变量之间本身存在着相互影响，同时，一个变量可能通过这两个变量之外的一个或多个变量间接对另一个变量产生影响。为了考察两个变量间的真实关联程度，就要去掉其他所有可能的变量所产生的影响。因此，可以进行偏相关分析，其对应的相关度可以用偏相关系数来表示。

其计算方法为：

将上一步分析得到的q-m+n个参数再一次计算Pearson相关系数，得到新的Pearson相关系数矩阵：

对矩阵R求逆：

则可求得x_i和x_j间的偏相关系数为：

根据偏相关系数绝对值的大小，对各参数进行排序。

根据上述方法，在Pearson相关分析的基础上，对影响无阻流量的因素进行偏相关分析，得到各参数与无阻流量的相关系数如下表所示:

表1偏相关系数表

指标	总砂量	DEN	返排液量	泵压	LLD	排量
							相关	0.2466	0.2332	0.1900	0.1602	0.1590	0.1305
指标	平均全烃	CNL	返排率	砂岩长度	含气饱和度	有效厚度
							相关	0.1097	0.0990	0.0957	0.0564	0.0482	0.0327
指标	烃含量大	GR	温度	渗透率	孔隙度	气测显示
							相关	0.0257	0.0255	0.0128	0.0022	0.0020	0.0003

偏相关分析的排序与前面相关分析结果对比发现，相关系数大的指标如总砂量、返排液量等排序变化不大，而相关系数小的指标排序变化较大，其原因可能是在进行偏相关分析时，删掉了部分参数，从而影响了剩下参数相关系数的变化。

灰色关联法分析步骤如下：

(1)原始序列确定

将第二步Pearson相关分析得到的q-m+n个参数组成一个原始序列。该序列由一个因变量和多个自变量因素组成。其中，因变量因素反映系统的行为特征，因素的多个样品数据值构成参考数列，因此无阻流量即为参考数列；自变量因素为影响系统行为特征的因素，每一个因素的多个样品数据值可构成一个比较数列，因此除无阻流量外的其他参数构成比较数列。数列分别表示为：

x₀＝{x₀(1),x₀(2),x₀(3),…,x₀(n)} (6)

x_i＝{x_i(1),x_i(2),x_i(3),…,x_i(n)}(i＝1,2,…,m) (7)

式中：x₀为参考数列；x_i为比较数列；i为比较数列的序号；m为数列中数据样品的个数；n为自变量因素的个数。

(2)原始数据处理

由于原始数据序列中各因素的计量单位不尽相同，不同的数列有不同的数量级和量纲，需要数据归一化方法将原始数据无量纲化。

(3)关联系数计算

根据邓氏关联度模型对原始数据进行无量纲化处理后，将比较数列(第i个)中每一个样品数值和参考数列中所对应的样品数值之间的绝对差值用下式表示：

Δ_oi(k)＝|Y_i(k)-Y₀(k)| (9)

在全部比较数列中，最大和最小样品数据绝对差值为:

邓氏关联系数表示为：

式中：ρ为分辨系数，ρ∈(0,1)，通常取0.5。

(4)关联度计算

由单个关联系数反映出的信息具有分散性，如果仅仅用n个关联系数对比较数列和参考数列之间的关联程度进行表示，根本无法反映各个因素对产量影响程度的大小。因此，需要集中处理关联信息，用其平均值对数列间的关联程度进行定量反映。

式中：r_oi为第i个比较数列和参考数列之间关联度。将各参数的灰色关联系数进行排序。

通过比较偏相关系数排序与灰色关联系数排序确定最终的排序结果。将两种排序方法都排在前面的参数也排在前面，将两者排序相差较大的指标以灰色关联分析的结果作为结论，得到各参数最终排序。

根据上述方法，在Pearson相关分析的基础上，对影响无阻流量的因素进行灰色关联分析，得到各参数与无阻流量的灰色关联系数如下表所示:

表2灰色关联度系数表

指标	总砂	砂岩长度	气测显	LLD	排量	DEN
							相关	0.8197	0.8116	0.8096	0.8041	0.8012	0.8006
指标	GR	含气饱和度	泵压	温度	平均全烃	CNL
							相关	0.7994	0.7986	0.7962	0.7955	0.7939	0.7895
指标	孔隙	有效厚度	烃含量	返排液量	渗透率	返排率
							相关	0.7885	0.7881	0.7766	0.7663	0.7578	0.7460

通过对比灰色关联分析结果与偏相关分析结果，同样可以得到，相关系数较大的指标最终排序结果变化不大，为了得到最终排序结果，对比分析灰色关联分析结论与偏相关分析结论，将两种方法都排在前面的指标最终也排在前面，将两者排序相差较大的指标以灰色关联分析的结果作为结论，最终排序结果如下：总砂量、LLD、排量、DEN、砂岩长度、含气饱和度、气测显示砂岩段长、GR、泵压、平均全烃、有效厚度、CNL、温度、返排液量、孔隙度、全烃含量大于20％段长、返排率、渗透率。

根据参数最终排序结果，首先选取排在前面的5个参数作为初始输入参数，将参数输入SVM模型，记录模型准确度，然后根据排序结果依次递增参数个数，记录模型准确度。对比分析参数个数对模型准确度的影响，选取模型准确度最高的参数作为模型的指标。

首先选取总砂量、LLD、排量、DEN、砂岩长度5个指标用SVM进行无阻流量预测，得到准确度为39.39％，增加指标个数时，结果如下表所示：

表3SVM训练准确度

将上表数据绘制成如图7所示的折线图：

通过图7可以发现：随着指标个数增多，准确度会趋于平稳，最终会下降，选取准确度最高，指标个数最小的点为指标个数。根据现场经验，需要考虑地质因素，故增加渗透率。训练后发现准度提高，为51.51％。因此最终选择总砂量、LLD、排量、DEN、砂岩长度、含气饱和度、气测显示砂岩段长、GR、泵压、平均全烃、有效厚度、CNL、温度、返排液量、渗透率15个指标；

r＝(r₁,r₂,…,r_n)

X＝(X₁,X₂,…,X_n)

L＝(L₁,L₂,…,L_n)

式中：σ为井层间的差异；

选取差异最小对应的预测产能等级为最终结果。

以上所述，并非对本发明作任何形式上的限制，虽然本发明已通过上述实施例揭示，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，可利用上述揭示的技术内容作出些变动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。