CN113807021A - 一种基于指标分析及多模型融合的气井产能等级预测方法 - Google Patents

一种基于指标分析及多模型融合的气井产能等级预测方法 Download PDF

Info

Publication number
CN113807021A
CN113807021A CN202111152813.9A CN202111152813A CN113807021A CN 113807021 A CN113807021 A CN 113807021A CN 202111152813 A CN202111152813 A CN 202111152813A CN 113807021 A CN113807021 A CN 113807021A
Authority
CN
China
Prior art keywords
parameters
correlation coefficient
historical
well layer
unimpeded flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111152813.9A
Other languages
English (en)
Other versions
CN113807021B (zh
Inventor
杨兆中
赵治钢
李小刚
闵超
贺宇廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202111152813.9A priority Critical patent/CN113807021B/zh
Publication of CN113807021A publication Critical patent/CN113807021A/zh
Application granted granted Critical
Publication of CN113807021B publication Critical patent/CN113807021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Primary Health Care (AREA)
  • Geometry (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于指标分析及多模型融合的气井产能等级预测方法,包括获取目标储层数据;并计算出各历史井层的产能等级;确定出影响无阻流量的q个参数;对各参数进行偏相关系数排序;对各参数进行灰色关联系数排序;确定参数的最终排序结果,选取模型准确度最高的参数作为模型的指标参数;建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。

Description

一种基于指标分析及多模型融合的气井产能等级预测方法
技术领域
本发明涉及一种基于指标分析及多模型融合的气井产能等级预测方法。
背景技术
致密低渗气藏在开发过程中,为了获得工业气流,需要对气藏采取适当的压裂增产措施。在压裂施工结束后,储层产能评价与预测对于气田的开发有着重要的意义,它既能评价压裂施工的效果,判断增产措施的有效性,又可以为后期的单井陪产、井网部署等生产规划提供依据。
压裂施工后的产能是地质数据、施工数据等多因素影响的结果,目前常用的方法是产能试井,通过多次改变气井的工作制度,测量在各个不同工作制度下的稳定产量与井底压力,从而确定气井的产能。这种测试方法需要改变工作制度,容易伤害储层,引起储层出砂。同时测试时间较长,增加测试费用。
发明内容
为了克服现有技术中的问题,本发明提供一种基于指标分析及多模型融合的气井产能等级预测方法。
本发明解决上述技术问题所提供的技术方案是:一种基于指标分析及多模型融合的气井产能等级预测方法,包括以下步骤:
步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数;
步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S,并计算出各历史井层的产能等级;
当a≥0.5S时,该历史井层的产能等级为4;当0.5S>a≥0.25S时,该历史井层的产能等级为3;当0.25S>a≥0.125S时,该历史井层的产能等级为2;当a<0.125S时,该历史井层的产能等级为1;
步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数;
步骤S4、将q个参数进一步计算出Pearson相关系数矩阵,并做出相关系数矩阵热力图,得到各影响参数之间的相关系数;
步骤S5、通过比较各参数两两之间相关系数的大小,筛选出参数之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数,并将剩下的q-m个数据组成一组;保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数;
步骤S6、将q-m+n个参数在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的偏相关系数,并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序;
步骤S7、将q-m+n个参数再在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数,并根据灰色关联系数对各参数进行灰色关联系数排序;
步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果;
步骤S9、根据参数的最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度;对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标参数;
步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
进一步的技术方案是,所述储层参数包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度;所述施工参数包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量。
进一步的技术方案是,所述步骤S3中首先定性分析影响无阻流量的参数,做出各参数与无阻流量的散点图,并画出数据趋势线,分析各参数对无阻流量的影响,选取与无阻流量有变化趋势的参数为影响无阻流量的q个参数。
进一步的技术方案是,所述步骤S6中各参数与无阻流量的偏相关系数的计算过程为:
将q-m+n个参数再一次计算Pearson相关系数,得到新的Pearson相关系数矩阵R;
Figure BDA0003287699980000031
对新的Pearson相关系数矩阵R求逆;
Figure BDA0003287699980000032
再计算出各参数与无阻流量的偏相关系数;
Figure BDA0003287699980000041
式中:cij为参数与无阻流量的偏相关系数。
进一步的技术方案是,所述步骤S7中各参数与无阻流量的灰色关联系数的计算过程为:
将q-m+n个参数组成一个原始序列;该原始序列中无阻流量为参考数列,除无阻流量外的其他参数构成比较数列,其数列分别表示为:
x0={x0(1),x0(2),x0(3),…,x0(n)}
xi={xi(1),xi(2),xi(3),…,xi(n)}(i=1,2,…,m)
式中:x0为参考数列;xi为比较数列;i为比较数列的序号;m为数列中数据样品的个数;n为自变量因素的个数;
通过数据归一化方法将原始数据进行无量纲化处理;
Figure BDA0003287699980000042
根据下式计算各参数与无阻流量的灰色关联系数;
Δoi(k)=|Yi(k)-Y0(k)|
Figure BDA0003287699980000043
Figure BDA0003287699980000044
Figure BDA0003287699980000045
式中:ρ为分辨系数,通常取0.5。
进一步的技术方案是,所述步骤S8中的具体过程为:将偏相关系数排序和灰色关联系数排序中都排在前面的参数也排在前面,将两者排序相差较大的指标以灰色关联系数排序的结果作为结论,得到各参数的最终排序结果。
进一步的技术方案是,所述步骤S10中通过对比目标井层与历史井层最相似的结果作为最终结果的具体过程为:
分别根据支持向量机、K近邻、随机森林三个分类器的预测产能等级确定出相同预测产能等级的历史井层数据;
再根据下式分别计算目标井层与支持向量机、K近邻、随机森林三个分类器相同预测产能等级的历史井层的差异;
r=(r1,r2,…,rn)
X=(X1,X2,…,Xn)
L=(L1,L2,…,Ln)
Figure BDA0003287699980000051
Figure BDA0003287699980000052
式中:σ为井层间的差异;
选取差异最小对应的预测产能等级为最终结果。
本发明具有以下有益效果:提出了一种基于指标筛选及多模型融合的气井产能等级预测方法。综合考虑多种指标分析的结果,提高了单一指标筛选方法的可靠性,通过多模型的融合,在单一模型的基础上提高了模型的准确度。同时该方法预测气井产能时不需要进行产能试井,规避了产能试井对储层带来的伤害,降低了产能试井成本。并基于本发明,选取实例某气田的井层进行应用,通过验证发现本模型的准确度与单一模型准确度相比提高了7%,说明了该方法的有效性。
附图说明
图1为地质参数与无阻流量的关系图;
图2为部分地质参数与无阻流量的关系图;
图3为测井参数与无阻流量的关系图;
图4为不同烃含量水平段长度与无阻流量的关系图;
图5为施工参数与无阻流量的关系图;
图6为相关系数热力图;
图7为指标个数与准确度图关系图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的一种基于指标分析及多模型融合的气井产能等级预测方法,包括以下步骤:
步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数;
步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S,并计算出各历史井层的产能等级;
当a≥0.5S时,该历史井层的产能等级为4;当0.5S>a≥0.25S时,该历史井层的产能等级为3;当0.25S>a≥0.125S时,该历史井层的产能等级为2;当a<0.125S时,该历史井层的产能等级为1;
步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数;
1)储层参数
储层参数表征了地层的油气含量和油气渗流条件,包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度等。有效厚度、含气饱和度和平均全烃越大,说明储层油气含量越多,更容易获得工业产能。渗透率、孔隙度说明了油气渗流条件,越大越有利于油气的流动。温度影响着油气的粘度,粘度的大小也影响着油气渗流。水平段长度,一方面可以表征油气的含量,同时还能表示油气的渗流面积。各影响因素与无阻流量的关系如图1和2所示:
从图1和2中可以看出气测显示砂岩段长度、含气饱额度、水平段长度、砂岩长度等参数与无阻流量成正相关。砂岩长度、气测显示砂岩长度、含气饱合度都可以表示烃含量的大小,这些参数越大,烃含量就越多;水平段长度越长可以增加井筒与地层的接触面积。同时泥岩长度与无阻流量成负相关,因为泥岩越长砂岩越短。
除此之外GR(自然伽马)、AC(声波时差)、CNL(补偿中子)、DEN(补偿密度)、LLD(深感应电阻率)也表征了储层的特征。GR可以分析地层的岩性;AC可以分析地层孔隙度、地层岩性和判断气层;CNL可用于分析储层的孔隙度等参数;DEN可用于储层划分和孔隙度确定等;LLD可分析地层流体性质,用于确定油气饱和度。各影响因素与无阻流量的关系如图3所示:
从图3中分析,这些测井参数似乎与无阻流量的关系不大,但这些测井参数也可以反映储层特征,因此可以用来分析无阻流量。
最后根据147口水平井的录井数据,分析了近5000个与全烃有关的数据,统计出全烃含量大于等于10%、全烃含量大于等于20%、全烃含量大于等于30%、全烃含量大于等于40%对应的水平段长,与无阻流量的关系如图4所示:
从图4可以发现,因为这一参数与烃含量直接相关,因此也会影响无阻流量。但是这四个参数具有线性关系,在下一步分析中可以删去一些参数。
2)施工参数
施工参数表征了地下裂缝的发展情况,说明了油气渗流环境的改善条件,包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量等。各影响因素与无阻流量间的关系如图5所示:
压裂段数、总液量、液氮用量、总砂量、平均每段加砂量与无阻流量正相关。压裂段数越多总液量总砂量等参数越大,越可能形成有效的支撑裂缝,无阻流量也就越高,同时返排液量与无阻流量成负相关,当返排液少时,留在地层中的流体可能对地层造成伤害。
步骤S4、将q个参数进一步计算出Pearson相关系数矩阵,并做出相关系数矩阵热力图,得到各影响参数之间的相关系数;
步骤S5、通过比较各参数两两之间相关系数的大小,筛选出参数之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数,并将剩下的q-m个数据组成一组;保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数;
步骤S6、将q-m+n个参数在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的偏相关系数,并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序;
将上一步确定的q个影响因素进行Pearson相关分析,Pearson相关用于评估两个连续变量之间的线性关联强度,其目的是剔除彼此之间线性关系较高的参数,降低数据的维度。设X、Y为样本数据,其计算公式为:
Figure BDA0003287699980000081
式中:Cov(X,Y)为X,Y的协方差,D(X),D(Y)分别为X,Y的方差。
上式可写为:
Figure BDA0003287699980000091
式中:Xi,Yi分别为第i个样本元素X和Y的值,
Figure BDA0003287699980000092
分别为所有样本元素X和Y的均值。
计算出Pearson相关系数矩阵后,做出相关系数矩阵热力图,可直观的看到各参数之间的相关系数大小。通过比较各参数两两之间相关系数的大小,筛选出影响因素之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数(m>n),并将剩下的q-m个数据组成一组。保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数,准备下一步分析,完成指标的初次筛选。
得到相关系数热力图如图6所示:
通过分析相关系数结果发现,有效厚度与砂厚之间;水平段长度、砂岩长度之间;平均全烃、全烃最大值、全烃含量大于30%长度、全烃含量大于40%长度之间;泥岩长度、砂岩长度、气测显示砂岩长度、全烃含量大于10%长度之间;总砂量与平均每段加砂量、总液量、压裂段数、液氮用量之间有较高的线性相关性。储层砂岩越厚则有效厚度也就越大,同样的,水平段长度越长,砂岩长度也就越长。平均全烃、全烃最大值、全烃含量大于30%长度、全烃含量大于40%长度都是反映的烃含量,因此也有线性关系。而全烃含量大于10%长度与气测显示砂岩长度相差不大,因此具有线性关系。平均每段加砂量、总液量、压裂段数、液氮用量越大则泵入地层的砂量越大,因此线性相关。通过对比这些线性参数与无阻流量相关性的大小,最终删除砂厚、平均每段加砂量、总液量、压裂段数、液氮用量、水平段长度、泥岩长度、全烃最大值11个参数。另外孔隙度与AC的相关性较高,而且孔隙度与AC存在联系,因此删除AC。
偏相关分析
Pearson相关分析在计算变量间相关程度过程中,只考虑所涉及的两个变量之间的关系。如果实际的问题模型仅有两个变量,那么通过这种方法可以获得代表他们之间相关程度的数值。但是对于一个包含多个变量的问题模型,由于任意两个变量间都可能存在不同程度的相关性,如果只考虑所涉及两个变量间的简单相关系数往往不能确切地反映他们之间的关系。因为两个变量之间本身存在着相互影响,同时,一个变量可能通过这两个变量之外的一个或多个变量间接对另一个变量产生影响。为了考察两个变量间的真实关联程度,就要去掉其他所有可能的变量所产生的影响。因此,可以进行偏相关分析,其对应的相关度可以用偏相关系数来表示。
其计算方法为:
将上一步分析得到的q-m+n个参数再一次计算Pearson相关系数,得到新的Pearson相关系数矩阵:
Figure BDA0003287699980000101
对矩阵R求逆:
Figure BDA0003287699980000102
则可求得xi和xj间的偏相关系数为:
Figure BDA0003287699980000103
根据偏相关系数绝对值的大小,对各参数进行排序。
根据上述方法,在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的相关系数如下表所示:
表1偏相关系数表
指标 总砂量 DEN 返排液量 泵压 LLD 排量
相关 0.2466 0.2332 0.1900 0.1602 0.1590 0.1305
指标 平均全烃 CNL 返排率 砂岩长度 含气饱和度 有效厚度
相关 0.1097 0.0990 0.0957 0.0564 0.0482 0.0327
指标 烃含量大 GR 温度 渗透率 孔隙度 气测显示
相关 0.0257 0.0255 0.0128 0.0022 0.0020 0.0003
偏相关分析的排序与前面相关分析结果对比发现,相关系数大的指标如总砂量、返排液量等排序变化不大,而相关系数小的指标排序变化较大,其原因可能是在进行偏相关分析时,删掉了部分参数,从而影响了剩下参数相关系数的变化。
步骤S7、将q-m+n个参数再在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数,并根据灰色关联系数对各参数进行灰色关联系数排序;
灰色关联法分析步骤如下:
(1)原始序列确定
将第二步Pearson相关分析得到的q-m+n个参数组成一个原始序列。该序列由一个因变量和多个自变量因素组成。其中,因变量因素反映系统的行为特征,因素的多个样品数据值构成参考数列,因此无阻流量即为参考数列;自变量因素为影响系统行为特征的因素,每一个因素的多个样品数据值可构成一个比较数列,因此除无阻流量外的其他参数构成比较数列。数列分别表示为:
x0={x0(1),x0(2),x0(3),…,x0(n)} (6)
xi={xi(1),xi(2),xi(3),…,xi(n)}(i=1,2,…,m) (7)
式中:x0为参考数列;xi为比较数列;i为比较数列的序号;m为数列中数据样品的个数;n为自变量因素的个数。
(2)原始数据处理
由于原始数据序列中各因素的计量单位不尽相同,不同的数列有不同的数量级和量纲,需要数据归一化方法将原始数据无量纲化。
Figure BDA0003287699980000121
(3)关联系数计算
根据邓氏关联度模型对原始数据进行无量纲化处理后,将比较数列(第i个)中每一个样品数值和参考数列中所对应的样品数值之间的绝对差值用下式表示:
Δoi(k)=|Yi(k)-Y0(k)| (9)
在全部比较数列中,最大和最小样品数据绝对差值为:
Figure BDA0003287699980000122
Figure BDA0003287699980000123
邓氏关联系数表示为:
Figure BDA0003287699980000124
式中:ρ为分辨系数,ρ∈(0,1),通常取0.5。
(4)关联度计算
由单个关联系数反映出的信息具有分散性,如果仅仅用n个关联系数对比较数列和参考数列之间的关联程度进行表示,根本无法反映各个因素对产量影响程度的大小。因此,需要集中处理关联信息,用其平均值对数列间的关联程度进行定量反映。
Figure BDA0003287699980000131
式中:roi为第i个比较数列和参考数列之间关联度。将各参数的灰色关联系数进行排序。
通过比较偏相关系数排序与灰色关联系数排序确定最终的排序结果。将两种排序方法都排在前面的参数也排在前面,将两者排序相差较大的指标以灰色关联分析的结果作为结论,得到各参数最终排序。
根据上述方法,在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数如下表所示:
表2灰色关联度系数表
指标 总砂 砂岩长度 气测显 LLD 排量 DEN
相关 0.8197 0.8116 0.8096 0.8041 0.8012 0.8006
指标 GR 含气饱和度 泵压 温度 平均全烃 CNL
相关 0.7994 0.7986 0.7962 0.7955 0.7939 0.7895
指标 孔隙 有效厚度 烃含量 返排液量 渗透率 返排率
相关 0.7885 0.7881 0.7766 0.7663 0.7578 0.7460
步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果;
通过对比灰色关联分析结果与偏相关分析结果,同样可以得到,相关系数较大的指标最终排序结果变化不大,为了得到最终排序结果,对比分析灰色关联分析结论与偏相关分析结论,将两种方法都排在前面的指标最终也排在前面,将两者排序相差较大的指标以灰色关联分析的结果作为结论,最终排序结果如下:总砂量、LLD、排量、DEN、砂岩长度、含气饱和度、气测显示砂岩段长、GR、泵压、平均全烃、有效厚度、CNL、温度、返排液量、孔隙度、全烃含量大于20%段长、返排率、渗透率。
步骤S9、根据参数的最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度;对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标参数;
根据参数最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度。对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标。
首先选取总砂量、LLD、排量、DEN、砂岩长度5个指标用SVM进行无阻流量预测,得到准确度为39.39%,增加指标个数时,结果如下表所示:
表3SVM训练准确度
Figure BDA0003287699980000141
Figure BDA0003287699980000151
将上表数据绘制成如图7所示的折线图:
通过图7可以发现:随着指标个数增多,准确度会趋于平稳,最终会下降,选取准确度最高,指标个数最小的点为指标个数。根据现场经验,需要考虑地质因素,故增加渗透率。训练后发现准度提高,为51.51%。因此最终选择总砂量、LLD、排量、DEN、砂岩长度、含气饱和度、气测显示砂岩段长、GR、泵压、平均全烃、有效厚度、CNL、温度、返排液量、渗透率15个指标;
步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
分别根据支持向量机、K近邻、随机森林三个分类器的预测产能等级确定出相同预测产能等级的历史井层数据;
再根据下式分别计算目标井层与支持向量机、K近邻、随机森林三个分类器相同预测产能等级的历史井层的差异;
r=(r1,r2,…,rn)
X=(X1,X2,…,Xn)
L=(L1,L2,…,Ln)
Figure BDA0003287699980000152
Figure BDA0003287699980000161
式中:σ为井层间的差异;
选取差异最小对应的预测产能等级为最终结果。
以上所述,并非对本发明作任何形式上的限制,虽然本发明已通过上述实施例揭示,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,可利用上述揭示的技术内容作出些变动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (7)

1.一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,包括以下步骤:
步骤S1、获取目标储层各历史井层的无阻流量a、各历史井层储层参数和历史井施工参数以及目标井层储层参数、目标井施工参数;
步骤S2、根据各历史井的无阻流量a确定历史井层无阻流量最大值S,并计算出各历史井层的产能等级;
当a≥0.5S时,该历史井层的产能等级为4;当0.5S>a≥0.25S时,该历史井层的产能等级为3;当0.25S>a≥0.125S时,该历史井层的产能等级为2;当a<0.125S时,该历史井层的产能等级为1;
步骤S3、根据目标井层储层参数、目标井施工参数确定出影响无阻流量的q个参数;
步骤S4、将q个参数进一步计算出Pearson相关系数矩阵,并做出相关系数矩阵热力图,得到各影响参数之间的相关系数;
步骤S5、通过比较各参数两两之间相关系数的大小,筛选出参数之间相关系数大于0.8的参数组成一组,最终得到n组共m个参数,并将剩下的q-m个数据组成一组;保留筛选出的n组中每一组与无阻流量相关系数最大的参数,其余参数全部删掉,得到n个参数,并将这n个参数放入之前q-m个数据中,共q-m+n个参数;
步骤S6、将q-m+n个参数在Pearson相关分析的基础上,对影响无阻流量的因素进行偏相关分析,得到各参数与无阻流量的偏相关系数,并根据偏相关系数绝对值的大小对各参数进行偏相关系数排序;
步骤S7、将q-m+n个参数再在Pearson相关分析的基础上,对影响无阻流量的因素进行灰色关联分析,得到各参数与无阻流量的灰色关联系数,并根据灰色关联系数对各参数进行灰色关联系数排序;
步骤S8、根据偏相关系数排序和灰色关联系数排序确定参数的最终排序结果;
步骤S9、根据参数的最终排序结果,首先选取排在前面的5个参数作为初始输入参数,将参数输入SVM模型,记录模型准确度,然后根据排序结果依次递增参数个数,记录模型准确度;对比分析参数个数对模型准确度的影响,选取模型准确度最高的参数作为模型的指标参数;
步骤S10、建立支持向量机、K近邻、随机森林三个分类器用于产能等级预测,再将步骤S9中确定的模型的指标参数分别带入支持向量机、K近邻、随机森林三个分类器中预测目标井的产能等级,将三种分类器的结果通过投票法进行融合,及取预测结果的众数作为最终的结果;如果没有众数,则找出所有与预测结果相同等级的历史井数据组成历史分析数据库;如果有多个众数,则找出与众数预测结果相同等级的历史井数据组成历史分析数据库;通过对比目标井层与历史井层最相似的结果作为最终结果。
2.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述储层参数包括有效厚度、渗透率、含气饱和度、温度、水平段长度、平均全烃、孔隙度;所述施工参数包括平均每段加砂量、排量、泵压、返排率、总液量、压裂段数、液氮用量。
3.根据权利要求2所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S3中首先定性分析影响无阻流量的参数,做出各参数与无阻流量的散点图,并画出数据趋势线,分析各参数对无阻流量的影响,选取与无阻流量有变化趋势的参数为影响无阻流量的q个参数。
4.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S6中各参数与无阻流量的偏相关系数的计算过程为:
将q-m+n个参数再一次计算Pearson相关系数,得到新的Pearson相关系数矩阵R;
Figure FDA0003287699970000031
对新的Pearson相关系数矩阵R求逆;
Figure FDA0003287699970000032
再计算出各参数与无阻流量的偏相关系数;
Figure FDA0003287699970000033
式中:cij为参数与无阻流量的偏相关系数。
5.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S7中各参数与无阻流量的灰色关联系数的计算过程为:
将q-m+n个参数组成一个原始序列;该原始序列中无阻流量为参考数列,除无阻流量外的其他参数构成比较数列,其数列分别表示为:
x0={x0(1),x0(2),x0(3),…,x0(n)}
xi={xi(1),xi(2),xi(3),…,xi(n)}(i=1,2,…,m)
式中:x0为参考数列;xi为比较数列;i为比较数列的序号;m为数列中数据样品的个数;n为自变量因素的个数;
通过数据归一化方法将原始数据进行无量纲化处理;
Figure FDA0003287699970000041
根据下式计算各参数与无阻流量的灰色关联系数;
Δoi(k)=|Yi(k)-Y0(k)|
Figure FDA0003287699970000042
Figure FDA0003287699970000043
Figure FDA0003287699970000044
式中:ρ为分辨系数,通常取0.5。
6.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S8中的具体过程为:将偏相关系数排序和灰色关联系数排序中都排在前面的参数也排在前面,将两者排序相差较大的指标以灰色关联系数排序的结果作为结论,得到各参数的最终排序结果。
7.根据权利要求1所述的一种基于指标分析及多模型融合的气井产能等级预测方法,其特征在于,所述步骤S10中通过对比目标井层与历史井层最相似的结果作为最终结果的具体过程为:
分别根据支持向量机、K近邻、随机森林三个分类器的预测产能等级确定出相同预测产能等级的历史井层数据;
再根据下式分别计算目标井层与支持向量机、K近邻、随机森林三个分类器相同预测产能等级的历史井层的差异;
r=(r1,r2,…,rn)
X=(X1,X2,…,Xn)
L=(L1,L2,…,Ln)
Figure FDA0003287699970000045
Figure FDA0003287699970000051
式中:σ为井层间的差异;
选取差异最小对应的预测产能等级为最终结果。
CN202111152813.9A 2021-09-29 2021-09-29 一种基于指标分析及多模型融合的气井产能等级预测方法 Active CN113807021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111152813.9A CN113807021B (zh) 2021-09-29 2021-09-29 一种基于指标分析及多模型融合的气井产能等级预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111152813.9A CN113807021B (zh) 2021-09-29 2021-09-29 一种基于指标分析及多模型融合的气井产能等级预测方法

Publications (2)

Publication Number Publication Date
CN113807021A true CN113807021A (zh) 2021-12-17
CN113807021B CN113807021B (zh) 2022-08-26

Family

ID=78897091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111152813.9A Active CN113807021B (zh) 2021-09-29 2021-09-29 一种基于指标分析及多模型融合的气井产能等级预测方法

Country Status (1)

Country Link
CN (1) CN113807021B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115539026A (zh) * 2022-09-27 2022-12-30 西南石油大学 一种复杂储层水平井初期产量融合预测方法
CN117172381A (zh) * 2023-09-05 2023-12-05 薪海科技(上海)有限公司 基于大数据的风险预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446797A (zh) * 2018-03-06 2018-08-24 西南石油大学 一种致密油藏水平井体积压裂初期产能预测方法
CN108960651A (zh) * 2018-07-11 2018-12-07 西南石油大学 一种致密油气藏多级压裂水平井完井效率的综合评价方法
CN110992200A (zh) * 2019-12-11 2020-04-10 长江大学 基于随机森林的页岩气井分段压裂效果评价和产量预测方法
CN112733340A (zh) * 2020-12-30 2021-04-30 成都北方石油勘探开发技术有限公司 一种基于数据驱动储层改造候选井的选井方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446797A (zh) * 2018-03-06 2018-08-24 西南石油大学 一种致密油藏水平井体积压裂初期产能预测方法
CN108960651A (zh) * 2018-07-11 2018-12-07 西南石油大学 一种致密油气藏多级压裂水平井完井效率的综合评价方法
CN110992200A (zh) * 2019-12-11 2020-04-10 长江大学 基于随机森林的页岩气井分段压裂效果评价和产量预测方法
CN112733340A (zh) * 2020-12-30 2021-04-30 成都北方石油勘探开发技术有限公司 一种基于数据驱动储层改造候选井的选井方法及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
唐凯等: "子洲气田二叠系山2气藏气井产能影响因素分析", 《物探化探计算技术》 *
黄力等: "超低渗透储层产能主要影响因素确定方法研究", 《科学技术与工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115539026A (zh) * 2022-09-27 2022-12-30 西南石油大学 一种复杂储层水平井初期产量融合预测方法
CN115539026B (zh) * 2022-09-27 2023-11-14 西南石油大学 一种复杂储层水平井初期产量融合预测方法
CN117172381A (zh) * 2023-09-05 2023-12-05 薪海科技(上海)有限公司 基于大数据的风险预测方法

Also Published As

Publication number Publication date
CN113807021B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
CN113807021B (zh) 一种基于指标分析及多模型融合的气井产能等级预测方法
CN108897066B (zh) 碳酸盐岩裂缝密度定量预测方法及装置
Zhou* et al. Evaluating gas production performances in marcellus using data mining technologies
CN111425193B (zh) 一种基于聚类分析测井岩石物理相划分的储层可压性评价方法
CN110284873B (zh) 一种油井储集性质的检测方法及检测装置
CN106897544B (zh) 对来自压裂的非常规地层的油气生产进行建模的方法
US20190120022A1 (en) Methods, systems and devices for modelling reservoir properties
CN115345378B (zh) 一种基于机器学习的页岩气井产量评价方法
CN112922591B (zh) 泥页岩储层岩相“甜点”预测方法及系统
EP2963235A1 (fr) Procede d'exploitation d'un gisement petrolier a partir d'une technique de positionnement des puits a forer
CN116127675A (zh) 一种页岩油水平井体积压裂最大可采储量的预测方法
US9652565B2 (en) System and method for producing display of petrophysical property height profile for both vertical and horizontal wellbores
CN114781951A (zh) 一种页岩油藏二氧化碳吞吐开发选井决策方法及系统
CN110717270B (zh) 一种基于数据的油气藏仿真模拟方法
CN114114414A (zh) 一种页岩储层“甜点”信息人工智能预测方法
Hudson et al. Unsupervised machine learning for detecting soil layer boundaries from cone penetration test data
CN114638147A (zh) 一种油气藏压裂工艺参数确定方法
CN111781638A (zh) 一种有效裂缝带预测方法及装置
CN115012903B (zh) 判别泥页岩层理构造发育的测井评价方法
CN108661629B (zh) 一种针对页岩地层的工程甜点定量评价方法
CN112765527A (zh) 页岩气资源量计算方法及系统
CN111488666A (zh) 一种气藏水平井产能预测模型建立、预测方法及装置
CN108898286B (zh) 储层裂缝发育程度的评价方法及装置
Ganiev et al. Waterflood Optimization Planning Based on MRT Analysis of Long-Term Bottom-Hole Pressure Records
CN114565116A (zh) 一种低渗储层物性参数的预测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant