CN110992200A - 基于随机森林的页岩气井分段压裂效果评价和产量预测方法 - Google Patents

基于随机森林的页岩气井分段压裂效果评价和产量预测方法 Download PDF

Info

Publication number
CN110992200A
CN110992200A CN201911265805.8A CN201911265805A CN110992200A CN 110992200 A CN110992200 A CN 110992200A CN 201911265805 A CN201911265805 A CN 201911265805A CN 110992200 A CN110992200 A CN 110992200A
Authority
CN
China
Prior art keywords
yield
fracturing
random forest
factors
influencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911265805.8A
Other languages
English (en)
Other versions
CN110992200B (zh
Inventor
李菊花
纪磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangtze University
Original Assignee
Yangtze University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangtze University filed Critical Yangtze University
Priority to CN201911265805.8A priority Critical patent/CN110992200B/zh
Publication of CN110992200A publication Critical patent/CN110992200A/zh
Application granted granted Critical
Publication of CN110992200B publication Critical patent/CN110992200B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Husbandry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Agronomy & Crop Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于随机森林的页岩气井分段压裂效果评价和产量预测方法,该方法首先使用皮尔逊相关系数和递归特征消除法的二级降维策略找出影响段产量的主要压裂、地质影响因素;基于优选的影响因素建立随机森林模型,使用该模型分析主要压裂因素对段产量的增益程度,完成压裂效果评价和完成产量的预测;本发明计算方法简便,方法先进。储层岩石的微观结构是非常复杂和不规则的,并经历了大规模的压裂,传统的理论很难将复杂、众多的压裂参数、地质参数结合在一起建立非线性方程,而数值模拟方法中的历史拟合难度较大。采用二级降维策略和随机森林算法能够识别重要的产量影响因素,可以良好的进行产量预测。

Description

基于随机森林的页岩气井分段压裂效果评价和产量预测方法
技术领域
本发明涉及页岩气井分段压裂效果评价,具体涉及一种基于随机森林的页岩气井分段压裂效果评价和产量预测方法。
背景技术
随着我国页岩气大规模投入压裂开发并获得可喜的成果以来,页岩气作为非常规油气资源日渐成为解决我国“气荒”问题的主力军。由于非常规油气藏的异质性,水平井各段之间的产量差异较大,美国几大页岩气区块统计表明压裂气井大约有1/3的射孔孔眼没有产量[1],单井总产气量的60%贡献度来自40%压裂段,采用常规分析方法显示各项施工参数与地质参数与单段产气贡献度的依存关系不明显。随着页岩气开发产业从粗放型到集约精细化的发展,能借助多因素准确地评价压裂效果和诊断出压裂气井段高产潜能区,实现压裂井段的优化布局与经济开发,已经成为页岩气高效开采的一个关键过程。
压裂效果评价有两种含义:
1)在总体方案实施过程中进行的评估,其目的除了评价压裂效果之外,还有检验设计与实际的符合程度,尤其是设计中所涉及到基础数据的合理性,以便完善设计,指导后续工作;
2)实施后的整体评估,其目的是对方案的实施效果、方设计技术和实施过程中对油气藏的认识程度进行总的评估,从顶部改进设计方案。 20世纪末,国内外就有对水力压裂体系大量的研究,而有关油气井压裂后效果评价的研究则不多。
页岩气藏压裂后产量的预测方法主要有解析法与数值模拟法。解析法求解产量因考虑因素过于理想化而不能满足真实复杂页岩储层的需要。虽然数值模拟方法日趋完善,可以通过建立不断精细化的地质模型及描述复杂的动态模型来追求产量预测的精准,但对数据的要求较高,需要准确的油藏数据及压裂施工数据,而且计算复杂,工作量大。
发明内容
本发明的目的在于克服现有技术的不足,提供了一种基于随机森林的页岩气井分段压裂效果评价和产量预测方法,该方法首先使用皮尔逊相关系数和递归特征消除法的二级降维策略找出影响段产量的主要压裂、地质影响因素。基于优选的影响因素建立随机森林模型,使用超参数自动搜索模块遍历各参数的合理范围,选择最优的参数用于模型。使用该模型的偏依赖图,分析主要压裂因素对段产量的增益程度,完成压裂效果评价,输入相应的压裂、地质数据,完成产量的预测。
为实现上述目的,本发明所设计一种基于随机森林的页岩气井分段压裂效果评价和产量预测方法,包括以下步骤:
1)确定影响压裂效果和产量的主要影响因素
a.第1级降维——皮尔逊相关系数
(1)首先假设原始样本集表示为一个m×(d+1)大小的矩阵A,表示为:
Figure BDA0002312803950000021
其中,每一行对应一个压裂段,最后一个元素为对应压裂段的产量,每行前d个元素对应压裂段的d个影响因素,将d个影响因素用集合表示为D={a1,a2,…,ad};
(2)然后使用皮尔逊相关系数对原始样本集表中的d个影响因素进行筛选,去除相关度高于0.9的影响因素,得到e个影响因素,得到总样本集,用矩阵B表示为:
Figure BDA0002312803950000022
其中,每一行对应一个压裂段,最后一个元素为对应压裂段的产量,每行前e个元素对应压裂段的e个影响因素,将e个影响因素用集合表示为D*={a1,a2,…,ae};
b.第2级降维——基于支持向量机的递归特征消除法
(1)首先将总样本中的产量进行分类:依据不同的标准,将产量划分为高、低产2个类别,划分依如下:
Figure BDA0002312803950000031
其中,Yn为段产量的类别;1代表高产,即大于1.3倍平均产量为高产,-1代表低产,即小于1.3倍平均产量为低产;y表示段产量的集合 y=(y1,y2,…,ym);avg(y)表示段产量y的平均值;
(2)再利用基于支持向量机的递归特征消除法进行数据降维,从e个影响因素中去除排序准则最小的影响因素,迭代多次后,得到影响产量的f个主要影响因素,从而得到最终样本;其中,
f个主要影响因素用集合表示为D**={a1,a2,…,af},最终样本集用矩阵C表示为;
Figure BDA0002312803950000032
c.建立训练集和测试集
最终样本集划分为包含m1个样本的训练集
Figure BDA0002312803950000033
和包含m2个样本的测试集
Figure BDA0002312803950000034
其中,m1+m2=m;
2)构建随机森林模型
根据训练集
Figure BDA0002312803950000035
中的数据,构建单棵决策回归树;将多棵决策回归树的结果进行平均,得到对应的随机森林算法结果;从而构建得到随机森林模型;
3)基于随机森林算法的压裂效果评价与产量预测
根据步骤1)第c小步得到的训练集
Figure BDA0002312803950000036
和步骤2)中构建的随机森林模型,完成压裂效果评价与产量预测;
a.压裂效果评价
基于上述随机森林模型,构建上述f个影响因素与产量的偏依赖关系:
①随机森林算法模型中的影响因素与产量的线性关系如下;
Figure BDA0002312803950000041
其中,
Figure BDA0002312803950000042
表示数据集第i个样本、第m2个影响因素所对应的值,
Figure BDA0002312803950000043
为对应的预测;
②偏依赖关系则是通过计算以下公式的平均值并在绘制在x的有效范围内得到:
Figure BDA0002312803950000044
其中,med(y)为产量y的中值,
Figure BDA0002312803950000045
显示:将其他因素平均化之后,影响因素k对模型预测值
Figure BDA0002312803950000046
的影响,
Figure BDA0002312803950000047
表示数据集第i个样本、第m2个影响因素所对应的值;
③根据上述偏依赖关系分析影响因素对产量的增益情况;
当影响因素对应的偏依赖度大于0时,影响因素的值在这个区间有利于高产;且偏依赖度越大,越有利于高产,压裂效果也就越好(在施工方案中,使用上述偏依赖度大于0的这个区间,以此来优化施工施工);
当影响因素对应的偏依赖度小于等于0时,影响因素的值在这个区间不利于高产;且偏依赖度越小,越有不利于高产,压裂效果也就越差 (在施工方案中,应该避免使用上述偏依赖度小于0这个区间施工);
b.建立基于随机森林的产量预测
根据步骤1)第c小步得到的测试集
Figure BDA0002312803950000048
的数据和步骤2)中的随机森林模型,得到测试集各个压裂段对应的预测产量,并根据均方根误差判断预测的效果:
Figure BDA0002312803950000051
其中:yi,ypre,i分别为样本i对应的实际产量和预测产量。
进一步地,所述步骤1)第a小步中,皮尔逊相关系数为:
Figure BDA0002312803950000052
其中,Corrij表示影响因素ai和影响因素aj之间的相关系数, ani表示影响因素ai对应样本的数值,
Figure BDA0002312803950000053
表示属性值ai对应样本的平均值,
Figure BDA0002312803950000054
表示属性值ai对应样本的标准差,m为总样本数。
再进一步地,所述步骤2)中,单棵决策回归树构建的步骤如下:
步骤1:从训练集
Figure BDA0002312803950000055
中随机抽取数据集T;
步骤2:创建节点N
步骤3:如果节点N都同属于一类,则标记N的值为T#中产量的平均值。结束过程;
步骤4:从影响因素集D**的影响因素作为候选分裂属性
Figure BDA0002312803950000056
步骤5:对于
Figure BDA0002312803950000057
中每个影响因素的每种可能的划分计算平方误差,确定二元划分;
步骤6:在步骤5确定二元划分的基础上,将T·划分为两部分
Figure BDA0002312803950000058
Figure BDA0002312803950000059
步骤7:将
Figure BDA00023128039500000510
的值标记为
Figure BDA00023128039500000511
中产量的均值;如果集合
Figure BDA00023128039500000512
中的样本少于 10,则结束过程。
本发明原理:
本发明通过利用诸多生产动态参数建立机器学习的压裂效果评价和段产量预测模型。本文引入的随机森林算法是机器学习中的代表算法,其使用自助采样法从训练样本中随机抽取数据以构建决策树,训练后,将多个决策树的结果进行平均,对未出现的训练样本进行预测。
本发明的有益效果:
1)传统压裂效果虽然方法众多,但是依赖与对产量的分析,无法将压裂效果与压裂施工因素、地质因素联系到一起,对后续的压裂工作给予的帮助也相当于有限。同时,传统的压裂效果评价方法要求也严格一点。本发明只需要借助压裂数据、地质数据和产量数据,就可以进行压裂效果评价,而且易于理解,能够找到各影响因素益于增产的合理范围。
2)常规的产量预测都需要建立复杂的地质模型,困难的历史拟合;亦或是要建立合理的介质模型和流动机理。这些都将加大对产量预测的难度,且耗时费力。另外,介质模型和流动机理也没有统一的、公认的标准,均属于研究的难点。本发明用机器学习中的随机森林算法,使用历史压裂、地质数据构成的模型进行产量预测。所有数据均来自历史数据,减少了认为的干预。
3)本发明计算方法简便,方法先进。储层岩石的微观结构是非常复杂和不规则的,并经历了大规模的压裂,传统的理论很难将复杂、众多的压裂参数、地质参数结合在一起建立非线性方程,而数值模拟方法中的历史拟合难度较大。采用二级降维策略和随机森林算法能够识别重要的产量影响因素,可以良好的进行产量预测。
综上所述,随机森林算法直接从原始数据中挖掘自变量和因变量之间的潜在信息,最大程度地避免误差的扩大,通过决策树数量的增多,也可以有效地降低泛化误差避免过拟合现象发生,并优于其他机器学习方法。通过与皮尔逊相关系数相和递归特征消除法的二级降维策略相结合,构建产量回归预测模型。并用基于随机森林模型的偏依赖图对水平段的压裂效果进行评价。为页岩气藏水平井多段压裂效果评价和产量预测提供新思路。
附图说明
图1为基于随机森林的页岩气井分段压裂效果评价和产量预测方法流程图;
图2为第2级降维——基于支持向量机的递归特征消除法结果;
图3为基于随机森林模型构建的主要影响因素压裂效果评价图;
图4为基于随机森林模型的预测产量与实测产量对比图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细描述,以便本领域技术人员理解。
实施例1
以川东某页岩气田的196个压裂段的压裂施工数据和段产量为基础,构成原始样本集A。使用的11个压裂施工因素如下表所示:
表1
Figure BDA0002312803950000071
1)确定影响压裂效果和产量的主要影响因素
a.第1级降维——皮尔逊相关系数
计算11个影响因素相互之间的皮尔逊相关系数,由于这11个影响因素间的相关系数较低,均低于0.9。所以这11个影响因素进入后续的第2级降维。此时的总样本集B与原始样本集A一样。
b.第2级降维——基于支持向量机的递归特征消除法
基于支持向量机的递归特征消除法结果如图1所示。图中显示:1个或者6个影响因素的交叉验证得分最高。所以选择6个影响因素作为主要影响因素,与段产量一并构成最终样本集C用于后续的随机森林模型的构建和压裂效果的评价,主要影响因素如下表2。
表2
Figure BDA0002312803950000072
c.建立训练集和测试集
以上述的最终样本集C为基础,随机将最终样本集C划分为训练集
Figure BDA0002312803950000073
(137个压裂段)和测试集
Figure BDA0002312803950000074
(57个压裂段)
2)构建随机森林模型
训练集
Figure BDA0002312803950000075
中的部分数据如下表3所示,由此数据可以构建随机森林模型。
表3
Figure BDA0002312803950000081
3)基于随机森林算法的压裂效果评价与产量预测。
a.压裂效果评价
通过基于随机森林的依赖关系分析,6个主要影响因素与产量的偏依赖图如图3所示.结论如下:
(1)层位对压裂段产量的影响较小。当压裂层位为1、2、3时,层位对压裂段产量的影响响应程度低,当压裂层位为4,5,6时,表示对压裂段产量有微小的增益效果。因此,后续的压裂施工应尽可能的选择在4, 5,6层。
(2)簇数对压裂段产量的影响与层位的影响类似,当簇数大于2时对压裂段产量有微小的增益效果,利于高产。因此,后续的压裂施工应
(3)簇间距对压裂段产量的响应较为敏感。随着簇间距的增大,对产量的不利局面逐渐改善,然后转变为利于高产。当簇间距为30m时偏依赖度达到最高,可以认为:此时的簇间距有最好的压裂效果。而当簇间距大于30m时,对压裂段产量的贡献已不明显。
(4)40/70低密度陶粒对压裂段产量的响应呈先下降再上升的趋势。 40/70低密度陶粒为25m3时对应压裂产量最小,此后随着40/70低密度陶粒量的增大表现出对压裂产量的正向贡献,当40/70低密度陶粒达到40m3后逐渐有利于高产。说明:40/70低密度陶粒越多,压裂效果会越好。
(5)与40/70低密度陶粒对压裂段产量的影响相反,总砂量对压裂段产量的响应曲线总体呈下降趋势。以总砂量56m3为界,总砂量小于56m3时,有利于高产;总砂量大于56m3时,不利于高产。应在后续施工中避免。
(6)中砂最高砂比对压裂段产量的影响呈稳步上升的趋势。当中砂最高砂比大于12时,有利于压裂段产量的提高。
b.产量预测
根据2)中的机森林模型,将测试集
Figure BDA0002312803950000082
(表4)的主要影响因素数据带入模型,就得到对应的预测产量。
表4
Figure BDA0002312803950000083
预测产量与实测值的对比如图4所示,在对数坐标轴中,预测产量与实测值显示了较好的对应性。由预测产量与实测值得到的均方根误差为0.306,也显示预测效果较好。
其它未详细说明的部分均为现有技术。尽管上述实施例对本发明做出了详尽的描述,但它仅仅是本发明一部分实施例,而不是全部实施例,人们还可以根据本实施例在不经创造性前提下获其他实施例,这些实施例都属于本发明保护范围。

Claims (3)

1.一种基于随机森林的页岩气井分段压裂效果评价和产量预测方法,其特征在于:包括以下步骤:
1)确定影响压裂效果和产量的主要影响因素
a.第1级降维——皮尔逊相关系数
(1)首先假设原始样本集表示为一个m×(d+1)大小的矩阵A,表示为:
Figure FDA0002312803940000011
其中,每一行对应一个压裂段,最后一个元素为对应压裂段的产量,每行前d个元素对应压裂段的d个影响因素,将d个影响因素用集合表示为D={a1,a2,…,ad};
(2)然后使用皮尔逊相关系数对原始样本集表中的d个影响因素进行筛选,去除相关度高于0.9的影响因素,得到e个影响因素,得到总样本集,用矩阵B表示为:
Figure FDA0002312803940000012
其中,每一行对应一个压裂段,最后一个元素为对应压裂段的产量,每行前e个元素对应压裂段的e个影响因素,将e个影响因素用集合表示为D*={a1,a2,…,ae};
b.第2级降维——基于支持向量机的递归特征消除法
(1)首先将总样本中的产量进行分类:依据不同的标准,将产量划分为高、低产2个类别,划分依如下:
Figure FDA0002312803940000013
其中,Yn为段产量的类别;1代表高产,即大于1.3倍平均产量为高产,-1代表低产,即小于1.3倍平均产量为低产;y表示段产量的集合y=(y1,y2,…,ym);avg(y)表示段产量y的平均值;
(2)再利用基于支持向量机的递归特征消除法进行数据降维,从e个影响因素中去除排序准则最小的影响因素,迭代多次后,得到影响产量的f个主要影响因素,从而得到最终样本;其中,
f个主要影响因素用集合表示为D**={a1,a2,…,af},最终样本集用矩阵C表示为;
Figure FDA0002312803940000021
c.建立训练集和测试集
最终样本集划分为包含m1个样本的训练集
Figure FDA0002312803940000022
和包含m2个样本的测试集
Figure FDA0002312803940000023
其中,m1+m2=m;
2)构建随机森林模型
根据训练集
Figure FDA0002312803940000024
中的数据,构建单棵决策回归树;将多棵决策回归树的结果进行平均,得到对应的随机森林算法结果;从而构建得到随机森林模型;
3)基于随机森林算法的压裂效果评价与产量预测
根据步骤1)第c小步得到的训练集
Figure FDA0002312803940000025
和步骤2)中构建的随机森林模型,完成压裂效果评价与产量预测;
a.压裂效果评价
基于上述随机森林模型,构建上述f个影响因素与产量的偏依赖关系:
①随机森林算法模型中的影响因素与产量的线性关系如下;
Figure FDA0002312803940000026
其中,
Figure FDA0002312803940000027
表示数据集第i个样本、第m2个影响因素所对应的值,
Figure FDA0002312803940000028
为对应的预测;
②偏依赖关系则是通过计算以下公式的平均值并在绘制在x的有效范围内得到:
Figure FDA0002312803940000031
其中,med(y)为产量y的中值,
Figure FDA0002312803940000032
显示:将其他因素平均化之后,影响因素k对模型预测值
Figure FDA0002312803940000033
的影响,
Figure FDA0002312803940000034
表示数据集第i个样本、第m2个影响因素所对应的值;
③根据上述偏依赖关系分析影响因素对产量的增益情况;
当影响因素对应的偏依赖度大于0时,影响因素的值在这个区间有利于高产;且偏依赖度越大,越有利于高产,压裂效果也就越好;
当影响因素对应的偏依赖度小于等于0时,影响因素的值在这个区间不利于高产;且偏依赖度越小,越有不利于高产,压裂效果也就越差;
b.建立基于随机森林的产量预测
根据步骤1)第c小步得到的测试集
Figure FDA0002312803940000035
的数据和步骤2)中的随机森林模型,得到测试集各个压裂段对应的预测产量,并根据均方根误差判断预测的效果:
Figure FDA0002312803940000036
其中:yi,ypre,i分别为样本i对应的实际产量和预测产量。
2.根据权利要求1所述基于随机森林的页岩气井分段压裂效果评价和产量预测方法,其特征在于:所述步骤1)第a小步中,皮尔逊相关系数为:
Figure FDA0002312803940000037
其中,Corrij表示影响因素ai和影响因素aj之间的相关系数,ani表示影响因素ai对应样本的数值,
Figure FDA00023128039400000410
表示属性值ai对应样本的平均值,
Figure FDA0002312803940000049
表示属性值ai对应样本的标准差,m为总样本数。
3.根据权利要求1所述基于随机森林的页岩气井分段压裂效果评价和产量预测方法,其特征在于:所述步骤2)中,单棵决策回归树构建的步骤如下:
步骤1:从训练集
Figure FDA0002312803940000041
中随机抽取数据集T;
步骤2:创建节点N
步骤3:如果节点N都同属于一类,则标记N的值为T#中产量的平均值,结束过程;
步骤4:从影响因素集D**的影响因素作为候选分裂属性
Figure FDA0002312803940000042
步骤5:对于
Figure FDA0002312803940000043
中每个影响因素的每种可能的划分计算平方误差,确定二元划分;
步骤6:在步骤5确定二元划分的基础上,将T·划分为两部分
Figure FDA0002312803940000044
Figure FDA0002312803940000045
步骤7:将
Figure FDA0002312803940000046
的值标记为中产量的均值;如果集合
Figure FDA0002312803940000048
中的样本少于10,则结束过程。
CN201911265805.8A 2019-12-11 2019-12-11 基于随机森林的页岩气井分段压裂效果评价和产量预测方法 Active CN110992200B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911265805.8A CN110992200B (zh) 2019-12-11 2019-12-11 基于随机森林的页岩气井分段压裂效果评价和产量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911265805.8A CN110992200B (zh) 2019-12-11 2019-12-11 基于随机森林的页岩气井分段压裂效果评价和产量预测方法

Publications (2)

Publication Number Publication Date
CN110992200A true CN110992200A (zh) 2020-04-10
CN110992200B CN110992200B (zh) 2022-09-27

Family

ID=70092329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911265805.8A Active CN110992200B (zh) 2019-12-11 2019-12-11 基于随机森林的页岩气井分段压裂效果评价和产量预测方法

Country Status (1)

Country Link
CN (1) CN110992200B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101625A (zh) * 2020-08-13 2020-12-18 重庆地质矿产研究院 一种页岩气井生产动态预测方法及系统
CN113240321A (zh) * 2021-05-31 2021-08-10 中海石油(中国)有限公司 一种基于深度学习的油田类比评价方法及系统
CN113344359A (zh) * 2021-05-31 2021-09-03 西南石油大学 基于随机森林的致密砂岩气储层质量主控因素定量评价方法
CN113486575A (zh) * 2021-06-21 2021-10-08 武汉科技大学 一种地表变形破坏预测预警方法、装置及存储介质
CN113738353A (zh) * 2021-09-28 2021-12-03 中国石油大学(北京) 一种含油页岩可动油量预测方法、系统、设备和存储介质
CN113807021A (zh) * 2021-09-29 2021-12-17 西南石油大学 一种基于指标分析及多模型融合的气井产能等级预测方法
CN114320266A (zh) * 2021-11-17 2022-04-12 陕西延长石油(集团)有限责任公司 一种基于支持向量机的致密油藏常规井产量预测方法
CN115270959A (zh) * 2022-07-27 2022-11-01 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115345378A (zh) * 2022-08-29 2022-11-15 西南石油大学 一种基于机器学习的页岩气井产量评价方法
CN116338819A (zh) * 2023-03-27 2023-06-27 北京智科远达数据技术有限公司 一种水体溶解氧浓度预测系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145229A1 (zh) * 2017-02-10 2018-08-16 广西壮族自治区气象减灾研究所 一种近地面气温的大面积精确反演方法
CN110502725A (zh) * 2019-08-12 2019-11-26 华南农业大学 基于相关性分析与随机森林的耕地定级指标赋权方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145229A1 (zh) * 2017-02-10 2018-08-16 广西壮族自治区气象减灾研究所 一种近地面气温的大面积精确反演方法
CN110502725A (zh) * 2019-08-12 2019-11-26 华南农业大学 基于相关性分析与随机森林的耕地定级指标赋权方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHAHNORBANUN SAHRAN等: "Absolute cosine-based SVM-RFE feature selection method for prostate histopathological grading", 《ARTIFICIAL INTELLIGENCE IN MEDICINE》, vol. 87, 31 May 2018 (2018-05-31), pages 78 - 90 *
宋宣毅 等: "基于灰狼算法优化的支持向量机产能预测", 《岩性油气藏》, vol. 32, no. 2, 26 August 2019 (2019-08-26), pages 134 - 140 *
秦鹏程等: "基于决策树和随机森林模型的湖北油菜产量限制因子分析", 《中国农业气象》, vol. 37, no. 06, 31 December 2016 (2016-12-31), pages 691 - 699 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101625B (zh) * 2020-08-13 2024-03-15 重庆地质矿产研究院 一种页岩气井生产动态预测方法及系统
CN112101625A (zh) * 2020-08-13 2020-12-18 重庆地质矿产研究院 一种页岩气井生产动态预测方法及系统
CN113240321A (zh) * 2021-05-31 2021-08-10 中海石油(中国)有限公司 一种基于深度学习的油田类比评价方法及系统
CN113344359A (zh) * 2021-05-31 2021-09-03 西南石油大学 基于随机森林的致密砂岩气储层质量主控因素定量评价方法
CN113486575A (zh) * 2021-06-21 2021-10-08 武汉科技大学 一种地表变形破坏预测预警方法、装置及存储介质
CN113738353A (zh) * 2021-09-28 2021-12-03 中国石油大学(北京) 一种含油页岩可动油量预测方法、系统、设备和存储介质
CN113807021A (zh) * 2021-09-29 2021-12-17 西南石油大学 一种基于指标分析及多模型融合的气井产能等级预测方法
CN114320266A (zh) * 2021-11-17 2022-04-12 陕西延长石油(集团)有限责任公司 一种基于支持向量机的致密油藏常规井产量预测方法
CN114320266B (zh) * 2021-11-17 2023-11-28 陕西延长石油(集团)有限责任公司 一种基于支持向量机的致密油藏常规井产量预测方法
CN115270959B (zh) * 2022-07-27 2023-08-22 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115270959A (zh) * 2022-07-27 2022-11-01 中国石油大学(北京) 基于递归特征消除融合随机森林的页岩岩性识别法及装置
CN115345378A (zh) * 2022-08-29 2022-11-15 西南石油大学 一种基于机器学习的页岩气井产量评价方法
CN116338819A (zh) * 2023-03-27 2023-06-27 北京智科远达数据技术有限公司 一种水体溶解氧浓度预测系统

Also Published As

Publication number Publication date
CN110992200B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN110992200B (zh) 基于随机森林的页岩气井分段压裂效果评价和产量预测方法
CN108009716B (zh) 一种水平井体积压裂效果影响因素多层次评价方法
CN108446797B (zh) 一种致密油藏水平井体积压裂初期产能预测方法
US10233728B2 (en) Method and apparatus for drilling a new well using historic drilling data
CN107387051B (zh) 低渗透非均质油藏多段压裂水平井重复压裂选井的方法
CN109236258B (zh) 一种基于自适应代理模型的致密油藏压裂水平井优化方法
CN109214026A (zh) 一种页岩气水平井初期产能预测方法
CN114548568B (zh) 一种致密页岩油藏注气吞吐参数协同优化方法
CN115906675B (zh) 基于时序多目标预测模型的井位及注采参数联合优化方法
CN112016212B (zh) 一种基于渗流控制方程的储层纵向非均质性评价方法
CN114781951A (zh) 一种页岩油藏二氧化碳吞吐开发选井决策方法及系统
CN110413952B (zh) 含油气盆地勘探程度的预测方法及装置
CN113946790B (zh) 一种导水裂隙带高度预测方法、系统、设备及终端
CN114580261A (zh) 可采储量预测模型建立方法、可采储量预测方法和装置
CN116090331A (zh) 一种页岩气水平井压裂参数优化的方法
CN116611343A (zh) 一种基于机器学习的底水锥进定量描述方法及工具
CN114880957B (zh) 一种非常规储层压裂射孔段簇参数组合优化方法
CN111460647A (zh) 用于多轮次吞吐后水平井分段靶向注汽量的定量调配方法
CN114462323A (zh) 一种基于多属性场融合的油藏流场表征方法
CN117391483A (zh) 基于协同训练的页岩油井压裂效果评价方法
CN115726776B (zh) 一种非常规油气藏经验产量递减模型优选方法
CN113887049A (zh) 一种基于机器学习的石油钻井的钻速预测方法及系统
CN113837890B (zh) 一种基于数据统计的页岩气水平井井型优选方法
CN114547748B (zh) 一种水平井分段压裂技术施工方案优化设计方法及系统
Feder Machine-learning approach determines spatial variation in shale decline curves

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant