CN113153286A - 基于决策树的页岩气开发主控因素分析方法 - Google Patents

基于决策树的页岩气开发主控因素分析方法 Download PDF

Info

Publication number
CN113153286A
CN113153286A CN202110570373.2A CN202110570373A CN113153286A CN 113153286 A CN113153286 A CN 113153286A CN 202110570373 A CN202110570373 A CN 202110570373A CN 113153286 A CN113153286 A CN 113153286A
Authority
CN
China
Prior art keywords
node
decision tree
shale gas
data set
gas development
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110570373.2A
Other languages
English (en)
Other versions
CN113153286B (zh
Inventor
陈娟
曾波
黄浩勇
宋毅
杨蕾
岳文翰
常海滨
黎俊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Petrochina Co Ltd
Original Assignee
Petrochina Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Petrochina Co Ltd filed Critical Petrochina Co Ltd
Priority to CN202110570373.2A priority Critical patent/CN113153286B/zh
Publication of CN113153286A publication Critical patent/CN113153286A/zh
Application granted granted Critical
Publication of CN113153286B publication Critical patent/CN113153286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B49/00Testing the nature of borehole walls; Formation testing; Methods or apparatus for obtaining samples of soil or well fluids, specially adapted to earth drilling or wells
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mining & Mineral Resources (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Geology (AREA)
  • Geochemistry & Mineralogy (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Fluid Mechanics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于决策树的页岩气开发主控因素分析方法,包括步骤:S1,获取页岩气开发数据集;S2,基于获取的页岩气开发数据集,建立决策树模型;S3,训练决策树模型;S4,基于训练后的决策树模型,计算特征重要性S5,根据特征重要性分析判断主控因素等;本发明可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性等。

Description

基于决策树的页岩气开发主控因素分析方法
技术领域
本发明涉及非常规油气藏开采技术领域,更为具体的,涉及基于决策树的页岩气开发主控因素分析方法。
背景技术
由于极低的渗透率,页岩气的开发一般需要借助水平钻井和多段压裂技术。而水平井的开发效果一般取决于地质静态参数(如孔隙度、TOC、脆性矿物含量、和含气量等)和压裂施工情况(压裂水平段长、改造段数、总簇数、用液量、加砂量、排量和停泵压力等)的综合影响。在实际开发中可能经常遇到不同平台的水平井产量差异巨大的情况,有时同一平台的水平井也可能有着截然不同的生产特征。为了解释这些现象,我们需要研究哪些参数对页岩气水平井生产起主导作用,即开展水平井产能主控因素分析。
传统的油气藏生产主控因素分析一般借助数值模拟开展,例如,传统的技术中,公开号为CN104698152A的中国专利申请公开了一种研究泥页岩吸附天然气主控因素的方法,该方法利用平行实验和数值模拟,通过分别控制单一因素:有机质丰度、粘土矿物含量、有机质成熟度、天然气组成、温压和湿度的变化,来揭示有机质丰度、粘土矿物含量、有机质成熟度、天然气组成、温压和湿度对泥页岩吸附能力的影响,为页岩气勘探有利区预测奠定基础。
但对于复杂的问题,数值模拟模型可能不能考虑到所有物理过程而引入模型误差,进而会影响主控因素分析结果的准确性。随着国内页岩气开发的不断推进,目前已经积累了一定数量的水平井开发数据,这些数据为基于数据挖掘的页岩气产能主控因素分析提供了基础。基于实际的开发数据进行分析,能够消除模型误差的影响,提高结果的准确性。
发明内容
本发明的目的在于克服现有技术的不足,提供基于决策树的页岩气开发主控因素分析方法,可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性等。
本发明的目的是通过以下方案实现的:
基于决策树的页岩气开发主控因素分析方法,包括步骤:
S1,获取页岩气开发数据集;
S2,基于获取的页岩气开发数据集,建立决策树模型;
S3,训练决策树模型;
S4,基于训练后的决策树模型,计算特征重要性;
S5,根据特征重要性分析判断主控因素。
进一步地,在步骤S1中,包括标记步骤:将获取的页岩气开发数据集标记为数据集D,且数据集D中每一个样本为一口页岩气井的数据,包括地质参数、工程参数和生产指标,并将每一个地质参数和工程参数称为一个特征,标记为A。
进一步地,在步骤S2中,所述决策树模型采用CART回归树,在选定的某一决策树节点,对于任意划分的特征A,对应的任意划分点s,数据集D划分成数据集D1和D2,作如下和方差计算处理:
Figure BDA0003082371150000021
其中,xi为样本输入,yi为样本输出,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值;然后,设定节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度作为CART回归树终止标准;
进一步地,在步骤S3中,训练决策树模型时,输入为训练集D,节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度;从根节点开始,用训练集递归地建立CART回归树。
进一步地,用训练集递归地建立CART回归树,包括如下步骤:
S31,对于当前节点,如果树的最大深度达到设定值,当前节点停止递归;
S32,对于当前节点的数据集为D,如果样本个数小于节点最小样本个数阈值或者没有特征,当前节点停止递归;
S33,计算样本集D的和方差,如果和方差小于节点划分最小和方差阈值,当前节点停止递归;
S34,计算当前节点现有的各个特征的各个划分点对数据集D的和方差,选择和方差最小的特征A和对应的划分点s;根据这个最优特征和划分点,把数据集划分成两部分D1和D2,同时建立当前节点的左右子节点,左子节点的数据集为D1,右子节点的数据集为D2;
S35,重复步骤S31~S34,依此递归下去,直到达到终止标准。
进一步地,在步骤S4中,包括步骤:
S41,计算节点j的重用性nj,计算公式如下:
Figure BDA0003082371150000031
其中,Cj代表节点j的和方差,Wj代表到达节点j的加权样本数量,通过达到节点j的样本数除以样本总数来计算,
Figure BDA0003082371150000032
分别代表左子节点和右子节点的和方差,
Figure BDA0003082371150000033
分别代表左子节点和右子节点的加权样本数量;
S42,计算特征i的重要性FIi,计算公式如下:
Figure BDA0003082371150000041
其中,
Figure BDA0003082371150000042
进一步地,在步骤S5中,包括步骤:基于计算所得的各特征的特征重要性进行排序,得到任一数量内的页岩气开发主控因素。
本发明的有益效果包括:
(1)本发明采用数据驱动的方法,可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性。
(2)本发明以川南地区页岩气水平井体积压裂效果为工程背景,以提高压裂后单井产能为目标,充分考虑了页岩储层静态参数,深入研究了TOC、孔隙度等地质参数与工程参数对产能的影响规律,基于决策树计算的数学模型,准确找到了影响产能的主控因素及其权重,为川南地区页岩气井的产能预测提供了一种新思路和新方法,提高了主控因素分析方法的准确度,并有效地指导现场施工。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的方法步骤流程图;
图2为本发明实施例的主控因素分析效果示意图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
如图1,2所示,基于决策树的页岩气开发主控因素分析方法,包括步骤:
S1,获取页岩气开发数据集;
S2,基于获取的页岩气开发数据集,建立决策树模型;
S3,训练决策树模型;
S4,基于训练后的决策树模型,计算特征重要性;
S5,根据特征重要性分析判断主控因素。
该实施例中,数据集D包含146口井的数据,其中地质和工程参数包括:五峰组长度、1小层长度、2小层长度、靶体中部距优质页岩底部距离、I类储层钻遇长度、I类储层钻遇长度、垂深、实际压裂段长、平均分段段长、实际段数、总簇数、单段射孔簇数、簇间距、排量、泵压、总液量、平均单段液量、用液强度、总滑溜水量、总线性胶量、总砂量、平均单段砂量、加砂强度、100目粉砂总量、40/70目陶粒总量、平均停泵压力、平均单段100目粉砂、平均单段40/70目陶粒、水平最大主应力、水平最小主应力、垂向应力、TOC、含气量、孔隙度、矿物脆性和闷井天数,生产指标为90天累计产量。这样,数据集D共含36个输入特征,1个输出指标。
决策数模型的类别选取为CART回归树。CART回归树的特征选择标准选取为和方差。节点最小样本个数阈值设置为1,节点划分最小和方差阈值设置为0,树的最大深度设置为8。
训练决策树模型后,计算各特征的重要性,最终进行排序,如图2所示。决策树选取的90天累计产量前10个主控因素为:平均单段液量、泵压、平均停泵压力、100目粉砂总量、平均单段砂量、排量、总液量、用液强度、靶体中部距优质页岩底部距离和2小层长度。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试或者实际的数据在程序实现中存在于只读存储器(Random Access Memory,RAM)、随机存取存储器(Random Access Memory,RAM)等。

Claims (7)

1.基于决策树的页岩气开发主控因素分析方法,其特征在于,包括步骤:
S1,获取页岩气开发数据集;
S2,基于获取的页岩气开发数据集,建立决策树模型;
S3,训练决策树模型;
S4,基于训练后的决策树模型,计算特征重要性;
S5,根据特征重要性分析判断主控因素。
2.根据权利要求1所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S1中,包括标记步骤:将获取的页岩气开发数据集标记为数据集D,且数据集D中每一个样本为一口页岩气井的数据,包括地质参数、工程参数和生产指标,并将每一个地质参数和工程参数称为一个特征,标记为A。
3.根据权利要求2所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S2中,所述决策树模型采用CART回归树,在选定的某一决策树节点,对于任意划分的特征A,对应的任意划分点s,数据集D划分成数据集D1和D2,作如下和方差计算处理:
Figure FDA0003082371140000011
其中,xi为样本输入,yi为样本输出,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值;然后,设定节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度作为CART回归树终止标准。
4.根据权利要求3所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S3中,训练决策树模型时,输入为训练集D,节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度;从根节点开始,用训练集递归地建立CART回归树。
5.根据权利要求4所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,用训练集递归地建立CART回归树,包括如下步骤:
S31,对于当前节点,如果树的最大深度达到设定值,当前节点停止递归;
S32,对于当前节点的数据集为D,如果样本个数小于节点最小样本个数阈值或者没有特征,当前节点停止递归;
S33,计算样本集D的和方差,如果和方差小于节点划分最小和方差阈值,当前节点停止递归;
S34,计算当前节点现有的各个特征的各个划分点对数据集D的和方差,选择和方差最小的特征A和对应的划分点s;根据这个最优特征和划分点,把数据集划分成两部分D1和D2,同时建立当前节点的左右子节点,左子节点的数据集为D1,右子节点的数据集为D2;
S35,重复步骤S31~S34,依此递归下去,直到达到终止标准。
6.根据权利要求1所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S4中,包括步骤:
S41,计算节点j的重用性nj,计算公式如下:
Figure FDA0003082371140000021
其中,Cj代表节点j的和方差,Wj代表到达节点j的加权样本数量,通过达到节点j的样本数除以样本总数来计算,
Figure FDA0003082371140000022
分别代表左子节点和右子节点的和方差,
Figure FDA0003082371140000023
分别代表左子节点和右子节点的加权样本数量;
S42,计算特征i的重要性FIi,计算公式如下:
Figure FDA0003082371140000031
其中,
Figure FDA0003082371140000032
7.根据权利要求6所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S5中,包括步骤:基于计算所得的各特征的特征重要性进行排序,得到任一数量内的页岩气开发主控因素。
CN202110570373.2A 2021-05-25 2021-05-25 基于决策树的页岩气开发主控因素分析方法 Active CN113153286B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110570373.2A CN113153286B (zh) 2021-05-25 2021-05-25 基于决策树的页岩气开发主控因素分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110570373.2A CN113153286B (zh) 2021-05-25 2021-05-25 基于决策树的页岩气开发主控因素分析方法

Publications (2)

Publication Number Publication Date
CN113153286A true CN113153286A (zh) 2021-07-23
CN113153286B CN113153286B (zh) 2024-04-30

Family

ID=76877405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110570373.2A Active CN113153286B (zh) 2021-05-25 2021-05-25 基于决策树的页岩气开发主控因素分析方法

Country Status (1)

Country Link
CN (1) CN113153286B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107589236A (zh) * 2017-09-14 2018-01-16 中国地质调查局油气资源调查中心 一种基于模糊矩阵的页岩气多因素选区评价方法
US20180260531A1 (en) * 2017-03-10 2018-09-13 Microsoft Technology Licensing, Llc Training random decision trees for sensor data processing
CN109214026A (zh) * 2017-07-07 2019-01-15 中国石油天然气股份有限公司 一种页岩气水平井初期产能预测方法
CN112561144A (zh) * 2020-12-07 2021-03-26 西安石油大学 一种致密油压裂水平井产能主控因素评判与产能预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180260531A1 (en) * 2017-03-10 2018-09-13 Microsoft Technology Licensing, Llc Training random decision trees for sensor data processing
CN109214026A (zh) * 2017-07-07 2019-01-15 中国石油天然气股份有限公司 一种页岩气水平井初期产能预测方法
CN107589236A (zh) * 2017-09-14 2018-01-16 中国地质调查局油气资源调查中心 一种基于模糊矩阵的页岩气多因素选区评价方法
CN112561144A (zh) * 2020-12-07 2021-03-26 西安石油大学 一种致密油压裂水平井产能主控因素评判与产能预测方法

Also Published As

Publication number Publication date
CN113153286B (zh) 2024-04-30

Similar Documents

Publication Publication Date Title
CN111441767B (zh) 油藏生产动态预测方法及装置
CN105488583B (zh) 预测致密油待评价区域可采储量的方法及装置
CN112308269B (zh) 用于低渗透油气藏的产能预测方法及装置
CN112360411B (zh) 基于图神经网络的局部井网注水开发优化方法
CN114548568B (zh) 一种致密页岩油藏注气吞吐参数协同优化方法
CN104314547A (zh) Hafd水平井压裂酸化分段优化方法及系统
CN112016212B (zh) 一种基于渗流控制方程的储层纵向非均质性评价方法
CN105719097A (zh) 缝洞型油藏动态分析与注水管理系统
Mahdiani et al. A new heuristic model for estimating the oil formation volume factor
CN113792479B (zh) 一种基于物理约束的煤层气藏压裂效果评价方法
CN109063403B (zh) 一种滑溜水压裂优化设计方法
CN112282742B (zh) 一种页岩油优质储层的预测方法
CN106014365B (zh) 一种预测水驱开发油田产量递减率的方法
CN110469299A (zh) 一种采油井注水开发见效效果评价方法
CN107451671B (zh) 用于预测页岩地层压裂后初始产能的方法及系统
CN110717270B (zh) 一种基于数据的油气藏仿真模拟方法
CN114139390A (zh) 一种适用于压裂水平井裂缝参数的一体化优化方法及装置
CN113153286A (zh) 基于决策树的页岩气开发主控因素分析方法
CN116011268A (zh) 一种优势渗流通道的定量描述方法
CN110851982B (zh) 一种中低渗油藏减氧空气驱可行性分析方法
CN115705452A (zh) 整装砂岩油藏开发中后期的新型采收率预测方法
CN115600355A (zh) 一种基于稀疏回归的页岩气开发主控因素分析方法
CN114060019A (zh) 一种聚合物驱后粘土颗粒调剖效果的预测方法
CN115034112B (zh) 基于测井数据确定毛管力曲线及毛管力曲线分布的方法
CN116882259A (zh) 一种页岩气多段压裂水平井产能主控因素分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100007 No. 9 North Main Street, Dongcheng District, Beijing, Dongzhimen

Applicant after: PetroChina Company Limited

Address before: 100011 Beijing city Dongcheng District No. 16 Andrew

Applicant before: PetroChina Company Limited

GR01 Patent grant
GR01 Patent grant