CN113153286A - 基于决策树的页岩气开发主控因素分析方法 - Google Patents
基于决策树的页岩气开发主控因素分析方法 Download PDFInfo
- Publication number
- CN113153286A CN113153286A CN202110570373.2A CN202110570373A CN113153286A CN 113153286 A CN113153286 A CN 113153286A CN 202110570373 A CN202110570373 A CN 202110570373A CN 113153286 A CN113153286 A CN 113153286A
- Authority
- CN
- China
- Prior art keywords
- node
- decision tree
- shale gas
- data set
- gas development
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000003066 decision tree Methods 0.000 title claims abstract description 35
- 238000011161 development Methods 0.000 title claims abstract description 35
- 238000000556 factor analysis Methods 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000004088 simulation Methods 0.000 abstract description 5
- 239000007789 gas Substances 0.000 description 24
- 239000007788 liquid Substances 0.000 description 7
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 239000004576 sand Substances 0.000 description 5
- 239000005416 organic matter Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000003345 natural gas Substances 0.000 description 3
- 238000005086 pumping Methods 0.000 description 3
- 239000002734 clay mineral Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000005553 drilling Methods 0.000 description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 2
- 239000011707 mineral Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21B—EARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
- E21B49/00—Testing the nature of borehole walls; Formation testing; Methods or apparatus for obtaining samples of soil or well fluids, specially adapted to earth drilling or wells
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mining & Mineral Resources (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Geology (AREA)
- Geochemistry & Mineralogy (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Fluid Mechanics (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于决策树的页岩气开发主控因素分析方法,包括步骤:S1,获取页岩气开发数据集;S2,基于获取的页岩气开发数据集,建立决策树模型;S3,训练决策树模型;S4,基于训练后的决策树模型,计算特征重要性S5,根据特征重要性分析判断主控因素等;本发明可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性等。
Description
技术领域
本发明涉及非常规油气藏开采技术领域,更为具体的,涉及基于决策树的页岩气开发主控因素分析方法。
背景技术
由于极低的渗透率,页岩气的开发一般需要借助水平钻井和多段压裂技术。而水平井的开发效果一般取决于地质静态参数(如孔隙度、TOC、脆性矿物含量、和含气量等)和压裂施工情况(压裂水平段长、改造段数、总簇数、用液量、加砂量、排量和停泵压力等)的综合影响。在实际开发中可能经常遇到不同平台的水平井产量差异巨大的情况,有时同一平台的水平井也可能有着截然不同的生产特征。为了解释这些现象,我们需要研究哪些参数对页岩气水平井生产起主导作用,即开展水平井产能主控因素分析。
传统的油气藏生产主控因素分析一般借助数值模拟开展,例如,传统的技术中,公开号为CN104698152A的中国专利申请公开了一种研究泥页岩吸附天然气主控因素的方法,该方法利用平行实验和数值模拟,通过分别控制单一因素:有机质丰度、粘土矿物含量、有机质成熟度、天然气组成、温压和湿度的变化,来揭示有机质丰度、粘土矿物含量、有机质成熟度、天然气组成、温压和湿度对泥页岩吸附能力的影响,为页岩气勘探有利区预测奠定基础。
但对于复杂的问题,数值模拟模型可能不能考虑到所有物理过程而引入模型误差,进而会影响主控因素分析结果的准确性。随着国内页岩气开发的不断推进,目前已经积累了一定数量的水平井开发数据,这些数据为基于数据挖掘的页岩气产能主控因素分析提供了基础。基于实际的开发数据进行分析,能够消除模型误差的影响,提高结果的准确性。
发明内容
本发明的目的在于克服现有技术的不足,提供基于决策树的页岩气开发主控因素分析方法,可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性等。
本发明的目的是通过以下方案实现的:
基于决策树的页岩气开发主控因素分析方法,包括步骤:
S1,获取页岩气开发数据集;
S2,基于获取的页岩气开发数据集,建立决策树模型;
S3,训练决策树模型;
S4,基于训练后的决策树模型,计算特征重要性;
S5,根据特征重要性分析判断主控因素。
进一步地,在步骤S1中,包括标记步骤:将获取的页岩气开发数据集标记为数据集D,且数据集D中每一个样本为一口页岩气井的数据,包括地质参数、工程参数和生产指标,并将每一个地质参数和工程参数称为一个特征,标记为A。
进一步地,在步骤S2中,所述决策树模型采用CART回归树,在选定的某一决策树节点,对于任意划分的特征A,对应的任意划分点s,数据集D划分成数据集D1和D2,作如下和方差计算处理:
其中,xi为样本输入,yi为样本输出,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值;然后,设定节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度作为CART回归树终止标准;
进一步地,在步骤S3中,训练决策树模型时,输入为训练集D,节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度;从根节点开始,用训练集递归地建立CART回归树。
进一步地,用训练集递归地建立CART回归树,包括如下步骤:
S31,对于当前节点,如果树的最大深度达到设定值,当前节点停止递归;
S32,对于当前节点的数据集为D,如果样本个数小于节点最小样本个数阈值或者没有特征,当前节点停止递归;
S33,计算样本集D的和方差,如果和方差小于节点划分最小和方差阈值,当前节点停止递归;
S34,计算当前节点现有的各个特征的各个划分点对数据集D的和方差,选择和方差最小的特征A和对应的划分点s;根据这个最优特征和划分点,把数据集划分成两部分D1和D2,同时建立当前节点的左右子节点,左子节点的数据集为D1,右子节点的数据集为D2;
S35,重复步骤S31~S34,依此递归下去,直到达到终止标准。
进一步地,在步骤S4中,包括步骤:
S41,计算节点j的重用性nj,计算公式如下:
S42,计算特征i的重要性FIi,计算公式如下:
其中,
进一步地,在步骤S5中,包括步骤:基于计算所得的各特征的特征重要性进行排序,得到任一数量内的页岩气开发主控因素。
本发明的有益效果包括:
(1)本发明采用数据驱动的方法,可以避免基于数值模拟方的诸多问题,有效提高页岩气开发主控因素判断的准确性。
(2)本发明以川南地区页岩气水平井体积压裂效果为工程背景,以提高压裂后单井产能为目标,充分考虑了页岩储层静态参数,深入研究了TOC、孔隙度等地质参数与工程参数对产能的影响规律,基于决策树计算的数学模型,准确找到了影响产能的主控因素及其权重,为川南地区页岩气井的产能预测提供了一种新思路和新方法,提高了主控因素分析方法的准确度,并有效地指导现场施工。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的方法步骤流程图;
图2为本发明实施例的主控因素分析效果示意图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
如图1,2所示,基于决策树的页岩气开发主控因素分析方法,包括步骤:
S1,获取页岩气开发数据集;
S2,基于获取的页岩气开发数据集,建立决策树模型;
S3,训练决策树模型;
S4,基于训练后的决策树模型,计算特征重要性;
S5,根据特征重要性分析判断主控因素。
该实施例中,数据集D包含146口井的数据,其中地质和工程参数包括:五峰组长度、1小层长度、2小层长度、靶体中部距优质页岩底部距离、I类储层钻遇长度、I类储层钻遇长度、垂深、实际压裂段长、平均分段段长、实际段数、总簇数、单段射孔簇数、簇间距、排量、泵压、总液量、平均单段液量、用液强度、总滑溜水量、总线性胶量、总砂量、平均单段砂量、加砂强度、100目粉砂总量、40/70目陶粒总量、平均停泵压力、平均单段100目粉砂、平均单段40/70目陶粒、水平最大主应力、水平最小主应力、垂向应力、TOC、含气量、孔隙度、矿物脆性和闷井天数,生产指标为90天累计产量。这样,数据集D共含36个输入特征,1个输出指标。
决策数模型的类别选取为CART回归树。CART回归树的特征选择标准选取为和方差。节点最小样本个数阈值设置为1,节点划分最小和方差阈值设置为0,树的最大深度设置为8。
训练决策树模型后,计算各特征的重要性,最终进行排序,如图2所示。决策树选取的90天累计产量前10个主控因素为:平均单段液量、泵压、平均停泵压力、100目粉砂总量、平均单段砂量、排量、总液量、用液强度、靶体中部距优质页岩底部距离和2小层长度。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试或者实际的数据在程序实现中存在于只读存储器(Random Access Memory,RAM)、随机存取存储器(Random Access Memory,RAM)等。
Claims (7)
1.基于决策树的页岩气开发主控因素分析方法,其特征在于,包括步骤:
S1,获取页岩气开发数据集;
S2,基于获取的页岩气开发数据集,建立决策树模型;
S3,训练决策树模型;
S4,基于训练后的决策树模型,计算特征重要性;
S5,根据特征重要性分析判断主控因素。
2.根据权利要求1所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S1中,包括标记步骤:将获取的页岩气开发数据集标记为数据集D,且数据集D中每一个样本为一口页岩气井的数据,包括地质参数、工程参数和生产指标,并将每一个地质参数和工程参数称为一个特征,标记为A。
4.根据权利要求3所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S3中,训练决策树模型时,输入为训练集D,节点最小样本个数阈值、节点划分最小和方差阈值和树的最大深度;从根节点开始,用训练集递归地建立CART回归树。
5.根据权利要求4所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,用训练集递归地建立CART回归树,包括如下步骤:
S31,对于当前节点,如果树的最大深度达到设定值,当前节点停止递归;
S32,对于当前节点的数据集为D,如果样本个数小于节点最小样本个数阈值或者没有特征,当前节点停止递归;
S33,计算样本集D的和方差,如果和方差小于节点划分最小和方差阈值,当前节点停止递归;
S34,计算当前节点现有的各个特征的各个划分点对数据集D的和方差,选择和方差最小的特征A和对应的划分点s;根据这个最优特征和划分点,把数据集划分成两部分D1和D2,同时建立当前节点的左右子节点,左子节点的数据集为D1,右子节点的数据集为D2;
S35,重复步骤S31~S34,依此递归下去,直到达到终止标准。
7.根据权利要求6所述的基于决策树的页岩气开发主控因素分析方法,其特征在于,在步骤S5中,包括步骤:基于计算所得的各特征的特征重要性进行排序,得到任一数量内的页岩气开发主控因素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110570373.2A CN113153286B (zh) | 2021-05-25 | 2021-05-25 | 基于决策树的页岩气开发主控因素分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110570373.2A CN113153286B (zh) | 2021-05-25 | 2021-05-25 | 基于决策树的页岩气开发主控因素分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113153286A true CN113153286A (zh) | 2021-07-23 |
CN113153286B CN113153286B (zh) | 2024-04-30 |
Family
ID=76877405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110570373.2A Active CN113153286B (zh) | 2021-05-25 | 2021-05-25 | 基于决策树的页岩气开发主控因素分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113153286B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107589236A (zh) * | 2017-09-14 | 2018-01-16 | 中国地质调查局油气资源调查中心 | 一种基于模糊矩阵的页岩气多因素选区评价方法 |
US20180260531A1 (en) * | 2017-03-10 | 2018-09-13 | Microsoft Technology Licensing, Llc | Training random decision trees for sensor data processing |
CN109214026A (zh) * | 2017-07-07 | 2019-01-15 | 中国石油天然气股份有限公司 | 一种页岩气水平井初期产能预测方法 |
CN112561144A (zh) * | 2020-12-07 | 2021-03-26 | 西安石油大学 | 一种致密油压裂水平井产能主控因素评判与产能预测方法 |
-
2021
- 2021-05-25 CN CN202110570373.2A patent/CN113153286B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180260531A1 (en) * | 2017-03-10 | 2018-09-13 | Microsoft Technology Licensing, Llc | Training random decision trees for sensor data processing |
CN109214026A (zh) * | 2017-07-07 | 2019-01-15 | 中国石油天然气股份有限公司 | 一种页岩气水平井初期产能预测方法 |
CN107589236A (zh) * | 2017-09-14 | 2018-01-16 | 中国地质调查局油气资源调查中心 | 一种基于模糊矩阵的页岩气多因素选区评价方法 |
CN112561144A (zh) * | 2020-12-07 | 2021-03-26 | 西安石油大学 | 一种致密油压裂水平井产能主控因素评判与产能预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113153286B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111441767B (zh) | 油藏生产动态预测方法及装置 | |
CN105488583B (zh) | 预测致密油待评价区域可采储量的方法及装置 | |
CN112308269B (zh) | 用于低渗透油气藏的产能预测方法及装置 | |
CN112360411B (zh) | 基于图神经网络的局部井网注水开发优化方法 | |
CN114548568B (zh) | 一种致密页岩油藏注气吞吐参数协同优化方法 | |
CN104314547A (zh) | Hafd水平井压裂酸化分段优化方法及系统 | |
CN112016212B (zh) | 一种基于渗流控制方程的储层纵向非均质性评价方法 | |
CN105719097A (zh) | 缝洞型油藏动态分析与注水管理系统 | |
Mahdiani et al. | A new heuristic model for estimating the oil formation volume factor | |
CN113792479B (zh) | 一种基于物理约束的煤层气藏压裂效果评价方法 | |
CN109063403B (zh) | 一种滑溜水压裂优化设计方法 | |
CN112282742B (zh) | 一种页岩油优质储层的预测方法 | |
CN106014365B (zh) | 一种预测水驱开发油田产量递减率的方法 | |
CN110469299A (zh) | 一种采油井注水开发见效效果评价方法 | |
CN107451671B (zh) | 用于预测页岩地层压裂后初始产能的方法及系统 | |
CN110717270B (zh) | 一种基于数据的油气藏仿真模拟方法 | |
CN114139390A (zh) | 一种适用于压裂水平井裂缝参数的一体化优化方法及装置 | |
CN113153286A (zh) | 基于决策树的页岩气开发主控因素分析方法 | |
CN116011268A (zh) | 一种优势渗流通道的定量描述方法 | |
CN110851982B (zh) | 一种中低渗油藏减氧空气驱可行性分析方法 | |
CN115705452A (zh) | 整装砂岩油藏开发中后期的新型采收率预测方法 | |
CN115600355A (zh) | 一种基于稀疏回归的页岩气开发主控因素分析方法 | |
CN114060019A (zh) | 一种聚合物驱后粘土颗粒调剖效果的预测方法 | |
CN115034112B (zh) | 基于测井数据确定毛管力曲线及毛管力曲线分布的方法 | |
CN116882259A (zh) | 一种页岩气多段压裂水平井产能主控因素分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100007 No. 9 North Main Street, Dongcheng District, Beijing, Dongzhimen Applicant after: PetroChina Company Limited Address before: 100011 Beijing city Dongcheng District No. 16 Andrew Applicant before: PetroChina Company Limited |
|
GR01 | Patent grant | ||
GR01 | Patent grant |