CN109345007B - 一种基于XGBoost特征选择的有利储层发育区预测方法 - Google Patents
一种基于XGBoost特征选择的有利储层发育区预测方法 Download PDFInfo
- Publication number
- CN109345007B CN109345007B CN201811066089.6A CN201811066089A CN109345007B CN 109345007 B CN109345007 B CN 109345007B CN 201811066089 A CN201811066089 A CN 201811066089A CN 109345007 B CN109345007 B CN 109345007B
- Authority
- CN
- China
- Prior art keywords
- reservoir development
- development area
- seismic
- attributes
- xgboost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Geophysics And Detection Of Objects (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于XGBoost特征选择的有利储层发育区预测方法,其特征在于利用规范化方法处理地震属性以及岩性剖面数据,通过对储层发育区的分类标准进行规定,形成带有类别标签的样本集;进而采用XGBoost算法对地震属性集进行特征选择,选择相关性大的地震属性构成关键属性集;最后采用支持向量机(SVM)分类算法对未知区域的储层发育区类别进行预测。本发明提供的方法可以有效的提高有利储层发育区预测的准确率,辅助地质人员快速地圈定有利目标。
Description
技术领域
本发明属于地球物理勘探领域和机器学习领域,具体涉及一种基于XGBoost特征选择的有利储层发育区预测方法。
背景技术
在进行有利储层发育区预测的过程中,传统的方式是通过地震属性分析得到沉积相和层位构造,通过测井曲线得到砂岩位置,通过多个井的测井曲线对比得到储层的分布,最后依据上述得到的数据分析物源和油气聚集区。而以上步骤部分是不确定性的,是根据人工经验进行的。随着云计算、物联网、大数据的发展,勘探过程中对数据精度要求越来越高,而传统手段预测有利储层发育区时间花费长、利用的地震属性种类少,忽略了未使用的地震属性可能存在的对分类结果的支配作用,导致预测结果往往不准确。
机器学习中分类预测的相关技术可应用到有利储层发育区预测,为地质人员圈定有利储层发育区起到了辅助作用。但是地震属性数量众多,其中可能存在不重要以及冗余的属性,属性个数越多,分析属性、训练模型所需的时间就越长且容易引起“维度灾难”。而好的属性能够提升分类模型的性能,提高预测的准确率,因此,特征选择显得尤为重要。
发明内容
为了克服传统有利储层发育区预测过程中遇到的困难,辅助地质人员快速圈定有利储层发育区,本发明提供了一种基于XGBoost特征选择的有利储层发育区预测方法:首先采用XGBoost特征选择,得到与类别标签相关性大的若干地震属性。其次,采用基于监督学习的SVM分类预测算法,用于预测未知区域是否为有利储层发育区。
为实现上述目的,本发明技术方案主要包括以下四个步骤:
A.数据采集及预处理:
从勘探数据库、地震数据体等数据源中提取地震属性以及岩性剖面数据,采用规范化方法对地震属性进行预处理,将属性数值映射到[0,1]区间,获得样本集。在此采用的规范化方法为Min-Max标准化,计算公式如下:
B.制定储层发育区分类标准:
根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,分别是非有利储层发育区(标记为0)、储层发育区(标记为1)、有利储层发育区(标记为2)。
C.采用XGBoost选择关键属性:
采用XGBoost方法对所有地震属性进行相关性分析,研究地震属性与储层发育区类别标签之间的相关性大小,选择相关性大的地震属性构成关键属性子集,去除不必要及冗余属性。
D.采用支持向量机预测分类:
以特征选择出的关键地震属性集作为输入变量,储层发育区类别标签(0,1,2)作为输出变量,将预处理后的地震数据及类别标签构成训练样本,采用支持向量机(SVM)分类模型进行训练,利用训练好的模型对未知区域进行有利储层发育区预测。
本发明的有益效果是:XGBoost是一种优化算法,具有很高的分类精度。采用基于XGBoost的特征选择方法,可以有效的考虑到多种地震属性之间的隐含关系,从而使预测结果更加准确。融入机器学习中关于特征选择以及分类预测的相关知识为地质人员在有利储层发育区预测上提供了辅助作用。
附图说明
图1是本发明的流程图
上图中:11.地震属性,12.岩性剖面数据,13.Min-Max标准化,14.XGBoost方法,15.关键属性子集,16.SVM分类器,17.未知区域的地震属性集。
具体实施方式
下面结合图1对本发明作进一步详细的描述:
A.数据采集及预处理:
从勘探数据库、地震数据体等数据源中提取地震属性11以及岩性剖面数据12,因不同地震属性的衡量规格不同,容易影响分类模型学习效率,于是采用规范化方法对地震属性进行预处理,将属性数值映射到[0,1]区间,作为输入变量X,记作X={x1,x2…xn},其中n为地震属性的个数。在此采用的规范化方法为Min-Max标准化13,计算公式如下:
B.制定储层发育区分类标准:
通过A提取的岩性剖面数据为:砂岩、页岩等具体类型,根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,举例如下:①砂岩累计厚度低于4m标记为0,表示非有利储层发育区;②砂岩累计厚度4m-10m或者单个小层(连续砂岩)厚度3m以上标记为1,表示储层发育区;③砂岩累计厚度10m以上标记为2,表示有利储层发育区。将类别标签作为输出变量Y,记作Y={y1,y2,y3}={1,2,3}。
C.采用XGBoost选择关键属性:
根据XGBoost方法14对所有地震属性进行相关性分析,研究地震属性与储层发育区类别标签之间的相关性大小,选择相关性大的地震属性构成关键属性子集15,去除不必要及冗余属性。
(1)XGBoost特征选择的原理:通过以下公式计算各个地震属性的增益,进而选择增益最大地震属性去做分裂,最后各地震属性的重要性为各地震属性在所有树中出现的次数之和。
式中:G表示节点损失函数的一阶导数之和,H表示节点损失函数的二阶导数之和,L代表左子树,R代表右子树。
(2)根据XGBoost原理计算地震属性集中每个属性xi与类y1、y2、y3的相关性,根据相关性大小按降序排列,只取重要性得分大于0的属性作为关键属性,记作X={x1,x2…xk},其中k为特征选择后的属性个数。
D.采用支持向量机(SVM)预测分类:
采用SVM分类器16进行预测分类的步骤如下:
(1)优先选择径向基核函数。在一般情况下,径向基核作为第一选择,具有较少的数值计算困难。
(2)通过交叉验证选择惩罚参数以及核函数参数的最优取值。
(3)利用选取的最佳参数进行训练。以样本集X={x1,x2…xk}及对应的类别标签Y作为训练数据,进行SVM分类模型的训练,使误差达到最小。
(4)运用该分类器进行预测。通过输入未知区域的地震属性集17,预测该区域是否为有利储层发育区,进而对有利储层发育区进行圈定。
以上所述,仅是本发明的较佳实施例,任何熟悉本专业的技术人员可能利用上述阐述的技术方案加以改型或变更为等同变化的等同实例。凡未脱离本发明技术方案内容,依据发明的技术方案对上述实施例进行的任何简单修改、变更或改型,均属于发明技术方案的保护范围。
Claims (1)
1.一种基于XGBoost特征选择的有利储层发育区预测方法,其特征在于,包括以下步骤:
从勘探数据库、地震数据体数据源中提取地震属性以及岩性剖面数据,采用规范化方法Min-Max标准化对地震属性进行预处理,将属性数值映射到[0,1]区间,获得样本集;根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,分别是非有利储层发育区、储层发育区、有利储层发育区;采用XGBoost方法对所有地震属性进行相关性分析,研究地震属性与储层发育区类别标签之间的相关性大小,选择相关性大的地震属性构成关键属性子集,去除不必要及冗余属性;以关键属性子集作为输入变量,储层发育区类别标签作为输出变量,将预处理后的地震数据及类别标签构成训练样本,采用支持向量机(SVM)分类模型进行训练,利用训练好的模型对未知区域进行有利储层发育区预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811066089.6A CN109345007B (zh) | 2018-09-13 | 2018-09-13 | 一种基于XGBoost特征选择的有利储层发育区预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811066089.6A CN109345007B (zh) | 2018-09-13 | 2018-09-13 | 一种基于XGBoost特征选择的有利储层发育区预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109345007A CN109345007A (zh) | 2019-02-15 |
CN109345007B true CN109345007B (zh) | 2021-06-04 |
Family
ID=65304986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811066089.6A Active CN109345007B (zh) | 2018-09-13 | 2018-09-13 | 一种基于XGBoost特征选择的有利储层发育区预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109345007B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110059755B (zh) * | 2019-04-22 | 2023-10-13 | 中国石油大学(华东) | 一种多特征评价准则融合的地震属性优选方法 |
CN110033053A (zh) * | 2019-04-22 | 2019-07-19 | 中国石油大学(华东) | 基于改进果蝇优化孪生支持向量机的有利储层预测方法 |
CN110288199A (zh) * | 2019-05-29 | 2019-09-27 | 北京航空航天大学 | 产品质量预测的方法 |
CN110824563A (zh) * | 2019-10-21 | 2020-02-21 | 中国海洋石油集团有限公司 | 一种基于Xgboost算法的储层岩性预测方法 |
CN110837115B (zh) * | 2019-10-31 | 2023-02-28 | 中国石油天然气股份有限公司 | 陆相混积岩致密储层岩性的地震识别方法及装置 |
CN111538879A (zh) * | 2020-04-21 | 2020-08-14 | 中国石油大学(华东) | 一种基于半监督卷积神经网络的储层预测方法 |
CN113642772A (zh) * | 2021-07-13 | 2021-11-12 | 重庆科技学院 | 基于机器学习的测井储层识别预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6370547B1 (en) * | 1999-04-21 | 2002-04-09 | Union Oil Company Of California | Database correlation method |
CN102478668A (zh) * | 2010-11-30 | 2012-05-30 | 中国石油天然气集团公司 | 一种应用地震多属性参数预测煤层厚度的方法 |
CN103777243A (zh) * | 2012-10-25 | 2014-05-07 | 中国石油化工股份有限公司 | 砂泥岩薄互层储层厚度预测方法 |
CN104330828A (zh) * | 2014-10-27 | 2015-02-04 | 中国石油天然气股份有限公司 | 甜点储层的预测方法及预测装置 |
CN106842301A (zh) * | 2016-12-22 | 2017-06-13 | 中国石油天然气股份有限公司 | 一种凝灰质砂岩有利储层的定量识别与预测方法 |
CN107356958A (zh) * | 2017-07-21 | 2017-11-17 | 西南石油大学 | 一种基于地质信息约束的河流相储层分步地震相预测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8233350B2 (en) * | 2007-08-29 | 2012-07-31 | Spectraseis Ag | Frequency shift reservoir localization |
US9128203B2 (en) * | 2011-09-28 | 2015-09-08 | Saudi Arabian Oil Company | Reservoir properties prediction with least square support vector machine |
-
2018
- 2018-09-13 CN CN201811066089.6A patent/CN109345007B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6370547B1 (en) * | 1999-04-21 | 2002-04-09 | Union Oil Company Of California | Database correlation method |
CN102478668A (zh) * | 2010-11-30 | 2012-05-30 | 中国石油天然气集团公司 | 一种应用地震多属性参数预测煤层厚度的方法 |
CN103777243A (zh) * | 2012-10-25 | 2014-05-07 | 中国石油化工股份有限公司 | 砂泥岩薄互层储层厚度预测方法 |
CN104330828A (zh) * | 2014-10-27 | 2015-02-04 | 中国石油天然气股份有限公司 | 甜点储层的预测方法及预测装置 |
CN106842301A (zh) * | 2016-12-22 | 2017-06-13 | 中国石油天然气股份有限公司 | 一种凝灰质砂岩有利储层的定量识别与预测方法 |
CN107356958A (zh) * | 2017-07-21 | 2017-11-17 | 西南石油大学 | 一种基于地质信息约束的河流相储层分步地震相预测方法 |
Non-Patent Citations (1)
Title |
---|
多元信息融合在地震属性储层预测中的应用;陈德进;《中国优秀硕士学位论文全文数据库基础科学辑》;20160430;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109345007A (zh) | 2019-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109345007B (zh) | 一种基于XGBoost特征选择的有利储层发育区预测方法 | |
CN110674841B (zh) | 一种基于聚类算法的测井曲线识别方法 | |
CN109800863B (zh) | 一种基于模糊理论和神经网络的测井相识别方法 | |
CN109061765B (zh) | 非均质薄砂岩互层油藏的圈闭评价方法 | |
CN107545577B (zh) | 基于神经网络的沉积相图像分割方法 | |
US8090538B2 (en) | System and method for interpretation of well data | |
CN109902390B (zh) | 一种基于小样本扩充的有利储层发育区预测方法 | |
CN112684497B (zh) | 地震波形聚类方法和装置 | |
CN108595414A (zh) | 基于源汇空间变量推理的土壤重金属企业污染源识别方法 | |
CN109407173A (zh) | 基于常规测井曲线的岩性精细化和自动化识别方法 | |
CN105760673A (zh) | 一种河流相储层地震敏感参数模板分析方法 | |
CN107038505A (zh) | 基于机器学习的找矿模型预测方法 | |
Zhu et al. | Rapid identification of high-quality marine shale gas reservoirs based on the oversampling method and random forest algorithm | |
CN105467449A (zh) | 基于地震分级敏感属性融合的深层薄互储层定量表征方法 | |
CN109613623B (zh) | 一种基于残差网络的岩性预测方法 | |
CN111079783B (zh) | 一种基于多核集成学习识别地层岩性参数的方法 | |
CN110059755B (zh) | 一种多特征评价准则融合的地震属性优选方法 | |
Ren et al. | Valuable data extraction for resistivity imaging logging interpretation | |
CN114114414A (zh) | 一种页岩储层“甜点”信息人工智能预测方法 | |
CN117473305A (zh) | 一种近邻信息增强的储层参数预测方法及系统 | |
CN111626377B (zh) | 一种岩相识别方法、装置、设备及存储介质 | |
CN115204277A (zh) | 一种基于多阈值量化输出观测的渐近最优岩性预测方法 | |
CN110570102A (zh) | 一种储层评价方法 | |
CN117452518B (zh) | 基于多学科数据融合聚类算法的储层岩性预测方法 | |
CN117633658B (zh) | 岩石储层岩性识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |