CN114638300A - 一种识别页岩油气藏“甜点”的方法、装置及存储介质 - Google Patents
一种识别页岩油气藏“甜点”的方法、装置及存储介质 Download PDFInfo
- Publication number
- CN114638300A CN114638300A CN202210259906.XA CN202210259906A CN114638300A CN 114638300 A CN114638300 A CN 114638300A CN 202210259906 A CN202210259906 A CN 202210259906A CN 114638300 A CN114638300 A CN 114638300A
- Authority
- CN
- China
- Prior art keywords
- quality
- factors
- sweet spot
- determining
- reservoir
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明涉及一种识别页岩油气藏“甜点”的方法、装置及存储介质,该方法包括:获取主控因素;根据所述主控因素,确定分类类别;基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;根据所述甜点评价因子,确定页岩气的有利勘探区。本发明通过运用机器学习的算法建立甜点评价模型,可完成构造复杂区页岩气甜点综合评价,优选富集高产带,帮助高效勘探开发。
Description
技术领域
本发明涉及勘探开采技术领域,尤其涉及一种识别页岩油气藏“甜点”的方法、装置及存储介质。
背景技术
页岩气产自富有机页岩,页岩气藏是自生自储连续型富集气藏。页岩气储层具有矿物颗粒和层理结构精细、渗透率极低、孔隙多尺度、气体储集流动特征独特等特点,增加了对页岩岩石物理性质研究的复杂性。页岩气具有自生性、自我储存性和自我保护性质,存在低产量、无自然产能、无水气边界等特征。目前中国已在多处发现了页岩气资源,发展前景良好。但与北美相比,中国页岩气形成与发展具明显的特殊性,许多勘探开发难题亟待解决。页岩气的发展是重要资源保障,而页岩油气藏“甜点”评价是权衡页岩地层是否具有开采价值的有效方法。
在现有技术中,一种是以地球物理预测为主,实现页岩甜点参数评价,该种方法研究也较深入,地质甜点预测技术包含总有机碳含量(TOC)、压力系数、含气量预测等,工程甜点预测技术包含脆性指数预测等,地质与工程相结合的甜点评价体系尚不完善,主要采取的是单一敏感参数因素的预测,由于单一因素有时候会产生一些不可预测的问题,不利于判断页岩气甜点;而另一种传统的预测方法主要是采用岩石物理、测井数据、全方位或宽方位三维地震数据综合进行页岩气储层评价并寻找页岩气勘探开发的甜点层。或者基于页岩层的有机化特征、现场含气量和页岩层的岩石力学特征等综合评价页岩气井不同层位的甜点层。然而,由于现有技术对页岩甜点层进行研究和识判的过程复杂,准确度低,因此不利于实现页岩气的高产。
综上,现有的页岩油气藏“甜点”评价方法存在评价不准、过程复杂的问题,目前还缺乏准确有效的识别页岩油气藏“甜点”的方法。因此,如何高效识别预测页岩油气藏“甜点”是亟待解决的问题。
发明内容
有鉴于此,有必要提供及一种识别页岩油气藏“甜点”的方法、装置及存储介质,用以克服现有技术中难以高效识别预测页岩油气藏“甜点”的问题。
为了解决上述技术问题,本发明提供一种识别页岩油气藏“甜点”的方法,包括:
获取主控因素;
根据所述主控因素,确定分类类别;
基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;
根据所述甜点评价因子,确定页岩气的有利勘探区。
进一步地,所述获取主控因素,包括:
获取岩心数据、地震数据和测井数据;
对所述岩心数据、所述地震数据和所述测井数据中的所有数据进行皮尔逊相关性分析,计算相关系数;
选取满足相关系数预设范围的数据,作为所述主控因素。
进一步地,所述根据所述主控因素,确定分类类别,包括:
根据所述主控因素,确定所述主控因素对应的所述分类类别,其中,所述分类类别包括有机质质量特征类别、油藏质量特征类别和完井质量特征类别,所述有机质质量特征类别包括总有机碳含量、成熟度、储存容量中的至少一种,所述油藏质量特征类别包括孔隙度、密度、厚度中的至少一种,所述完井质量类别包括粘土含量、泊松比、杨氏模量、脆度、压力中的至少一种。
进一步地,所述甜点评价模型包括有机质质量模型,所述甜点评价因子包括有机质影响因子,所述基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,包括:
根据属于有机质质量特征类别的主控因素,构建有机质质量训练集;
从所述有机质质量训练集中抽取K1个有机质样本集,其中,每个有机质样本集的容量为预设容量;
对于K1个有机质样本集,分别建立K1个决策树模型,对应得到K1个决策结果;
根据K1个决策结果进行投票,确定最终的所述有机质影响因子。
进一步地,所述甜点评价模型包括油藏质量模型,所述甜点评价因子包括油藏质量影响因子,所述基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,包括:
根据属于油藏质量特征类别的主控因素,构建油藏质量训练集;
从所述油藏质量训练集中抽取K2个油藏质量样本集,其中,每个油藏质量样本集的容量为预设容量;
对于K2个油藏质量样本集,分别建立K2个决策树模型,对应得到K2个决策结果;
根据K2个决策结果进行投票,确定最终的所述油藏质量影响因子。
进一步地,所述甜点评价模型包括完井质量模型,所述甜点评价因子包括完井质量影响因子,所述基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,包括:
根据属于完井质量特征类别的主控因素,构建完井质量训练集;
从所述完井质量训练集中抽取K3个有机质样本集,其中,每个完井质量样本集的容量为预设容量;
对于K3个完井质量样本集,分别建立K3个决策树模型,对应得到K3个决策结果;
根据K3个决策结果进行投票,确定最终的所述完井质量影响因子。
进一步地,所述甜点评价因子包括有机质影响因子、油藏质量影响因子和完井质量影响因子,所述根据所述甜点评价因子,确定页岩气的有利勘探区,包括:
对所述有机质质量模型筛选出的有机质影响因子按照敏感度进行排序,确定第一排序结果;
对所述油藏质量模型筛选出的油藏质量影响因子按照敏感度进行排序,确定第二排序结果;
对所述完井质量模型筛选出的完井质量影响因子按照敏感度进行排序,确定第三排序结果;
根据所述第一排序结果、第二排序结果和第三排序结果,判定页岩气有利勘探区。
进一步地,所述甜点评价模型的建立过程,包括:
根据属于所述分类类别的所述主控因素,形成样本集,其中,所述主控因素对应的标签为甜点类型;
针对单个决策树,从样本集中抽取样本形成至少一个训练集和测试集;
从根节点出发进行节点分裂,其中,分裂后形成的两个子节点选择基尼系数或者信息增益进行衡量,分裂时选择的M个特征个数从训练样本的M个特征中进行随机选择,按照计算出来的信息增益或者基尼系数,从M个特征中依据分裂原则选择最合适的特征进行分裂;
每个节点按照根节点的分裂方式进行分裂,直到不能分裂为止,形成叶子节点;
针对多个完成构建的决策树,形成随机森林,建立所述甜点评价模型。
本发明还提供了一种识别页岩油气藏“甜点”的装置,包括:
获取单元,用于获取主控因素;
处理单元,用于根据所述主控因素,确定分类类别;用于基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;
预测单元,用于根据所述甜点评价因子,确定页岩气的有利勘探区。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如上所述的识别页岩油气藏“甜点”的方法。
与现有技术相比,本发明的有益效果包括:首先,对主控因素进行有效的获取;然后,将主控因素进行有效的分类,确定主控因素属于哪一种类别;进而,利用随机森林,对于不同分类类别的主控因素进行建模,确定甜点评价模型,从而确定主控因素中的甜点评价因子;最后,基于甜点评价因子,对页岩气的有利勘探区进行有效地勘探。综上,本发明在利用单一敏感参数进行页岩气甜点关键参数预测的基础上改进的一种新的方法,考虑因素较全面,综合考虑了多方面的敏感参数,规避单一敏感参数预测不同的甜点关键参数时结果相似的问题,使预测更为准确,具有可推广性,且通过运用机器学习的算法建立甜点评价模型,可完成构造复杂区页岩气甜点综合评价,过程简单,且能通过模型建立对复杂区进行预测,实用性强,应用场景广泛,优选富集高产带,帮助高效勘探开发。
附图说明
图1为本发明提供的识别页岩油气藏“甜点”的方法一实施例的流程示意图;
图2为本发明提供的图1中步骤S101一实施例的流程示意图;
图3为本发明提供的图1中步骤S103一实施例的流程示意图;
图4为本发明提供的图1中步骤S103另一实施例的流程示意图;
图5为本发明提供的图1中步骤S103又一实施例的流程示意图;
图6为本发明提供的图1中步骤S104一实施例的流程示意图;
图7为本发明提供的甜点评价模型的建立一实施例的流程示意图;
图8为本发明提供的随机森林算法建立模型一实施例的建立示意图;
图9为本发明提供的三质量数据归一化一实施例的推理链示意图;
图10为本发明提供的识别页岩油气藏“甜点”的装置一实施例的结构示意图;
图11为本发明提供的电子设备一实施例的结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。此外,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明的描述中,提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,所描述的实施例可以与其它实施例相结合。
本发明提供了一种识别页岩油气藏“甜点”的方法、装置及存储介质,探究多个敏感参数对不同的甜点关键参数的预测,构造复杂区页岩气甜点的综合评价,为进一步提高识别页岩油气藏“甜点”的的准确性和高效性提供了新思路。
在实施例描述之前,对相关词语进行释义:
页岩气甜点:是指在某页岩气藏勘探区域里商业开采率比较高的地方;
有机质质量:是指单位体积土壤中含有的各种动植物残体与微生物及其分解合成的有机物质的相关参数,包括总有机碳含量(TOC),成熟度,干酪根类型,储层容量等;
油藏质量:对油气藏形成的可能性、特性、储量、质量等适时作出参数评价,包括孔隙度,渗透率、饱和度、密度、厚度等;
完井质量:裸眼井钻达设计井深后,使井底和油层以一定结构连通起来,评价生成的结构的相关参数,包括粘土含量、泊松比、杨氏模量、脆度、压力等。
基于上述技术名词的描述,现有技术中,往往利用单一敏感参数因素的预测,或者结合岩石物理、测井数据、三维地震数据进行综合评价,以上方法存在评价不准、过程复杂的问题,难以有效进行页岩气甜点的预测,因而,本发明旨在提出一种高效准确的识别页岩油气藏“甜点”的方法。
以下分别对具体实施例进行详细说明:
本发明实施例提供了一种识别页岩油气藏“甜点”的方法,结合图1来看,图1为本发明提供的识别页岩油气藏“甜点”的方法一实施例的流程示意图,包括步骤S101至步骤S104,其中:
在步骤S101中,获取主控因素;
在步骤S102中,根据所述主控因素,确定分类类别;
在步骤S103中,基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;
在步骤S104中,根据所述甜点评价因子,确定页岩气的有利勘探区。
在本发明实施例中,首先,对主控因素进行有效的获取;然后,将主控因素进行有效的分类,确定主控因素属于哪一种类别;进而,利用随机森林,对于不同分类类别的主控因素进行建模,确定甜点评价模型,从而确定主控因素中的甜点评价因子;最后,基于甜点评价因子,对页岩气的有利勘探区进行有效地勘探。
需要说明的是,本发明技术思路是运用相关性分析从岩心数据、测井数据和地震资料筛选出页岩气富集成藏的主控因素;基于相关性分析选取的主控因素,将影响“甜点”的指标分为3类:有机质质量(Organic Quality)、油藏质量(Reservoir Quality)和完井质量(Completion Quality),获得分类结果;运用三质量获得的分类结果,运用机器学习中的随机森林算法建立页岩甜点评价模型M;基于随机森林算法获得的评价模型M,确定页岩甜点评价因子Ms;根据评价因子Ms帮助判定页岩气有利勘探区。本发明通过运用机器学习建立甜点评价模型,可完成构造复杂区页岩甜点综合评价,优选富集高产带,帮助高效勘探开发。
作为优选的实施例,结合图2来看,图2为本发明提供的图1中步骤S101一实施例的流程示意图,步骤S101包括步骤S201至步骤S203,其中:
在步骤S201中,获取岩心数据、地震数据和测井数据;
在步骤S202中,对所述岩心数据、所述地震数据和所述测井数据中的所有数据进行皮尔逊相关性分析,计算相关系数;
在步骤S203中,选取满足相关系数预设范围的数据,作为所述主控因素。
在本发明实施例中,用皮尔逊(Pearson)系数,对岩心数据、地震数据和测井数据中的所有数据进行皮尔逊相关性分析,其中相关性越小的特征,越容易区分,因为我们需要选择相关性不大特征进行研究,所以根据皮尔逊计算的值最终选择了界限(cutoff)为[-0.5,0.5]之间的特征。
作为优选的实施例,上述步骤S102包括:
根据所述主控因素,确定所述主控因素对应的所述分类类别,其中,所述分类类别包括有机质质量特征类别、油藏质量特征类别和完井质量特征类别,所述有机质质量特征类别包括总有机碳含量、成熟度、储存容量中的至少一种,所述油藏质量特征类别包括孔隙度、密度、厚度中的至少一种,所述完井质量类别包括粘土含量、泊松比、杨氏模量、脆度、压力中的至少一种。
在本发明实施例中,将主控因素进行有效分类,对影响“甜点”的指标分为3类:有机质质量包括:总有机碳含量(TOC),成熟度,干酪根类型,储层容量;油藏质量包括:孔隙度,渗透率、饱和度、密度、厚度;完井质量包括:粘土含量,泊松比,杨氏模量,脆度,抗压强度,应力场,压力。我们对选出来的所有特征分类,确定了11个特征,其中有机质质量有:总有机碳含量、成熟度、储存容量;油藏质量有:孔隙度、密度、厚度;完井质量有:粘土含量、泊松比、杨氏模量、脆度、压力。
作为优选的实施例,所述甜点评价模型包括有机质质量模型,所述甜点评价因子包括有机质影响因子,结合图3来看,图3为本发明提供的图1中步骤S103一实施例的流程示意图,步骤S103包括步骤S301至步骤S304,其中:
在步骤S301中,根据属于有机质质量特征类别的主控因素,构建有机质质量训练集;
在步骤S302中,从所述有机质质量训练集中抽取K1个有机质样本集,其中,每个有机质样本集的容量为预设容量;
在步骤S303中,对于K1个有机质样本集,分别建立K1个决策树模型,对应得到K1个决策结果;
在步骤S304中,根据K1个决策结果进行投票,确定最终的所述有机质影响因子。
在本发明实施例中,对于选取的属于有机质质量特征类别的主控因素,运用机器学习中的随机森林算法建立有机质质量模型。
作为优选的实施例,所述甜点评价模型包括油藏质量模型,所述甜点评价因子包括油藏质量影响因子,结合图4来看,图4为本发明提供的图1中步骤S103另一实施例的流程示意图,步骤S103包括步骤S401至步骤S404,其中:
在步骤S401中,根据属于油藏质量特征类别的主控因素,构建油藏质量训练集;
在步骤S402中,从所述油藏质量训练集中抽取K2个油藏质量样本集,其中,每个油藏质量样本集的容量为预设容量;
在步骤S403中,对于K2个油藏质量样本集,分别建立K2个决策树模型,对应得到K2个决策结果;
在步骤S404中,根据K2个决策结果进行投票,确定最终的所述油藏质量影响因子。
在本发明实施例中,对于选取的属于油藏质量特征类别的主控因素,运用机器学习中的随机森林算法建立油藏质量模型。
作为优选的实施例,所述甜点评价模型包括完井质量模型,所述甜点评价因子包括完井质量影响因子,结合图5来看,图5为本发明提供的图1中步骤S103又一实施例的流程示意图,步骤S103包括步骤S501至步骤S504,其中:
在步骤S501中,根据属于完井质量特征类别的主控因素,构建完井质量训练集;
在步骤S502中,从所述完井质量训练集中抽取K3个有机质样本集,其中,每个完井质量样本集的容量为预设容量;
在步骤S503中,对于K3个完井质量样本集,分别建立K3个决策树模型,对应得到K3个决策结果;
在步骤S504中,根据K3个决策结果进行投票,确定最终的所述完井质量影响因子。
在本发明实施例中,对于选取的属于完井质量特征类别的主控因素,运用机器学习中的随机森林算法建立完井质量模型。
在本发明一个具体的实施例中,将选取的特征,分别按照有机质质量、油藏质量和完井质量利用机器学习的随机森林算法进行建模。有机质质量随机森林建模基本流程:首先,利用bootstrap抽样从有机质质量训练集抽取K1个样本,每个样本的样本容量都与原始训练集一样;然后,对K1个样本分别建立k1个决策树模型,得到K1种结果;最后,根据K1种结果对每个记录进行投票表决决定其最终重要的影响因子。油藏质量随机森林建模基本流程:首先,利用bootstrap抽样从有机质质量训练集抽取K2个样本,每个样本的样本容量都与原始训练集一样;然后,对K2个样本分别建立K2个决策树模型,得到K2种结果;最后,根据K2种结果对每个记录进行投票表决决定其最终重要的影响因子。完井质量随机森林建模基本流程:首先,利用bootstrap抽样从有机质质量训练集抽取K3个样本,每个样本的样本容量都与原始训练集一样;然后,对K3个样本分别建立K3个决策树模型,得到K3种结果;最后,根据K3种结果对每个记录进行投票表决决定其最终重要的影响因子。其中输入:三质量数据,输出:页岩气甜点预测结果。其中训练样本是选取的地层数据,标签是该地层是Ⅰ型、Ⅱ型、Ⅲ型甜点。
需要说明的是,Bootstrap又称自展法、自举法、自助法、靴带法,是统计学习中一种重采样(Resampling)技术,用来估计标准误差、置信区间和偏差。Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。机器学习中的Bagging,AdaBoost等方法其实都蕴含了Boostrap的思想,在集成学习的范畴里Bootstrap直接派生出了Bagging模型。
作为优选的实施例,所述甜点评价因子包括有机质影响因子、油藏质量影响因子和完井质量影响因子,结合图6来看,图6为本发明提供的图1中步骤S104一实施例的流程示意图,步骤S104包括步骤S601至步骤S604,其中:
在步骤S601中,对所述有机质质量模型筛选出的有机质影响因子按照敏感度进行排序,确定第一排序结果;
在步骤S602中,对所述油藏质量模型筛选出的油藏质量影响因子按照敏感度进行排序,确定第二排序结果;
在步骤S603中,对所述完井质量模型筛选出的完井质量影响因子按照敏感度进行排序,确定第三排序结果;
在步骤S604中,根据所述第一排序结果、第二排序结果和第三排序结果,判定页岩气有利勘探区。
在本发明实施例中,介绍了一种页岩气甜点关键参数TOC、含气量、孔隙度敏感参数的选择方法,针对性较强,研究中对选择出的敏感参数按照敏感度进行了排序,并通过多元统计分析方法拟合了页岩气甜点关键参数与敏感参数的关系式,相似度较高。
在本发明一个具体的实施例中,根据评价因子Ms,对选择出的评价因子Ms按照敏感度进行了排序,帮助判定页岩气有利勘探区。比如某区的某几口井最终得到的评价因子排序,有机质质量:σ总有机碳含量>σ储存容量>σ成熟度;油藏质量:
σ孔隙度>σ厚度>σ密度;完井质量:σ压力>σ脆度>σ泊松比>σ杨氏模量>σ粘土含量。
作为优选的实施例,结合图7来看,图7为本发明提供的甜点评价模型的建立一实施例的流程示意图,甜点评价模型的建立过程包括步骤S701至步骤S704,其中:
在步骤S701中,根据属于所述分类类别的所述主控因素,形成样本集,其中,所述主控因素对应的标签为甜点类型;
在步骤S702中,针对单个决策树,从样本集中抽取样本形成至少一个训练集和测试集;
在步骤S703中,从根节点出发进行节点分裂,其中,分裂后形成的两个子节点选择基尼系数或者信息增益进行衡量,分裂时选择的M个特征个数从训练样本的M个特征中进行随机选择,按照计算出来的信息增益或者基尼系数,从M个特征中依据分裂原则选择最合适的特征进行分裂;
在步骤S704中,每个节点按照根节点的分裂方式进行分裂,直到不能分裂为止,形成叶子节点;
在步骤S705中,针对多个完成构建的决策树,形成随机森林,建立所述甜点评价模型。
在本发明实施例中,将三质量的数据划分位训练集和测试集,然后运用机器学习模型(随机森林模型M)进行训练最终由多个决策树投票获得最优参数Ms,评价因子Ms帮助判定页岩气有利勘探区。
在本发明一个具体的实施例中,结合图8来看,图8为本发明提供的随机森林算法建立模型一实施例的建立示意图,随机森林建模过程具体如下:
第一步,首先,单个决策树的建立过程如下:
(1)通过Bagging集成法从样本集中选择N个样本形成训练集。
(2)从根节点出发,进行节点分裂,分裂原则为分裂后的两个子节点能尽可能地提升纯度,一般选择基尼系数或者信息增益进行衡量。分裂时选择的特征个数m从训练样本的M个特征中进行随机选择,按照计算出来的信息增益或者基尼系数,从这m个特征中依据分裂原则选择最合适的特征进行分裂。
(3)每个节点按照步骤(2)进行分裂,直到不能分裂为止,即形成叶子节点。
第二步,然后,每个决策树按照以上步骤进行,最终形成森林,最终预测阶段的方法就是随机森林模型的决策模式。
下面结合一个具体的应用场景更好地说明本发明技术方案,识别页岩油气藏“甜点”的流程如下:
第1步,运用相关性分析从岩心数据、测井数据和地震资料筛选出页岩气富集成藏的主控因素;
第2步,基于相关性分析选取的主控因素,将影响“甜点”的指标分为3类:有机质质量(Organic Quality)、油藏质量(Reservoir Quality)和完井质量(CompletionQuality),获得分类结果;
第3步,运用三质量获得的分类结果,运用机器学习中的随机森林算法建立页岩气甜点评价模型M;
第4步,基于随机森林算法获得的评价模型M,确定页岩气甜点评价因子Ms;
第5步,根据评价因子Ms帮助判定页岩气有利勘探区。
其中,第1步至第2步中,对输入的数据进行相关性分析,当相关性没有达到规定阈值的时候,剔除杂质;当相关性达到需要的阈值的时候,保留并判断是否是有机质质量,是则分到有机质质量,不是则判断是不是油藏质量,是则分到油藏质量,不是则判断是否是完井质量,是则保留,不是则删除。(这里判断是原本我们有自己规定的相应的特征是有机质质量,油藏质量和完井质量)。
其中,结合图9来看,图9为本发明提供的三质量数据归一化一实施例的推理链示意图,本专利主要运用的特征如下:
有机制质量:总有机碳含量(Total Organic Carbon)、成熟度、干酪根类型、储存容量;
油藏质量:孔隙度、渗透率、饱和度、密度、厚度;
完井质量:黏土质量、泊松比、杨氏模量、脆度、抗压强度、应力场、压力。对特征进行归一化得到推理链如图三所示的,A到P各自代表的在表1中显示了。
其中物理意义描述:
总有机碳含量TOC(A):是以碳的含量表示水中有机物的总量,结果以碳(C)的质量浓度(mg/L)表示;
成熟度(B):有机质成熟度可用来衡量有机质的演化程度,判断有机质热成熟阶段以及评价泥页岩的生烃能力和储层潜能;
干酪根类型(C):不同类型的干酪根对应的生烃能力和生烃量是不同的,单位体积下,Ⅰ型干酪根比Ⅱ、Ⅲ型干酪根的生烃能力和生烃量大;
储层容量(D):容量也指该区页岩气所能够容纳的单位物体的数量;
孔隙度(E):孔隙度是指岩样中所有孔隙空间体积之和与该岩样体积的比值,称为该岩石的总孔隙度,以百分数表示;
渗透率(F):渗透率是指在一定压差下,岩石允许流体通过的能力,是表征土或岩石本身传导液体能力的参数;
饱和度(G):应用阿尔齐公式计算得到;
密度(H):密度是对特定体积内的质量的度量,密度等于物体的质量除以体积,可以用符号ρ(读作róu)表示,国际单位制和中国法定计量单位中,密度的单位为千克每立方米,符号是kg/m3;
厚度(I):优质泥页岩的规模是决定能否获得高产页岩气的基础,厚度大的泥页岩更加有利于页岩气富集,同时能改善页岩层的封盖能力,提高保存能力;
粘土质量(J):地层下粘土的质量;
泊松比(K):泊松比是指侧向应变与纵向应变的比值;
杨氏模量(L):杨氏模量为纵向应力与纵向应变的比值;
脆度(M):高脆性矿物含量是天然裂缝及后期开发压裂造缝的基础;
抗压强度(N):通过凯里卡特计算得到;
应力场(O):页岩气勘探开发的先决条件主要是在应力作用下的地质条件;
压力(P):压力产生的原因主要有泥岩欠压实、粘土矿物脱水、有机质生烃、流体热膨胀以及构造挤压等。
其中,第4步中具体为:将三质量的数据划分位训练集和测试集,然后运用机器学习模型(随机森林模型M)进行训练最终由多个决策树投票获得最优参数Ms,评价因子Ms帮助判定页岩气有利勘探区。
本发明实施例还提供了一种识别页岩油气藏“甜点”的装置,结合图10来看,图10为本发明提供的识别页岩油气藏“甜点”的装置一实施例的结构示意图,识别页岩油气藏“甜点”的装置1000包括:
获取单元1001,用于获取主控因素;
处理单元1002,用于根据所述主控因素,确定分类类别;用于基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;
预测单元1003,用于根据所述甜点评价因子,确定页岩气的有利勘探区。
识别页岩油气藏“甜点”的装置的各个单元的更具体实现方式可以参见对于上述识别页岩油气藏“甜点”的方法的描述,且具有与之相似的有益效果,在此不再赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如上所述的识别页岩油气藏“甜点”的方法。
一般来说,用于实现本发明方法的计算机指令的可以采用一个或多个计算机可读的存储介质的任意组合来承载。非临时性计算机可读存储介质可以包括任何计算机可读介质,除了临时性地传播中的信号本身。
计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言,特别是可以使用适于神经网络计算的Python语言和基于TensorFlow、PyTorch等平台框架。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例还提供了一种电子设备,结合图11来看,图11为本发明提供的电子设备一实施例的结构示意图,电子设备1100包括处理器1101、存储器1102及存储在存储器1102上并可在处理器1101上运行的计算机程序,处理器1101执行程序时,实现如上所述的识别页岩油气藏“甜点”的方法。
作为优选的实施例,上述电子设备1100还包括显示器1103,用于显示处理器1101执行如上所述的识别页岩油气藏“甜点”的方法。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器1102中,并由处理器1101执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在电子设备1100中的执行过程。例如,计算机程序可以被分割成上述实施例中的获取单元1001、处理单元1002及预测单元1003,各单元的具体功能如上所述,在此不一一赘述。
电子设备1100可以是带可调摄像头模组的桌上型计算机、笔记本、掌上电脑或智能手机等设备。
其中,处理器1101可能是一种集成电路芯片,具有信号的处理能力。上述的处理器1101可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,存储器1102可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器1102用于存储程序,所述处理器1101在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的方法可以应用于处理器1101中,或者由处理器1101实现。
其中,显示器1103可以是LCD显示屏,也可以是LED显示屏。例如,手机上的显示屏。
可以理解的是,图11所示的结构仅为电子设备1100的一种结构示意图,电子设备1100还可以包括比图11所示更多或更少的组件。图11中所示的各组件可以采用硬件、软件或其组合实现。
根据本发明上述实施例提供的计算机可读存储介质和电子设备,可以参照根据本发明实现如上所述的识别页岩油气藏“甜点”的方法具体描述的内容实现,并具有与如上所述的识别页岩油气藏“甜点”的方法类似的有益效果,在此不再赘述。
本发明公开了一种识别页岩油气藏“甜点”的方法、装置及存储介质,首先,对主控因素进行有效的获取;然后,将主控因素进行有效的分类,确定主控因素属于哪一种类别;进而,利用随机森林,对于不同分类类别的主控因素进行建模,确定甜点评价模型,从而确定主控因素中的甜点评价因子;最后,基于甜点评价因子,对页岩气的有利勘探区进行有效地勘探。
本发明技术方案,在利用单一敏感参数进行页岩气甜点关键参数预测的基础上改进的一种新的方法,考虑因素较全面,可以规避单一敏感参数预测不同的甜点关键参数时结果相似的问题,具有可推广性,且通过运用机器学习的算法建立甜点评价模型,可完成构造复杂区页岩气甜点综合评价,优选富集高产带,帮助高效勘探开发。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种识别页岩油气藏“甜点”的方法,其特征在于,包括:
获取主控因素;
根据所述主控因素,确定分类类别;
基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;
根据所述甜点评价因子,确定页岩气的有利勘探区。
2.根据权利要求1所述的识别页岩油气藏“甜点”的方法,其特征在于,所述获取主控因素,包括:
获取岩心数据、地震数据和测井数据;
对所述岩心数据、所述地震数据和所述测井数据中的所有数据进行皮尔逊相关性分析,计算相关系数;
选取满足相关系数预设范围的数据,作为所述主控因素。
3.根据权利要求1所述的识别页岩油气藏“甜点”的方法,其特征在于,所述根据所述主控因素,确定分类类别,包括:
根据所述主控因素,确定所述主控因素对应的所述分类类别,其中,所述分类类别包括有机质质量特征类别、油藏质量特征类别和完井质量特征类别,所述有机质质量特征类别包括总有机碳含量、成熟度、储存容量中的至少一种,所述油藏质量特征类别包括孔隙度、密度、厚度中的至少一种,所述完井质量特征类别包括粘土含量、泊松比、杨氏模量、脆度、压力中的至少一种。
4.根据权利要求3所述的识别页岩油气藏“甜点”的方法,其特征在于,所述甜点评价模型包括有机质质量模型,所述甜点评价因子包括有机质影响因子,所述基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,包括:
根据属于有机质质量特征类别的主控因素,构建有机质质量训练集;
从所述有机质质量训练集中抽取K1个有机质样本集,其中,每个有机质样本集的容量为预设容量;
对于K1个有机质样本集,分别建立K1个决策树模型,对应得到K1个决策结果;
根据K1个决策结果进行投票,确定最终的所述有机质影响因子。
5.根据权利要求3所述的识别页岩油气藏“甜点”的方法,其特征在于,所述甜点评价模型包括油藏质量模型,所述甜点评价因子包括油藏质量影响因子,所述基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,包括:
根据属于油藏质量特征类别的主控因素,构建油藏质量训练集;
从所述油藏质量训练集中抽取K2个油藏质量样本集,其中,每个油藏质量样本集的容量为预设容量;
对于K2个油藏质量样本集,分别建立K2个决策树模型,对应得到K2个决策结果;
根据K2个决策结果进行投票,确定最终的所述油藏质量影响因子。
6.根据权利要求3所述的识别页岩油气藏“甜点”的方法,其特征在于,所述甜点评价模型包括完井质量模型,所述甜点评价因子包括完井质量影响因子,所述基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,包括:
根据属于完井质量特征类别的主控因素,构建完井质量训练集;
从所述完井质量训练集中抽取K3个有机质样本集,其中,每个完井质量样本集的容量为预设容量;
对于K3个完井质量样本集,分别建立K3个决策树模型,对应得到K3个决策结果;
根据K3个决策结果进行投票,确定最终的所述完井质量影响因子。
7.根据权利要求1所述的识别页岩油气藏“甜点”的方法,其特征在于,所述甜点评价因子包括有机质影响因子、油藏质量影响因子和完井质量影响因子,所述根据所述甜点评价因子,确定页岩气的有利勘探区,包括:
对所述有机质质量模型筛选出的有机质影响因子按照敏感度进行排序,确定第一排序结果;
对所述油藏质量模型筛选出的油藏质量影响因子按照敏感度进行排序,确定第二排序结果;
对所述完井质量模型筛选出的完井质量影响因子按照敏感度进行排序,确定第三排序结果;
根据所述第一排序结果、第二排序结果和第三排序结果,判定页岩气有利勘探区。
8.根据权利要求1所述的识别页岩油气藏“甜点”的方法,其特征在于,所述甜点评价模型的建立过程,包括:
根据属于所述分类类别的所述主控因素,形成样本集,其中,所述主控因素对应的标签为甜点类型;
针对单个决策树,从样本集中抽取样本形成至少一个训练集和测试集;
从根节点出发进行节点分裂,其中,分裂后形成的两个子节点选择基尼系数或者信息增益进行衡量,分裂时选择的M个特征个数从训练样本的M个特征中进行随机选择,按照计算出来的信息增益或者基尼系数,从M个特征中依据分裂原则选择特征进行分裂;
每个节点按照根节点的分裂方式进行分裂,直到不能分裂为止,形成叶子节点;
针对多个完成构建的决策树,形成随机森林,建立所述甜点评价模型。
9.一种识别页岩油气藏“甜点”的装置,其特征在于,包括:
获取单元,用于获取主控因素;
处理单元,用于根据所述主控因素,确定分类类别;用于基于随机森林,根据所述主控因素和所述分类类别,构建甜点评价模型,并确定甜点评价因子;
预测单元,用于根据所述甜点评价因子,确定页岩气的有利勘探区。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现根据权利要求1至8任一项所述的识别页岩油气藏“甜点”的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210259906.XA CN114638300A (zh) | 2022-03-16 | 2022-03-16 | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210259906.XA CN114638300A (zh) | 2022-03-16 | 2022-03-16 | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114638300A true CN114638300A (zh) | 2022-06-17 |
Family
ID=81948770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210259906.XA Pending CN114638300A (zh) | 2022-03-16 | 2022-03-16 | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114638300A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116168172A (zh) * | 2023-04-19 | 2023-05-26 | 武汉中旺亿能科技发展有限公司 | 页岩油气甜点预测方法、装置、设备及存储介质 |
CN117272841A (zh) * | 2023-11-21 | 2023-12-22 | 西南石油大学 | 一种基于混合神经网络的页岩气甜点预测方法 |
-
2022
- 2022-03-16 CN CN202210259906.XA patent/CN114638300A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116168172A (zh) * | 2023-04-19 | 2023-05-26 | 武汉中旺亿能科技发展有限公司 | 页岩油气甜点预测方法、装置、设备及存储介质 |
CN117272841A (zh) * | 2023-11-21 | 2023-12-22 | 西南石油大学 | 一种基于混合神经网络的页岩气甜点预测方法 |
CN117272841B (zh) * | 2023-11-21 | 2024-01-26 | 西南石油大学 | 一种基于混合神经网络的页岩气甜点预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110442666B (zh) | 一种基于神经网络模型的矿产资源预测方法及系统 | |
Liang et al. | A machine learning analysis based on big data for eagle ford shale formation | |
CN114638300A (zh) | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 | |
CN101738639A (zh) | 提高岩石裂缝参数计算精度的方法 | |
CN113344050B (zh) | 一种基于深度学习的岩性智能化识别方法及系统 | |
Zhu et al. | Rapid identification of high-quality marine shale gas reservoirs based on the oversampling method and random forest algorithm | |
CN113033648A (zh) | 一种使用机器学习算法实现测井解释的方法 | |
CN113762320A (zh) | 通过学习测井记录来估计岩相的方法和设备 | |
Magana-Mora et al. | Machine-learning model for the prediction of lithology porosity from surface drilling parameters | |
CN114117881A (zh) | 一种出砂风险预测方法及系统 | |
Park et al. | Hybrid physics and data-driven modeling for unconventional field development—onshore US basin case study | |
CN117272841B (zh) | 一种基于混合神经网络的页岩气甜点预测方法 | |
CN117473305A (zh) | 一种近邻信息增强的储层参数预测方法及系统 | |
CN116821786A (zh) | 一种低渗储层分类方法、装置及介质 | |
CN112541523B (zh) | 一种泥质含量计算方法和装置 | |
US20240133293A1 (en) | Concentration Prediction in Produced Water | |
Stuov et al. | Out of Distribution Detection of Well Logs for AI-Assisted Formation Evaluation | |
Ashayeri et al. | Using the Adaptive Variable Structure Regression Approach in Data Selection and Data Preparation for Improving Machine Learning-Based Performance Prediction in Unconventional Plays | |
Pratama et al. | Well pair based communication strength analysis for water injection reservoir surveillance using monte carlo simulation coupled with machine learning approach | |
CN111709189A (zh) | 一种铜矿矿床规模预测方法及系统 | |
CN111967677A (zh) | 一种非常规资源甜点分布的预测方法及装置 | |
CN117633658B (zh) | 岩石储层岩性识别方法及系统 | |
de Oliveira et al. | Ensemble of heterogeneous classifiers applied to lithofacies classification using logs from different wells | |
CN116662569B (zh) | 基于知识图谱的油气地质评价方法 | |
CN113032717B (zh) | 页岩油储层含油性的确定方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |