CN114913364B - 一种基于机器学习的薄互层油藏储量分类方法及系统 - Google Patents

一种基于机器学习的薄互层油藏储量分类方法及系统 Download PDF

Info

Publication number
CN114913364B
CN114913364B CN202210409158.9A CN202210409158A CN114913364B CN 114913364 B CN114913364 B CN 114913364B CN 202210409158 A CN202210409158 A CN 202210409158A CN 114913364 B CN114913364 B CN 114913364B
Authority
CN
China
Prior art keywords
parameters
thin interbed
classification
reserves
reserve
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210409158.9A
Other languages
English (en)
Other versions
CN114913364A (zh
Inventor
马康
徐伟
张旭
郜益华
苑志旺
王晖
吴浩
康博韬
郭富欣
段瑞凯
陈国宁
房磊
邹婧芸
胡钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Research Center of CNOOC China Ltd
CNOOC China Ltd
Original Assignee
Beijing Research Center of CNOOC China Ltd
CNOOC China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Research Center of CNOOC China Ltd, CNOOC China Ltd filed Critical Beijing Research Center of CNOOC China Ltd
Priority to CN202210409158.9A priority Critical patent/CN114913364B/zh
Publication of CN114913364A publication Critical patent/CN114913364A/zh
Application granted granted Critical
Publication of CN114913364B publication Critical patent/CN114913364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于机器学习的薄互层油藏储量分类方法及系统,其包括:筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;根据所述薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为初步分类结果,并采用评级字典对初步分类结果进行定量化精细评价。本发明能对薄互层油藏储量分类进行预测,预测精度较高,能满足储量分类的要求。本发明可以在石油天然气开采技术领域中应用。

Description

一种基于机器学习的薄互层油藏储量分类方法及系统
技术领域
本发明涉及一种石油天然气开采技术领域,特别是关于一种基于机器学习的薄互层油藏储量分类方法及系统。
背景技术
储量分类主要是对储层储集油气的能力和开发难度进行综合评价,其目标是寻找优质有效储量发育区,评价结果能有效指导油田的开发,是储量研究的重要内容之一。
与其他类型油藏相比,薄互层油藏中不同类型储层的储量品质差异更大,现有储量品质分析方法考虑的指标因素数量不足,且缺乏定量标准作为分析依据。此外,对于计算单元数量多的油田,储量品质研究往往费时费力,还存在较强的人为主观性,储量分类结果因人而异,差别较大。
由于储量优劣是综合指标衡量的结果,因此储量分类不能使用单一参数进行评价,需要全面考虑储量综合特征影响因素,并且各个评价参数需要具有一定的独立性。在这种评价参数主次不清的条件下,目前的分类方法会使分类结果表现出模糊性、多解性,评价效果主观性强,不能满足储量分类的要求。因此,建立一种基于多因素的薄互层油藏储量定量分类模型对油气田开发具有重要意义。
发明内容
针对上述问题,本发明的目的是提供一种基于机器学习的薄互层油藏储量分类方法及系统,其能对薄互层油藏储量分类进行预测,预测精度较高,能满足储量分类的要求。
为实现上述目的,本发明采取以下技术方案:一种基于机器学习的薄互层油藏储量分类方法,其包括:筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;根据所述薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
进一步,所述影响储量优劣的参数为储量、面积、砂地比、丰度、孔隙度、渗透率、饱和度和粘度。
进一步,所述分析不同类型储量中各参数的密度分布曲线,包括:针对数据分布相似的参数进一步扩充实际参数的数据量,使不同类型储量的参数分布具有差异性。
进一步,所述根据具有差异性的参数与储量之间的相关性剔除部分参数,包括:
剔除两类参数,第一类参数是将具有相关性的两个参数中的一个参数剔除;剔除第二类参数是与储量品质不相关的参数。
进一步,所述剩余参数作为主控变量,用于构建的薄互层油藏储量分类模型并进行准确性验证,包括:
将数据集划分为训练集和验证集;将训练集中的参数及其对应的现有分类标签均作为薄互层油藏储量分类模型的输入,并统一输入的参数的形式、格式,进行归一化处理;
通过验证集验证薄互层油藏储量分类模型的准确性。
进一步,采用有监督的机器学习算法-随机森林构建的薄互层油藏储量分类模型,并根据筛选出的参数设定各约束条件;
若满足各约束条件,则得到所述薄互层储量分类预测模型;反之,对所述薄互层油藏储量分类模型进行优化,并重新判定是否满足相应的各约束条件。
进一步,所述采用评级字典对分类结果进行定量化精细评价,包括:
根据概率分布构建定量化评级字典,通过查询分类字典定量评分,实现同一类别中的定量精细排序。
一种基于机器学习的薄互层油藏储量分类系统,其包括:筛选模块,筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;模型构建模块,根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;分类模块,根据所述薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为初步分类结果,并采用评级字典对初步分类结果进行定量化精细评价。
一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行上述方法中的任一方法。
一种计算设备,其包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行上述方法中的任一方法的指令。
本发明由于采取以上技术方案,其具有以下优点:
1、本发明定量分析参数对储量品质和类型的影响程度,明确主控因素与次要因素;并考虑多项影响因素的综合影响,结果更为全面客观。
2、本发明采用机器学习的方法可获取反映不同单元储量品质的定量指标得分,进而整体排序,为储量动用提供依据。
3、本发明既能保证结果的客观性,排除过大的人为因素,也可节省大量人力和时间。
综上,本发明也可以推广至其他类油藏的储量品质定量评价。
附图说明
图1是本发明实施例中的薄互层油藏储量分类方法整体流程示意图;
图2是本发明实施例中的数据集中不同类型储层的密度分布曲线图;
图3是本发明实施例中的参数间相关性评价示意图;
图4是本发明实施例中基于机器学习的储量分类模型构建流程图;
图5是本发明实施例中不同类型的三类层;
图6是本发明实施例中三类层的评分字典;
图7是本发明实施例中不同参数重要程度评价图;
图8是本发明实施例中不同类储层预测精度对比图;
图9是本发明实施例中定量评分字典验证图;
图10是本发明实施例中交叉验证示意图;
图11是本发明实施例中模型稳定性评价示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明的基于机器学习的薄互层油藏储量分类方法及系统,包括:筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;根据具有差异性的参数与储量之间的相关性剔除部分参数,剩余参数作为数据集,用于构建的薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;根据薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为初步分类结果,并采用评级字典对初步分类结果进行定量化精细分类。本发明能对薄互层油藏储量分类进行预测,准确高效的进行分类,且分类结果准确性高。为薄互层油藏储量推荐动用顺序和制定高效的开发对策提供更加科学客观的参考依据,有较高的实用价值。
在本发明的一个实施例中,提供一种基于机器学习的薄互层油藏储量分类方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例所提供的薄互层油藏储量分类方法,也可应用到其他类油藏的储量品质定量评价。本实施例中,在现有研究成果的基础上,采用某薄互层油田10个井区559个计算单元进行分类,综合考虑储量、砂地比、孔隙度、渗透率、流动系数、分层系数、面积、丰度、厚度、泥质含量、饱和度、粘度对储量分类的影响,采用随机森林的机器学习算法搭建模型,并根据概率分布构建了定量化评级字典,最终形成储量分类定量表征方法。如图1所示,该方法包括以下步骤:
1)筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;
2)根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;
3)根据薄互层储量分类预测模型对目标储层进行分类,得到不同类的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
上述步骤1)中,影响储量优劣的参数为八个:储量、面积、砂地比、丰度、孔隙度、渗透率、饱和度和粘度。
上述步骤1)中,由于薄互层地质参数在不同类型储量中的差异是利用机器学习进行分类的基础,故需分析不同类型储量中各参数的密度分布曲线,包括:针对数据分布相似的参数进一步扩充实际参数的数据量,使不同类型储量的参数分布具有差异性。
在本实施例中,分别绘制不同类型储量中参数的密度分布曲线,针对数据分布差异小的参数进一步扩充实际参数的数据量,使不同类型储量的参数分布呈现明显差异。经过数据补充后获得了559个储层的物性参数分布曲线如图2所示。
上述步骤2)中,根据具有差异性的参数与储量之间的相关性剔除部分参数,具体为:剔除两类参数,第一类参数是将具有相关性的两个参数中的一个参数剔除;剔除第二类参数是与储量品质不相关的参数。
在本实施例中,机器学习模型要求输入参数之间相互独立,绘制8个参数的热力图分析数据之间的相关性,如图3所示。其中,网格中数值的大小表示相关性的强弱,正负表示是正负相关性。从图3中可以看出,储量及面积相关性最强,且与储层品质(1类最优)是正相关,粘度是唯一与储量品质呈负相关的变量。通过相关性评价,储量与面积相关性过强,最终决定剔除面积,将剩余7个参数作为主要评价指标应用于后续模型。
上述步骤2)中,剩余参数作为主控变量,用于构建的薄互层油藏储量分类模型并进行准确性验证,具体为:将数据集划分为训练集和验证集;将训练集中的参数及其对应的现有分类标签均作为薄互层油藏储量分类模型的输入,并统一输入的参数的形式、格式,进行归一化处理。通过验证集验证薄互层油藏储量分类模型的准确性。
在本实施例中,以559个储层的7个输入参数和对应的分类标签为基础,采用有监督的机器学习算法—随机森林构建分类模型。储量分类模型构建的流程如图4所示,对数据进行初步处理后,将80%的数据作为训练集,20%的数据作为验证集,通过不断的优化模型参数提升预测的精度,最终形成可靠的基于机器学习的薄互层储量分类预测模型,应用于新探明储量分类。
上述步骤2)中,采用有监督的机器学习算法-随机森林构建的薄互层油藏储量分类模型,并根据筛选出的参数设定各约束条件;
若满足各约束条件,则得到薄互层储量分类预测模型;反之,对薄互层油藏储量分类模型进行优化,并重新判定是否满足相应的各约束条件。其中,通过重新设定分类条件实现对薄互层油藏储量分类模型的优化。
在本实施例中,各约束条件为:各个参数需满足预先设定的相应阈值。
上述步骤3)中,根据薄互层储量分类预测模型对目标储层进行分类,得到不同类的概率,将概率最大的类型作为最终的分类判定结果,如图5所示,三类层的概率最高,因此两个样本均为三类层。
在本实施例中,为了针对同一类型层进一步行进行定量化的表征评分,构建了定量评分字典,如图6所示。采用评级字典对初步分类结果进行定量化精细评价,具体为:根据概率分布构建定量化评级字典,通过查询分类字典定量评分,将排名靠前的作为最优的分类结果,实现同一类别中的定量精细排序。
该字典列举了每一类层中所有可能出现的概率分布情况,其中接近一类的概率越大,排名越靠前。根据全部的分布情况标注了相应的分数,如图6中分数列所示。
综上,为了验证本发明的准确性和稳定性,从以下四个方面进行评价:
(1)参数敏感性评价
根据随机森林算法的特征,评价7个参数对模型判别准确性的重要程度,如图7所示。本发明采用的预测模型得到的评价结果与目前地质家的认识相同,可以看出基于机器学习算法得到的结果与经验认识符合。
(2)预测精度
用验证数据集(总数据集的20%,112个储层)检验模型的准确性,多次测试结果表明,验证集的预测精度达到95%以上,如图8所示。
(3)定量评分
对于图5中进行评价分析,结果如图9所示,样本1分数为5.26,样本2分数为47.37。从概率分布图可以看出,样本2更偏向于二类层,因此分数较高。通过定量评分字典可以准确的实现定量化的表征。
(4)模型稳定性评价
通过交叉验证的方法评价本发明采用的预测模型的稳定性,其原理为依次选取验证集的数据范围,用平均的预测精度评价模型的稳定性,如图10所示。从运行结果来看,模型预测精度跨度0.95~1,如图11所示,整体稳定性较好,满足预测精度要求。
对比结果表明,本发明可以对储量分类进行有效地预测,对储层描述以及生产对策的制定都有重要的指导意义与价值。
在本发明的一个实施例中,提供一种基于机器学习的薄互层油藏储量分类系统,其包括:
筛选模块,筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;
模型构建模块,根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;
分类模块,根据薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
本实施例提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
本发明一实施例中提供一种计算设备结构示意图,该计算设备可以是终端,其可以包括:处理器(processor)、通信接口(Communications Interface)、存储器(memory)、显示屏和输入装置。其中,处理器、通信接口、存储器通过通信总线完成相互间的通信。该处理器用于提供计算和控制能力。该存储器包括非易失性存储介质、内存储器,该非易失性存储介质存储有操作系统和计算机程序,该计算机程序被处理器执行时以实现一种分类方法;该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、管理商网络、NFC(近场通信)或其他技术实现。该显示屏可以是液晶显示屏或者电子墨水显示屏,该输入装置可以是显示屏上覆盖的触摸层,也可以是计算设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。处理器可以调用存储器中的逻辑指令,以执行如下方法:筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;根据薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以理解,上述计算设备的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的计算设备的限定,具体的计算设备可以包括更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本发明的一个实施例中,提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;根据薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
在本发明的一个实施例中,提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储服务器指令,该计算机指令使计算机执行上述各实施例提供的方法,例如包括:筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;根据具有差异性的参数与储量之间的相关性剔除部分参数,剩余参数作为主控变量,用于构建的薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;根据薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于机器学习的薄互层油藏储量分类方法,其特征在于,包括:
筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;
根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;
根据所述薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为最终的分类判定结果,并采用评级字典对分类结果进行定量化精细评价。
2.如权利要求1所述基于机器学习的薄互层油藏储量分类方法,其特征在于,所述影响储量优劣的参数为储量、面积、砂地比、丰度、孔隙度、渗透率、饱和度和粘度。
3.如权利要求1所述基于机器学习的薄互层油藏储量分类方法,其特征在于,所述分析不同类型储量中各参数的密度分布曲线,包括:针对数据分布相似的参数进一步扩充实际参数的数据量,使不同类型储量的参数分布具有差异性。
4.如权利要求1或2所述基于机器学习的薄互层油藏储量分类方法,其特征在于,所述根据具有差异性的参数与储量之间的相关性剔除部分参数,包括:
剔除两类参数,第一类参数是将具有相关性的两个参数中的一个参数剔除;剔除第二类参数是与储量品质不相关的参数。
5.如权利要求1所述基于机器学习的薄互层油藏储量分类方法,其特征在于,所述剩余参数作为主控变量,用于构建的薄互层油藏储量分类模型并进行准确性验证,包括:
将数据集划分为训练集和验证集;将训练集中的参数及其对应的现有分类标签均作为薄互层油藏储量分类模型的输入,并统一输入的参数的形式、格式,进行归一化处理;
通过验证集验证薄互层油藏储量分类模型的准确性。
6.如权利要求1所述基于机器学习的薄互层油藏储量分类方法,其特征在于,采用有监督的机器学习算法-随机森林构建的薄互层油藏储量分类模型,并根据筛选出的参数设定各约束条件;
若满足各约束条件,则得到所述薄互层储量分类预测模型;反之,对所述薄互层油藏储量分类模型进行优化,并重新判定是否满足相应的各约束条件。
7.如权利要求1所述基于机器学习的薄互层油藏储量分类方法,其特征在于,所述采用评级字典对分类结果进行定量化精细评价,包括:
根据概率分布构建定量化评级字典,通过查询分类字典定量评分,实现同一类别中的定量精细排序。
8.一种基于机器学习的薄互层油藏储量分类系统,其特征在于,包括:
筛选模块,筛选出影响储量优劣的薄互层地质参数,分析不同类型储量中各参数的密度分布曲线,得到薄互层地质参数在不同类型储量中差异性;
模型构建模块,根据具有差异性的参数与储量之间的相关性剔除部分不相关参数,剩余参数作为主控变量,用于构建薄互层油藏储量分类模型并进行准确性验证,形成可靠的基于机器学习的薄互层储量分类预测模型;
分类模块,根据所述薄互层储量分类预测模型对目标储层进行分类,得到不同类型储量的概率,将概率最大的类型作为初步分类结果,并采用评级字典对初步分类结果进行定量化精细评价。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1至7所述方法中的任一方法。
10.一种计算设备,其特征在于,包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行如权利要求1至7所述方法中的任一方法的指令。
CN202210409158.9A 2022-04-19 2022-04-19 一种基于机器学习的薄互层油藏储量分类方法及系统 Active CN114913364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210409158.9A CN114913364B (zh) 2022-04-19 2022-04-19 一种基于机器学习的薄互层油藏储量分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210409158.9A CN114913364B (zh) 2022-04-19 2022-04-19 一种基于机器学习的薄互层油藏储量分类方法及系统

Publications (2)

Publication Number Publication Date
CN114913364A CN114913364A (zh) 2022-08-16
CN114913364B true CN114913364B (zh) 2024-08-23

Family

ID=82764411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210409158.9A Active CN114913364B (zh) 2022-04-19 2022-04-19 一种基于机器学习的薄互层油藏储量分类方法及系统

Country Status (1)

Country Link
CN (1) CN114913364B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379256A (zh) * 2021-06-16 2021-09-10 西南石油大学 一种Kmeans-随机森林的储层评价预测方法
CN113435456A (zh) * 2021-02-08 2021-09-24 中国石油化工股份有限公司 基于机器学习的岩石薄片组分识别方法、装置及介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI676940B (zh) * 2018-08-29 2019-11-11 國立交通大學 以機械學習為基礎之最佳化預測模型的建立與預測結果的取得系統及方法
CN111441767B (zh) * 2020-05-11 2022-05-20 中国石油大学(华东) 油藏生产动态预测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435456A (zh) * 2021-02-08 2021-09-24 中国石油化工股份有限公司 基于机器学习的岩石薄片组分识别方法、装置及介质
CN113379256A (zh) * 2021-06-16 2021-09-10 西南石油大学 一种Kmeans-随机森林的储层评价预测方法

Also Published As

Publication number Publication date
CN114913364A (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN116108758B (zh) 滑坡易发性评价方法
CN105760673B (zh) 一种河流相储层地震敏感参数模板分析方法
CN110738564A (zh) 贷后风险评估方法及装置、存储介质
CN111160473A (zh) 一种分类标签的特征挖掘方法及装置
CN107563448B (zh) 基于近红外光谱分析的样本空间聚类划分法
CN110472363B (zh) 适用于高速铁路隧道的围岩变形等级预测方法及系统
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
CN111090579B (zh) 基于皮尔森相关性加权关联分类规则的软件缺陷预测方法
CN109300040A (zh) 基于全媒体大数据技术的海外投资风险评估方法及系统
CN112836509A (zh) 一种专家系统知识库构建方法及系统
CN104598774A (zh) 基于logistic与相关信息熵的特征基因选择方法
CN115394383A (zh) 磷光材料的发光波长预测方法及系统
CN115630732A (zh) 一种面向城市运营的企业迁移大数据监测预警方法及装置
CN116842240A (zh) 一种基于全链路治理管控的数据治理系统
CN113837266B (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN114913364B (zh) 一种基于机器学习的薄互层油藏储量分类方法及系统
CN116739764A (zh) 一种基于机器学习的交易风险检测方法、装置、设备及介质
CN113722230B (zh) 针对模糊测试工具漏洞挖掘能力的集成化评估方法及装置
CN115619539A (zh) 贷前风险评价方法以及装置
CN116186507A (zh) 一种特征子集的选取方法、装置及存储介质
CN113807587B (zh) 一种基于多梯核深度神经网络模型积分预警方法以及系统
Sari et al. Employee Attrition Prediction Using Feature Selection with Information Gain and Random Forest Classification
CN111680572B (zh) 一种电网运行场景动态判定方法及系统
CN110413782B (zh) 一种表自动主题分类方法、装置、计算机设备及存储介质
CN113657106A (zh) 基于归一化词频权重的特征选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant