CN114021922A - 一种油井产能主控因素分析方法、系统、设备和存储介质 - Google Patents
一种油井产能主控因素分析方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN114021922A CN114021922A CN202111253964.3A CN202111253964A CN114021922A CN 114021922 A CN114021922 A CN 114021922A CN 202111253964 A CN202111253964 A CN 202111253964A CN 114021922 A CN114021922 A CN 114021922A
- Authority
- CN
- China
- Prior art keywords
- data
- factors
- production
- oil well
- geological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003129 oil well Substances 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000000556 factor analysis Methods 0.000 title claims description 20
- 238000004519 manufacturing process Methods 0.000 claims abstract description 112
- 230000003068 static effect Effects 0.000 claims abstract description 56
- 238000004140 cleaning Methods 0.000 claims abstract description 36
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 238000010801 machine learning Methods 0.000 claims abstract description 30
- 238000012163 sequencing technique Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 abstract description 7
- 238000011160 research Methods 0.000 abstract description 6
- 239000003921 oil Substances 0.000 description 20
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 239000010779 crude oil Substances 0.000 description 6
- 230000035699 permeability Effects 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Marine Sciences & Fisheries (AREA)
- Artificial Intelligence (AREA)
- Animal Husbandry (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- General Health & Medical Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Agronomy & Crop Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种油井产能主控因素分析方法、系统、设备和存储介质,方法包括以下步骤:分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;采用控制变量的方法,对已清洗的生产动态与静态地质数据做独立分析,分别设计其应用方式,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。本发明通过对生产动态与静态地质数据的高效数据清洗,并采用适宜于生产动态与静态地质数据特点的数据使用方式,可提升机器学习算法在油井产能主控因素研究领域的适用性与准确性。因此,本发明可以广泛应用于油气田开发领域。
Description
技术领域
本发明涉及油气田开发领域,特别涉及一种数据驱动的油井产能主控因素分析方法、系统、设备和存储介质。
背景技术
油井产能的主控因素是开展油井产能评价的基础研究内容,现有的油井产能主控因素分析方法包括:理论公式、物理实验、数值模拟和数据分析方法。但因油井产能的影响因素众多,且油井产能与各影响因素间呈较强的非线性关系,故以上方法在复杂现实情况下的适用性有限。
为更准确地分析油井产能与各影响因素间的非线性关系,采用机器学习方法,并运用实际数据进行油井产能主控因素分析的研究方式得到应用。目前,在该类工作中,多直接采用机器学习算法对已收集数据进行分析,较少关注实际数据的高效数据清洗方法、合理的数据使用方式以及机器学习算法在油井产能研究领域的适用性。致使大量不准确的数据被使用,并导致机器学习算法的分析结果与已有的油田开发理论存在较大偏差。
发明内容
针对上述问题,本发明的目的是提供一种数据驱动的油井产能主控因素分析方法、系统、设备和存储介质,能够对实际数据进行高效数据清洗,提高油井产能主控因素分析的准确性。
为实现上述目的,本发明采取以下技术方案:
第一方面,是提供一种油井产能主控因素分析方法,其包括以下步骤:
分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;
分别对经过数据清洗的生产动态因素与静态地质因素做独立分析,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。
优选地,对于生产动态因素,其数据清洗的步骤为:
依据第一预设判别标准筛选已投产的油井;
缺失数据处理;
依据第二预设判别标准确定油井的正式投产日期;
依据第三预设判别标准去除受作业影响的数据。
优选地,对静态地质因素,其数据清洗的步骤为:
筛选射孔层位的地质因素数据;
单井整体地质数据的计算;
缺失数据处理。
优选地,所述单井整体地质数据的计算方法为:对单井的储层厚度与射开厚度,采用各小层数据的累加,其余各项静态地质因素,则按各层的射开厚度对其进行加权平均,计算得到单井整体的地质数据。
优选地,所述单井整体地质数据的计算公式为:
式中,X为单井整体的地质数据;xi为第i层的地质数据;Hi为第i层的射开厚度;i为单井的小层编号。
优选地,所述对生产动态因素进行分析的方法,包括:
①从生产动态数据集中选取一口井,以日产油量为机器学习算法的标签,以其余各项生产动态因素为输入的特征,采用机器学习算法作为基模型,以该井数据训练基模型并得到各特征的重要性权重;
②依次对各井的生产动态数据按步骤①计算特征的重要性权重,并对所有井相应的特征权重取平均值,依据平均权重大小确定各特征的重要性排序;
③依据重要性排序,去除最重要的一个或几个特征,用剩余的特征组成新数据集,并使用基模型进行下一轮训练与特征重要性评价;
④重复②-③步,直至筛选出最不重要的特征,将特征依次被剔除的顺序作为油井产能动态因素的重要性排序。
优选地,所述对静态地质因素做分析的方法,包括:
①以所有井的静态地质因素数据为训练集,以日产油量为机器学习算法的标签,以其他各项静态地质因素为输入特征,采用机器学习算法作为基模型,进行模型训练并得到各特征的重要性权重;
②依据权重大小确定各特征的重要性排序,并去除最重要的一个或几个特征,用剩余的特征组成新数据集,并使用基模型进行下一轮训练与特征重要性评价;
③重复第②步,直至筛选出最不重要的特征,将特征依次被剔除的顺序作为油井产能静态地质因素的重要性排序。
第二方面,是提供一种油井产能主控因素分析系统,其包括:
数据清洗模块,用于分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;
主控因素分析模块,用于分别对经过数据清洗的生产动态因素与静态地质因素做独立分析,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。
第三方面,是提供一种处理设备,所述处理设备至少包括处理器和存储器,所述存储器上存储有计算机程序,所述处理器运行所述计算机程序时执行以实现所述油井产能主控因素分析方法的步骤。
第四方面,是提供一种计算机存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现所述油井产能主控因素分析方法的步骤。
本发明由于采取以上技术方案,其具有以下优点:
(1)本发明结合油田开发理论的先验知识,对生产动态与静态地质数据的高效数据清洗;
(2)本发明采用适宜于生产动态与静态地质数据特点的数据使用方式,并配合针对油井产能影响因素特点设计的主控因素分析方法,实现对油井产能影响因素中不准确数据的剔除,同时有效提高油井产能主控因素分析的准确性。
因此,本发明可以广泛应用于油气田开发领域。
附图说明
图1是本发明实施例提供的油井产能主控因素分析方法流程图;
图2(a)~图2(h)是本发明实施例中数据清洗前后的生产动态数据对比图,其中,图2(a)是日产油量对比图;图2(b)是生产压差对比图,图2(c)是汽油比对比图;图2(d)是含水率对比图;图2(e)是井口压力对比图;图2(f)是套管压力对比图;图2(g)是油嘴尺寸对比图;图2(h)是泵的频率对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明提供的一种油井产能主控因素分析方法,分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;采用控制变量的方法,对已清洗的生产动态与静态地质数据做独立分析,分别设计其应用方式,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。本发明通过对生产动态与静态地质数据的高效数据清洗,并采用适宜于生产动态与静态地质数据特点的数据使用方式,可提升机器学习算法在油井产能主控因素研究领域的适用性与准确性。
与之相对应地,本发明的一些实施例中还提供一种油井产能主控因素分析系统、设备和存储介质。
实施例1
如图1所示,本实施例提供的一种油井产能主控因素分析方法,包括以下步骤:
1)分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;
2)分别对经过数据清洗的生产动态因素与静态地质因素做独立分析,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。
优选地,上述步骤1)中,获取的油井数据可以分为生产动态因素与静态地质因素两类。
具体地,生产动态因素包括:日期、日生产时长、日产油量、含水率、气油比、生产压差、井口压力、套压、泵的频率、油嘴尺寸等;
静态地质因素包括:渗透率、孔隙度、含油饱和度、泥质含量、储层厚度、射开厚度、原油密度、原油粘度等。
优选地,上述步骤1)中,对获取的油井数据进行数据清洗时,分别根据数据类型采用不同的数据清洗方法。
具体地,对于生产动态因素,其数据清洗的步骤为:
①依据第一预设判别标准筛选得到已投产的油井的生产数据;
方法为:按日期顺序读取该油井的日生产时长数据,当日生产时长数据满足第一预设判别标准时,则进入下一步骤,否则弃用该油井生产数据。
可选地,第一预设判别标准为:日生产时长大于0小时的天数大于0天。
②对筛选得到的已投产油井生成数据进行缺失数据处理;
按日期顺序读取该油井的日生产时长、油嘴尺寸与生产压差数据,若其中某项数据缺失,则去除该日期的生产数据;
③依据第二预设判别标准确定该油井的正式投产日期;
按日期顺序读取该油井的日生产时长与含水率数据,若当日的日生产时长与含水率数据满足第二预设判别标准,则将该日作为该油井的正式投产日期,并将该日期之前的生产数据去除;
可选地,第二预设判别标准为:连续7天的日生产时长大于0小时且含水率小于5%;
④依据第三预设判别标准去除受作业影响的数据;
按日期顺序读取该油井的日生产时长、油嘴尺寸与生产压差数据,并依据第三预设判别标准去除受作业影响的生产数据;
可选地,第三预设判别标准为:日生产时长小于24小时的日期所对应的生产动态数据,去除油嘴尺寸变化大于3毫米且生产压差变化大于0.2兆帕的日期所对应的生产数据。
⑤经上述步骤处理后保留的油井及其相应的生产数据,即可作为训练机器学习算法的数据集。
对静态地质因素,其数据清洗的步骤为:
①筛选射孔层位的地质因素数据;
按储层深度顺序读取该油井的射开层位,并选取其对应的各项地质因素数据;
②单井整体地质数据的计算;
对单井的储层厚度与射开厚度,采用各小层数据的累加,其余各项地质因素数据,依据公式(1)按各层的射开厚度对其进行加权平均,计算得单井整体的地质数据;
式中,式中,X为单井整体的地质数据;xi为第i层的地质数据;Hi为第i层的射开厚度;i为单井的小层编号。
③缺失数据处理;
若某油井的流体物性数据缺失,则采用邻井相应数据对该井进行补全,若某油井的储层物性数据缺失,则在第②步的加权平均中不使用该层数据;
④经上述步骤处理后计算得到的油井静态地质因素数据,即可作为训练机器学习算法的数据集。
优选地,上述步骤2)中,具体地,对生产动态因素,采用先单井分析,再各井取平均的方式,确定各生产动态因素的重要性排序,包括以下步骤:
①从数据集中选取一口井,以日产油量为机器学习算法的标签,以其余各项生产动态因素为输入的特征,以Random Forest或XGBoost等具有重要性评价能力的机器学习算法作为基模型,以该井数据训练基模型并得到各输入的特征的重要性权重;
②依次对各井数据按步骤①计算各特征的重要性权重,并对所有井相应的特征权重取平均值,依据平均权重大小确定各特征的重要性排序;
③依据重要性排序,去除最重要的一个或几个特征,用剩余的特征组成新数据集,并使用基模型进行下一轮训练与特征重要性评价;
④重复②-③步,直至筛选出最不重要的特征,特征依次被剔除的顺序即为其重要性由强到弱的排序;
⑤基于重要性排序即可完成油井产能生产动态主控因素的分析。
优选地,上述步骤2)中,对静态地质因素采用多井数据联合分析的方式,确定各静态地质因素的重要性排序,主要步骤为:
①以数据集中所有井的静态地质因素数据为训练集,以日产油量为机器学习算法的标签,以各项静态地质因素为输入特征,以Random Forest或XGBoost等具有重要性评价能力的机器学习算法作为基模型,进行模型训练并得到各特征的重要性权重;
②依据权重大小确定各特征的重要性排序,并去除最重要的一个或几个特征,用剩余的特征组成新数据集,并使用基模型进行下一轮训练与特征重要性评价;
③重复第②步,直至筛选出最不重要的特征,特征依次被剔除的顺序即为其重要性由强到弱的排序;
④基于重要性排序即可完成油井产能静态地质主控因素的分析。
本实施例以数据驱动的方式,在应用机器学习算法研究油井产能主控因素的过程中,考虑油田开发理论的先验知识,针对生产动态因素与静态地质因素,分别给出其数据清洗方法与主控因素分析方法,形成一套数据驱动的油井产能主控因素分析方法与系统。本发明可实现高效的数据清洗,为机器学习算法在油井产能主控因素研究领域的运用提供合理的数据使用方式,并提升其准确性。
实施例2
本实施例以P油田的87口油井为例,应用实施例1的方法对油井产能的主控因素进行分析。具体如下:
(1)采用结合油田开发理论先验知识的数据清洗方法,对油井生产动态与静态地质数据进行处理,选取W1井作为展示实例。
依据实施例1所述的数据清洗方法对日产油量、含水率、气油比、生产压差、井口压力、套压、泵的频率、油嘴尺寸等生产动态数据进行处理,处理结果如图2(a)~图2(h)所示。
对渗透率、孔隙度、含油饱和度、泥质含量、储层厚度、射开厚度、原油密度、原油粘度等静态地质数据,依据数据清洗方法的处理结果如表1所示。
表1数据清洗前后的静态地质数据对比
以Random Forest算法为基模型,基于87口井的数据集进行多轮训练,每轮训练后剔除权重最高的因素,直至筛选出最不重要的因素,各训练轮次的结果如表2所示。由表可得各因素的剔除顺序,即各因素对油井产能的影响强弱为:生产压差>气油比>含水率>井口压力>泵的频率>油嘴尺寸>套管压力。根据这一重要性排序,可选择排名前1/2的因素作为油井产能的主控因素,即生产压差、气油比、含水率。
表2各训练轮次的生产动态因素权重
以Random Forest算法为基模型,基于87口井的数据集进行多轮训练,每轮训练后剔除权重最高的因素,直至筛选出最不重要的因素,各训练轮次的结果如表3所示。由表可得各因素的剔除顺序,即各因素对油井产能的影响强弱为:渗透率>射开厚度>储层厚度>含油饱和度>孔隙度>泥质含量>原油密度>原油粘度。根据这一重要性排序,结合实际应用需求,可选择排名前1/2的因素作为油井产能的主控因素,即渗透率、射开厚度、储层厚度、含油饱和度。
表3各训练轮次的静态地质因素权重
实施例3
上述实施例1提供了一种油井产能主控因素分析方法,与之相对应地,本实施例提供一种油井产能主控因素分析系统。本实施例提供的识别系统可以实施实施例1的一种油井产能主控因素分析方法,该识别系统可以通过软件、硬件或软硬结合的方式来实现。例如,该系统可以包括集成的或分开的功能模块或功能单元来执行实施例1各方法中的对应步骤。由于本实施例的识别系统基本相似于方法实施例,所以本实施例描述过程比较简单,相关之处可以参见实施例1的部分说明即可,本实施例的系统的实施例仅仅是示意性的。
本实施例提供的一种油井产能主控因素分析系统,包括:
数据清洗模块,用于分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;
主控因素分析模块,用于分别对经过数据清洗的生产动态因素与静态地质因素做独立分析,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。
实施例4
本实施例提供一种与本实施例1所提供的一种油井产能主控因素分析方法对应的处理设备,处理设备可以是用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行实施例1的方法。
所述处理设备包括处理器、存储器、通信接口和总线,处理器、存储器和通信接口通过总线连接,以完成相互间的通信。存储器中存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行本实施例1所提供的一种油井产能主控因素分析方法。
在一些实现中,存储器可以是高速随机存取存储器(RAM:Random AccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
在另一些实现中,处理器可以为中央处理器(CPU)、数字信号处理器(DSP)等各种类型通用处理器,在此不做限定。
实施例5
本实施例1的一种油井产能主控因素分析方法可被具体实现为一种计算机程序产品,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本实施例1所述的一种油井产能主控因素分析方法的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
需要说明的是,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
上述各实施例仅用于说明本发明,其中各部件的结构、连接方式和制作工艺等都是可以有所变化的,凡是在本发明技术方案的基础上进行的等同变换和改进,均不应排除在本发明的保护范围之外。
Claims (10)
1.一种油井产能主控因素分析方法,其特征在于,包括以下步骤:
分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;
分别对经过数据清洗的生产动态因素与静态地质因素做独立分析,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。
2.如权利要求1所述的一种油井产能主控因素分析方法,其特征在于:对于生产动态因素,其数据清洗的步骤为:
依据第一预设判别标准筛选已投产的油井;
缺失数据处理;
依据第二预设判别标准确定油井的正式投产日期;
依据第三预设判别标准去除受作业影响的数据。
3.如权利要求1所述的一种油井产能主控因素分析方法,其特征在于:对静态地质因素,其数据清洗的步骤为:
筛选射孔层位的地质因素数据;
单井整体地质数据的计算;
缺失数据处理。
4.如权利要求3所述的一种油井产能主控因素分析方法,其特征在于:所述单井整体地质数据的计算方法为:对单井的储层厚度与射开厚度,采用各小层数据的累加,其余各项静态地质因素,则按各层的射开厚度对其进行加权平均,计算得到单井整体的地质数据。
6.如权利要求1所述的一种油井产能主控因素分析方法,其特征在于:所述对生产动态因素进行分析的方法,包括:
①从生产动态数据集中选取一口井,以日产油量为机器学习算法的标签,以其余各项生产动态因素为输入的特征,采用机器学习算法作为基模型,以该井数据训练基模型并得到各特征的重要性权重;
②依次对各井的生产动态数据按步骤①计算特征的重要性权重,并对所有井相应的特征权重取平均值,依据平均权重大小确定各特征的重要性排序;
③依据重要性排序,去除最重要的一个或几个特征,用剩余的特征组成新数据集,并使用基模型进行下一轮训练与特征重要性评价;
④重复②-③步,直至筛选出最不重要的特征,将特征依次被剔除的顺序作为油井产能动态因素的重要性排序。
7.如权利要求1所述的一种油井产能主控因素分析方法,其特征在于:所述对静态地质因素做分析的方法,包括:
①以所有井的静态地质因素数据为训练集,以日产油量为机器学习算法的标签,以其他各项静态地质因素为输入特征,采用机器学习算法作为基模型,进行模型训练并得到各特征的重要性权重;
②依据权重大小确定各特征的重要性排序,并去除最重要的一个或几个特征,用剩余的特征组成新数据集,并使用基模型进行下一轮训练与特征重要性评价;
③重复第②步,直至筛选出最不重要的特征,将特征依次被剔除的顺序作为油井产能静态地质因素的重要性排序。
8.一种油井产能主控因素分析系统,其特征在于,包括:
数据清洗模块,用于分别对获取的油井数据中的生产动态因素和静态地质因素进行数据清洗;
主控因素分析模块,用于分别对经过数据清洗的生产动态因素与静态地质因素做独立分析,并使用机器学习算法开展油井产能主控因素的排序,得到各生产动态因素和静态地质因素的重要性排序。
9.一种处理设备,所述处理设备至少包括处理器和存储器,所述存储器上存储有计算机程序,其特征在于,所述处理器运行所述计算机程序时执行以实现权利要求1到7任一项所述油井产能主控因素分析方法的步骤。
10.一种计算机存储介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现根据权利要求1到7任一项所述油井产能主控因素分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111253964.3A CN114021922A (zh) | 2021-10-27 | 2021-10-27 | 一种油井产能主控因素分析方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111253964.3A CN114021922A (zh) | 2021-10-27 | 2021-10-27 | 一种油井产能主控因素分析方法、系统、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114021922A true CN114021922A (zh) | 2022-02-08 |
Family
ID=80057982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111253964.3A Pending CN114021922A (zh) | 2021-10-27 | 2021-10-27 | 一种油井产能主控因素分析方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021922A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151480A (zh) * | 2023-04-04 | 2023-05-23 | 北京科技大学 | 一种页岩油井产量预测方法和装置 |
-
2021
- 2021-10-27 CN CN202111253964.3A patent/CN114021922A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151480A (zh) * | 2023-04-04 | 2023-05-23 | 北京科技大学 | 一种页岩油井产量预测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019201880B2 (en) | System and method for automatically correlating geologic tops | |
US11704748B2 (en) | System and method for automatically correlating geologic tops | |
US8355872B2 (en) | System and method for reservoir analysis background | |
US10909281B2 (en) | History matching of hydrocarbon production from heterogenous reservoirs | |
CN107678059A (zh) | 一种储层含气识别的方法、装置及系统 | |
CN105277979B (zh) | 一种地震属性的优化方法和装置 | |
CN103760600A (zh) | 一种含气饱和度反演方法 | |
CN111985081A (zh) | 一种测井曲线构建方法、系统、设备及可读存储介质 | |
CN114021922A (zh) | 一种油井产能主控因素分析方法、系统、设备和存储介质 | |
Hloupis | Temporal pattern in corinth rift seismicity revealed by visibility graph analysis | |
US20180225396A1 (en) | Ensemble-based reservoir characterization method using multiple kalman gains and dynamic data selection | |
CN114548299A (zh) | 一种地震相识别方法、装置、计算机设备及存储介质 | |
WO2023146833A1 (en) | Detection and correction of false positive classifications from a product sand detection tool | |
CN115977615A (zh) | 压裂效果评价方法、系统、介质及电子设备 | |
CN114239655A (zh) | 地震相识别模型训练方法及装置、地震相预测方法及装置 | |
CN111553981B (zh) | 一种基于建模区域分类的三维地质建模方法及系统 | |
CN114063169B (zh) | 一种波阻抗反演方法、系统、设备和存储介质 | |
Wei et al. | A symbolic tree model for oil and gas production prediction using time-series production data | |
CN118643028A (zh) | 地震道数据分辨率提升方法、装置、设备及存储介质 | |
CN114428887B (zh) | 点击数据去噪方法、装置、电子设备及存储介质 | |
CN118673626A (zh) | 压裂参数优化方法、装置、电子设备和存储介质 | |
CN118298206A (zh) | 一种丘滩体的分类方法、装置、电子设备及存储介质 | |
CN118640001A (zh) | 一种致密气藏目标气井的绝对无阻流量确定方法及装置 | |
CN118690906A (zh) | 页岩气井分段产量的预测方法、装置、设备和存储介质 | |
CN115267908A (zh) | 余弦相似度地震属性计算方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |