CN113537592A - 基于长短时记忆网络的油气藏产量预测方法及装置 - Google Patents
基于长短时记忆网络的油气藏产量预测方法及装置 Download PDFInfo
- Publication number
- CN113537592A CN113537592A CN202110798943.3A CN202110798943A CN113537592A CN 113537592 A CN113537592 A CN 113537592A CN 202110798943 A CN202110798943 A CN 202110798943A CN 113537592 A CN113537592 A CN 113537592A
- Authority
- CN
- China
- Prior art keywords
- long
- memory network
- training
- production
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004519 manufacturing process Methods 0.000 claims abstract description 115
- 238000012549 training Methods 0.000 claims abstract description 109
- 238000005457 optimization Methods 0.000 claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 238000012795 verification Methods 0.000 claims description 18
- 238000002347 injection Methods 0.000 claims description 17
- 239000007924 injection Substances 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 15
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000035699 permeability Effects 0.000 claims description 11
- 239000004215 Carbon black (E152) Substances 0.000 claims description 8
- 229930195733 hydrocarbon Natural products 0.000 claims description 8
- 150000002430 hydrocarbons Chemical class 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 5
- 239000007789 gas Substances 0.000 description 42
- 230000007787 long-term memory Effects 0.000 description 23
- 230000006403 short-term memory Effects 0.000 description 19
- 239000003129 oil well Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 239000003209 petroleum derivative Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
Abstract
本发明实施例公开了一种基于长短时记忆网络的油气藏产量预测方法及装置,该方法包括:获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月;将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。本发明能够实现对新井进行全生命周期的产量预测。
Description
技术领域
本发明涉及油气藏开发技术领域,具体而言,涉及一种基于长短时记忆网络的油气藏产量预测方法及装置。
背景技术
在油气藏的开发过程中,由于地层的强非均质性,流体渗流规律变得极其复杂,使得产量受多种因素的控制,而这些因素内部之间也存在着一定的联系,种种原因导致该类油气藏的产量无法用公式进行定量计算,预测难度大,传统的产能预测方法预测精度低,严重制约了油气藏的高效开发。
近年来,随着人工智能在科学和工程领域的广泛应用,且具有数据广、数据量大、多样性、真实可靠性等特点,大数据和机器学习己经成为石油和天然气工业的热点。大数据和机器学习已在地质特征预测、岩性判断、油气井产量主控因素、油气井产量预测分析取得了显著的成果。
现今基于机器学习的油气藏产量预测模型,虽能考虑多种影响因素和非线性关系,但是只能对已经有生产历史的老井进行产量预测,不能对新井,即从来没有生产过的井,进行全生命周期的产量预测,使用范围很有限。
因此,现有技术缺少一种能够对新井进行全生命周期的产量预测的方法。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种基于长短时记忆网络的油气藏产量预测方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种基于长短时记忆网络的油气藏产量预测方法,该方法包括:
获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月;
将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
可选的,该基于长短时记忆网络的油气藏产量预测方法,还包括:
获取训练样本集,其中,所述训练样本集包含多个所述训练样本;
根据所述训练样本集对预设的长短时记忆网络进行训练,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,得到所述产量预测模型。
可选的,所述采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,具体包括:
结合贝叶斯优化算法,以训练后的长短时记忆网络对验证样本集中的各验证样本的预测平均误差作为目标,对所述长短时记忆网络的超参数进行优化。
可选的,所述超参数具体包括:网络层数、每层网络的神经元个数、每层网络后防止过拟合的Dropout层的丢失率、Adam优化器的学习率、每次训练网络代入的训练样本集中训练样本的个数以及总的训练周期数。
可选的,所述生产参数包括:注水量、渗透率、孔隙度、油藏含油饱和度以及油藏厚度。
可选的,所述已投产油气井和所述目标新井的生产条件相同,所述生产条件包括:井网条件。
为了实现上述目的,根据本发明的另一方面,提供了一种基于长短时记忆网络的油气藏产量预测装置,该装置包括:
新井数据获取模块,用于获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月;
新井全周期产量预测模块,用于将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
可选的,该基于长短时记忆网络的油气藏产量预测装置,还包括:
训练样本集获取模块,用于获取训练样本集,其中,所述训练样本集包含多个所述训练样本;
训练模块,用于根据所述训练样本集对预设的长短时记忆网络进行训练,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,得到所述产量预测模型。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于长短时记忆网络的油气藏产量预测方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述基于长短时记忆网络的油气藏产量预测方法中的步骤。
本发明的有益效果为:
本发明将长短时记忆网络与油气藏产量预测相结合,基于长短时记忆网络训练出产量预测模型,能够实现对新井全生命周期的产量进行预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例基于长短时记忆网络的油气藏产量预测方法的第一流程图;
图2是本发明实施例基于长短时记忆网络的油气藏产量预测方法的第二流程图;
图3是本发明实施例基于长短时记忆网络的油气藏产量预测装置的第一结构框图;
图4是本发明实施例基于长短时记忆网络的油气藏产量预测装置的第二结构框图;
图5是本发明实施例样本数据示意图;
图6是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
长短时记忆网络(LSTM神经网络),由于其对时间序列数据处理的强大能力,可以被应用在油气田产量预测上,其展现出了强大的非线性拟合能力。但是,现今的这种基于LSTM神经网络的油气藏产量预测模型,基本都只是对一口已经生产了一段时间,有一定生产数据的老井进行后续的产量预测,其原理是利用LSTM神经网络对该老井已有的产量数据进行训练和拟合,从而再利用训练好的模型对老井未来的产量进行预测。
这种基于LSTM的油气藏产量预测模型,只能对已经有生产历史的老井进行产量预测,不能对新井,即没有生产过的井,进行产量预测,使用范围有限,而且,依靠该方法建立的产量预测模型,在建立的过程中,需要人工手动调整神经网络的超参数(学习率、网络层数、每层网络中神经元个数等),调参过程费时费力,直接影响模型的预测效果,并且容易陷入局部极小值。
本发明提出了一种基于长短时记忆网络的对新井的全生产周期的产量进行预测的方案。
图1是本发明实施例基于长短时记忆网络的油气藏产量预测方法的第一流程图,如图1所示,在本发明一个实施例中,本发明的基于长短时记忆网络的油气藏产量预测方法包括步骤S101和步骤S102。
步骤S101,获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月。
在本发明实施例中,生命周期为从开井生产到废弃(不生产)的时间。在本发明一个可选实施例中,为方便描述,这里将目标新井的生命周期设为24个月,即T=24,即从开井生产算,生产24个月结束,不再生产,这24个月就是该新井的全生命周期,每个时间点对应这着一个产量,即该时间点,油井的产量。为方便描述,这里以月为时间点,则共有24个时间点,每个月内油井的产出量,即为预测目标。而每个月的产出量受到当月的生产参数影响。
在本发明一个实施例中,所述生产参数包括:注水量、渗透率、孔隙度、油藏含油饱和度以及油藏厚度。其中,注水量可能每个月会发生改变,而渗透率、孔隙度、油藏含油饱和度以及油藏厚度是地质变量,是不随时间改变的。
在本发明另一个实施例中,所述生产参数还可以包括:有无压裂、压裂液类型、压裂级数以及完井类型等。
步骤S102,将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
在本发明一个实施例中,所述已投产油气井和所述目标新井的生产条件相同,所述生产条件包括:井网条件。
在本发明一个实施例中,已投产油气井历史上T个月的数据具体指的是,已投产油气井从投产第一个月至第T个月的数据,即该T个月的数据为从投产第一个月开始连续的T个月的数据。在本发明实施例中,所述已投产油气井为多个,每个已投产油气井对应一个训练样本、验证样本或测试样本。
在本发明一个实施例中,本发明收集与所述目标新井生产条件类似(如井网条件相同)的多个已投产油气的全生命周期的历史生产数据,筛选出生命周期大于T的油气井,为方便描述,这里将筛选出的油气井数量记为M,然后将这M口井的T个月内的历史生产数据,以油井为基本单位,按照一定的比例划分为训练样本集、验证样本集和测试样本集。
在本发明一个实施例中,由于油田真实数据较难收集,且油田的数据大都存在保密协议,所以本实施例将以油藏数值模拟软件为基础,构建产量预测所需的样本数据。本实施例结合油田现场实际开发状况,采用五点法井网,建立了四注(I1,I2,I3,I4)一采(P1)的非均质油藏模型注采系统。其中,建立的油藏模型的有效厚度为40m,网格长度及宽度均为100m,共20×20×5=2000个网格,并且将整个油藏平均分为了4个区域,区域之间的渗透率、孔隙度各不相同,区域之内的渗透率、孔隙度保持一致,纵向渗透率均为横向渗透率的0.3倍,以此来模拟真实油藏的非均质性。
构建训练样本的具体操作步骤如下:
1:结合油田现场实际注水状况,通过Eclipse软件,建立起了四注一采的五点法井网,定生产井的井底流压为10bar,即生产时井底流压保持不变,并将生产时间设置为两年;
2:设置4口注水井的注水量、4个区域的渗透率以及4个区域的孔隙度(由于计算操作繁琐,这里暂时让油藏厚度与含油饱和度保持不变),模拟生产2年,得到2年内油井的产油量数据,根据这4口注水井和一口生产井2年的注采数据形成1个样本数据;
3:重复步骤2,在井网条件不变的情况下,通过混合正交试验设计改变4口注水井的注水量、4个区域的渗透率以及4个区域的孔隙度,从而得到多组样本数据。
其中,每组样本数据主要包含2年内4口注水井的月注水量、4个区域的渗透率、4个区域的孔隙度、油藏含油饱和度、油藏厚度、生产井的每个月的月产油量以及对应的生产时间。
如图5所示,即为120组样本中的一组,变量1为生产时间,变量2-5位该井网条件下油井周围4口注水井对应的每个月的注水量,生产变量1-5是随时间发生变化的;变量6-15是地质变量,在建立模型时设置,是不随时间改变的;预测变量为每个月份油井的产量。一共有15个自变量(X),1个预测目标(Y)。
根据上述方法,本实施例进行了120次数值模拟,一共得到了120组样本数据,每组样本具有24个数据点,共有2880个数据点。其中,每个数据点对应有16个特征,15个自变量特征,1个预测变量特征。
本发明进而以油井为基本单位,将所有样本数据按照6:2:2的比例划分为训练样本集、验证样本集和测试样本集,则训练样本集中有72组油井的数据(即训练样本),验证样本集中有24组油井的数据(即验证样本),测试样本集中有24组油井的数据(即测试样本)。
在本发明一个实施例中,本发明在根据所述训练样本对长短时记忆网络进行训练之前,还对训练样本集中每个训练样本的数据进行最大最小归一化处理,并利用训练样本集中每个训练样本的数据的最大值和最小值对验证样本集中每个验证样本以及测试样本集中每个测试样本的数据进行处理。
在本发明一个实施例中,最大最小归一化公式如下:
本发明将长短时记忆网络与油气藏产量预测相结合,基于长短时记忆网络训练出产量预测模型,能够实现对新井全生命周期的产量进行预测。下面对本发明的产量预测模型的训练流程进行详细介绍。
图2是本发明实施例基于长短时记忆网络的油气藏产量预测方法的第二流程图,如图2所示,在本发明一个实施例中,本发明产量预测模型的具体训练流程包括步骤S201和步骤S202。
步骤S201,获取训练样本集,其中,所述训练样本集包含多个所述训练样本。
在本发明实施例中,本发明收集与所述目标新井生产条件类似(如井网条件相同)的多个油气井的全生命周期的历史生产数据,筛选出生命周期大于T的油气井,为方便描述,这里将筛选出的油气井数量记为M,然后将这M口井的T个月内的历史生产数据,以油井为基本单位,构建出M个数据样本,将M数据样本按照一定比例划分成训练样本集、验证样本集和测试样本集。
步骤S202,根据所述训练样本集对预设的长短时记忆网络进行训练,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,得到所述产量预测模型。
在本发明一个实施例中,所述超参数具体包括:网络层数、每层网络的神经元个数、每层网络后防止过拟合的Dropout层的丢失率、Adam优化器的学习率、每次训练网络代入的训练样本集中训练样本的个数以及总的训练周期数。
在本发明一个实施例中,本发明将T个月中每个月各自对应的生产参数(时序数据)作为输入变量,T个月中每个月各自对应的产量作为输出变量,将新油气井的生命周期T作为LSTM神经网络的时间步长,搭建LSTM的网络结构,并将需要优化的超参数设置为可变值。其中,每个时间步内,输入的自变量为生产参数,生产参数包括地质、工程、生产等多个因素,使得每个时间步内的自变量是多维的,生产参数的总数,即为自变量的总维度。与此同时,每个时间步内,对应有当时的预测目标变量,即当前时刻对应的产量,由于预测目标量只有产量,所以输出目标是一维的。
在本发明一个实施例中,本发明可以利用Tensorflow自带的Keras模块以及Pycharm编程软件,基于Python语言,搭建长短时记忆网络的网络结构,将长短时记忆网络的时间步长设置为T,并将需要优化的超参数,即网络层数、每层网络的神经元个数、每层网络后防止过拟合的Dropout层的丢失率、Adam优化器的学习率、每次训练网络代入的训练样本集中训练样本的个数以及总的训练周期数等6个超参数设置为可变值。
本发明在对长短时记忆网络进行训练时,采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化。在本发明一个实施例中,本步骤的的所述采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,具体包括:
结合贝叶斯优化算法,以训练后的长短时记忆网络对验证样本集中的各验证样本的预测平均误差(预测平均绝对百分比误差)作为目标,对所述长短时记忆网络的超参数进行优化,并将最优的模型保存下来,该模型即为将用来对新油气井的全生命周期产量进行预测的产量预测模型。所述验证样本和所述训练样本一样,均为已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
在本发明一个实施例中,经过贝叶斯优化,得到的最优的超参数组合为网络层数为2层、每层网络的神经元个数为31个、每层网络后防止过拟合的Dropout层的丢失率为0、Adam优化器的学习率为0.0007672、每次训练网络代入的训练样本集中的训练样本的个数1、总的训练周期数为288。
在本发明一个实施例中,经过实验,本发明利用贝叶斯优化得到的最终产量预测模型在72组训练样本上预测的平均绝对百分比误差为2.58%。
在本发明一个实施例中,经过实验,本发明利用贝叶斯优化得到的最终产量预测模型在24组验证样本上预测的平均绝对百分比误差为3.27%。
在本发明一个实施例中,经过实验,本发明利用贝叶斯优化得到的最终产量预测模型在24组测试样本上预测的平均绝对百分比误差为7.89%,误差低于10%,说明该模型的泛化能力高,也验证了该在石油产量预测上的适用性,具有广泛的应用前景。
由以上实施例可以看出,本发明结合机器学习方法,考虑各种影响产能的因素,利用长短期记忆神经网络(LSTM),通过对大量油气藏生产数据的学习,建立了数据驱动的油气藏单井全生命周期产量预测模型,并且结合贝叶斯优化方法,解决了机器学习方法调参繁琐困难的问题,获得了较高的预测精度。该产能预测模型拓宽了LSTM神经网络在石油与天然气产量预测的应用范围,提出了一种新的产量预测思路和方法,对油气藏新井产量预测以及油气藏开发方案设计具有重要意义。而且,该模型建立过程简便、计算效率高、预测精度高,综合性、适用性强,为机器学习在石油产量预测上的大规模应用奠定了一定的基础,具有广泛的应用前景。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种基于长短时记忆网络的油气藏产量预测装置,可以用于实现上述实施例所描述的基于长短时记忆网络的油气藏产量预测方法,如下面的实施例所述。由于基于长短时记忆网络的油气藏产量预测装置解决问题的原理与基于长短时记忆网络的油气藏产量预测方法相似,因此基于长短时记忆网络的油气藏产量预测装置的实施例可以参见基于长短时记忆网络的油气藏产量预测方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是本发明实施例基于长短时记忆网络的油气藏产量预测装置的第一结构框图,如图3所示,在本发明一个实施例中,本发明的基于长短时记忆网络的油气藏产量预测装置包括:
新井数据获取模块1,用于获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月;
新井全周期产量预测模块2,用于将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
图4是本发明实施例基于长短时记忆网络的油气藏产量预测装置的第一结构框图,如图4所示,在本发明一个实施例中,本发明的基于长短时记忆网络的油气藏产量预测装置还包括:
训练样本集获取模块3,用于获取训练样本集,其中,所述训练样本集包含多个所述训练样本;
训练模块4,用于根据所述训练样本集对预设的长短时记忆网络进行训练,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,得到所述产量预测模型
在本发明一个实施例中,上述训练模块4具体用于结合贝叶斯优化算法,以训练后的长短时记忆网络对验证样本集中的各验证样本的预测平均误差作为目标,对所述长短时记忆网络的超参数进行优化。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图6所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述基于长短时记忆网络的油气藏产量预测方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于长短时记忆网络的油气藏产量预测方法,其特征在于,包括:
获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月;
将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
2.根据权利要求1所述的基于长短时记忆网络的油气藏产量预测方法,其特征在于,还包括:
获取训练样本集,其中,所述训练样本集包含多个所述训练样本;
根据所述训练样本集对预设的长短时记忆网络进行训练,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,得到所述产量预测模型。
3.根据权利要求1所述的基于长短时记忆网络的油气藏产量预测方法,其特征在于,所述采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,具体包括:
结合贝叶斯优化算法,以训练后的长短时记忆网络对验证样本集中的各验证样本的预测平均误差作为目标,对所述长短时记忆网络的超参数进行优化。
4.根据权利要求1所述的基于长短时记忆网络的油气藏产量预测方法,其特征在于,所述超参数具体包括:网络层数、每层网络的神经元个数、每层网络后防止过拟合的Dropout层的丢失率、Adam优化器的学习率、每次训练网络代入的训练样本集中训练样本的个数以及总的训练周期数。
5.根据权利要求1所述的基于长短时记忆网络的油气藏产量预测方法,其特征在于,所述生产参数包括:注水量、渗透率、孔隙度、油藏含油饱和度以及油藏厚度。
6.根据权利要求1所述的基于长短时记忆网络的油气藏产量预测方法,其特征在于,所述已投产油气井和所述目标新井的生产条件相同,所述生产条件包括:井网条件。
7.一种基于长短时记忆网络的油气藏产量预测装置,其特征在于,包括:
新井数据获取模块,用于获取目标新井的生命周期中每个月各自对应的生产参数,其中,所述目标新井的生命周期为T个月;
新井全周期产量预测模块,用于将所述目标新井的生命周期中每个月各自对应的生产参数输入到预先训练出的产量预测模型中,得到所述目标新井的生命周期中每个月各自对应的产量预测值,其中,所述产量预测模型为采用训练样本对预设的长短时记忆网络进行训练得到的,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,所述训练样本包括已投产油气井历史上T个月中每个月各自对应的生产参数及产量。
8.根据权利要求7所述的基于长短时记忆网络的油气藏产量预测装置,其特征在于,还包括:
训练样本集获取模块,用于获取训练样本集,其中,所述训练样本集包含多个所述训练样本;
训练模块,用于根据所述训练样本集对预设的长短时记忆网络进行训练,并且在训练时采用贝叶斯优化算法对所述长短时记忆网络的超参数进行优化,得到所述产量预测模型。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至6任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110798943.3A CN113537592B (zh) | 2021-07-15 | 2021-07-15 | 基于长短时记忆网络的油气藏产量预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110798943.3A CN113537592B (zh) | 2021-07-15 | 2021-07-15 | 基于长短时记忆网络的油气藏产量预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113537592A true CN113537592A (zh) | 2021-10-22 |
CN113537592B CN113537592B (zh) | 2023-09-15 |
Family
ID=78099346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110798943.3A Active CN113537592B (zh) | 2021-07-15 | 2021-07-15 | 基于长短时记忆网络的油气藏产量预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537592B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115169761A (zh) * | 2022-09-08 | 2022-10-11 | 中科数智能源科技(深圳)有限公司 | 基于gnn和lstm的复杂井网油田产量预测方法 |
CN115199240A (zh) * | 2022-08-25 | 2022-10-18 | 西南石油大学 | 一种页岩气井产量预测方法、装置及存储介质 |
CN116256814A (zh) * | 2023-03-15 | 2023-06-13 | 东营市睿建石油装备有限公司 | 一种石油地质勘探监测方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427845A (zh) * | 2018-03-16 | 2018-08-21 | 中南大学 | 一种铅锌矿采矿过程碳排放短期预测方法 |
CN109523072A (zh) * | 2018-11-02 | 2019-03-26 | 中国石油化工股份有限公司 | 基于lstm的油田产油量预测方法 |
CN111144542A (zh) * | 2019-12-26 | 2020-05-12 | 中国石油大学(北京) | 油井产能预测方法、装置和设备 |
CN111489034A (zh) * | 2020-04-10 | 2020-08-04 | 华中科技大学 | 一种油气储层渗透率预测模型的构建方法及其应用 |
CN111553535A (zh) * | 2020-05-06 | 2020-08-18 | 东华大学 | 一种基于ae-lstm-bo车流量预测的导航参考方法 |
CN111695724A (zh) * | 2020-06-01 | 2020-09-22 | 浙江大学 | 一种基于混合神经网络模型的风速预测方法 |
CN111783356A (zh) * | 2020-06-29 | 2020-10-16 | 清华大学深圳国际研究生院 | 一种基于人工智能的石油产量预测方法和装置 |
US20210109252A1 (en) * | 2019-10-15 | 2021-04-15 | Chevron U.S.A. Inc. | Forecasting hydrocarbon production |
CN112819240A (zh) * | 2021-02-19 | 2021-05-18 | 北京科技大学 | 基于物理约束的lstm模型预测页岩油产量的方法 |
-
2021
- 2021-07-15 CN CN202110798943.3A patent/CN113537592B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427845A (zh) * | 2018-03-16 | 2018-08-21 | 中南大学 | 一种铅锌矿采矿过程碳排放短期预测方法 |
CN109523072A (zh) * | 2018-11-02 | 2019-03-26 | 中国石油化工股份有限公司 | 基于lstm的油田产油量预测方法 |
US20210109252A1 (en) * | 2019-10-15 | 2021-04-15 | Chevron U.S.A. Inc. | Forecasting hydrocarbon production |
CN111144542A (zh) * | 2019-12-26 | 2020-05-12 | 中国石油大学(北京) | 油井产能预测方法、装置和设备 |
CN111489034A (zh) * | 2020-04-10 | 2020-08-04 | 华中科技大学 | 一种油气储层渗透率预测模型的构建方法及其应用 |
CN111553535A (zh) * | 2020-05-06 | 2020-08-18 | 东华大学 | 一种基于ae-lstm-bo车流量预测的导航参考方法 |
CN111695724A (zh) * | 2020-06-01 | 2020-09-22 | 浙江大学 | 一种基于混合神经网络模型的风速预测方法 |
CN111783356A (zh) * | 2020-06-29 | 2020-10-16 | 清华大学深圳国际研究生院 | 一种基于人工智能的石油产量预测方法和装置 |
CN112819240A (zh) * | 2021-02-19 | 2021-05-18 | 北京科技大学 | 基于物理约束的lstm模型预测页岩油产量的方法 |
Non-Patent Citations (1)
Title |
---|
侯春华: "《基于长短期记忆神经网络的油田新井产油量预测方法》", 《油气地质与采收率》, vol. 26, no. 3, pages 105 - 110 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115199240A (zh) * | 2022-08-25 | 2022-10-18 | 西南石油大学 | 一种页岩气井产量预测方法、装置及存储介质 |
CN115169761A (zh) * | 2022-09-08 | 2022-10-11 | 中科数智能源科技(深圳)有限公司 | 基于gnn和lstm的复杂井网油田产量预测方法 |
CN116256814A (zh) * | 2023-03-15 | 2023-06-13 | 东营市睿建石油装备有限公司 | 一种石油地质勘探监测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113537592B (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113537592A (zh) | 基于长短时记忆网络的油气藏产量预测方法及装置 | |
CN113052371B (zh) | 基于深度卷积神经网络的剩余油分布预测方法及装置 | |
Shirangi et al. | Closed-loop field development under uncertainty by use of optimization with sample validation | |
CN104376420A (zh) | 有水气藏气井见水风险评价方法及评价装置 | |
Huang et al. | Comparison of different machine learning algorithms for predicting the SAGD production performance | |
CN108509596A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
US11308413B2 (en) | Intelligent optimization of flow control devices | |
CN111766635B (zh) | 砂体连通程度分析方法和系统 | |
Busby et al. | Use of data analytics to improve well placement optimization under uncertainty | |
Khoshneshin et al. | Integrated well placement and completion optimization using heuristic algorithms: A case study of an Iranian carbonate formation | |
KR101474874B1 (ko) | 지능형 생산정 위치 선정 전산 시스템 및 이를 이용한 생산정 위치 선정 방법 | |
CN113435128A (zh) | 基于条件生成式对抗网络的油气藏产量预测方法及装置 | |
Huang et al. | Prediction and optimization of WAG flooding by using LSTM neural network model in Middle East carbonate reservoir | |
Wang et al. | An interpretable interflow simulated graph neural network for reservoir connectivity analysis | |
CN117574755B (zh) | 页岩储层井工厂水平井压裂参数分层多级优化方法 | |
CN113779881A (zh) | 致密含水气藏产能预测方法、装置及设备 | |
WO2019023255A1 (en) | DEVELOPMENT OF OIL FIELD MODELS USING COGNITIVE CALCULATION | |
Tang et al. | Prediction of casing damage in unconsolidated sandstone reservoirs using machine learning algorithms | |
Fattakhov et al. | Using artificial neural networks for analyzing efficiency of advanced recovery methods | |
CN116911432A (zh) | 用于水平井产能的预测方法、存储介质及处理器 | |
Wang et al. | Adaptive Basis Function Selection Enhanced Multisurrogate-Assisted Evolutionary Algorithm for Production Optimization | |
CN105718705B (zh) | 油气田动态分析方法 | |
CN114764546A (zh) | 基于生成对抗神经网络的断块油藏剩余油预测方法 | |
Chaikine | Machine Learning Applications for Production Prediction and Optimization in Multistage Hydraulically Fractured Wells | |
Qoqandi et al. | Production Forecasting in Tight Gas Reservoirs Using Long Short-Term Memory Methods (LSTM) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |