CN111144542B - 油井产能预测方法、装置和设备 - Google Patents
油井产能预测方法、装置和设备 Download PDFInfo
- Publication number
- CN111144542B CN111144542B CN201911362959.9A CN201911362959A CN111144542B CN 111144542 B CN111144542 B CN 111144542B CN 201911362959 A CN201911362959 A CN 201911362959A CN 111144542 B CN111144542 B CN 111144542B
- Authority
- CN
- China
- Prior art keywords
- target
- data
- oil well
- well productivity
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003129 oil well Substances 0.000 title claims abstract description 155
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000004519 manufacturing process Methods 0.000 claims abstract description 258
- 238000012549 training Methods 0.000 claims abstract description 57
- 239000002245 particle Substances 0.000 claims abstract description 46
- 238000005457 optimization Methods 0.000 claims abstract description 44
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 41
- 230000015654 memory Effects 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 23
- 230000007787 long-term memory Effects 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims description 39
- 230000002159 abnormal effect Effects 0.000 claims description 29
- 210000002569 neuron Anatomy 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 14
- 230000006403 short-term memory Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 abstract description 11
- 238000013528 artificial neural network Methods 0.000 description 23
- 230000003247 decreasing effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 11
- 238000011161 development Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000019637 foraging behavior Effects 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本申请提供了一种油井产能预测方法、装置和设备,其中,该方法包括:获取目标油井在目标预测周期前一个周期的日产油数据和目标预测周期生产制度数据;对所述前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理;获取目标油井产能预测模型,其中,目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的;根据预处理后的数据,利用目标油井产能预测模型,得到目标预测周期中日产油的预测值。在本申请实施例中,采用基于长短期记忆网络和粒子群优化算法训练得到的目标油井产能预测模型,不仅可以预测日产油数据的整体变化趋势,还可以对单点进行准确的预测,有效提高对日产油预测的准确度。
Description
技术领域
本申请涉及油藏开发技术领域,特别涉及一种油井产能预测方法、装置和设备。
背景技术
石油作为一种战略能源,在低油价时代,最大化的开发现有油田变得尤为重要。其中,油井产能预测是管理和维护油藏的关键内容,如果可以提前掌握油井产量变化的规律,就能及时调整改进油藏开发方案,从而获得更高的产量,取得更大的经济效益。但由于储层的非均质性、流动过程中复杂的相态变化、生产制度的调整、各种增产措施等诸多因素的影响,油井的产能呈现非线性特征,使得时序产能预测较为困难。
现有技术中通常采用油藏数值模拟方法、解析方法和递减规律分析来预测油井的产能,其中,采用油藏数值模拟方法建立油藏数值模型,通常需要大量的油藏地质数据、流体数据等,使得建立一个准确的模型需要耗费较大的时间成本和经济成本。采用解析方法建立数学模型时需要进行各种假设,如:边界、压缩性、毛细管力、热效应等方面,上述假设可以帮助简化并求解研究问题,却较大的限制了模型的应用范围。进一步的,上述方法虽然可以给出时序产能变化,但是得到的日产油曲线往往连续光滑,与实际情况不符。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种油井产能预测方法、装置和设备,以解决现有技术中无法准确预测油井的产能问题。
本申请实施例提供了一种油井产能预测方法,包括:获取目标油井在目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据;对所述目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据分别进行预处理;获取目标油井产能预测模型,其中,所述目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的;根据预处理后的目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据,利用所述目标油井产能预测模型,得到所述目标油井在所述目标预测周期中日产油的预测值。
在一个实施例中,所述生产制度数据包括:油嘴尺寸。
在一个实施例中,在获取所述目标油井产能预测模型之前,还包括:获取目标油井的历史日产油数据和历史生产制度数据;对所述历史日产油数据和所述历史生产制度数据进行预处理;将预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集;设定时间窗口长度的范围和隐含层的神经元数量的范围;根据所述长短期记忆网络、隐含层的神经元数量的范围和时间窗口长度的范围,建立初始油井产能预测模型;根据所述训练集和所述粒子群优化算法,优化所述初始油井产能预测模型。
在一个实施例中,按照以下公式,根据所述长短期记忆网络和时间窗口长度的范围,建立初始油井产能预测模型:
O(t)=F{C(t),O(t-1),O(t-2),…,O(t-n)}
其中,O(t)为预测得到的第t时间步的日产油数据;C(t)为在第t时间步的生产制度数据;n为时间窗口长度,n的取值范围为所述时间窗口长度的范围。
在一个实施例中,根据所述训练集和所述粒子群优化算法,优化所述初始油井产能预测模型,包括:根据所述训练集训练所述初始油井产能预测模型;在训练过程中根据所述粒子群优化算法,对所述初始油井产能预测模型中的所述时间窗口长度和长短期记忆网络层的神经元数量进行优化;确定优化过程中各个时间窗口长度和长短期记忆网络层的神经元数量对应的损失函数值;判断所述损失函数值是否达到预设阈值;在判断所述损失函数值达到所述预设阈值的情况下结束优化,得到目标时间窗口长度和目标油井产能预测模型。
在一个实施例中,在得到所述目标油井产能预测模型之后,还包括:根据所述测试集,确定所述目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差;根据所述目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差,确定所述目标油井产能预测模型的性能。
在一个实施例中,对所述历史日产油数据和所述历史生产制度数据进行预处理,包括:对所述日产油数据和所述历史生产制度数据进行异常值检测,确定是否存在异常值;在确定存在异常值的情况下,将所述异常值移除;对移除所述异常值后的日产油数据和历史生产制度数据分别进行归一化处理。
在一个实施例中,按照以下公式,对移除所述异常值后的日产油数据和历史生产制度数据分别进行归一化处理:
其中,xnew为归一化后的数据;xold为数据的实际值;xmin为数据最小值;xmax为数据最大值。
本申请实施例还提供了一种油井产能预测装置,包括:第一获取模块,用于获取目标油井在目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据;预处理模块,用于对所述目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据分别进行预处理;第二获取模块,用于获取目标油井产能预测模型,其中,所述目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的;预测模块,用于根据归一化后的目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据,利用所述目标油井产能预测模型,得到所述目标油井在所述目标预测周期中日产油的预测值。
在一个实施例中,日产油数据和历史生产制度数据;预处理单元,用于对所述历史日产油数据和所述历史生产制度数据进行预处理;划分单元,用于将预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集;设定单元,用于设定时间窗口长度的范围和隐含层的神经元数量的范围;建立单元,用于根据所述长短期记忆网络、隐含层的神经元数量的范围和时间窗口长度的范围,建立初始油井产能预测模型;优化单元,用于根据所述训练集和所述粒子群优化算法,优化所述初始油井产能预测模型。
本申请实施例还提供了一种油井产能预测设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述油井产能预测方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述油井产能预测方法的步骤。
本申请实施例提供了一种油井产能预测方法,可以通过获取目标油井在目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据,对所述目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据分别进行预处理,其中,预先对数据进行预处理可以避免目标油井产能预测模型受数据最大值和最小值、噪声数据的影响,提高预测的精确度。可以获取目标油井产能预测模型,其中,所述目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的,采用基于长短期记忆网络和粒子群优化算法训练得到的目标油井产能预测模型,不仅可以预测在一段时间内的日产油数据的整体变化趋势,还可以对单点进行准确的预测。并且上述预测过程简单、便捷,有效降低了预测的时间成本和经济成本。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。在附图中:
图1是根据本申请实施例提供的油井产能预测方法的步骤示意图;
图2是根据本申请具体实施例提供的油井产能预测方法的示意图;
图3是根据本申请具体实施例提供的初始油井产能预测模型结构的示意图;
图4是根据本申请具体实施例提供的油井的原始日产油数据及对应的生产制度数据的示意图;
图5是根据本申请具体实施例提供的递减规律分析(Decline curve)曲线的示意图;
图6(a)为是根据本申请具体实施例提供的人工神经网络(ANN)模型的计算结果的示意图;
图6(b)为是根据本申请具体实施例提供的循环神经网络(RNN)模型的计算结果的示意图;
图6(c)为是根据本申请具体实施例提供的长短期记忆神经网络(LSTM)模型的计算结果的示意图;
图7是根据本申请具体实施例提供的采用ANN、RNN、Decline curve、LSTM这四种模型进行日产油数据预测的相对误差分布特征的示意图;
图8是根据本申请具体实施例提供的ANN、RNN、LSTM三种模型绝对相对误差的分布范围的示意图;
图9是根据本申请实施例提供的油井产能预测装置的结构示意图;
图10是根据本申请实施例提供的油井产能预测设备的结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域的技术人员知道,本申请的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本申请公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
考虑到火山岩油藏由于天然裂缝发育,由于容易产生早期水淹而无法通过注水维持压力或提高火山岩油藏的采收率,通常均采用衰竭式开发,因此,其产量的大小只通过油嘴的大小来控制。
基于以上问题,本发明实施例提供了一种油井产能预测方法,如图1所示,可以包括以下步骤:
S101:获取目标油井在目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据。
由于在目标油井开发过程中,生产制度的变化影响目标油井的日产油数据,因此,将目标油井的生产制度数据考虑在内,从而进一步提高对日产油预测的准确度。在一个实施例中,可以预先获取目标油井在目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,其中,上述目标预测周期的生产制度数据可以是一个给定的数值。在目标预测周期前一个周期的日产油数据可以体现日产油数据的变化规律,日产油的大小是由生产制度控制的。
其中,上述生产制度数据可以用于表示油井日常生产过程中进行生产的工作制度调整,可以包括但不限于以下至少之一:定液量生产、水井的注入量、开关井、油嘴大小(尺寸)等。
在具体的实施过程中,上述目标预测周期可以为某一个时间点也可以为某一个时间段,时间段的长度可以为3天、5天、10天或者1个月,具体的需要根据基于长短期记忆网络和粒子群优化算法对油井产能预测模型进行训练的结果确定。上述目标预测周期的时间段长度可以表示需要预测的日产油数据与之前多少个历史日产油数据有关系,从而可以根据目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据来预测目标预测周期的日产油数据。
S102:对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理。
为了避免目标油井产能预测模型受数据中最大值和最小值的影响,可以对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理。上述预处理可以包括:检测数据中是否存在异常值、替换数据中存在的异常值、数据的归一化等。
在一个实施例中,目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据中可能会存在噪声数据。因此,可以在进行归一化处理之前,采用局部异常因子算法对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据进行异常值检测,将检测到的异常值剔除或替换,从而可以避免异常值的存在影响预测的精确度。
S103:获取目标油井产能预测模型,其中,目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的。
在进行日产油数据预测之前可以先获取预先训练得到的目标油井产能预测模型,其中,目标油井产能预测模型可以是基于长短期记忆(Long Short Term Memory,LSTM)网络和粒子群优化算法(Particle Swarm Optimization,PSO)训练得到的。
其中,上述长短期记忆网络(LSTM,Long Short-Term Memory)是一种改进的循环神经网络(RNN,Recurrent Neural Networks),主要用于解决RNN在处理长序列过程中的梯度消失问题。相较于普通的RNN,长短期记忆网络在长序列问题中有更好的性能。上述粒子群优化算法是通过模拟鸟群觅食行为而形成的仿生优化算法,每个优化问题的解都是搜索空间中的鸟的空间位置,将鸟称之为“粒子”。
在一个实施例中,在获取上述目标油井产能预测模型之前,可以先获取目标油井的历史日产油数据和历史生产制度数据。上述历史日产油数据和上述历史生产制度数据可以理解为:目标油井从生产之初至目前所记录所有的日产油数据和生产制度数据,其中,每个日产油数据和生产制度数据都有一个与之对应日期,即日产油数据和生产制度数据都是按日期时序存储的。
为避免历史数据中的最大值和最小值以及噪声数据影响训练的效果,因此,可以对历史日产油数据和历史生产制度数据进行预处理。并将预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集。根据训练集、长短期记忆网络和粒子群优化算法,训练初始油井产能预测模型。
在具体的实施过程中,上述预处理可以包括:先对日产油数据和历史生产制度数据进行异常值检测,确定是否存在异常值,在确定存在异常值的情况下,将异常值移除。最后可以对移除异常值后的日产油数据和历史生产制度数据分别进行归一化处理,在一个实施例中,可以按照以下公式,对移除异常值后的日产油数据和历史生产制度数据分别进行归一化处理:
其中,在对移除异常值后的日产油数据进行归一化处理时,xnew为归一化后的数据;xold为数据的实际值;xmin为移除异常值后的日产油数据中原始数据的最小值;xmax为移除异常值后的日产油数据中原始数据的最大值。在对移除异常值后的生产制度数据进行归一化处理时,xnew为归一化后的数据;xold为数据的实际值;xmin为移除异常值后的生产制度数据中原始数据的最小值;xmax为移除异常值后的生产制度数据中原始数据的最大值。
其中,进行异常值检测的方法可以包括但不限于以下至少之一:均方差、IQR非参数异常值检测方法、Z-score(一维或低维特征空间中的参数异常检测方法)、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类方法、孤立森林、局部异常因子算法等,具体的可以根据实际情况确定,本申请对此不作限定。
在预测某一时间的日产油时,其通常只与该时间点前一段时间的数据关联较大,而不是与以前的所有数据相关。因此,可以设定一个时间窗口长度的范围,时间窗口长度表示需要预测的某一时间点的日产油数据与之前多少个历史日产油数据有关联。
进一步的,基于长短期记忆网络的初始油井产能预测模型可以采用下述公式进行描述:
O(t)=F{C(t),O(t-1),O(t-2),…,O(t-n)}
其中,O(t)为预测得到的第t时间步的日产油数据;C(t)为在第t时间步的生产制度数据;n为上述时间窗口长度,即如果时间窗口长度为n,则对应的包含n个时间步,n的取值范围为所述时间窗口长度的范围。以时间窗口长度的日产油数据和希望预测的时间点的生产制度数据作为输入,将希望预测的时间点的日产油数据作为输出。例如:在时间窗口大小为3的情况下,可以将训练集中的日产油数据集和生产制度数据集重新整理为以下形式:
进一步的,可以将进行预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集。其中,划分的方式可以是随机的也可以是根据时间顺序的,即可以将预处理后的历史日产油数据和历史生产制度数据中分别随机抽取一部分数据作为训练集,相应的另一部分数据作为测试集;也可以将预处理后的历史日产油数据和历史生产制度数据中前一段时间的数据作为训练集,相应的将其余时间的数据作为测试集的验证结果。
在预测时,目标预测周期的日产油数据往往是未知的,因此划分后除训练集之外的数据集可以作为测试集对应的结果,但是不能作为测试集,这里将每一步的预测结果迭代形成预测集。当时间窗口为3时,测试集应为如下所示:
其中,O'(t+n)是第t+n时间步的日产油预测值,输出的预测值均为归一化后的值。在对输出数据进行去归一化之后,可以获得t+1至t+n这n个时间步的日产油预测值。由于在预测时由于t时间步后面的日产油量数据是未知的,因此,后面每预测一个时间步时,都需要将该时间步的预测值更新加入到下一个时间步的预测数组中去。
上述初始油井产能预测模型中的隐含层采用长短期记忆网络,隐含层中长短期记忆网络的神经元数量需要根据PSO的优化结果确定。
在一个实施例中,可以根据上述训练集和粒子群优化算法,优化上述初始油井产能预测模型。如果期望模型输出的结果是一段时间内的日产油预测值,可以在训练之前对训练集中的数据先进行整理。
在一个实施例中,可以预先给定时间窗口长度的范围和长短期记忆网络中隐含层神经元数量的取值范围,在建立初始油井产能预测模型时,可以采用粒子群优化算法根据上述时间窗口长度的范围和长短期记忆网络中隐含层神经元数量的取值范围,从中选择一个时间窗口长度和对应的神经元数量作为初始值。进一步的,可以采用测试集对上述初始油井产能预测模型进行测试,得到测试结果。粒子群优化算法可以根据测试结果,从上述时间窗口长度的范围和长短期记忆网络中隐含层神经元数量的取值范围中不断挑选更好的时间窗口长度和神经元数量的组合,直至损失函数达到预设阈值。
在一个实施例中,可以根据粒子群优化算法,对上述初始油井产能预测模型中的时间窗口长度和长短期记忆网络层的神经元数量进行优化,并确定优化过程中各个时间窗口长度和长短期记忆网络层的神经元数量对应的损失函数值,判断损失函数值是否达到预设阈值,在判断损失函数值达到预设阈值的情况下结束优化,得到目标时间窗口长度和目标油井产能预测模型,其中,目标时间窗口长度等于目标预测周期的长度。上述预设阈值可以为大于0的数值,在一些情况下可以设定为该损失函数可以达到的最小值,具体的可以根据实际情况确定,本申请对此不作限定。
具体的,在粒子群算法内部,可以将搜索维度设置为2,一个维度代表时间窗口长度,另一个维度代表长短期记忆网络层的神经元数量,基于此的一个两维变量即为搜索空间中的一个点,根据下述两个公式,可以使该点所对应的损失函数不断变小,直至在粒子群两个维度的搜索空间内损失函数达到最小值,这样便同时得到了最优的目标时间窗口长度和长短期记忆网络层的神经元数量。
其中和分别为第k次迭代时粒子i的位置矢量和速度矢量;ω为惯性权重;为单个粒子的最佳位置;g*为所有粒子的全局最佳位置;c1和c2是两个正加速度常数,用于代表群体的个人和整体性质;r1和r2分别为[0,1]范围内的两个随机值。
在一些实施例中,在得到目标油井产能预测模型之后,可以进一步的利用上述测试集,确定目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差,从而根据目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差,确定上述目标油井产能预测模型的性能。在性能不符合预设的要求时,可以调整模型中的一些参数重新进行训练,直至上述目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差达到预设的要求。
S104:根据归一化后的目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,利用目标油井产能预测模型,得到目标油井在目标预测周期中日产油的预测值。
可以将归一化后的目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据作为输入数据,输入上述目标油井产能预测模型中,上述目标油井产能预测模型输出结果为目标油井在目标预测周期中日产油的预测值。
从以上的描述中,可以看出,本申请实施例实现了如下技术效果:可以通过获取目标油井在目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理,其中,预先对数据进行预处理可以避免目标油井产能预测模型受数据最大值和最小值以及噪声数据的影响,提高了预测的精确度。可以获取目标油井产能预测模型,其中,目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的,采用基于长短期记忆网络和粒子群优化算法训练得到的目标油井产能预测模型,不仅可以预测在一段时间内的日产油数据的整体变化趋势,还可以对单点进行准确的预测。进一步的,可以根据归一化后的目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,利用目标油井产能预测模型,得到目标油井在目标预测周期中日产油的预测值。将目标油井的生产制度数据对日产油数据的考虑在内,从而可以进一步提高对日产油预测的准确度。并且上述预测过程简单、便捷,有效降低了预测的时间成本和经济成本。
下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本申请,并不构成对本申请的不当限定。
本发明实施提供了一种油井产能预测方法,如图2所示,可以包括:
步骤1:数据预处理。
针对由于早期水淹而无法通过注水维持压力或提高采收率的火山岩储层通常都采用衰竭式开发,其产液量仅受油嘴大小控制。因此,可以收集目标油井的日产油数据和生产制度数据,其中,上述生产制度数据包括:油嘴大小,并对收集的数据进行数据预处理。
其中,上述数据预处理包括:检查异常值并舍去以减少噪声。由于长短期记忆网络对输入数据的范围敏感,因此,进一步的可以将进行去噪处理之后的日产油数据集和生产制度数据集进行归一化处理,使得归一化之后的数据在[0,1]之间,以避免模型参数受最大值和最小值的影响,归一化公式下所示:
其中,xnew为归一化后的数据;xold为数据的实际值;xmin为数据集中原始数据的最小值;xmax为数据集中原始数据的最大值。
根据火山岩储层的特征和长短期记忆网络,初始化得到一个初始油井产能预测模型,其中,上述初始油井产能预测模型可以描述为:
O(t)=F{C(t),O(t-1),O(t-2),…,O(t-n)}
其中,O(t)为预测得到的t时间步的日产油数据;C(t)为在t时间步的油嘴大小数据;n为时间窗口长度,n的取值范围为所述时间窗口长度的范围。假设时间窗口大小为3,可以将日产油数据集和油嘴大小数据集重新整理为以下形式:
其中,以时间窗口长度的日产油数据和相应的油嘴大小作为输入,将下一个时间步的日产油作为输出,模型中隐含层采用LSTM网络,初始油井产能预测模型结构如图3所示。如果给定了下一个时间步的油嘴尺寸,则可以预测得到下一个时间步的日产油。输入数据的维数由时间窗口长度决定,LSTM层用于记忆和提取来自输入数据的信息。
步骤2:训练初始油井产能预测模型。
将整理后的日产油数据集和油嘴大小数据集划分为两部分:前80%作为训练集。使用训练集训练初始油井产能预测模型,在训练过程中,通过PSO算法优选时间窗口长度和LSTM层神经元数量。在粒子群算法内部,将搜索维度设置为2,一个维度代表时间窗口长度,另一个维度代表LSTM层神经元数量,基于此的一个两维变量即为搜索空间中的一个点,根据下述两个公式,可以使该点所对应的损失函数不断变小,直至在粒子群两个维度的搜索空间内损失函数达到最小值,这样便同时得到了最优的时间窗口长度和LSTM层神经元数量。
其中和分别为第k次迭代时粒子i的位置矢量和速度矢量;ω为惯性权重;为单个粒子的最佳位置;g*为所有粒子的全局最佳位置;c1和c2是两个正加速度常数,用于代表群体的个人和整体性质;r1和r2分别为[0,1]范围内的两个随机值。
步骤3:使用训练得到的油井产能预测模型进行预测。
油井产能预测模型的目标是利用历史生产动态来预测未来某个或某段时期的日产油数据。在预测时由于t时间步后面的日产油量数据是未知的,因此,后面每预测一个时间步时,需要将该时间步的预测值更新加入到下一个时间步的预测数组中去。因此,使用训练好的模型进行预测时,其输入、输出形式为:
其中,O'(t+n)是第t+n时间步的日产油预测值,输出的预测值均为归一化后的值。在对输出数据进行去归一化之后,可以获得t+1至t+n这n个时间步的日产油预测值。
LSTM可以基于Keras实现,使用TensorFlow作为后端的深度学习库,整个工作流程采用python3.7编码,并在CoreTMi7-2600 3.40GHz CPU上执行。其中,上述Keras是一个高层神经网络API,Keras由纯Python编写而成并基于TensorFlow、Theano以及CNTK后端。
在一个实施例中采用位于我国新疆火山岩储层某压裂水平井的生产数据,验证模型的预测能力。压裂水平井投产约17个月,有501个数据点,油井的原始日产油数据及对应的生产制度数据如图4所示,其中,异常点(outlier)的值采用黑色菱形的数据点来表示,油嘴大小(choke size)对应的是灰色条状数据点,分别是纵坐标3.0和2.5,日产油(oilrate)对应的是主坐标是图中较小的圆形数据点。在图4中可见,油嘴大小初始为2.5mm,然后更换为3mm。但是由于油嘴尺寸大,地层压力衰减较快,导致产量下降较快。油嘴大小在2017年4月20日又变为了2.5mm。黑色菱形数据点时通过局部异常因子算法检测到的异常值,可以使用其前一个和后一个数据的平均值替换该异常值,然后将数据归一化并输入LSTM模型建立日产油预测模型。
使用递减规律分析(Decline curve)油井产量变化时,应在相同的生产制度数据,以及日产油呈现出稳定的下降趋势的情况下进行。因此,递减规律分析曲线如图5所示,其中,递减规律分析是通过产量递减曲线分析油井的产量递减规律。对应图中两条黑色曲线,即对油井产量递减规律的分析分为两个部分,第一部分的初始下降率为0.005,下降指数为0.4;第二部分的初始下降率和下降指数分别为0.002和0.5。
在一个实施例中,采用粒子群优化算法优选得到的结果是:LSTM层有15个神经元,时间窗口大小为6。为了更好地进行对比,设计ANN(人工神经网络,Artificial NeutralNetwork)和RNN的网络结构与LSTM相同。模型计算的结果如图6(a)、图6(b)和图6(c)所示,其中,图6(a)、图6(b)、图6(c)分别为ANN、RNN、LSTM三种模型的计算结果,History是油井的历史日产油数据,Training set是训练集的预测结果,Testing set是测试集的预测结果。
从图6(a)和图6(b)可以看出ANN和RNN对训练集的预测结果的误差较小,但是对测试集的预测结果均存在明显的误差,这说明ANN和RNN模型的泛化性能不强,无法预测训练过程中没有出现数据,尤其是对于长期时序问题。相比之下,采用LSTM模型可以很好的捕捉油井产能的变化规律,图6(c)所示,其对于训练集和测试集都有较好的预测效果,误差相对较小。
测试集是用于评价验证预测模型的关键,因为它所包含的数据在训练过程中没有输入到模型中。因此,可以根据测试集的预测结果对预测模型进一步进行分析,图7中展示了采用ANN、RNN、递减规律分析、LSTM这四种模型进行日产油数据预测的相对误差分布特征。其中,ANN模型和RNN模型的大部分预测结果误差都超过了20%,误差较大。LSTM模型预测误差大多在20%以内,只有虚线划分的区域之外而且与其很接近,由此可见LSTM模型更适合预测复杂的时序产能预测问题,即LSTM模型不仅可以提供整体趋势预测,而且可以提供准确的单点预测。
图8为ANN、RNN、LSTM三种模型绝对相对误差的分布范围,可以看出,ANN和RNN模型的预测结果中50%以上的预测结果误差都大于20%,不适用于时序产能的预测。递减曲线分析的预测结果相较于ANN和RNN模型更好。LSTM模型75%以上的预测结果误差小于20%,50%的预测结果误差在10%以内,即预测得到的日产油数据是可靠的。
可以采用平均绝对误差(MAE)、平均绝对误差百分比(MAPE)、和均方根误差(RMSE)等指标对模型的性能进行评价,平均绝对误差(MAE)和平均绝对百分误差(MAPE)指模型预测结果与实际数据之间的平均差值,模型的均方根误差(RMSE)表示模型预测误差的标准差,越小的值表示模型性能越好。数据统计得到的性能对比如表1中所示。
其中,ANN和RNN的结果误差较大。就MAPE,MAE和RMSE三项指标而言,递减规律分析的结果要优于ANN和RNN的结果。对于LSTM模型,预测结果优于其他三个模型,平均绝对百分比误差为9.88%,平均绝对误差为1.60,表明LSTM模型具有较高的准确性。进一步的,较小的RMSE表明LSTM模型也比其他三种方法稳定。油井产能预测的准确性主要取决于模型的泛化能力,根据表格中的数据可知LSTM模型的泛化能力优于ANN和RNN。对于传统的递减规律分析,尽管可以给出产能的整体变化趋势,但单点的预测误差并不可靠。LSTM模型不仅可以给出日产油的变化趋势,而且可以为日产油提供更准确的预测。
上述平均绝对误差(MAE)、平均绝对误差百分比(MAPE)、和均方根误差(RMSE)三个指标的定义如下:
其中,yi、分别为n个样本中的第i个实测值、第i个预测值。
表1四种模型性能对比
Model | MAPE | MAE | RMSE |
ANN | 20.14 | 3.46 | 4.10 |
RNN | 18.49 | 3.18 | 3.81 |
Decline analysis | 14.15 | 2.31 | 2.73 |
LSTM | 9.88 | 1.60 | 2.02 |
基于同一发明构思,本申请实施例中还提供了一种油井产能预测装置,如下面的实施例。由于油井产能预测装置解决问题的原理与油井产能预测方法相似,因此油井产能预测装置的实施可以参见油井产能预测方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图9是本申请实施例的油井产能预测装置的一种结构框图,如图9所示,可以包括:第一获取模块901、预处理模块902、第二获取模块903、预测模块904,下面对该结构进行说明。
上述第一获取模块,可以用于获取目标油井在目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据;
上述预处理模块,可以用于对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理;
上述第二获取模块,可以用于获取目标油井产能预测模型,其中,目标油井产能预测模型时基于长短期记忆网络和粒子群优化算法训练得到的;
上述预测模块,可以用于根据预处理后的目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,利用目标油井产能预测模型,得到目标油井在目标预测周期中日产油的预测值。
在一个实施例中,上述油井产能预测装置还可以包括:获取单元,用于获取目标油井的历史日产油数据和历史生产制度数据;预处理单元,用于对历史日产油数据和历史生产制度数据进行预处理;划分单元,用于将预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集;设定单元,用于设定时间窗口长度的范围和隐含层的神经元数量的范围;建立单元,用于根据长短期记忆网络、隐含层的神经元数量的范围和时间窗口长度的范围,建立初始油井产能预测模型;优化单元,用于根据训练集和粒子群优化算法,优化初始油井产能预测模型。
本申请实施方式还提供了一种电子设备,具体可以参阅图10所示的基于本申请实施例提供的油井产能预测方法的电子设备组成结构示意图,电子设备具体可以包括输入设备101、处理器102、存储器103。其中,输入设备101具体可以用于输入目标油井在目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据。处理器102具体可以用于对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理;获取目标油井产能预测模型,其中,目标油井产能预测模型时基于长短期记忆网络和粒子群优化算法训练得到的;根据预处理后的目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,利用目标油井产能预测模型,得到目标油井在目标预测周期中日产油的预测值。存储器103具体可以用于存储目标油井在目标预测周期中日产油的预测值等参数。
在本实施方式中,所述输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。所述输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
在本实施方式中,该电子设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本申请实施方式中还提供了一种基于油井产能预测方法的计算机存储介质,计算机存储介质存储有计算机程序指令,在计算机程序指令被执行时可以实现:获取目标油井在目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据;对目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据分别进行预处理;获取目标油井产能预测模型,其中,目标油井产能预测模型时基于长短期记忆网络和粒子群优化算法训练得到的;根据预处理后的目标预测周期前一个周期的日产油数据和目标预测周期的生产制度数据,利用目标油井产能预测模型,得到目标油井在目标预测周期中日产油的预测值。
在本实施方式中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。
虽然本申请提供了如上述实施例或流程图所述的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述的方法的在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本申请的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (12)
1.一种油井产能预测方法,其特征在于,包括:
获取目标油井在目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据;其中,所述日产油数据受所述目标预测周期的生产制度数据控制;
对所述目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据分别进行预处理;
获取目标油井产能预测模型,其中,所述目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的;
根据预处理后的目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据,利用所述目标油井产能预测模型,得到所述目标油井在所述目标预测周期中日产油的预测值;
其中,在获取所述目标油井产能预测模型之前,还包括:
获取训练集和测试集;所述测试集如下所示:
其中,C(t+n)是第t+n时间步的生产制度数据,O(t)是第t时间步的日产油预测值,O'(t+n)是第t+n时间步的日产油预测值,n为时间窗口长度;
根据所述训练集和所述粒子群优化算法,优化初始油井产能预测模型;其中,所述粒子群优化算法用于根据所述测试集的测试结果,获取在损失函数达到预设阈值时的目标时间窗口长度和神经元数量的组合;所述测试集的测试结果为测试集输入至所述初始油井产能预测模型中得到的结果。
2.根据权利要求1所述的方法,其特征在于,所述生产制度数据包括:油嘴尺寸。
3.根据权利要求1所述的方法,其特征在于,获取训练集和测试集,包括:
获取目标油井的历史日产油数据和历史生产制度数据;
对所述历史日产油数据和所述历史生产制度数据进行预处理;
将预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集。
4.根据权利要求1所述的方法,其特征在于,按照以下公式,根据所述长短期记忆网络和初始时间窗口长度的范围,建立初始油井产能预测模型:
O(t)=F{C(t),O(t-1),O(t-2),L,O(t-n)}
其中,O(t)为预测得到的第t时间步的日产油;C(t)为在第t时间步的生产制度数据;n为时间窗口长度,n的取值范围为所述时间窗口长度的范围。
5.根据权利要求1所述的方法,其特征在于,根据所述训练集和所述粒子群优化算法,优化所述初始油井产能预测模型,包括:
根据所述训练集训练所述初始油井产能预测模型;
在训练过程中根据所述粒子群优化算法,对所述初始油井产能预测模型中的时间窗口长度和长短期记忆网络层的神经元数量进行优化;
确定优化过程中各个时间窗口长度和长短期记忆网络层的神经元数量对应的损失函数值;
判断所述损失函数值是否达到预设阈值;
在判断所述损失函数值达到所述预设阈值的情况下结束优化,得到目标时间窗口长度和目标油井产能预测模型。
6.根据权利要求5所述的方法,其特征在于,在得到所述目标油井产能预测模型之后,还包括:
根据所述测试集,确定所述目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差;
根据所述目标油井产能预测模型的平均绝对误差、平均绝对误差百分比和均方根误差,确定所述目标油井产能预测模型的性能。
7.根据权利要求3所述的方法,其特征在于,对所述历史日产油数据和所述历史生产制度数据进行预处理,包括:
对所述日产油数据和所述历史生产制度数据进行异常值检测,确定是否存在异常值;
在确定存在异常值的情况下,采用异常值前一个数据和后一个数据的平均值替换所述异常值;
对替换异常值后的日产油数据和历史生产制度数据分别进行归一化处理。
8.根据权利要求7所述的方法,其特征在于,按照以下公式,对移除所述异常值后的日产油数据和历史生产制度数据分别进行归一化处理:
其中,xnew为归一化后的数据;xold为数据的实际值;xmin为数据最小值;xmax为数据最大值。
9.一种油井产能预测装置,其特征在于,包括:
第一获取模块,用于获取目标油井在目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据;其中,所述日产油数据受所述目标预测周期的生产制度数据控制;
预处理模块,用于对所述目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据分别进行预处理;
第二获取模块,用于获取目标油井产能预测模型,其中,所述目标油井产能预测模型是基于长短期记忆网络和粒子群优化算法训练得到的;
预测模块,用于根据预处理后的目标预测周期前一个周期的日产油数据和所述目标预测周期的生产制度数据,利用所述目标油井产能预测模型,得到所述目标油井在所述目标预测周期中日产油的预测值;
其中,在获取所述目标油井产能预测模型之前,还包括:
获取训练集和测试集;所述测试集如下所示:
其中,C(t+n)是第t+n时间步的生产制度数据,O(t)是第t时间步的日产油预测值,O'(t+n)是第t+n时间步的日产油预测值,n为时间窗口长度;
根据所述训练集和所述粒子群优化算法,优化初始油井产能预测模型;其中,所述粒子群优化算法用于根据所述测试集的测试结果,获取在损失函数达到预设阈值时的目标时间窗口长度和神经元数量的组合;所述测试集的测试结果为测试集输入至所述初始油井产能预测模型中得到的结果。
10.根据权利要求9所述的装置,其特征在于,还包括:
获取单元,用于获取目标油井的历史日产油数据和历史生产制度数据;
预处理单元,用于对所述历史日产油数据和所述历史生产制度数据进行预处理;
划分单元,用于将预处理后的历史日产油数据和历史生产制度数据进行划分,得到训练集和测试集。
11.一种油井产能预测设备,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至8中任一项所述方法的步骤。
12.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被执行时实现权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911362959.9A CN111144542B (zh) | 2019-12-26 | 2019-12-26 | 油井产能预测方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911362959.9A CN111144542B (zh) | 2019-12-26 | 2019-12-26 | 油井产能预测方法、装置和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111144542A CN111144542A (zh) | 2020-05-12 |
CN111144542B true CN111144542B (zh) | 2023-09-22 |
Family
ID=70520146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911362959.9A Active CN111144542B (zh) | 2019-12-26 | 2019-12-26 | 油井产能预测方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144542B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738584B (zh) * | 2020-06-15 | 2024-01-30 | 中国石油化工股份有限公司 | 矿场应用油井产能分析方法 |
CN111784065B (zh) * | 2020-07-09 | 2021-04-16 | 东北石油大学 | 一种基于灰关联的油井产能智能预测方法 |
CN111950784B (zh) * | 2020-08-04 | 2023-06-09 | 广东工业大学 | 一种融合注意力机制的产能预测方法 |
CN112329983B (zh) * | 2020-09-30 | 2024-07-26 | 联想(北京)有限公司 | 一种数据处理方法及装置 |
CN112819239B (zh) * | 2021-02-19 | 2024-05-14 | 北京骑胜科技有限公司 | 产品数量预测方法、装置、电子设备和可读存储介质 |
CN113011639A (zh) * | 2021-03-04 | 2021-06-22 | 中国石油大学(华东) | 基于机器学习的射孔井产能预测方法及系统 |
CN113435128B (zh) * | 2021-07-15 | 2024-09-13 | 中国石油大学(北京) | 基于条件生成式对抗网络的油气藏产量预测方法及装置 |
CN113537592B (zh) * | 2021-07-15 | 2023-09-15 | 中国石油大学(北京) | 基于长短时记忆网络的油气藏产量预测方法及装置 |
CN114662414B (zh) * | 2022-05-25 | 2022-09-27 | 中国石油大学(华东) | 一种基于图小波神经网络模型的油藏生产预测方法 |
CN114925623B (zh) * | 2022-07-22 | 2022-09-23 | 中国地质大学(北京) | 油气藏产量预测方法及系统 |
CN115169761B (zh) * | 2022-09-08 | 2022-12-13 | 中科数智能源科技(深圳)有限公司 | 基于gnn和lstm的复杂井网油田产量预测方法 |
CN116861800B (zh) * | 2023-09-04 | 2023-11-21 | 青岛理工大学 | 一种基于深度学习的油井增产措施优选及效果预测方法 |
CN116956049A (zh) * | 2023-09-19 | 2023-10-27 | 中国联合网络通信集团有限公司 | 工业产能预测模型的训练方法、装置、设备及存储介质 |
CN117408396B (zh) * | 2023-12-15 | 2024-02-23 | 北京天安智慧信息技术有限公司 | 一种基于深度学习的油气井产量预测方法与预测系统 |
CN118428606A (zh) * | 2024-06-05 | 2024-08-02 | 中国石油大学(北京) | 一种油井可开采等级评估方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108986470A (zh) * | 2018-08-20 | 2018-12-11 | 华南理工大学 | 粒子群算法优化lstm神经网络的行程时间预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019169400A1 (en) * | 2018-03-02 | 2019-09-06 | Deepsig Inc | Learning communication systems using channel approximation |
-
2019
- 2019-12-26 CN CN201911362959.9A patent/CN111144542B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108986470A (zh) * | 2018-08-20 | 2018-12-11 | 华南理工大学 | 粒子群算法优化lstm神经网络的行程时间预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111144542A (zh) | 2020-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144542B (zh) | 油井产能预测方法、装置和设备 | |
CN109255506B (zh) | 一种基于大数据的互联网金融用户贷款逾期预测方法 | |
CN110148285B (zh) | 一种基于大数据技术的油井参数智能预警系统及其预警方法 | |
CN109615226B (zh) | 一种运营指标异常监测方法 | |
RU2573746C2 (ru) | Система и способы для прогнозирования поведения скважины | |
Lai et al. | Online pattern matching and prediction of incoming alarm floods | |
CN114548591B (zh) | 一种基于混合深度学习模型和Stacking的时序数据预测方法及系统 | |
CN112761628B (zh) | 基于长短期记忆神经网络的页岩气产量确定方法、装置 | |
CN112016097B (zh) | 一种预测网络安全漏洞被利用时间的方法 | |
Cheng et al. | Prediction of oil well production based on the time series model of optimized recursive neural network | |
CN112990480A (zh) | 构建模型的方法、装置、电子设备和存储介质 | |
KR101474874B1 (ko) | 지능형 생산정 위치 선정 전산 시스템 및 이를 이용한 생산정 위치 선정 방법 | |
CN105488598A (zh) | 一种基于模糊聚类的中长期电力负荷预测方法 | |
Rodriguez et al. | Methodology for the prediction of fluid production in the waterflooding process based on multivariate long–short term memory neural networks | |
Le et al. | Physics-constrained deep learning for production forecast in tight reservoirs | |
Ju et al. | Hydrologic simulations with artificial neural networks | |
CN115511341B (zh) | 一种库岸边坡时变失效概率评估方法及装置 | |
George | Predicting Oil Production Flow Rate Using Artificial Neural Networks-The Volve Field Case | |
CN114970674A (zh) | 一种基于关联度对齐的时序数据概念漂移适配方法 | |
Luo et al. | Production Forecast for Multistage Hydraulically Fractured Shale Gas Well Based on Integration of Domain Knowledge and Deep Learning Algorithm | |
CN113011657A (zh) | 进行台风水位预测的方法、装置、电子设备及存储介质 | |
Vega-Ortiz et al. | Decline Curve Analysis Using Machine Learning Algorithms: RNN, LSTM, and GRU | |
CN112926774A (zh) | 基于长短时记忆神经网络的地热产能预测方法及系统 | |
Deng et al. | Deep learning-based dynamic forecasting method and application for ultra-deep fractured reservoir production | |
Verheugd | Predicting water pipe failures: A Neural Hawkes Process approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |