CN113722997A

CN113722997A - 一种基于静态油气田数据的新井动态产量预测方法

Info

Publication number: CN113722997A
Application number: CN202111019424.9A
Authority: CN
Inventors: 罗怡雯; 田志欣
Original assignee: Beijing Zhongdi Jinshi Technology Co ltd
Current assignee: Beijing Zhongdi Jinshi Technology Co ltd
Priority date: 2021-09-01
Filing date: 2021-09-01
Publication date: 2021-11-30

Abstract

本发明提出了一种基于静态油气田数据的新井动态产量预测方法。该方法包括：油气井数据的汇总与预处理；进行BP神经网络累产量预测模型的训练与模型超参数的优化；进行BP‑LSTM月产量预测模型的训练并优化模型超参数；经过反归一化处理得到月产量数据的预测值。该模型利用神经网络模型较强的非线性拟合能力以及LSTM神经网络在时间序列数据上较强的的预测能力，解决在仅仅已知静态油气田数据的情况下对新井月产量动态数据做出非线性预测的问题，适合新井开发过程中的产量趋势的快速估算，特别适合矿场工程技术人员使用。

Description

一种基于静态油气田数据的新井动态产量预测方法

技术领域

本发明涉及油气开采技术领域，更为具体地，涉及一种基于静态油气田数据的新井动态产量预测方法。

背景技术

在油气田区块的实际开发中已包含很多成熟的动静态产量预测方法。在预测油气井产能方面，近十年来应用次数较多的机器学习的方法包括多元回归分析、RF模型以及神经网络等，而其他机器学习的方法如支持向量回归(SVM)、梯度提升回归(GBM)等模型也有所涉及。Alatrach等人选取了位于阿联酋阿布扎比的一个低渗透碳酸盐油气藏，通过分析将井位坐标、静态信息(TVD，初始饱和度等)等参数输入到了ANN预测模型中，并将油、气以及水的产量、储层压力与水饱和度作为模型的输出参数，分别建立模型进行了预测，最终表明了神经网络模型的有良好的非线性拟合性。Chakra等人为了克服传统神经网络在油气产量预测方面的局限性，应用高阶神经网络(HONN)对累积产油量进行预测。所建立的高阶神经网络模型克服了传统方法的局限性，它可以对线性数据以及非线性数据分别进行表征。谷建伟等人为了解决常规产量预测方法无法考虑时序影响因素的非同步性以及滞后性的问题，提出使用时间序列分析方法对产量进行预测，他将时间序列与卡尔曼滤波器结合在一起，根据历史产量数据建立时间序列中的产量差分自回归积分移动平均模型，这之后又将ARIMA模型与Kalman滤波器相结合构建了产量预测模型，在实际油田数据上开展了机器学习模型的应用研究，最终采用数据拟合及预测检验的方法评价了算法合理性，并且对产量数据的做出了预测。现有技术中，一种单井产量快速预测方法及系统(202110715729.7)提供了一种采用LSTM模型预测产量的方法，具体包括：1)分别获取每一油井的静态参数和动态参数，并分别构建对应的LSTM模型；2)对各LSTM模型的网络计算参数进行敏感性分析；3)建立日产油波动程度与最优网络计算参数之间的相关关系，形成日产油波动程度与最优网络计算参数之间的关系图版；4)确定最优的LSTM模型；5)获取待预测油井的静态参数和动态参数，并输入至最优的LSTM模型，得到待预测油井的产量预测值。该方法虽然也采用了LSTM，但该方法依赖于完善的油气田开采历史数据，必须要使用静态数据和动态参数才能实现对油井的产量预测，对于仅有静态数据的新井的动态产量预测具有局限性。

虽然传统的模型在产量预测问题上已经取得一定的成果，但是这些方法均包含各自的短板，主要体现在：适用的范围即区块特征不同，适用油气田生产开发的阶段不同，预测要求的条件及流程复杂程度不同等方面。上述现有技术只考虑了静态油气数据或者动态油气田数据中的一方面对产能预测的影响，在仅仅已知静态油气田数据的情况下，现有技术无法对新井动态产量做出预测。

发明内容

本发明的目的在于解决上述现有技术无法解决在仅仅已知静态油气田数据的情况下对新井动态产量做出预测的技术问题，提供一种基于静态油气田数据的新井动态产量预测方法。

本发明是通过下述技术方案实现：一种基于静态油气田数据的新井动态产量预测方法，包括以下步骤：

步骤S1：油气井静态数据的汇总与预处理；

步骤S2：进行BP(反向传播)神经网络累产量预测模型的训练与模型超参数的优化；

步骤S3：进行BP-LSTM(长短时记忆网络)月产量预测模型的训练并优化模型超参数；

步骤S4：经过反归一化处理得到新井动态月产量数据的预测值。

在本发明的一较佳实施方式中，在所述步骤S1中，所述油气井静态数据包括静态油气田数据以及每口井的累产量数据，并对所述油气井数据进行无量纲化处理，计算公式为：

式中，x为样本数据，无因次，μ为样本数据的均值，无因次，σ为样本数据的标准差，无因次，x′为无量纲化之后的数据，无因次。

在本发明的一较佳实施方式中，在所述步骤S2中，所述BP神经网络累产量预测模型的训练方法为：在隐藏层中选择relu作为中间的激活函数；在输出层选择sigmoid作为激活函数，所述sigmoid可以将输出向量映射到0到1之间方便计算与处理。

在本发明的一较佳实施方式中，在所述步骤S2中，所述隐藏层中的激活函数为：

式中，x为神经网络隐藏层计算得到的数据，无因次。

在本发明的一较佳实施方式中，在所述步骤S2中，所述输出层中的激活函数为：

式中，x为神经网络输出层计算得到的数据，无因次。

在本发明的一较佳实施方式中，在所述步骤S2中，所述BP神经网络累产量预测模型的训练过程均包括前向传播与反向传播两个步骤。

在本发明的一较佳实施方式中，在所述步骤S2中，所述前向传播过程中，对于一个含有L层的神经网络，其第L层的第j个神经元处的一般计算公式为：

式中：n_l表示第L层的参与计算的神经元个数，

表示将第L-1层即上一层的输出值作为第L层的输入值，

表示第L-1层中第i个神经元与第L层中的j个神经元之间的权重值，

表示第L层中第j个神经元的偏置系数，f表示激活函数。

在本发明的一较佳实施方式中，在所述步骤S2中，所述反向传播的迭代过程中，采用随机梯度下降法对损失函数求导进行更新权重与偏置参数的步骤，所述更新权重公式如下：

其中：α为学习率，即为梯度按照一定方向下降时候的步长因子，

表示第L层中第j个神经元的偏置系数，J^(L)表示第L层的损失函数，

表示对某一项求偏导。

在本发明的一较佳实施方式中，在所述步骤S3中，所述LSTM神经网络的输入层与隐藏层均为LSTM层，所述LSTM层由一个个LSTM储存单元构成，输出层为神经网络的全连接层，多个LSTM层构成了DLSTM模型；所述BP-LSTM月产量预测模型通过Python中的keras包建立。

先比现有技术，本发明的有益效果是：(1)提供了一种基于静态油气田数据的新井动态产量预测方法相较于传统的动静态产量预测方法，使用机器学习方法预测油气田生产动态具有其天然的优势，无需公式推导与地质建模，数据直接来源于实际生产资料，有效避免人为因素干扰，提高产能预测效率等。(2)本发明基于神经网络的方法，其中神经网络模型有着较强的非线性拟合能力，其解决在仅仅已知静态油气田数据的情况下对新井月产量动态数据做出非线性预测的问题。

附图说明

图1为本发明一种基于静态油气田数据的新井动态产量预测方法的流程图；

图2为本发明的实施例的油井已投产时间T统计图；

图3为本发明的实施例的BP神经网络累产量预测模型结构图；

图4为本发明的实施例的某井月产量实际值与BP累产量预测模型月产量预测值对比图；

图5为本发明的实施例的k时刻下多个LSTM层之间的状态更新示意图；

图6为本发明的实施例的LSTM层单个储存单元单个时间步的计算流程图；

图7为本发明的实施例的BP模型、BP-LSTM模型预测结果与实际值对比图

具体实施方式

下面结合实施例，对本发明作进一步详细说明，但本发明的实施方式不仅限于此。

图1示出了根据本发明的一种基于静态油气田数据的新井动态产量预测方法的流程。

以M油田区块为例，该地区共有148口油井，生产数据记录从2015年12月持续到2020年4月，每口井的开始生产时间不同，但是数据记录均截止于2020年4月。具体实施包括以下步骤：

步骤S1：油气井静态数据的汇总与预处理；

按照每口井的已投产时间T(月份)对其进行了统计与分析，油对数据进行无量纲化处理以便于后续建模应用，从统计图2中可以看出大部分油井的已投产时间T集中在半年到三年之间，占比约为84.46％，说明这是一个较新开发的区块。

M区块共包含平均孔隙度，平均渗透率，平均含油饱和度So，Ⅲ类油层厚度占比，设计段数，设计簇数，簇间距，总砂量，单簇加砂量，加砂强度，用液强度，总液量，水平段长，压裂液量共14种静态油气田数据。数据归一化方法为正态分布归一化法，最终使得数据的均值为零方差为1。

步骤S2：进行BP神经网络累产量预测模型的训练与模型超参数的优化；

模型的超参数是通过网格搜索法优化的，并且将随机种子数设置为一个固定值且采用单线程模式，保证了模型的可重复性，权重初始化方法均为标准正态分布初始化。在BP神经网络模型的训练过程中，在隐藏层中选择relu作为中间的激活函数，其中涉及到的计算公式为：

在输出层选择sigmoid作为激活函数，它可以将输出向量映射到0到1之间方便计算与处理，计算公式为：

每一个BP神经网络的训练过程均包括前向传播与反向传播两个步骤。前向传播过程中，对于一个含有L层的神经网络，其第L层的第j个神经元处的一般计算公式为：

其中：n_l表示第L层的参与计算的神经元个数，

表示将第L-1层即上一层的输出值作为第L层的输入值，

表示第L-1层中第i个神经元与第L层中的j个神经元之间的权重值。

对于一个包含m个数据的训练集来讲，将均方误差作为它的损失函数，为了防止过拟合加入了L2范数，综上第L层的损失函数定义为：

其中：m表示样本数，n表示输出值的维度，

表示第L层第j个神经元的第k个维度的实际值，

表示第L层第j个神经元的第k个维度的预测值，θ表示权重或偏置参数的矩阵，λ为L2范数的可调节参数。

在反向传播的迭代过程中，采用随机梯度下降法对损失函数求导进行更新权重与偏置参数的步骤，更新公式如下：

表示对某一项求偏导。

实施例中所建立的BP神经网络累产量预测模型的结构如图3所示。模型输入层输入的为经过归一化处理之后的14个静态因素的数据，加上偏置共计15维数据，隐藏层的数量以及每一层神经元的个数利用网格搜索法确定，输出层输出的是反归一化之后的各个井的前x个月累积产量、…、前x+5个月累积产量共计6维数据，在数据预处理之前删除静态因素数据不完整的井数据，在这种情形下，由于已投产时间36个月及以上的井的数量较少，所以选取x＝1,7,13,19,25根据输出层的不同一共建立5个BP神经网络累产量预测模型。

按照训练集：测试集＝8：2的比例划分数据集，基于Python中的keras包实现了模型的建立与预测，五个BP神经网络累产量预测模型的参数信息如表1所示。

表1BP神经网络累产量预测模型参数信息统计表

选取了M区块的一口典型井，先得到典型井的前1到30个月的累产量预测值，再将累产量做差值计算得到典型井的30个月的月产量变化图4。

步骤S3：进行BP-LSTM月产量预测模型的训练并优化模型超参数；

实施例中BP-LSTM月产量预测模型构建方法为：LSTM神经网络的输入层与隐藏层均为LSTM层，该层由一个个LSTM储存单元构成，输出层为神经网络的全连接层，图5为在k时刻下多个LSTM层的状态更新示意图，这属于LSTM神经网络模型横向上(同一时刻不同层)的剖分，其中多个LSTM层构成了DLSTM模型。

在时刻k处，输入数据x_k和LSTM层1储存单元的上一时间步时的隐藏状态

同时被输入到LSTM层1的储存单元，计算并输出现在LSTM层1储存单元的隐藏状态

而一方面，

被输入到下一时间步时的LSTM层1的储存单元，另一方面，隐藏状态

和LSTM层2储存单元的上一时间步时的隐藏状态

同时被输入到LSTM层2的储存单元，计算并输出现在LSTM层2储存单元的隐藏状态

而

一方面会被输入到下一时间步时的LSTM层2的储存单元，另一方面，又会和LSTM层3储存单元上一时间步时的隐藏状态

同时被输入到第LSTM层3的储存单元。以此类推直到数据信息输入到最后一个LSTM层的储存单元上。

在单个LSTM层中最为关键的是储存单元的状态，该状态沿着整个LSTM结构运行并由三个门结构调节，这属于LSTM神经网络模型纵向上(不同时刻同一层)的剖分，如图6所示在每一个

处分别进行了一次门结构处理，在k时刻状态的调节过程由以下三个步骤完成：

第一步：遗忘门根据当前的输入x_k和上一时刻的输出h_k-1决定哪一部分记忆需要被遗忘，输入值z和遗忘门F的公式如下：

z＝tanh(w_z[h_k-1,x_k])

F＝sigmoid(w_F[h_k-1,x_k])

第二步：输入门根据x_k和h_k-1决定哪些信息加入到状态c_k-1中生成新的状态c_k，这里可以具体分为两步，首先输入门决定要更新哪些值，之后创建新的状态c_k，输入门I与新状态c_k的公式如下：

I＝sigmoid(w_I[h_k-1,x_k])

c_k＝Fc_k-1+Iz

第三步：在LSTM得到新的状态c_k后，输出门产生当前时刻的输出h_k，输出门O和当前时刻输出h_k的公式为：

O＝sigmoid(w_O[h_k-1,x_k])

h_k＝Otanh(c_k)

其中，w_F、w_I、w_O、w_z均为权重矩阵。

利用基于BP神经网络累产量预测模型得到的月产量数据建立了BP-LSTM月产量预测模型，预测思路为一步式的滑动窗口预测，即用前t个时刻的数据预测第t+1时刻的数据(本实施例中t＝4)，先将动态月产数据转化为了监督数据的格式，然后利用最大最小归一化方法进行了处理(公式如下)，按照训练集：测试集＝7：3的比例划分之后输入到模型中，最后在经过反归一化处理得到月产量数据的预测值。

反归一化处理公式为：

模型通过Python中的keras包建立，随机种子数设定为了一个固定值并采用单线程均是为了保证模型的可重复性，选取Adam方法为权重参数优化方法，LSTM层的激活函数为tanh函数，输出层的函数为sigmoid函数。超参数采用了网格搜索法寻优，其中LSTM层数为2层，每层神经元个数为6，Dropout的比例为0.4。图7表明了BP-LSTM月产量预测模型可以对月产量的变化趋势做出大致预测，且该模型测试集的相对误差为小于BP累产量预测模型预测结果的相对误差，说明了BP-LSTM模型的预测性能优于BP模型，因为BP-LSTM方法不仅考虑了静态数据与动态数据之间的关系，也考虑了动态数据之间的关系。故，本发明在仅仅已知静态油气田数据的情况下可以对新井月产量动态数据做出非线性预测，适合新井开发过程中的产量趋势的快速估算，特别适合矿场工程技术人员使用。

以上所述，仅是本发明的较佳实施例并非对本发明对任何形式上的限制，凡是依据本发明的技术、方法实质上以上实施例所作的任何简单修改、等同变化，均落入本发明的保护范围之内。

Claims

1.一种基于静态油气田数据的新井动态产量预测方法，其特征在于，包括以下步骤：

步骤S1：油气井静态数据的汇总与预处理；

2.根据权利要求1所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S1中，所述油气井静态数据包括静态油气田数据以及每口井的累产量数据，并对所述油气井数据进行无量纲化处理，计算公式为：

3.根据权利要求2所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S2中，所述BP神经网络累产量预测模型的训练方法为：在隐藏层中选择relu作为中间的激活函数；在输出层选择sigmoid作为激活函数，所述sigmoid可以将输出向量映射到0到1之间方便计算与处理。

4.根据权利要求3所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S2中，所述隐藏层中的激活函数为：

式中，x为神经网络隐藏层计算得到的数据，无因次。

5.根据权利要求4所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S2中，所述输出层中的激活函数为：

式中，x为神经网络输出层计算得到的数据，无因次。

6.根据权利要求5所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S2中，所述BP神经网络累产量预测模型的训练过程均包括前向传播与反向传播两个步骤。

7.根据权利要求6所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S2中，所述前向传播过程中，对于一个含有L层的神经网络，其第L层的第j个神经元处的一般计算公式为：

式中：n_l表示第L层的参与计算的神经元个数，

表示将第L-1层即上一层的输出值作为第L层的输入值，

表示第L层中第j个神经元的偏置系数，f表示激活函数。

8.根据权利要求7所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S2中，所述反向传播的迭代过程中，采用随机梯度下降法对损失函数求导进行更新权重与偏置参数的步骤，所述更新权重公式如下：

表示对某一项求偏导。

9.根据权利要求8所述的基于静态油气田数据的新井动态产量预测方法，其特征在于：在所述步骤S3中，所述LSTM神经网络的输入层与隐藏层均为LSTM层，所述LSTM层由一个个LSTM储存单元构成，输出层为神经网络的全连接层，多个LSTM层构成了DLSTM模型；所述BP-LSTM月产量预测模型通过Python中的keras包建立。