CN114925623A

CN114925623A - 油气藏产量预测方法及系统

Info

Publication number: CN114925623A
Application number: CN202210864648.8A
Authority: CN
Inventors: 郭翠平; 林箐; 廉海荣; 罗万静; 韩慧萍
Original assignee: China University of Geosciences Beijing
Current assignee: China University of Geosciences Beijing
Priority date: 2022-07-22
Filing date: 2022-07-22
Publication date: 2022-08-19
Anticipated expiration: 2042-07-22
Also published as: CN114925623B

Abstract

本申请提供了一种油气藏产量预测方法及系统，属于油气藏开发技术领域，油气藏产量预测方法包括：建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型；获取油藏数据，对油藏数据进行预处理；对预处理后的油藏数据通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集；通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果；通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。通过本申请的技术方案，长短期记忆网络结合卡尔曼滤波预测油气藏产量，能够提高预测的准确率。

Description

油气藏产量预测方法及系统

技术领域

本申请涉及油气藏开发技术领域，具体而言，涉及一种油气藏产量预测方法及系统。

背景技术

油井产量预测贯穿油田开发生产全过程。在产量预测模型中，根据产量影响因素及矿场获取数据的难易程度，考虑部分地质和生产参数作为油井产量预测的输入参数。日产气、日排液、套压、油压、输压、和水气比可从地层能量、操作调整、生产限制等方面衡量对产油量的影响水平。

在相关技术中，针对卡尔曼滤波方法应用于油藏产量预测领域做了诸多研究，随着油藏工程研究的深入，油气井的模型变得更为复杂，地质参数也越来越多。传统卡尔曼滤波对于系统模型的要求较高，它要求状态方程和量测方程是线性的高斯分布，且系统噪声可知。在以上条件下，通过迭代进行预测和更新步骤，但在处理非高斯分布的数据时，尤其是油气井在地下由于地层的构造特点和油藏不同的属性，分布是十分不均衡的。而且油藏的开发周期是很长的，随着开采的进行，地下开采环境会更恶劣，产量也会随之降低，还有各种意外因素会导致停工停产的状况，因此单一的卡尔曼滤波模型预测效果误差很大。

发明内容

本申请旨在解决或改善单一卡尔曼滤波模型预测效果误差大的问题。

为此，本申请的第一目的在于提供一种油气藏产量预测方法。

本申请的第二目的在于提供一种油气藏产量预测系统。

为实现本申请的第一目的，本发明第一方面的技术方案提供了一种油气藏产量预测方法，油气藏产量预测方法基于长短期记忆网络和卡尔曼滤波，油气藏产量预测方法包括：建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；获取油藏数据，对油藏数据进行预处理，预处理包括以下之一或其组合：缺失值处理、异常值处理和剔除无关变量；对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集,其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。

根据本申请提供的油气藏产量预测方法，首先建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整。然后获取油藏数据，对油藏数据进行预处理。在对油藏数据进行初步的预处理之后，对油藏数据以统计方法进行描述性分析，使用相关性分析和逐步回归方法讨论参数的特征贡献度，筛选出特征参数，剔除贡献度较小的参数，以筛选后的油气井实际参数指标如产气量、油压和水气比等指标综合分析并对油气产量进行预测。其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数。基于特征参数构建数据集，通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果。其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正。最后通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力，对于高度并行的时序信息处理能力也很强大，无论输入、输出是否具有线性特性，它都有很好的容错性和鲁棒性，可与卡尔曼滤波算法互补，从而提高预测的准确率。

另外，本申请提供的技术方案还可以具有如下附加技术特征：

上述技术方案中，静态模型的公式为：

；

；

；

⊙

+

⊙

；

⊙

；

其中，

为遗忘门，

为遗忘门的偏置项，

为遗忘门的输入权重，

为遗忘门的循环权重，

为外部输入门，

为外部输入门的偏置项，

为外部输入门的输入权重，

为外部输入门的循环权重，

为输出门，

为输出门的偏置项，

为输出门的输入权重，

为输出门的循环权重，

为最终长短期记忆网络元胞状态，

为输出结果。

在该技术方案中，长短期记忆网络创造性地改变了元胞的内部结构，每个元胞内部设计了4个非线性神经网络层，而且增加了元胞状态的概念。同时将隐层单元和元胞状态输入到下个元胞。长短期记忆网络通过一种叫门的结构来控制，它是一种选择性让信息通过的方式，这种门的功能在元胞结构中添加或删除信息。他具体是由一个S形层和一个元素相乘操作组成。S形层输出0~1之间的值，每个值表示对应的部分信息通过量。不允许信息通过表示为0，让所有信息通过表示为1。一个长短期记忆网络有3个这种门来保护和控制元胞状态。

其中，遗忘门

负责对通过的信息有选择性进行丢弃，

分别是遗忘门中的偏置、输入权重和循环权重，外部输入门

负责更新信息，自身参数分别为

。输出门o也有其对应参数。最终长短期记忆网络元胞状态为c(t)，输出结果为h(t)。通过以上公式可以看出，基于目前的元胞状态再加入过滤，就可以得到输出结果。首先建立一个S形层的输出门，来决定将元胞的哪些部分进行输出。然后将元胞状态通过激活函数之后，与输出门相乘，只输出想输出的部分。

上述技术方案中，动态调整模型包括时间更新方程和测量更新方程，时间更新方程包括先验状态估计方程和误差协方差方程，测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程，先验状态估计方程为：

=

；

误差协方差方程为：

=

+

；

卡尔曼增益方程为：

=

；

后验估计方程为：

=

+

；

协方差更新方程为：

=

；

其中，

为

时刻的先验估计，

为

时刻的后验估计，

为状态

到状态

的一步状态转移矩阵，

为

时刻的误差协方差矩阵，

为

时刻系统过程噪声的协方差矩阵，

为

时刻量测噪声的协方差矩阵，

是

时刻的

维测量矩阵，

为

时刻的卡尔曼增益，

为量测变量，

为测量残差。

在该技术方案中，卡尔曼滤波是建立在一套状态系统方程上进行递归求解的，在这个系统当中分为两步，一个预测步骤一个更新过程。卡尔曼滤波作为一种经典的动态递推算法，可根据历史数据和更新数据，对静态预测结果进行调整，而且具有较高的计算精度。算法启动之前需要设置初始的

和

，算法启动后状态向量会不断递归最终收敛，因此初始值的选定只需在合理范围内即可。通过结合长短期记忆网络算法和卡尔曼滤波算法，构建长短期记忆网络改进卡尔曼滤波的预测模型，实际数据作为长短期记忆网络算法的输入，输出结果作为卡尔曼滤波的观测集，对预测结果进行修正，能够提高预测的准确率。

上述技术方案中，静态模型包括滑动窗口模型，滑动窗口模型用于预测未来多个时刻的数据；静态模型包括输入层、隐含层和输出层，输入层的神经单元数由输入变量的个数确定。

在该技术方案中，静态模型包括滑动窗口模型，滑动窗口模型用于预测未来多个时刻数据。具体地，设有时序性数据

，首先进行单步的预测输入初始数据，得到下一时刻的输出

，接着预测再下一时刻的数据

时，将一步预测的

和

作为新的输入，以此类推，通过多次的迭代预测，得到未来多个时刻的预测值。

其中，长短期记忆网络的训练速度、拟合能力取决于它的结构，它的结构主要包括输入层、隐含层和输出层。输入层的神经单元数由输入变量个数确定。油藏数据结构复杂，参数类型多样，选择合适的参数进行预测尤为关键。油藏生产数据当中的参数并不一定都对输出产生影响，且这些参数之间也可能存在依赖关系，为了保证参与预测的指标与产量具有相关性，降低神经网络的复杂度，提高预测效率，要对输入变量进行特征筛选。对于隐含层来说，通常是根据经验来选择神经元个数，当发现神经元的数目太多时，这时候训练集往往拟合程度很好，而测试集上效果就会很差，称为过拟合。太少的话神经网络学习能力不够强，拟合速度慢。通过遍历所有可行的神经元个数，此时隐含层结构就是选择最后误差最小的结构。在长短期记忆网络的输出层中可以知道在这层中神经元的数目大小对其影响较小，根据所需求的指标，选取可行性较强且具有代表性的指标作输出层神经元。

上述技术方案中，油藏数据包括训练集和预测集，训练集用于训练模型，预测集用于预测性能模型的预测精度。在实施过程中，可以将油井生产历史数据按照8：2 进行比例分配，划分为训练集和预测集，通过训练集学习后，使用预测集中的数据样本预测性能模型的预测精度。

上述技术方案中，缺失值处理包括以下之一或其组合：删除全空变量、序列均值填充、邻近均值填充、中位数填充和线性插值填充。

在该技术方案中，对于缺失值，常规的处理方法一般有删除全空变量、序列均值填充、邻近均值填充、中位数填充、和线性插值填充。油气井的产量，出现缺失值情况大多是由停产导致，会出现一段时间多个特征参数全部为空的情况，对于这种数据，采取直接删除的方法，对于个别缺失某个变量的情况，使用中位数进行填充。

进一步地，为了预测准确性，需要进行数据归一化，去除量纲影响。由于初始数据的各个变量分布较为集中，选择Min-max 标准化方法来对初始数据进行线性变换。通过使用归一化后的数据作为输入，经训练得到结果进行反归一化处理，得到最终的预测值作为输出值。

上述技术方案中，对预处理后的油藏数据，通过相关性分析和逐步回归方法选出特征参数，具体包括：计算出油藏数据所有特征和因变量的相关系数

，对于预先设定的临界值

，筛选出满足

的特征参数；对上述筛选出的特征参数，利用逐步回归法筛选出最终的特征参数。

在该技术方案中，通过相关性分析和逐步回归方法选出特征参数，具体为首先计算出油藏数据所有特征和因变量的相关系数

，对于预先设定的临界值

，筛选满足

的特征参数，然后对上述筛选出的特征参数，利用逐步回归法筛选出最终的特征参数。

可以理解，皮尔逊相关系数或斯皮尔曼相关系数等统计量常用来判断特征和目标特征之间的关系，所以该相关性分析可基于皮尔逊相关系数或斯皮尔曼相关系数等来进行。例如，对于皮尔逊相关系数，其大小可用来衡量特征变量之间和特征变量与响应变量之间的线性关系，并且这个选取过程很容易实现。由皮尔逊相关系数的计算公式得到的值在

内，其中1表示完全正相关，

表示完全负相关。当相关系数的绝对值属于

时，那就表明两个自变量的关系是弱相关关系。相关系数的绝对值介于0.3到0.5之间，那就表明两个自变量的关系是中等程度相关关系。当相关系数的绝对值属于

时，则表明两个自变量的关系是强相关关系。对于斯皮尔曼相关系数，其值介于

与1之间，绝对值越大，变量间的相关性越强。一般而言，当斯皮尔曼相关系数的绝对值属于[0,0.4]时，称为弱相关；当斯皮尔曼相关系数的绝对值属于(0.4,0.7)时，称为中度相关；当斯皮尔曼相关系数的绝对值属于[0.7,1)时，称为强相关。

进一步地，逐步回归分析的基本思路是通过将自变量逐个引入，检查其偏回归平方和的结果是否显著，若显著，则将变量引入模型当中，每次引入新的自变量时，都会重新测试已经存在的旧变量，并消除从显著变量变为无显著变量的变量，这样一边引入一边剔除，直到所有自变量都引入且无旧变量可以剔除为止。逐步回归分两种筛选变量的方法，一种是正向法，这种方法的思路是逐个比较变量的显著性，然后将显著的变量引入回归模型中，知道不显著时逐步回归过程停止。另外一种是后向法，首先所有的候选变量建立一个初始数学回归模型，并逐渐消除这个模型贡献最小的候选变量，这个过程一直到模型中变量全部都显著时停止。对于油井数据，可以根据AIC 准则标准来作为选择突出特征变量的准则。AIC基于熵的概念，可用于平衡模型的拟合和复杂性，是测试统计模型是否良好的标准之一。具体而言，此部分使用反向方法根据AIC 的大小自动选择特征。

上述技术方案中，在通过油气藏产量预测模型对数据集进行训练和预测之前，还包括：对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。

在该技术方案中，在应用油气藏产量预测模型对数据集进行训练之前，对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。对长短期记忆网络模型来说，迭代次数、隐含层节点个数、学习率和批处理大小几个因素会对预测结果产生较大的影响，通过正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合，能够提高预测的准确率。

上述技术方案中，指标评价模型包括以下之一：均方误差、平均绝对误差和平均相对误差。

在该技术方案中，在使用机器学习算法过程当中，针对不同的问题使用不同模型评估标准，主要分为分类与回归两大类。对于回归问题，衡量指标相对直观，主要有均方误差、平均绝对误差和平均相对误差。

为实现本申请的第二目的，本申请第二方面的技术方案提供了一种油气藏产量预测系统，包括：预测模型建立模块，用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；获取模块，用于获取油藏数据，对油藏数据进行预处理；特征参数筛选模块，用于对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集,其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；训练和预测模块，用于通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；评估模块，用于通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到预测油气井日产气的最优模型。

根据本申请提供的油气藏产量预测系统，包括预测模型建立模块、获取模块、特征参数筛选模块、训练和预测模块和评估模块。其中，预测模型建立模块用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整。获取模块用于获取油藏数据，对油藏数据进行预处理。特征参数筛选模块用于对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集。训练和预测模块用于通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正。评估模块用于通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到预测油气井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力，对于高度并行的时序信息处理能力也很强大，无论输入、输出是否具有线性特性，它都有很好的容错性和鲁棒性，可与卡尔曼滤波算法互补，从而提高预测的准确率。

本申请的附加方面和优点将在下面的描述部分中变得明显，或通过本申请的实践了解到。

附图说明

本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请一个实施例的油气藏产量预测方法的步骤流程图；

图2为本申请一个实施例的油气藏产量预测方法的步骤流程图；

图3为本申请一个实施例的油气藏产量预测方法的步骤流程图；

图4为本申请一个实施例的油气藏产量预测方法的步骤流程图；

图5为本申请一个实施例的油气藏产量预测系统的结构示意框图；

图6为本申请另一个实施例的油气藏产量预测系统的结构示意框图；

图7为本申请一个实施例的电子设备的硬件结构示意图。

其中，图5至图7中的附图标记与部件名称之间的对应关系为：

10：油气藏产量预测系统；110：预测模型建立模块；120：获取模块；130；特征参数筛选模块；140；训练和预测模块；150：评估模块；300：存储器；400：处理器；1100：电子设备；1101：射频单元；1102：网络模块；1103：音频输出单元；1104：输入单元；11041：图形处理器；11042：麦克风；1105：传感器；1106：显示单元；11061：显示面板；1107：用户输入单元；11071：触控面板；11072：其他输入设备；1108：接口单元；1109：存储器；1110：处理器。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，但是，本申请还可以采用其他不同于在此描述的其他方式来实施，因此，本申请的保护范围并不受下面公开的具体实施例的限制。

下面参照图1至图7描述本申请一些实施例的油气藏产量预测方法及系统

如图1所示，根据本发明提出的一个实施例的油气藏产量预测方法，包括以下步骤：

步骤S102：建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；

步骤S104：获取油藏数据，对油藏数据进行预处理，预处理包括以下之一或其组合：缺失值处理、异常值处理和剔除无关变量；

步骤S106：对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集，其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；

步骤S108：通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；

步骤S110：通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。

根据本实施例提供的油气藏产量预测方法，首先建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整。然后获取油藏数据，对油藏数据进行预处理。在对油藏数据进行初步的预处理之后，对油藏数据以统计方法进行描述性分析，使用相关性分析和逐步回归方法讨论参数的特征贡献度，筛选出特征参数，剔除贡献度较小的参数，以筛选后的油气井实际参数指标如产气量、油压和水气比等指标综合分析并对油气产量进行预测。其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数。基于特征参数构建数据集，通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果。其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正。最后通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力，对于高度并行的时序信息处理能力也很强大，无论输入、输出是否具有线性特性，它都有很好的容错性和鲁棒性，可与卡尔曼滤波算法互补，从而提高预测的准确率。

具体地，长短期记忆网络创造性地改变了元胞的内部结构，每个元胞内部设计了4个非线性神经网络层，而且增加了元胞状态的概念。同时将隐层单元和元胞状态输入到下个元胞。长短期记忆网络通过一种叫门的结构来控制，它是一种选择性让信息通过的方式，这种门的功能在元胞结构中添加或删除信息。他具体是由一个S形层和一个元素相乘操作组成。S形层输出0~1之间的值，每个值表示对应的部分信息通过量。不允许信息通过表示为0，让所有信息通过表示为1。一个长短期记忆网络有3个这种门来保护和控制元胞状态。其中，静态模型的公式为：

；

；

；

⊙

+

⊙

；

⊙

；

其中，

为遗忘门，

为遗忘门的偏置项，

为遗忘门的输入权重，

为遗忘门的循环权重，

为外部输入门，

为外部输入门的偏置项，

为外部输入门的输入权重，

为外部输入门的循环权重，o为输出门，

为输出门的偏置项，

为输出门的输入权重，

为输出门的循环权重，

为最终长短期记忆网络元胞状态，

为输出结果。通过以上公式可以看出，基于目前的元胞状态再加入过滤，就可以得到输出结果。首先建立一个S形层的输出门，来决定将元胞的哪些部分进行输出。然后将元胞状态通过激活函数之后，与输出门相乘，只输出想输出的部分。

激活函数是长短期记忆网络中一个关键的部分，在计算每一层神经网络的激活值时，利用激活函数确定激活值，改变数据线性关系。根据每一层前面的激活、权重和偏置，为下一层的每个激活计算一个值。在将该值发送给下一层之前，使用一个激活函数这个输出进行缩放，是神经网络的核心单元，大多数激活函数都是非线性或与线性的组合。常用的激活函数有tanh 函数、sigmod 函数、ELU 函数和RELU 函数等。

进一步地，动态调整模型包括时间更新方程和测量更新方程，时间更新方程包括先验状态估计方程和误差协方差方程，测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程，先验状态估计方程为：

=

；

误差协方差方程为：

=

+

；

卡尔曼增益方程为：

=

；

后验估计方程为：

=

+

；

协方差更新方程为：

=

；

其中，

为

时刻的先验估计，

为

时刻的后验估计，

为状态t−1到状态

的一步状态转移矩阵，

为

时刻的误差协方差矩阵，

为

时刻系统过程噪声的协方差矩阵，

为

时刻量测噪声的协方差矩阵，

是

时刻的

维测量矩阵，

为

时刻的卡尔曼增益，

为量测变量，

为测量残差。卡尔曼滤波是建立在一套状态系统方程上进行递归求解的，在这个系统当中分为两步，一个预测步骤一个更新过程。卡尔曼滤波作为一种经典的动态递推算法，可根据历史数据和更新数据，对静态预测结果进行调整，而且具有较高的计算精度。算法启动之前需要设置初始的x (0)和P(0)，算法启动后状态向量会不断递归最终收敛，因此初始值的选定只需在合理范围内即可。通过结合长短期记忆网络算法和卡尔曼滤波算法，构建长短期记忆网络改进卡尔曼滤波的预测模型，实际数据作为长短期记忆网络算法的输入，输出结果作为卡尔曼滤波的观测集，对预测结果进行修正，能够提高预测的准确率。

在一些实施例中，静态模型包括滑动窗口模型，滑动窗口模型用于预测未来多个时刻数据。具体地，设有时序性数据

，首先进行单步的预测输入初始数据，得到下一时刻的输出

，接着预测再下一时刻的数据

时，将一步预测的

和

在上述实施例中，油藏数据包括训练集和预测集，训练集用于训练模型。可以将油井生产历史数据按照8：2 进行比例分配，划分为训练集和预测集，通过训练集学习后，使用预测集中的数据样本预测性能模型的预测精度。

进一步地，对油藏数据的预处理包括缺失值处理，对于缺失值，常规的处理方法一般有删除全空变量、序列均值填充、邻近均值填充、中位数填充、和线性插值填充。油气井的产量，出现缺失值情况大多是由停产导致，会出现一段时间多个特征参数全部为空的情况，对于这种数据，采取直接删除的方法，对于个别缺失某个变量的情况，使用中位数进行填充。为了预测准确性，需要进行数据归一化，去除量纲影响。由于初始数据的各个变量分布较为集中，选择Min-max 标准化方法来对初始数据进行线性变换。通过使用归一化后的数据作为输入，经训练得到结果进行反归一化处理，得到最终的预测值作为输出值。

如图2所示，根据本发明提出的一个实施例的油气藏产量预测方法，对预处理后的油藏数据，通过相关性分析和逐步回归方法选出特征参数，具体包括以下步骤：

步骤S202：计算出油藏数据所有特征和因变量的相关系数

，对于预先设定的临界值

，筛选出满足

的特征参数；

步骤S204：对上述筛选出的特征参数，利用逐步回归法筛选出最终的特征参数。

在该实施例中，在该技术方案中，通过相关性分析和逐步回归方法选出特征参数，具体为首先计算出油藏数据所有特征和因变量的相关系数

，对于预先设定的临界值

（例如，可取

），筛选满足

众所周知，皮尔逊相关系数或斯皮尔曼相关系数等统计量常用来判断特征和目标特征之间的关系，所以该相关性分析可基于皮尔逊相关系数或斯皮尔曼相关系数等来进行。例如，对于皮尔逊相关系数，其大小可用来衡量特征变量之间和特征变量与响应变量之间的线性关系，并且这个选取过程很容易实现。由皮尔逊相关系数的计算公式得到的值在

内，其中1表示完全正相关，

表示完全负相关。当相关系数的绝对值属于

进一步地，逐步回归分析的基本思路是通过将自变量逐个引入，检查其偏回归平方和的结果是否显著，若显著，则将变量引入模型当中，每次引入新的自变量时，都会重新测试已经存在的旧变量，并消除从显著变量变为无显著变量的变量，这样一边引入一遍剔除，直到所有自变量都引入且无旧变量可以剔除为止。逐步回归分两种筛选变量的方法，一种是正向法，这种方法的思路是逐个比较变量的显著性，然后将显著的变量引入回归模型中，知道不显著时逐步回归过程停止。另外一种是后向法，首先所有的候选变量建立一个初始数学回归模型，并逐渐消除这个模型贡献最小的候选变量，这个过程一直到模型中变量全部都显著时停止。对于油井数据，可以根据AIC 准则标准来作为选择突出特征变量的准则。AIC基于熵的概念，可用于平衡模型的拟合和复杂性，是测试统计模型是否良好的标准之一。具体而言，此部分使用反向方法根据AIC 的大小自动选择特征。

如图3所示，根据本发明提出的另一个实施例的油气藏产量预测方法，包括以下步骤：

步骤S302：建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；

步骤S304：获取油藏数据，对油藏数据进行预处理，预处理包括以下之一或其组合：缺失值处理、异常值处理和剔除无关变量；

步骤S306：对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集，其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；

步骤S308：对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合；

步骤S310：通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；

步骤S312：通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。

在该实施例中，在应用油气藏产量预测模型对数据集进行训练之前，对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。对长短期记忆网络模型来说，迭代次数、隐含层节点个数、学习率和批处理大小几个因素会对预测结果产生较大的影响，通过正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合，能够提高预测的准确率。

在一些实施例中，在使用机器学习算法过程当中，针对不同的问题使用不同模型评估标准，主要分为分类与回归两大类。对于回归问题，衡量指标相对直观，主要有均方误差、平均绝对误差和平均相对误差。

如图4所示，根据本发明提出的又一个实施例的油气藏产量预测方法，包括以下步骤：

步骤S402：建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；

步骤S404：获取油藏数据，对油藏数据进行预处理，预处理包括以下之一或其组合：缺失值处理、异常值处理和剔除无关变量；

步骤S406：对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集，其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；

步骤S408：通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；

步骤S410：通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型；

步骤S412：根据最优模型为油气田管理人员提供决策支持。

在该实施例中，在通过指标评价模型对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型后，根据最优模型为油气田管理人员提供决策支持，从而提高预测的准确率。

如图5所示，本申请第二方面的实施例提供了一种油气藏产量预测系统10，包括：预测模型建立模块110，用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；获取模块120，用于获取油藏数据，对油藏数据进行预处理；特征参数筛选模块130，用于对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集，其中，相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；训练和预测模块140，用于通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；评估模块150，用于通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到预测油气井日产气的最优模型。

在该实施例中，油气藏产量预测系统10包括预测模型建立模块110、获取模块120、特征参数筛选模块130、训练和预测模块140和评估模块150。其中，预测模型建立模块110用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整。获取模块120用于获取油藏数据，对油藏数据进行预处理。特征参数筛选模块130用于对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集。训练和预测模块140用于通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正。评估模块150用于通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到预测油气井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力，对于高度并行的时序信息处理能力也很强大，无论输入、输出是否具有线性特性，它都有很好的容错性和鲁棒性，可与卡尔曼滤波算法互补，从而提高预测的准确率。

如图6所示，本申请第三方面的实施例提供了一种油气藏产量预测系统10，包括：存储器300和处理器400，其中，存储器300上存储有可在处理器400上运行的程序或指令，处理器400执行程序或指令时实现上述方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

如图7所示，举例来说，油气藏产量预测系统10可以通过电子设备1100实现，电子设备1100包括但不限于：射频单元1101、网络模块1102、音频输出单元1103、输入单元1104、传感器1105、显示单元1106、用户输入单元1107、接口单元1108、存储器1109、以及处理器1110等部件。

本领域技术人员可以理解，电子设备1100还可以包括给各个部件供电的电源（比如电池），电源可以通过电源管理系统与处理器1110逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，处理器1110用于执行指令或程序，实现以下处理过程：

建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，油气藏产量预测模型包括静态模型和动态调整模型，静态模型通过长短期记忆网络预测油气的产量，动态调整模型通过卡尔曼滤波对预测产量进行动态调整；

获取油藏数据，对油藏数据进行预处理，预处理包括以下之一或其组合：缺失值处理、异常值处理和剔除无关变量；

对预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于特征参数构建数据集；

通过油气藏产量预测模型对数据集进行训练和预测，得出预测结果，其中，数据集作为静态模型的输入，静态模型的输出结果作为卡尔曼滤波的观测集，通过动态调整模型对输出结果进行修正；

通过指标评价模型预测效果，对输出结果和预测结果进行评估分析，得到影响油井日产气的最优模型。

本申请采用长短期记忆网络结合卡尔曼滤波预测油气藏产量，由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力，对于高度并行的时序信息处理能力也很强大，无论输入、输出是否具有线性特性，它都有很好的容错性和鲁棒性，可与卡尔曼滤波算法互补，从而提高预测的准确率。

本申请实施例提供的处理器1110可以实现上述油气藏产量预测方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解的是，本申请实施例中，输入单元1104可以包括图形处理器（GraphicsProcessing Unit，GPU）11041和麦克风11042，图形处理器11041对在视频捕获模式或图像捕获模式中由图像捕获装置（如摄像头）获得的静态图片或视频的图像数据进行处理。显示单元1106可包括显示面板11061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板11061。用户输入单元1107包括触控面板11071以及其他输入设备11072中的至少一种。触控面板11071，也称为触摸屏。触控面板11071可包括触摸检测装置和触摸控制器两个部分。其他输入设备11072可以包括但不限于物理键盘、功能键（比如音量控制按键、开关按键等）、轨迹球、鼠标、操作杆，在此不再赘述。

存储器1109可用于存储软件程序以及各种数据。存储器1109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作系统、至少一个功能所需的应用程序或指令（比如声音播放功能、图像播放功能等）等。此外，存储器1109可以包括易失性存储器或非易失性存储器，或者，存储器1109可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请实施例中的存储器1109包括但不限于这些和任意其它适合类型的存储器。

处理器1110可包括一个或多个处理单元；可选的，处理器1110集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器1110中。

本申请第四方面的实施例提供了一种可读存储介质，可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述多采样率地震数据重建方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，处理器为上述实施例中的油气藏产量预测系统中的处理器。可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片，芯片包括处理器和通信接口，通信接口和处理器耦合，处理器用于运行程序或指令，实现上述油气藏产量预测方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

本申请实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如上述油气藏产量预测方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

在本申请中，术语“第一”、“第二”、“第三”仅用于描述的目的，而不能理解为指示或暗示相对重要性；术语“多个”则指两个或两个以上，除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解，例如，“连接”可以是固定连接，也可以是可拆卸连接，或一体地连接；“相连”可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本申请中的具体含义。

本申请的描述中，需要理解的是，术语“上”、“下”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作，因此，不能理解为对本申请的限制。

在本说明书的描述中，术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或实例。而且，描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种油气藏产量预测方法，其特征在于，包括：

建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，所述油气藏产量预测模型包括静态模型和动态调整模型，所述静态模型通过长短期记忆网络预测油气的产量，所述动态调整模型通过卡尔曼滤波对预测产量进行动态调整；

获取油藏数据，对所述油藏数据进行预处理，所述预处理包括以下之一或其组合：缺失值处理、异常值处理和剔除无关变量；

对所述预处理后的油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于所述特征参数构建数据集，其中，所述相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；

通过所述油气藏产量预测模型对所述数据集进行训练和预测，得出预测结果，其中，所述数据集作为所述静态模型的输入，所述静态模型的输出结果作为所述卡尔曼滤波的观测集，通过所述动态调整模型对所述输出结果进行修正；

通过指标评价模型预测效果，对所述输出结果和所述预测结果进行评估分析，得到影响油井日产气的最优模型。

2.根据权利要求1所述的油气藏产量预测方法，其特征在于，所述静态模型的公式为：

；

；

；

⊙

+

⊙

；

⊙

；

其中，

为遗忘门，

为遗忘门的偏置项，

为遗忘门的输入权重，

为遗忘门的循环权重，

为外部输入门，

为外部输入门的偏置项，

为外部输入门的输入权重，

为外部输入门的循环权重，

为输出门，

为输出门的偏置项，

为输出门的输入权重，

为输出门的循环权重，

为最终长短期记忆网络元胞状态，

为输出结果。

3.根据权利要求1所述的油气藏产量预测方法，其特征在于，所述动态调整模型包括时间更新方程和测量更新方程，时间更新方程包括先验状态估计方程和误差协方差方程，测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程，先验状态估计方程为：

=

；

误差协方差方程为：

=

+

；

卡尔曼增益方程为：

=

；

后验估计方程为：

=

+

；

协方差更新方程为：

=

；

其中，

为

时刻的先验估计，

为

时刻的后验估计，

为状态t−1到状态

的一步状态转移矩阵，

为

时刻的误差协方差矩阵，

为

时刻系统过程噪声的协方差矩阵，

为

时刻量测噪声的协方差矩阵，

是

时刻的

维测量矩阵，

为

时刻的卡尔曼增益，

为量测变量，

为测量残差。

4.根据权利要求1所述的油气藏产量预测方法，其特征在于，

所述静态模型包括滑动窗口模型，所述滑动窗口模型用于预测未来多个时刻的数据；

所述静态模型包括输入层、隐含层和输出层，输入层的神经单元数由输入变量的个数确定。

5.根据权利要求1所述的油气藏产量预测方法，其特征在于，油藏数据包括训练集和预测集，所述训练集用于训练模型，所述预测集用于预测性能模型的预测精度。

6.根据权利要求1所述的油气藏产量预测方法，其特征在于，所述缺失值处理包括以下之一或其组合：删除全空变量、序列均值填充、邻近均值填充、中位数填充和线性插值填充。

7.根据权利要求1所述的油气藏产量预测方法，其特征在于，所述对预处理后的油藏数据，通过相关性分析和逐步回归方法选出特征参数，具体包括：

计算出所述油藏数据所有特征和因变量的相关系数

，对于预先设定的临界值

，筛选出满足

的特征参数；

对上述筛选出的特征参数，利用逐步回归法筛选出最终的特征参数。

8.根据权利要求1至7中任一项所述的油气藏产量预测方法，其特征在于，在所述通过所述油气藏产量预测模型对所述数据集进行训练和预测之前，还包括：

对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差，以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。

9.根据权利要求8所述的油气藏产量预测方法，其特征在于，所述指标评价模型包括以下之一：均方误差、平均绝对误差和平均相对误差。

10.一种油气藏产量预测系统，其特征在于，包括：

预测模型建立模块（110），用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型，所述油气藏产量预测模型包括静态模型和动态调整模型，所述静态模型通过长短期记忆网络预测油气的产量，所述动态调整模型通过卡尔曼滤波对预测产量进行动态调整；

获取模块（120），用于获取油藏数据，对所述油藏数据进行预处理；

特征参数筛选模块（130），用于对预处理后的所述油藏数据，通过相关性分析和逐步回归方法筛选出特征参数，基于所述特征参数构建数据集,其中，所述相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数；

训练和预测模块（140），用于通过所述油气藏产量预测模型对所述数据集进行训练和预测，得出预测结果，其中，所述数据集作为所述静态模型的输入，所述静态模型的输出结果作为所述卡尔曼滤波的观测集，通过所述动态调整模型对所述输出结果进行修正；

评估模块（150），用于通过指标评价模型预测效果，对所述输出结果和所述预测结果进行评估分析，得到预测油气井日产气的最优模型。