CN114925623A - 油气藏产量预测方法及系统 - Google Patents

油气藏产量预测方法及系统 Download PDF

Info

Publication number
CN114925623A
CN114925623A CN202210864648.8A CN202210864648A CN114925623A CN 114925623 A CN114925623 A CN 114925623A CN 202210864648 A CN202210864648 A CN 202210864648A CN 114925623 A CN114925623 A CN 114925623A
Authority
CN
China
Prior art keywords
model
prediction
oil
reservoir
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210864648.8A
Other languages
English (en)
Other versions
CN114925623B (zh
Inventor
郭翠平
林箐
廉海荣
罗万静
韩慧萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences Beijing
Original Assignee
China University of Geosciences Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences Beijing filed Critical China University of Geosciences Beijing
Priority to CN202210864648.8A priority Critical patent/CN114925623B/zh
Publication of CN114925623A publication Critical patent/CN114925623A/zh
Application granted granted Critical
Publication of CN114925623B publication Critical patent/CN114925623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Computer Hardware Design (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种油气藏产量预测方法及系统,属于油气藏开发技术领域,油气藏产量预测方法包括:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型;获取油藏数据,对油藏数据进行预处理;对预处理后的油藏数据通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集;通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果;通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。通过本申请的技术方案,长短期记忆网络结合卡尔曼滤波预测油气藏产量,能够提高预测的准确率。

Description

油气藏产量预测方法及系统
技术领域
本申请涉及油气藏开发技术领域,具体而言,涉及一种油气藏产量预测方法及系统。
背景技术
油井产量预测贯穿油田开发生产全过程。在产量预测模型中,根据产量影响因素及矿场获取数据的难易程度,考虑部分地质和生产参数作为油井产量预测的输入参数。日产气、日排液、套压、油压、输压、和水气比可从地层能量、操作调整、生产限制等方面衡量对产油量的影响水平。
在相关技术中,针对卡尔曼滤波方法应用于油藏产量预测领域做了诸多研究,随着油藏工程研究的深入,油气井的模型变得更为复杂,地质参数也越来越多。传统卡尔曼滤波对于系统模型的要求较高,它要求状态方程和量测方程是线性的高斯分布,且系统噪声可知。在以上条件下,通过迭代进行预测和更新步骤,但在处理非高斯分布的数据时,尤其是油气井在地下由于地层的构造特点和油藏不同的属性,分布是十分不均衡的。而且油藏的开发周期是很长的,随着开采的进行,地下开采环境会更恶劣,产量也会随之降低,还有各种意外因素会导致停工停产的状况,因此单一的卡尔曼滤波模型预测效果误差很大。
发明内容
本申请旨在解决或改善单一卡尔曼滤波模型预测效果误差大的问题。
为此,本申请的第一目的在于提供一种油气藏产量预测方法。
本申请的第二目的在于提供一种油气藏产量预测系统。
为实现本申请的第一目的,本发明第一方面的技术方案提供了一种油气藏产量预测方法,油气藏产量预测方法基于长短期记忆网络和卡尔曼滤波,油气藏产量预测方法包括:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
根据本申请提供的油气藏产量预测方法,首先建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。然后获取油藏数据,对油藏数据进行预处理。在对油藏数据进行初步的预处理之后,对油藏数据以统计方法进行描述性分析,使用相关性分析和逐步回归方法讨论参数的特征贡献度,筛选出特征参数,剔除贡献度较小的参数,以筛选后的油气井实际参数指标如产气量、油压和水气比等指标综合分析并对油气产量进行预测。其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数。基于特征参数构建数据集,通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果。其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。最后通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
另外,本申请提供的技术方案还可以具有如下附加技术特征:
上述技术方案中,静态模型的公式为:
Figure 58818DEST_PATH_IMAGE001
Figure 131816DEST_PATH_IMAGE002
Figure 365351DEST_PATH_IMAGE003
Figure 930325DEST_PATH_IMAGE004
Figure 969825DEST_PATH_IMAGE005
+
Figure 303854DEST_PATH_IMAGE006
Figure 708291DEST_PATH_IMAGE007
Figure 619615DEST_PATH_IMAGE008
Figure 338172DEST_PATH_IMAGE009
其中,
Figure 589025DEST_PATH_IMAGE010
为遗忘门,
Figure 226680DEST_PATH_IMAGE011
为遗忘门的偏置项,
Figure 766246DEST_PATH_IMAGE012
为遗忘门的输入权重,
Figure 85232DEST_PATH_IMAGE013
为遗忘门的循环权重,
Figure 252908DEST_PATH_IMAGE014
为外部输入门,
Figure 202409DEST_PATH_IMAGE015
为外部输入门的偏置项,
Figure 760429DEST_PATH_IMAGE016
为外部输入门的输入权重,
Figure 7740DEST_PATH_IMAGE017
为外部输入门的循环权重,
Figure 170868DEST_PATH_IMAGE018
为输出门,
Figure 88009DEST_PATH_IMAGE019
为输出门的偏置项,
Figure 461221DEST_PATH_IMAGE020
为输出门的输入权重,
Figure 122010DEST_PATH_IMAGE021
为输出门的循环权重,
Figure 139644DEST_PATH_IMAGE022
为最终长短期记忆网络元胞状态,
Figure 555582DEST_PATH_IMAGE023
为输出结果。
在该技术方案中,长短期记忆网络创造性地改变了元胞的内部结构,每个元胞内部设计了4个非线性神经网络层,而且增加了元胞状态的概念。同时将隐层单元和元胞状态输入到下个元胞。长短期记忆网络通过一种叫门的结构来控制,它是一种选择性让信息通过的方式,这种门的功能在元胞结构中添加或删除信息。他具体是由一个S形层和一个元素相乘操作组成。S形层输出0~1之间的值,每个值表示对应的部分信息通过量。不允许信息通过表示为0,让所有信息通过表示为1。一个长短期记忆网络有3个这种门来保护和控制元胞状态。
其中,遗忘门
Figure 88194DEST_PATH_IMAGE010
负责对通过的信息有选择性进行丢弃,
Figure 490357DEST_PATH_IMAGE024
分别是遗忘门中的偏置、输入权重和循环权重,外部输入门
Figure 487132DEST_PATH_IMAGE014
负责更新信息,自身参数分别为
Figure 11654DEST_PATH_IMAGE025
。输出门o也有其对应参数。最终长短期记忆网络元胞状态为c(t),输出结果为h(t)。通过以上公式可以看出,基于目前的元胞状态再加入过滤,就可以得到输出结果。首先建立一个S形层的输出门,来决定将元胞的哪些部分进行输出。然后将元胞状态通过激活函数之后,与输出门相乘,只输出想输出的部分。
上述技术方案中,动态调整模型包括时间更新方程和测量更新方程,时间更新方程包括先验状态估计方程和误差协方差方程,测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程,先验状态估计方程为:
Figure 234825DEST_PATH_IMAGE026
=
Figure 299733DEST_PATH_IMAGE027
误差协方差方程为:
Figure 88697DEST_PATH_IMAGE028
=
Figure 987383DEST_PATH_IMAGE029
+
Figure 291326DEST_PATH_IMAGE030
卡尔曼增益方程为:
Figure 97608DEST_PATH_IMAGE031
=
Figure 944341DEST_PATH_IMAGE032
后验估计方程为:
Figure 545087DEST_PATH_IMAGE033
=
Figure 867483DEST_PATH_IMAGE026
+
Figure 149560DEST_PATH_IMAGE034
协方差更新方程为:
Figure 241013DEST_PATH_IMAGE035
=
Figure 12660DEST_PATH_IMAGE036
其中,
Figure 432140DEST_PATH_IMAGE026
Figure 580225DEST_PATH_IMAGE037
时刻的先验估计,
Figure 526184DEST_PATH_IMAGE033
Figure 671994DEST_PATH_IMAGE037
时刻的后验估计,
Figure 703404DEST_PATH_IMAGE038
为状态
Figure 389601DEST_PATH_IMAGE039
到状态
Figure 65432DEST_PATH_IMAGE037
的一步状态转移矩阵,
Figure 506778DEST_PATH_IMAGE040
Figure 697588DEST_PATH_IMAGE037
时刻的误差协方差矩阵,
Figure 390738DEST_PATH_IMAGE041
Figure 45710DEST_PATH_IMAGE037
时刻系统过程噪声的协方差矩阵,
Figure 595640DEST_PATH_IMAGE042
Figure 211429DEST_PATH_IMAGE037
时刻量测噪声的协方差矩阵,
Figure 567324DEST_PATH_IMAGE043
Figure 14486DEST_PATH_IMAGE037
时刻的
Figure 735317DEST_PATH_IMAGE044
维测量矩阵,
Figure 900719DEST_PATH_IMAGE031
Figure 794726DEST_PATH_IMAGE037
时刻的卡尔曼增益,
Figure 299657DEST_PATH_IMAGE045
为量测变量,
Figure 191389DEST_PATH_IMAGE046
为测量残差。
在该技术方案中,卡尔曼滤波是建立在一套状态系统方程上进行递归求解的,在这个系统当中分为两步,一个预测步骤一个更新过程。卡尔曼滤波作为一种经典的动态递推算法,可根据历史数据和更新数据,对静态预测结果进行调整,而且具有较高的计算精度。算法启动之前需要设置初始的
Figure 906404DEST_PATH_IMAGE047
Figure 479468DEST_PATH_IMAGE048
,算法启动后状态向量会不断递归最终收敛,因此初始值的选定只需在合理范围内即可。通过结合长短期记忆网络算法和卡尔曼滤波算法,构建长短期记忆网络改进卡尔曼滤波的预测模型,实际数据作为长短期记忆网络算法的输入,输出结果作为卡尔曼滤波的观测集,对预测结果进行修正,能够提高预测的准确率。
上述技术方案中,静态模型包括滑动窗口模型,滑动窗口模型用于预测未来多个时刻的数据;静态模型包括输入层、隐含层和输出层,输入层的神经单元数由输入变量的个数确定。
在该技术方案中,静态模型包括滑动窗口模型,滑动窗口模型用于预测未来多个时刻数据。具体地,设有时序性数据
Figure 901222DEST_PATH_IMAGE049
,首先进行单步的预测输入初始数据,得到下一时刻的输出
Figure 495015DEST_PATH_IMAGE050
,接着预测再下一时刻的数据
Figure 369430DEST_PATH_IMAGE051
时,将一步预测的
Figure 870818DEST_PATH_IMAGE050
Figure 147079DEST_PATH_IMAGE049
作为新的输入,以此类推,通过多次的迭代预测,得到未来多个时刻的预测值。
其中,长短期记忆网络的训练速度、拟合能力取决于它的结构,它的结构主要包括输入层、隐含层和输出层。输入层的神经单元数由输入变量个数确定。油藏数据结构复杂,参数类型多样,选择合适的参数进行预测尤为关键。油藏生产数据当中的参数并不一定都对输出产生影响,且这些参数之间也可能存在依赖关系,为了保证参与预测的指标与产量具有相关性,降低神经网络的复杂度,提高预测效率,要对输入变量进行特征筛选。对于隐含层来说,通常是根据经验来选择神经元个数,当发现神经元的数目太多时,这时候训练集往往拟合程度很好,而测试集上效果就会很差,称为过拟合。太少的话神经网络学习能力不够强,拟合速度慢。通过遍历所有可行的神经元个数,此时隐含层结构就是选择最后误差最小的结构。在长短期记忆网络的输出层中可以知道在这层中神经元的数目大小对其影响较小,根据所需求的指标,选取可行性较强且具有代表性的指标作输出层神经元。
上述技术方案中,油藏数据包括训练集和预测集,训练集用于训练模型,预测集用于预测性能模型的预测精度。在实施过程中,可以将油井生产历史数据按照8:2 进行比例分配,划分为训练集和预测集,通过训练集学习后,使用预测集中的数据样本预测性能模型的预测精度。
上述技术方案中,缺失值处理包括以下之一或其组合:删除全空变量、序列均值填充、邻近均值填充、中位数填充和线性插值填充。
在该技术方案中,对于缺失值,常规的处理方法一般有删除全空变量、序列均值填充、邻近均值填充、中位数填充、和线性插值填充。油气井的产量,出现缺失值情况大多是由停产导致,会出现一段时间多个特征参数全部为空的情况,对于这种数据,采取直接删除的方法,对于个别缺失某个变量的情况,使用中位数进行填充。
进一步地,为了预测准确性,需要进行数据归一化,去除量纲影响。由于初始数据的各个变量分布较为集中,选择Min-max 标准化方法来对初始数据进行线性变换。通过使用归一化后的数据作为输入,经训练得到结果进行反归一化处理,得到最终的预测值作为输出值。
上述技术方案中,对预处理后的油藏数据,通过相关性分析和逐步回归方法选出特征参数,具体包括:计算出油藏数据所有特征和因变量的相关系数
Figure 583876DEST_PATH_IMAGE052
,对于预先设定的临界值
Figure 7904DEST_PATH_IMAGE053
,筛选出满足
Figure 719508DEST_PATH_IMAGE055
的特征参数;对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
在该技术方案中,通过相关性分析和逐步回归方法选出特征参数,具体为首先计算出油藏数据所有特征和因变量的相关系数
Figure 319117DEST_PATH_IMAGE052
,对于预先设定的临界值
Figure 51450DEST_PATH_IMAGE053
,筛选满足
Figure 103719DEST_PATH_IMAGE056
的特征参数,然后对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
可以理解,皮尔逊相关系数或斯皮尔曼相关系数等统计量常用来判断特征和目标特征之间的关系,所以该相关性分析可基于皮尔逊相关系数或斯皮尔曼相关系数等来进行。例如,对于皮尔逊相关系数,其大小可用来衡量特征变量之间和特征变量与响应变量之间的线性关系,并且这个选取过程很容易实现。由皮尔逊相关系数的计算公式得到的值在
Figure 946910DEST_PATH_IMAGE057
内,其中1表示完全正相关,
Figure 135446DEST_PATH_IMAGE058
表示完全负相关。当相关系数的绝对值属于
Figure 710784DEST_PATH_IMAGE059
时,那就表明两个自变量的关系是弱相关关系。相关系数的绝对值介于0.3到0.5之间,那就表明两个自变量的关系是中等程度相关关系。当相关系数的绝对值属于
Figure 374984DEST_PATH_IMAGE060
时,则表明两个自变量的关系是强相关关系。对于斯皮尔曼相关系数,其值介于
Figure 631653DEST_PATH_IMAGE058
与1之间,绝对值越大,变量间的相关性越强。一般而言,当斯皮尔曼相关系数的绝对值属于[0,0.4]时,称为弱相关;当斯皮尔曼相关系数的绝对值属于(0.4,0.7)时,称为中度相关;当斯皮尔曼相关系数的绝对值属于[0.7,1)时,称为强相关。
进一步地,逐步回归分析的基本思路是通过将自变量逐个引入,检查其偏回归平方和的结果是否显著,若显著,则将变量引入模型当中,每次引入新的自变量时,都会重新测试已经存在的旧变量,并消除从显著变量变为无显著变量的变量,这样一边引入一边剔除,直到所有自变量都引入且无旧变量可以剔除为止。逐步回归分两种筛选变量的方法,一种是正向法,这种方法的思路是逐个比较变量的显著性,然后将显著的变量引入回归模型中,知道不显著时逐步回归过程停止。另外一种是后向法,首先所有的候选变量建立一个初始数学回归模型,并逐渐消除这个模型贡献最小的候选变量,这个过程一直到模型中变量全部都显著时停止。对于油井数据,可以根据AIC 准则标准来作为选择突出特征变量的准则。AIC基于熵的概念,可用于平衡模型的拟合和复杂性,是测试统计模型是否良好的标准之一。具体而言,此部分使用反向方法根据AIC 的大小自动选择特征。
上述技术方案中,在通过油气藏产量预测模型对数据集进行训练和预测之前,还包括:对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。
在该技术方案中,在应用油气藏产量预测模型对数据集进行训练之前,对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。对长短期记忆网络模型来说,迭代次数、隐含层节点个数、学习率和批处理大小几个因素会对预测结果产生较大的影响,通过正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合,能够提高预测的准确率。
上述技术方案中,指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
在该技术方案中,在使用机器学习算法过程当中,针对不同的问题使用不同模型评估标准,主要分为分类与回归两大类。对于回归问题,衡量指标相对直观,主要有均方误差、平均绝对误差和平均相对误差。
为实现本申请的第二目的,本申请第二方面的技术方案提供了一种油气藏产量预测系统,包括:预测模型建立模块,用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;获取模块,用于获取油藏数据,对油藏数据进行预处理;特征参数筛选模块,用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;训练和预测模块,用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;评估模块,用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。
根据本申请提供的油气藏产量预测系统,包括预测模型建立模块、获取模块、特征参数筛选模块、训练和预测模块和评估模块。其中,预测模型建立模块用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。获取模块用于获取油藏数据,对油藏数据进行预处理。特征参数筛选模块用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集。训练和预测模块用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。评估模块用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
本申请的附加方面和优点将在下面的描述部分中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图2为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图3为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图4为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图5为本申请一个实施例的油气藏产量预测系统的结构示意框图;
图6为本申请另一个实施例的油气藏产量预测系统的结构示意框图;
图7为本申请一个实施例的电子设备的硬件结构示意图。
其中,图5至图7中的附图标记与部件名称之间的对应关系为:
10:油气藏产量预测系统;110:预测模型建立模块;120:获取模块;130;特征参数筛选模块;140;训练和预测模块;150:评估模块;300:存储器;400:处理器;1100:电子设备;1101:射频单元;1102:网络模块;1103:音频输出单元;1104:输入单元;11041:图形处理器;11042:麦克风;1105:传感器;1106:显示单元;11061:显示面板;1107:用户输入单元;11071:触控面板;11072:其他输入设备;1108:接口单元;1109:存储器;1110:处理器。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
下面参照图1至图7描述本申请一些实施例的油气藏产量预测方法及系统
如图1所示,根据本发明提出的一个实施例的油气藏产量预测方法,包括以下步骤:
步骤S102:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
步骤S104:获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
步骤S106:对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
步骤S108:通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
步骤S110:通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
根据本实施例提供的油气藏产量预测方法,首先建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。然后获取油藏数据,对油藏数据进行预处理。在对油藏数据进行初步的预处理之后,对油藏数据以统计方法进行描述性分析,使用相关性分析和逐步回归方法讨论参数的特征贡献度,筛选出特征参数,剔除贡献度较小的参数,以筛选后的油气井实际参数指标如产气量、油压和水气比等指标综合分析并对油气产量进行预测。其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数。基于特征参数构建数据集,通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果。其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。最后通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
具体地,长短期记忆网络创造性地改变了元胞的内部结构,每个元胞内部设计了4个非线性神经网络层,而且增加了元胞状态的概念。同时将隐层单元和元胞状态输入到下个元胞。长短期记忆网络通过一种叫门的结构来控制,它是一种选择性让信息通过的方式,这种门的功能在元胞结构中添加或删除信息。他具体是由一个S形层和一个元素相乘操作组成。S形层输出0~1之间的值,每个值表示对应的部分信息通过量。不允许信息通过表示为0,让所有信息通过表示为1。一个长短期记忆网络有3个这种门来保护和控制元胞状态。其中,静态模型的公式为:
Figure 737012DEST_PATH_IMAGE001
Figure 811147DEST_PATH_IMAGE002
Figure 306850DEST_PATH_IMAGE003
Figure 429527DEST_PATH_IMAGE004
Figure 451710DEST_PATH_IMAGE005
+
Figure 572113DEST_PATH_IMAGE006
Figure 883008DEST_PATH_IMAGE007
Figure 617832DEST_PATH_IMAGE008
Figure 635467DEST_PATH_IMAGE009
其中,
Figure 989088DEST_PATH_IMAGE010
为遗忘门,
Figure 584017DEST_PATH_IMAGE011
为遗忘门的偏置项,
Figure 986180DEST_PATH_IMAGE012
为遗忘门的输入权重,
Figure 920638DEST_PATH_IMAGE013
为遗忘门的循环权重,
Figure 507477DEST_PATH_IMAGE014
为外部输入门,
Figure 465069DEST_PATH_IMAGE015
为外部输入门的偏置项,
Figure 733239DEST_PATH_IMAGE016
为外部输入门的输入权重,
Figure 584520DEST_PATH_IMAGE017
为外部输入门的循环权重,o为输出门,
Figure 217627DEST_PATH_IMAGE019
为输出门的偏置项,
Figure 724832DEST_PATH_IMAGE020
为输出门的输入权重,
Figure 859010DEST_PATH_IMAGE021
为输出门的循环权重,
Figure 440164DEST_PATH_IMAGE022
为最终长短期记忆网络元胞状态,
Figure 306489DEST_PATH_IMAGE023
为输出结果。通过以上公式可以看出,基于目前的元胞状态再加入过滤,就可以得到输出结果。首先建立一个S形层的输出门,来决定将元胞的哪些部分进行输出。然后将元胞状态通过激活函数之后,与输出门相乘,只输出想输出的部分。
激活函数是长短期记忆网络中一个关键的部分,在计算每一层神经网络的激活值时,利用激活函数确定激活值,改变数据线性关系。根据每一层前面的激活、权重和偏置,为下一层的每个激活计算一个值。在将该值发送给下一层之前,使用一个激活函数这个输出进行缩放,是神经网络的核心单元,大多数激活函数都是非线性或与线性的组合。常用的激活函数有tanh 函数、sigmod 函数、ELU 函数和RELU 函数等。
进一步地,动态调整模型包括时间更新方程和测量更新方程,时间更新方程包括先验状态估计方程和误差协方差方程,测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程,先验状态估计方程为:
Figure 97727DEST_PATH_IMAGE026
=
Figure 910962DEST_PATH_IMAGE027
误差协方差方程为:
Figure 674519DEST_PATH_IMAGE028
=
Figure 508483DEST_PATH_IMAGE029
+
Figure 193542DEST_PATH_IMAGE030
卡尔曼增益方程为:
Figure 341627DEST_PATH_IMAGE031
=
Figure 22007DEST_PATH_IMAGE032
后验估计方程为:
Figure 167817DEST_PATH_IMAGE033
=
Figure 871331DEST_PATH_IMAGE026
+
Figure 151003DEST_PATH_IMAGE034
协方差更新方程为:
Figure 561255DEST_PATH_IMAGE035
=
Figure 268180DEST_PATH_IMAGE036
其中,
Figure 458990DEST_PATH_IMAGE026
Figure 152140DEST_PATH_IMAGE037
时刻的先验估计,
Figure 807112DEST_PATH_IMAGE033
Figure 357042DEST_PATH_IMAGE037
时刻的后验估计,
Figure 972831DEST_PATH_IMAGE038
为状态t−1到状态
Figure 328726DEST_PATH_IMAGE037
的一步状态转移矩阵,
Figure 775888DEST_PATH_IMAGE040
Figure 699982DEST_PATH_IMAGE037
时刻的误差协方差矩阵,
Figure 927701DEST_PATH_IMAGE041
Figure 821707DEST_PATH_IMAGE037
时刻系统过程噪声的协方差矩阵,
Figure 61059DEST_PATH_IMAGE042
Figure 280687DEST_PATH_IMAGE037
时刻量测噪声的协方差矩阵,
Figure 667806DEST_PATH_IMAGE043
Figure 240870DEST_PATH_IMAGE037
时刻的
Figure 990520DEST_PATH_IMAGE044
维测量矩阵,
Figure 53154DEST_PATH_IMAGE031
Figure 865253DEST_PATH_IMAGE037
时刻的卡尔曼增益,
Figure 366641DEST_PATH_IMAGE045
为量测变量,
Figure 846164DEST_PATH_IMAGE046
为测量残差。卡尔曼滤波是建立在一套状态系统方程上进行递归求解的,在这个系统当中分为两步,一个预测步骤一个更新过程。卡尔曼滤波作为一种经典的动态递推算法,可根据历史数据和更新数据,对静态预测结果进行调整,而且具有较高的计算精度。算法启动之前需要设置初始的x (0)和P(0),算法启动后状态向量会不断递归最终收敛,因此初始值的选定只需在合理范围内即可。通过结合长短期记忆网络算法和卡尔曼滤波算法,构建长短期记忆网络改进卡尔曼滤波的预测模型,实际数据作为长短期记忆网络算法的输入,输出结果作为卡尔曼滤波的观测集,对预测结果进行修正,能够提高预测的准确率。
在一些实施例中,静态模型包括滑动窗口模型,滑动窗口模型用于预测未来多个时刻数据。具体地,设有时序性数据
Figure 79699DEST_PATH_IMAGE061
,首先进行单步的预测输入初始数据,得到下一时刻的输出
Figure 503727DEST_PATH_IMAGE050
,接着预测再下一时刻的数据
Figure 684173DEST_PATH_IMAGE051
时,将一步预测的
Figure 80519DEST_PATH_IMAGE050
Figure 547273DEST_PATH_IMAGE061
作为新的输入,以此类推,通过多次的迭代预测,得到未来多个时刻的预测值。
其中,长短期记忆网络的训练速度、拟合能力取决于它的结构,它的结构主要包括输入层、隐含层和输出层。输入层的神经单元数由输入变量个数确定。油藏数据结构复杂,参数类型多样,选择合适的参数进行预测尤为关键。油藏生产数据当中的参数并不一定都对输出产生影响,且这些参数之间也可能存在依赖关系,为了保证参与预测的指标与产量具有相关性,降低神经网络的复杂度,提高预测效率,要对输入变量进行特征筛选。对于隐含层来说,通常是根据经验来选择神经元个数,当发现神经元的数目太多时,这时候训练集往往拟合程度很好,而测试集上效果就会很差,称为过拟合。太少的话神经网络学习能力不够强,拟合速度慢。通过遍历所有可行的神经元个数,此时隐含层结构就是选择最后误差最小的结构。在长短期记忆网络的输出层中可以知道在这层中神经元的数目大小对其影响较小,根据所需求的指标,选取可行性较强且具有代表性的指标作输出层神经元。
在上述实施例中,油藏数据包括训练集和预测集,训练集用于训练模型。可以将油井生产历史数据按照8:2 进行比例分配,划分为训练集和预测集,通过训练集学习后,使用预测集中的数据样本预测性能模型的预测精度。
进一步地,对油藏数据的预处理包括缺失值处理,对于缺失值,常规的处理方法一般有删除全空变量、序列均值填充、邻近均值填充、中位数填充、和线性插值填充。油气井的产量,出现缺失值情况大多是由停产导致,会出现一段时间多个特征参数全部为空的情况,对于这种数据,采取直接删除的方法,对于个别缺失某个变量的情况,使用中位数进行填充。为了预测准确性,需要进行数据归一化,去除量纲影响。由于初始数据的各个变量分布较为集中,选择Min-max 标准化方法来对初始数据进行线性变换。通过使用归一化后的数据作为输入,经训练得到结果进行反归一化处理,得到最终的预测值作为输出值。
如图2所示,根据本发明提出的一个实施例的油气藏产量预测方法,对预处理后的油藏数据,通过相关性分析和逐步回归方法选出特征参数,具体包括以下步骤:
步骤S202:计算出油藏数据所有特征和因变量的相关系数
Figure 130701DEST_PATH_IMAGE052
,对于预先设定的临界值
Figure 114837DEST_PATH_IMAGE053
,筛选出满足
Figure 428007DEST_PATH_IMAGE062
的特征参数;
步骤S204:对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
在该实施例中,在该技术方案中,通过相关性分析和逐步回归方法选出特征参数,具体为首先计算出油藏数据所有特征和因变量的相关系数
Figure 3345DEST_PATH_IMAGE052
,对于预先设定的临界值
Figure 11752DEST_PATH_IMAGE053
(例如,可取
Figure DEST_PATH_IMAGE063
),筛选满足
Figure 924213DEST_PATH_IMAGE064
的特征参数,然后对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
众所周知,皮尔逊相关系数或斯皮尔曼相关系数等统计量常用来判断特征和目标特征之间的关系,所以该相关性分析可基于皮尔逊相关系数或斯皮尔曼相关系数等来进行。例如,对于皮尔逊相关系数,其大小可用来衡量特征变量之间和特征变量与响应变量之间的线性关系,并且这个选取过程很容易实现。由皮尔逊相关系数的计算公式得到的值在
Figure 967256DEST_PATH_IMAGE057
内,其中1表示完全正相关,
Figure 41391DEST_PATH_IMAGE058
表示完全负相关。当相关系数的绝对值属于
Figure 864990DEST_PATH_IMAGE059
时,那就表明两个自变量的关系是弱相关关系。相关系数的绝对值介于0.3到0.5之间,那就表明两个自变量的关系是中等程度相关关系。当相关系数的绝对值属于
Figure 925350DEST_PATH_IMAGE060
时,则表明两个自变量的关系是强相关关系。对于斯皮尔曼相关系数,其值介于
Figure 213112DEST_PATH_IMAGE058
与1之间,绝对值越大,变量间的相关性越强。一般而言,当斯皮尔曼相关系数的绝对值属于[0,0.4]时,称为弱相关;当斯皮尔曼相关系数的绝对值属于(0.4,0.7)时,称为中度相关;当斯皮尔曼相关系数的绝对值属于[0.7,1)时,称为强相关。
进一步地,逐步回归分析的基本思路是通过将自变量逐个引入,检查其偏回归平方和的结果是否显著,若显著,则将变量引入模型当中,每次引入新的自变量时,都会重新测试已经存在的旧变量,并消除从显著变量变为无显著变量的变量,这样一边引入一遍剔除,直到所有自变量都引入且无旧变量可以剔除为止。逐步回归分两种筛选变量的方法,一种是正向法,这种方法的思路是逐个比较变量的显著性,然后将显著的变量引入回归模型中,知道不显著时逐步回归过程停止。另外一种是后向法,首先所有的候选变量建立一个初始数学回归模型,并逐渐消除这个模型贡献最小的候选变量,这个过程一直到模型中变量全部都显著时停止。对于油井数据,可以根据AIC 准则标准来作为选择突出特征变量的准则。AIC基于熵的概念,可用于平衡模型的拟合和复杂性,是测试统计模型是否良好的标准之一。具体而言,此部分使用反向方法根据AIC 的大小自动选择特征。
如图3所示,根据本发明提出的另一个实施例的油气藏产量预测方法,包括以下步骤:
步骤S302:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
步骤S304:获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
步骤S306:对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
步骤S308:对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合;
步骤S310:通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
步骤S312:通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
在该实施例中,在应用油气藏产量预测模型对数据集进行训练之前,对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。对长短期记忆网络模型来说,迭代次数、隐含层节点个数、学习率和批处理大小几个因素会对预测结果产生较大的影响,通过正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合,能够提高预测的准确率。
在一些实施例中,在使用机器学习算法过程当中,针对不同的问题使用不同模型评估标准,主要分为分类与回归两大类。对于回归问题,衡量指标相对直观,主要有均方误差、平均绝对误差和平均相对误差。
如图4所示,根据本发明提出的又一个实施例的油气藏产量预测方法,包括以下步骤:
步骤S402:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
步骤S404:获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
步骤S406:对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
步骤S408:通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
步骤S410:通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型;
步骤S412:根据最优模型为油气田管理人员提供决策支持。
在该实施例中,在通过指标评价模型对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型后,根据最优模型为油气田管理人员提供决策支持,从而提高预测的准确率。
如图5所示,本申请第二方面的实施例提供了一种油气藏产量预测系统10,包括:预测模型建立模块110,用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;获取模块120,用于获取油藏数据,对油藏数据进行预处理;特征参数筛选模块130,用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;训练和预测模块140,用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;评估模块150,用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。
在该实施例中,油气藏产量预测系统10包括预测模型建立模块110、获取模块120、特征参数筛选模块130、训练和预测模块140和评估模块150。其中,预测模型建立模块110用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。获取模块120用于获取油藏数据,对油藏数据进行预处理。特征参数筛选模块130用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集。训练和预测模块140用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。评估模块150用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
如图6所示,本申请第三方面的实施例提供了一种油气藏产量预测系统10,包括:存储器300和处理器400,其中,存储器300上存储有可在处理器400上运行的程序或指令,处理器400执行程序或指令时实现上述方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
如图7所示,举例来说,油气藏产量预测系统10可以通过电子设备1100实现,电子设备1100包括但不限于:射频单元1101、网络模块1102、音频输出单元1103、输入单元1104、传感器1105、显示单元1106、用户输入单元1107、接口单元1108、存储器1109、以及处理器1110等部件。
本领域技术人员可以理解,电子设备1100还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1110用于执行指令或程序,实现以下处理过程:
建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集;
通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
本申请采用长短期记忆网络结合卡尔曼滤波预测油气藏产量,由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
本申请实施例提供的处理器1110可以实现上述油气藏产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解的是,本申请实施例中,输入单元1104可以包括图形处理器(GraphicsProcessing Unit,GPU)11041和麦克风11042,图形处理器11041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1106可包括显示面板11061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板11061。用户输入单元1107包括触控面板11071以及其他输入设备11072中的至少一种。触控面板11071,也称为触摸屏。触控面板11071可包括触摸检测装置和触摸控制器两个部分。其他输入设备11072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器1109可用于存储软件程序以及各种数据。存储器1109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器1109可以包括易失性存储器或非易失性存储器,或者,存储器1109可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器1109包括但不限于这些和任意其它适合类型的存储器。
处理器1110可包括一个或多个处理单元;可选的,处理器1110集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器1110中。
本申请第四方面的实施例提供了一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述多采样率地震数据重建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的油气藏产量预测系统中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述油气藏产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述油气藏产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
在本申请中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
本申请的描述中,需要理解的是,术语“上”、“下”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本申请的限制。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种油气藏产量预测方法,其特征在于,包括:
建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,所述油气藏产量预测模型包括静态模型和动态调整模型,所述静态模型通过长短期记忆网络预测油气的产量,所述动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
获取油藏数据,对所述油藏数据进行预处理,所述预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
对所述预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于所述特征参数构建数据集,其中,所述相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
通过所述油气藏产量预测模型对所述数据集进行训练和预测,得出预测结果,其中,所述数据集作为所述静态模型的输入,所述静态模型的输出结果作为所述卡尔曼滤波的观测集,通过所述动态调整模型对所述输出结果进行修正;
通过指标评价模型预测效果,对所述输出结果和所述预测结果进行评估分析,得到影响油井日产气的最优模型。
2.根据权利要求1所述的油气藏产量预测方法,其特征在于,所述静态模型的公式为:
Figure 646959DEST_PATH_IMAGE001
Figure 284614DEST_PATH_IMAGE002
Figure 620917DEST_PATH_IMAGE003
Figure 877586DEST_PATH_IMAGE004
Figure 310842DEST_PATH_IMAGE005
+
Figure 260343DEST_PATH_IMAGE006
Figure 83942DEST_PATH_IMAGE007
Figure 15076DEST_PATH_IMAGE008
Figure 974941DEST_PATH_IMAGE009
其中,
Figure 360923DEST_PATH_IMAGE010
为遗忘门,
Figure 468557DEST_PATH_IMAGE011
为遗忘门的偏置项,
Figure 129345DEST_PATH_IMAGE013
为遗忘门的输入权重,
Figure 146980DEST_PATH_IMAGE014
为遗忘门的循环权重,
Figure 235021DEST_PATH_IMAGE016
为外部输入门,
Figure 95530DEST_PATH_IMAGE017
为外部输入门的偏置项,
Figure 497693DEST_PATH_IMAGE018
为外部输入门的输入权重,
Figure 760047DEST_PATH_IMAGE019
为外部输入门的循环权重,
Figure 18990DEST_PATH_IMAGE020
为输出门,
Figure 976581DEST_PATH_IMAGE021
为输出门的偏置项,
Figure 979172DEST_PATH_IMAGE023
为输出门的输入权重,
Figure 830454DEST_PATH_IMAGE024
为输出门的循环权重,
Figure 729140DEST_PATH_IMAGE025
为最终长短期记忆网络元胞状态,
Figure 236344DEST_PATH_IMAGE026
为输出结果。
3.根据权利要求1所述的油气藏产量预测方法,其特征在于,所述动态调整模型包括时间更新方程和测量更新方程,时间更新方程包括先验状态估计方程和误差协方差方程,测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程,先验状态估计方程为:
Figure 839364DEST_PATH_IMAGE027
=
Figure 951677DEST_PATH_IMAGE028
误差协方差方程为:
Figure 552422DEST_PATH_IMAGE029
=
Figure 609240DEST_PATH_IMAGE030
+
Figure 156896DEST_PATH_IMAGE031
卡尔曼增益方程为:
Figure 920453DEST_PATH_IMAGE032
=
Figure 19996DEST_PATH_IMAGE033
后验估计方程为:
Figure 236213DEST_PATH_IMAGE034
=
Figure 587560DEST_PATH_IMAGE027
+
Figure 267940DEST_PATH_IMAGE035
协方差更新方程为:
Figure 476068DEST_PATH_IMAGE036
=
Figure 117265DEST_PATH_IMAGE037
其中,
Figure 131357DEST_PATH_IMAGE027
Figure 869506DEST_PATH_IMAGE038
时刻的先验估计,
Figure 186218DEST_PATH_IMAGE034
Figure 377028DEST_PATH_IMAGE038
时刻的后验估计,
Figure 194811DEST_PATH_IMAGE039
为状态t−1到状态
Figure 459570DEST_PATH_IMAGE038
的一步状态转移矩阵,
Figure 9500DEST_PATH_IMAGE040
Figure 749923DEST_PATH_IMAGE038
时刻的误差协方差矩阵,
Figure 246763DEST_PATH_IMAGE041
Figure 693925DEST_PATH_IMAGE038
时刻系统过程噪声的协方差矩阵,
Figure 211494DEST_PATH_IMAGE042
Figure 580159DEST_PATH_IMAGE038
时刻量测噪声的协方差矩阵,
Figure 739745DEST_PATH_IMAGE043
Figure 306992DEST_PATH_IMAGE038
时刻的
Figure 870829DEST_PATH_IMAGE044
维测量矩阵,
Figure 523527DEST_PATH_IMAGE032
Figure 221225DEST_PATH_IMAGE038
时刻的卡尔曼增益,
Figure 580662DEST_PATH_IMAGE045
为量测变量,
Figure 643296DEST_PATH_IMAGE046
为测量残差。
4.根据权利要求1所述的油气藏产量预测方法,其特征在于,
所述静态模型包括滑动窗口模型,所述滑动窗口模型用于预测未来多个时刻的数据;
所述静态模型包括输入层、隐含层和输出层,输入层的神经单元数由输入变量的个数确定。
5.根据权利要求1所述的油气藏产量预测方法,其特征在于,油藏数据包括训练集和预测集,所述训练集用于训练模型,所述预测集用于预测性能模型的预测精度。
6.根据权利要求1所述的油气藏产量预测方法,其特征在于,所述缺失值处理包括以下之一或其组合:删除全空变量、序列均值填充、邻近均值填充、中位数填充和线性插值填充。
7.根据权利要求1所述的油气藏产量预测方法,其特征在于,所述对预处理后的油藏数据,通过相关性分析和逐步回归方法选出特征参数,具体包括:
计算出所述油藏数据所有特征和因变量的相关系数
Figure DEST_PATH_IMAGE047
,对于预先设定的临界值
Figure 48869DEST_PATH_IMAGE048
,筛选出满足
Figure DEST_PATH_IMAGE049
的特征参数;
对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
8.根据权利要求1至7中任一项所述的油气藏产量预测方法,其特征在于,在所述通过所述油气藏产量预测模型对所述数据集进行训练和预测之前,还包括:
对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。
9.根据权利要求8所述的油气藏产量预测方法,其特征在于,所述指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
10.一种油气藏产量预测系统,其特征在于,包括:
预测模型建立模块(110),用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,所述油气藏产量预测模型包括静态模型和动态调整模型,所述静态模型通过长短期记忆网络预测油气的产量,所述动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
获取模块(120),用于获取油藏数据,对所述油藏数据进行预处理;
特征参数筛选模块(130),用于对预处理后的所述油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于所述特征参数构建数据集,其中,所述相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
训练和预测模块(140),用于通过所述油气藏产量预测模型对所述数据集进行训练和预测,得出预测结果,其中,所述数据集作为所述静态模型的输入,所述静态模型的输出结果作为所述卡尔曼滤波的观测集,通过所述动态调整模型对所述输出结果进行修正;
评估模块(150),用于通过指标评价模型预测效果,对所述输出结果和所述预测结果进行评估分析,得到预测油气井日产气的最优模型。
CN202210864648.8A 2022-07-22 2022-07-22 油气藏产量预测方法及系统 Active CN114925623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210864648.8A CN114925623B (zh) 2022-07-22 2022-07-22 油气藏产量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210864648.8A CN114925623B (zh) 2022-07-22 2022-07-22 油气藏产量预测方法及系统

Publications (2)

Publication Number Publication Date
CN114925623A true CN114925623A (zh) 2022-08-19
CN114925623B CN114925623B (zh) 2022-09-23

Family

ID=82815851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210864648.8A Active CN114925623B (zh) 2022-07-22 2022-07-22 油气藏产量预测方法及系统

Country Status (1)

Country Link
CN (1) CN114925623B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115204532A (zh) * 2022-09-16 2022-10-18 中国地质大学(北京) 基于多变量误差修正组合模型的油气产量预测方法及系统
CN115204533A (zh) * 2022-09-16 2022-10-18 中国地质大学(北京) 基于多变量的加权组合模型的油气产量预测方法及系统
CN115660221A (zh) * 2022-12-07 2023-01-31 西南石油大学 基于混合神经网络的油气藏经济可采储量评估方法及系统
CN115983088A (zh) * 2022-10-09 2023-04-18 中国地质大学(北京) 一种基于集成学习建立的海相页岩原地气量预测模型
CN116151480A (zh) * 2023-04-04 2023-05-23 北京科技大学 一种页岩油井产量预测方法和装置
CN116662569A (zh) * 2023-05-31 2023-08-29 东北石油大学 基于知识图谱的油气地质评价方法
CN116680622A (zh) * 2023-08-03 2023-09-01 西安核音智言科技有限公司 一种基于残差lstm网络的煤矿出井人员预测方法
CN117192063A (zh) * 2023-11-06 2023-12-08 山东大学 基于耦合卡尔曼滤波数据同化的水质预测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109507733A (zh) * 2018-12-11 2019-03-22 中国石油天然气股份有限公司大港油田分公司 一种预测烃源岩有机质丰度的方法及装置
CN110309616A (zh) * 2019-07-09 2019-10-08 精英数智科技股份有限公司 构建瓦斯浓度预测模型的方法、装置、系统及存储介质
CN111144542A (zh) * 2019-12-26 2020-05-12 中国石油大学(北京) 油井产能预测方法、装置和设备
US20210010351A1 (en) * 2019-07-11 2021-01-14 Halliburton Energy Services, Inc. Systems and methods for forecasting well productivity
CN113722997A (zh) * 2021-09-01 2021-11-30 北京中地金石科技有限公司 一种基于静态油气田数据的新井动态产量预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109507733A (zh) * 2018-12-11 2019-03-22 中国石油天然气股份有限公司大港油田分公司 一种预测烃源岩有机质丰度的方法及装置
CN110309616A (zh) * 2019-07-09 2019-10-08 精英数智科技股份有限公司 构建瓦斯浓度预测模型的方法、装置、系统及存储介质
US20210010351A1 (en) * 2019-07-11 2021-01-14 Halliburton Energy Services, Inc. Systems and methods for forecasting well productivity
CN111144542A (zh) * 2019-12-26 2020-05-12 中国石油大学(北京) 油井产能预测方法、装置和设备
CN113722997A (zh) * 2021-09-01 2021-11-30 北京中地金石科技有限公司 一种基于静态油气田数据的新井动态产量预测方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115204533A (zh) * 2022-09-16 2022-10-18 中国地质大学(北京) 基于多变量的加权组合模型的油气产量预测方法及系统
CN115204532A (zh) * 2022-09-16 2022-10-18 中国地质大学(北京) 基于多变量误差修正组合模型的油气产量预测方法及系统
CN115983088A (zh) * 2022-10-09 2023-04-18 中国地质大学(北京) 一种基于集成学习建立的海相页岩原地气量预测模型
CN115983088B (zh) * 2022-10-09 2023-08-15 中国地质大学(北京) 一种基于集成学习建立的海相页岩原地气量预测模型
CN115660221B (zh) * 2022-12-07 2023-03-21 西南石油大学 基于混合神经网络的油气藏经济可采储量评估方法及系统
CN115660221A (zh) * 2022-12-07 2023-01-31 西南石油大学 基于混合神经网络的油气藏经济可采储量评估方法及系统
CN116151480A (zh) * 2023-04-04 2023-05-23 北京科技大学 一种页岩油井产量预测方法和装置
CN116662569A (zh) * 2023-05-31 2023-08-29 东北石油大学 基于知识图谱的油气地质评价方法
CN116662569B (zh) * 2023-05-31 2024-04-16 东北石油大学 基于知识图谱的油气地质评价方法
CN116680622A (zh) * 2023-08-03 2023-09-01 西安核音智言科技有限公司 一种基于残差lstm网络的煤矿出井人员预测方法
CN116680622B (zh) * 2023-08-03 2023-10-20 西安核音智言科技有限公司 一种基于残差lstm网络的煤矿出井人员预测方法
CN117192063A (zh) * 2023-11-06 2023-12-08 山东大学 基于耦合卡尔曼滤波数据同化的水质预测方法及系统
CN117192063B (zh) * 2023-11-06 2024-03-15 山东大学 基于耦合卡尔曼滤波数据同化的水质预测方法及系统

Also Published As

Publication number Publication date
CN114925623B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN114925623B (zh) 油气藏产量预测方法及系统
CN112036084B (zh) 一种相似产品寿命迁移筛选方法和系统
Gokceoglu et al. A neuro-fuzzy model for modulus of deformation of jointed rock masses
CN106453293A (zh) 一种基于改进bpnn的网络安全态势预测方法
CN111030889B (zh) 一种基于gru模型的网络流量预测方法
CN115513951B (zh) 一种基于概念漂移检测的电力负荷预测方法及系统
CN111625516A (zh) 检测数据状态的方法、装置、计算机设备和存储介质
CN111680786B (zh) 一种基于改进权重门控单元的时序预测方法
CN113065703A (zh) 一种结合多种模型的时间序列预测方法
Aue et al. Delay times of sequential procedures for multiple time series regression models
CN113236228B (zh) 一种单井产量快速预测方法及系统
CN112733997A (zh) 基于woa-lstm-mc的水文时间序列预测优化方法
Dong et al. A deep reinforcement learning (DRL) based approach for well-testing interpretation to evaluate reservoir parameters
CN114065653A (zh) 电力负荷预测模型的构建方法与电力负荷预测方法
CN115204533A (zh) 基于多变量的加权组合模型的油气产量预测方法及系统
Asadi et al. Development of optimal fuzzy models for predicting the strength of intact rocks
Mohanty et al. Settlement of shallow foundations on cohesionless soils based on SPT value using multi-objective feature selection
CN113449919A (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN112765894B (zh) 一种基于k-lstm的铝电解槽状态预测方法
CN114330815A (zh) 一种基于改进goa优化lstm的超短期风电功率预测方法与系统
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
Zhang et al. Remaining useful life prediction of lithium-ion batteries based on TCN-DCN fusion model combined with IRRS filtering
CN116381510A (zh) 一种锂电池剩余寿命的预测方法、系统及存储介质
CN115204532A (zh) 基于多变量误差修正组合模型的油气产量预测方法及系统
CN116542701A (zh) 一种基于cnn-lstm组合模型的碳价预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant