CN114925623A - 油气藏产量预测方法及系统 - Google Patents
油气藏产量预测方法及系统 Download PDFInfo
- Publication number
- CN114925623A CN114925623A CN202210864648.8A CN202210864648A CN114925623A CN 114925623 A CN114925623 A CN 114925623A CN 202210864648 A CN202210864648 A CN 202210864648A CN 114925623 A CN114925623 A CN 114925623A
- Authority
- CN
- China
- Prior art keywords
- model
- prediction
- oil
- reservoir
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000004519 manufacturing process Methods 0.000 claims abstract description 69
- 230000015654 memory Effects 0.000 claims abstract description 67
- 238000001914 filtration Methods 0.000 claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000010219 correlation analysis Methods 0.000 claims abstract description 31
- 238000012216 screening Methods 0.000 claims abstract description 31
- 230000000694 effects Effects 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 239000003129 oil well Substances 0.000 claims abstract description 14
- 238000013210 evaluation model Methods 0.000 claims abstract description 12
- 230000003068 static effect Effects 0.000 claims description 65
- 238000012545 processing Methods 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000005259 measurement Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 239000004215 Carbon black (E152) Substances 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000002474 experimental method Methods 0.000 claims description 5
- 229930195733 hydrocarbon Natural products 0.000 claims description 5
- 150000002430 hydrocarbons Chemical class 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 claims 1
- 230000007787 long-term memory Effects 0.000 abstract description 14
- 230000006403 short-term memory Effects 0.000 abstract description 14
- 238000011161 development Methods 0.000 abstract description 5
- 210000004027 cell Anatomy 0.000 description 24
- 238000004422 calculation algorithm Methods 0.000 description 20
- 210000002569 neuron Anatomy 0.000 description 12
- 230000004913 activation Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000013102 re-test Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000011425 standardization method Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Geometry (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种油气藏产量预测方法及系统,属于油气藏开发技术领域,油气藏产量预测方法包括:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型;获取油藏数据,对油藏数据进行预处理;对预处理后的油藏数据通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集;通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果;通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。通过本申请的技术方案,长短期记忆网络结合卡尔曼滤波预测油气藏产量,能够提高预测的准确率。
Description
技术领域
本申请涉及油气藏开发技术领域,具体而言,涉及一种油气藏产量预测方法及系统。
背景技术
油井产量预测贯穿油田开发生产全过程。在产量预测模型中,根据产量影响因素及矿场获取数据的难易程度,考虑部分地质和生产参数作为油井产量预测的输入参数。日产气、日排液、套压、油压、输压、和水气比可从地层能量、操作调整、生产限制等方面衡量对产油量的影响水平。
在相关技术中,针对卡尔曼滤波方法应用于油藏产量预测领域做了诸多研究,随着油藏工程研究的深入,油气井的模型变得更为复杂,地质参数也越来越多。传统卡尔曼滤波对于系统模型的要求较高,它要求状态方程和量测方程是线性的高斯分布,且系统噪声可知。在以上条件下,通过迭代进行预测和更新步骤,但在处理非高斯分布的数据时,尤其是油气井在地下由于地层的构造特点和油藏不同的属性,分布是十分不均衡的。而且油藏的开发周期是很长的,随着开采的进行,地下开采环境会更恶劣,产量也会随之降低,还有各种意外因素会导致停工停产的状况,因此单一的卡尔曼滤波模型预测效果误差很大。
发明内容
本申请旨在解决或改善单一卡尔曼滤波模型预测效果误差大的问题。
为此,本申请的第一目的在于提供一种油气藏产量预测方法。
本申请的第二目的在于提供一种油气藏产量预测系统。
为实现本申请的第一目的,本发明第一方面的技术方案提供了一种油气藏产量预测方法,油气藏产量预测方法基于长短期记忆网络和卡尔曼滤波,油气藏产量预测方法包括:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
根据本申请提供的油气藏产量预测方法,首先建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。然后获取油藏数据,对油藏数据进行预处理。在对油藏数据进行初步的预处理之后,对油藏数据以统计方法进行描述性分析,使用相关性分析和逐步回归方法讨论参数的特征贡献度,筛选出特征参数,剔除贡献度较小的参数,以筛选后的油气井实际参数指标如产气量、油压和水气比等指标综合分析并对油气产量进行预测。其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数。基于特征参数构建数据集,通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果。其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。最后通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
另外,本申请提供的技术方案还可以具有如下附加技术特征:
上述技术方案中,静态模型的公式为:
其中,为遗忘门,为遗忘门的偏置项,为遗忘门的输入权重,为遗忘门的循环权重,为外部输入门,为外部输入门的偏置项,为外部输入门的输入权重,为外部输入门的循环权重,为输出门,为输出门的偏置项,为输出门的输入权重,为输出门的循环权重,为最终长短期记忆网络元胞状态,为输出结果。
在该技术方案中,长短期记忆网络创造性地改变了元胞的内部结构,每个元胞内部设计了4个非线性神经网络层,而且增加了元胞状态的概念。同时将隐层单元和元胞状态输入到下个元胞。长短期记忆网络通过一种叫门的结构来控制,它是一种选择性让信息通过的方式,这种门的功能在元胞结构中添加或删除信息。他具体是由一个S形层和一个元素相乘操作组成。S形层输出0~1之间的值,每个值表示对应的部分信息通过量。不允许信息通过表示为0,让所有信息通过表示为1。一个长短期记忆网络有3个这种门来保护和控制元胞状态。
其中,遗忘门负责对通过的信息有选择性进行丢弃,分别是遗忘门中的偏置、输入权重和循环权重,外部输入门负责更新信息,自身参数分别为。输出门o也有其对应参数。最终长短期记忆网络元胞状态为c(t),输出结果为h(t)。通过以上公式可以看出,基于目前的元胞状态再加入过滤,就可以得到输出结果。首先建立一个S形层的输出门,来决定将元胞的哪些部分进行输出。然后将元胞状态通过激活函数之后,与输出门相乘,只输出想输出的部分。
上述技术方案中,动态调整模型包括时间更新方程和测量更新方程,时间更新方程包括先验状态估计方程和误差协方差方程,测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程,先验状态估计方程为:
误差协方差方程为:
卡尔曼增益方程为:
后验估计方程为:
协方差更新方程为:
其中,为时刻的先验估计,为时刻的后验估计,为状态到状态的一步状态转移矩阵,为时刻的误差协方差矩阵,为时刻系统过程噪声的协方差矩阵,为时刻量测噪声的协方差矩阵,是时刻的维测量矩阵,为时刻的卡尔曼增益,为量测变量,为测量残差。
在该技术方案中,卡尔曼滤波是建立在一套状态系统方程上进行递归求解的,在这个系统当中分为两步,一个预测步骤一个更新过程。卡尔曼滤波作为一种经典的动态递推算法,可根据历史数据和更新数据,对静态预测结果进行调整,而且具有较高的计算精度。算法启动之前需要设置初始的和,算法启动后状态向量会不断递归最终收敛,因此初始值的选定只需在合理范围内即可。通过结合长短期记忆网络算法和卡尔曼滤波算法,构建长短期记忆网络改进卡尔曼滤波的预测模型,实际数据作为长短期记忆网络算法的输入,输出结果作为卡尔曼滤波的观测集,对预测结果进行修正,能够提高预测的准确率。
上述技术方案中,静态模型包括滑动窗口模型,滑动窗口模型用于预测未来多个时刻的数据;静态模型包括输入层、隐含层和输出层,输入层的神经单元数由输入变量的个数确定。
在该技术方案中,静态模型包括滑动窗口模型,滑动窗口模型用于预测未来多个时刻数据。具体地,设有时序性数据,首先进行单步的预测输入初始数据,得到下一时刻的输出,接着预测再下一时刻的数据时,将一步预测的和作为新的输入,以此类推,通过多次的迭代预测,得到未来多个时刻的预测值。
其中,长短期记忆网络的训练速度、拟合能力取决于它的结构,它的结构主要包括输入层、隐含层和输出层。输入层的神经单元数由输入变量个数确定。油藏数据结构复杂,参数类型多样,选择合适的参数进行预测尤为关键。油藏生产数据当中的参数并不一定都对输出产生影响,且这些参数之间也可能存在依赖关系,为了保证参与预测的指标与产量具有相关性,降低神经网络的复杂度,提高预测效率,要对输入变量进行特征筛选。对于隐含层来说,通常是根据经验来选择神经元个数,当发现神经元的数目太多时,这时候训练集往往拟合程度很好,而测试集上效果就会很差,称为过拟合。太少的话神经网络学习能力不够强,拟合速度慢。通过遍历所有可行的神经元个数,此时隐含层结构就是选择最后误差最小的结构。在长短期记忆网络的输出层中可以知道在这层中神经元的数目大小对其影响较小,根据所需求的指标,选取可行性较强且具有代表性的指标作输出层神经元。
上述技术方案中,油藏数据包括训练集和预测集,训练集用于训练模型,预测集用于预测性能模型的预测精度。在实施过程中,可以将油井生产历史数据按照8:2 进行比例分配,划分为训练集和预测集,通过训练集学习后,使用预测集中的数据样本预测性能模型的预测精度。
上述技术方案中,缺失值处理包括以下之一或其组合:删除全空变量、序列均值填充、邻近均值填充、中位数填充和线性插值填充。
在该技术方案中,对于缺失值,常规的处理方法一般有删除全空变量、序列均值填充、邻近均值填充、中位数填充、和线性插值填充。油气井的产量,出现缺失值情况大多是由停产导致,会出现一段时间多个特征参数全部为空的情况,对于这种数据,采取直接删除的方法,对于个别缺失某个变量的情况,使用中位数进行填充。
进一步地,为了预测准确性,需要进行数据归一化,去除量纲影响。由于初始数据的各个变量分布较为集中,选择Min-max 标准化方法来对初始数据进行线性变换。通过使用归一化后的数据作为输入,经训练得到结果进行反归一化处理,得到最终的预测值作为输出值。
上述技术方案中,对预处理后的油藏数据,通过相关性分析和逐步回归方法选出特征参数,具体包括:计算出油藏数据所有特征和因变量的相关系数,对于预先设定的临界值,筛选出满足的特征参数;对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
在该技术方案中,通过相关性分析和逐步回归方法选出特征参数,具体为首先计算出油藏数据所有特征和因变量的相关系数,对于预先设定的临界值,筛选满足的特征参数,然后对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
可以理解,皮尔逊相关系数或斯皮尔曼相关系数等统计量常用来判断特征和目标特征之间的关系,所以该相关性分析可基于皮尔逊相关系数或斯皮尔曼相关系数等来进行。例如,对于皮尔逊相关系数,其大小可用来衡量特征变量之间和特征变量与响应变量之间的线性关系,并且这个选取过程很容易实现。由皮尔逊相关系数的计算公式得到的值在内,其中1表示完全正相关,表示完全负相关。当相关系数的绝对值属于时,那就表明两个自变量的关系是弱相关关系。相关系数的绝对值介于0.3到0.5之间,那就表明两个自变量的关系是中等程度相关关系。当相关系数的绝对值属于时,则表明两个自变量的关系是强相关关系。对于斯皮尔曼相关系数,其值介于与1之间,绝对值越大,变量间的相关性越强。一般而言,当斯皮尔曼相关系数的绝对值属于[0,0.4]时,称为弱相关;当斯皮尔曼相关系数的绝对值属于(0.4,0.7)时,称为中度相关;当斯皮尔曼相关系数的绝对值属于[0.7,1)时,称为强相关。
进一步地,逐步回归分析的基本思路是通过将自变量逐个引入,检查其偏回归平方和的结果是否显著,若显著,则将变量引入模型当中,每次引入新的自变量时,都会重新测试已经存在的旧变量,并消除从显著变量变为无显著变量的变量,这样一边引入一边剔除,直到所有自变量都引入且无旧变量可以剔除为止。逐步回归分两种筛选变量的方法,一种是正向法,这种方法的思路是逐个比较变量的显著性,然后将显著的变量引入回归模型中,知道不显著时逐步回归过程停止。另外一种是后向法,首先所有的候选变量建立一个初始数学回归模型,并逐渐消除这个模型贡献最小的候选变量,这个过程一直到模型中变量全部都显著时停止。对于油井数据,可以根据AIC 准则标准来作为选择突出特征变量的准则。AIC基于熵的概念,可用于平衡模型的拟合和复杂性,是测试统计模型是否良好的标准之一。具体而言,此部分使用反向方法根据AIC 的大小自动选择特征。
上述技术方案中,在通过油气藏产量预测模型对数据集进行训练和预测之前,还包括:对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。
在该技术方案中,在应用油气藏产量预测模型对数据集进行训练之前,对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。对长短期记忆网络模型来说,迭代次数、隐含层节点个数、学习率和批处理大小几个因素会对预测结果产生较大的影响,通过正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合,能够提高预测的准确率。
上述技术方案中,指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
在该技术方案中,在使用机器学习算法过程当中,针对不同的问题使用不同模型评估标准,主要分为分类与回归两大类。对于回归问题,衡量指标相对直观,主要有均方误差、平均绝对误差和平均相对误差。
为实现本申请的第二目的,本申请第二方面的技术方案提供了一种油气藏产量预测系统,包括:预测模型建立模块,用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;获取模块,用于获取油藏数据,对油藏数据进行预处理;特征参数筛选模块,用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;训练和预测模块,用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;评估模块,用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。
根据本申请提供的油气藏产量预测系统,包括预测模型建立模块、获取模块、特征参数筛选模块、训练和预测模块和评估模块。其中,预测模型建立模块用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。获取模块用于获取油藏数据,对油藏数据进行预处理。特征参数筛选模块用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集。训练和预测模块用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。评估模块用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
本申请的附加方面和优点将在下面的描述部分中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图2为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图3为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图4为本申请一个实施例的油气藏产量预测方法的步骤流程图;
图5为本申请一个实施例的油气藏产量预测系统的结构示意框图;
图6为本申请另一个实施例的油气藏产量预测系统的结构示意框图;
图7为本申请一个实施例的电子设备的硬件结构示意图。
其中,图5至图7中的附图标记与部件名称之间的对应关系为:
10:油气藏产量预测系统;110:预测模型建立模块;120:获取模块;130;特征参数筛选模块;140;训练和预测模块;150:评估模块;300:存储器;400:处理器;1100:电子设备;1101:射频单元;1102:网络模块;1103:音频输出单元;1104:输入单元;11041:图形处理器;11042:麦克风;1105:传感器;1106:显示单元;11061:显示面板;1107:用户输入单元;11071:触控面板;11072:其他输入设备;1108:接口单元;1109:存储器;1110:处理器。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
下面参照图1至图7描述本申请一些实施例的油气藏产量预测方法及系统
如图1所示,根据本发明提出的一个实施例的油气藏产量预测方法,包括以下步骤:
步骤S102:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
步骤S104:获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
步骤S106:对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
步骤S108:通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
步骤S110:通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
根据本实施例提供的油气藏产量预测方法,首先建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。然后获取油藏数据,对油藏数据进行预处理。在对油藏数据进行初步的预处理之后,对油藏数据以统计方法进行描述性分析,使用相关性分析和逐步回归方法讨论参数的特征贡献度,筛选出特征参数,剔除贡献度较小的参数,以筛选后的油气井实际参数指标如产气量、油压和水气比等指标综合分析并对油气产量进行预测。其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数。基于特征参数构建数据集,通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果。其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。最后通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
具体地,长短期记忆网络创造性地改变了元胞的内部结构,每个元胞内部设计了4个非线性神经网络层,而且增加了元胞状态的概念。同时将隐层单元和元胞状态输入到下个元胞。长短期记忆网络通过一种叫门的结构来控制,它是一种选择性让信息通过的方式,这种门的功能在元胞结构中添加或删除信息。他具体是由一个S形层和一个元素相乘操作组成。S形层输出0~1之间的值,每个值表示对应的部分信息通过量。不允许信息通过表示为0,让所有信息通过表示为1。一个长短期记忆网络有3个这种门来保护和控制元胞状态。其中,静态模型的公式为:
其中,为遗忘门,为遗忘门的偏置项,为遗忘门的输入权重,为遗忘门的循环权重,为外部输入门,为外部输入门的偏置项,为外部输入门的输入权重,为外部输入门的循环权重,o为输出门,为输出门的偏置项,为输出门的输入权重,为输出门的循环权重,为最终长短期记忆网络元胞状态,为输出结果。通过以上公式可以看出,基于目前的元胞状态再加入过滤,就可以得到输出结果。首先建立一个S形层的输出门,来决定将元胞的哪些部分进行输出。然后将元胞状态通过激活函数之后,与输出门相乘,只输出想输出的部分。
激活函数是长短期记忆网络中一个关键的部分,在计算每一层神经网络的激活值时,利用激活函数确定激活值,改变数据线性关系。根据每一层前面的激活、权重和偏置,为下一层的每个激活计算一个值。在将该值发送给下一层之前,使用一个激活函数这个输出进行缩放,是神经网络的核心单元,大多数激活函数都是非线性或与线性的组合。常用的激活函数有tanh 函数、sigmod 函数、ELU 函数和RELU 函数等。
进一步地,动态调整模型包括时间更新方程和测量更新方程,时间更新方程包括先验状态估计方程和误差协方差方程,测量更新方程包括卡尔曼增益方程、后验估计方程和协方差更新方程,先验状态估计方程为:
误差协方差方程为:
卡尔曼增益方程为:
后验估计方程为:
协方差更新方程为:
其中,为时刻的先验估计,为时刻的后验估计,为状态t−1到状态的一步状态转移矩阵,为时刻的误差协方差矩阵,为时刻系统过程噪声的协方差矩阵,为时刻量测噪声的协方差矩阵,是时刻的维测量矩阵,为时刻的卡尔曼增益,为量测变量,为测量残差。卡尔曼滤波是建立在一套状态系统方程上进行递归求解的,在这个系统当中分为两步,一个预测步骤一个更新过程。卡尔曼滤波作为一种经典的动态递推算法,可根据历史数据和更新数据,对静态预测结果进行调整,而且具有较高的计算精度。算法启动之前需要设置初始的x (0)和P(0),算法启动后状态向量会不断递归最终收敛,因此初始值的选定只需在合理范围内即可。通过结合长短期记忆网络算法和卡尔曼滤波算法,构建长短期记忆网络改进卡尔曼滤波的预测模型,实际数据作为长短期记忆网络算法的输入,输出结果作为卡尔曼滤波的观测集,对预测结果进行修正,能够提高预测的准确率。
在一些实施例中,静态模型包括滑动窗口模型,滑动窗口模型用于预测未来多个时刻数据。具体地,设有时序性数据,首先进行单步的预测输入初始数据,得到下一时刻的输出,接着预测再下一时刻的数据时,将一步预测的和作为新的输入,以此类推,通过多次的迭代预测,得到未来多个时刻的预测值。
其中,长短期记忆网络的训练速度、拟合能力取决于它的结构,它的结构主要包括输入层、隐含层和输出层。输入层的神经单元数由输入变量个数确定。油藏数据结构复杂,参数类型多样,选择合适的参数进行预测尤为关键。油藏生产数据当中的参数并不一定都对输出产生影响,且这些参数之间也可能存在依赖关系,为了保证参与预测的指标与产量具有相关性,降低神经网络的复杂度,提高预测效率,要对输入变量进行特征筛选。对于隐含层来说,通常是根据经验来选择神经元个数,当发现神经元的数目太多时,这时候训练集往往拟合程度很好,而测试集上效果就会很差,称为过拟合。太少的话神经网络学习能力不够强,拟合速度慢。通过遍历所有可行的神经元个数,此时隐含层结构就是选择最后误差最小的结构。在长短期记忆网络的输出层中可以知道在这层中神经元的数目大小对其影响较小,根据所需求的指标,选取可行性较强且具有代表性的指标作输出层神经元。
在上述实施例中,油藏数据包括训练集和预测集,训练集用于训练模型。可以将油井生产历史数据按照8:2 进行比例分配,划分为训练集和预测集,通过训练集学习后,使用预测集中的数据样本预测性能模型的预测精度。
进一步地,对油藏数据的预处理包括缺失值处理,对于缺失值,常规的处理方法一般有删除全空变量、序列均值填充、邻近均值填充、中位数填充、和线性插值填充。油气井的产量,出现缺失值情况大多是由停产导致,会出现一段时间多个特征参数全部为空的情况,对于这种数据,采取直接删除的方法,对于个别缺失某个变量的情况,使用中位数进行填充。为了预测准确性,需要进行数据归一化,去除量纲影响。由于初始数据的各个变量分布较为集中,选择Min-max 标准化方法来对初始数据进行线性变换。通过使用归一化后的数据作为输入,经训练得到结果进行反归一化处理,得到最终的预测值作为输出值。
如图2所示,根据本发明提出的一个实施例的油气藏产量预测方法,对预处理后的油藏数据,通过相关性分析和逐步回归方法选出特征参数,具体包括以下步骤:
步骤S204:对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
在该实施例中,在该技术方案中,通过相关性分析和逐步回归方法选出特征参数,具体为首先计算出油藏数据所有特征和因变量的相关系数,对于预先设定的临界值(例如,可取),筛选满足的特征参数,然后对上述筛选出的特征参数,利用逐步回归法筛选出最终的特征参数。
众所周知,皮尔逊相关系数或斯皮尔曼相关系数等统计量常用来判断特征和目标特征之间的关系,所以该相关性分析可基于皮尔逊相关系数或斯皮尔曼相关系数等来进行。例如,对于皮尔逊相关系数,其大小可用来衡量特征变量之间和特征变量与响应变量之间的线性关系,并且这个选取过程很容易实现。由皮尔逊相关系数的计算公式得到的值在内,其中1表示完全正相关,表示完全负相关。当相关系数的绝对值属于时,那就表明两个自变量的关系是弱相关关系。相关系数的绝对值介于0.3到0.5之间,那就表明两个自变量的关系是中等程度相关关系。当相关系数的绝对值属于时,则表明两个自变量的关系是强相关关系。对于斯皮尔曼相关系数,其值介于与1之间,绝对值越大,变量间的相关性越强。一般而言,当斯皮尔曼相关系数的绝对值属于[0,0.4]时,称为弱相关;当斯皮尔曼相关系数的绝对值属于(0.4,0.7)时,称为中度相关;当斯皮尔曼相关系数的绝对值属于[0.7,1)时,称为强相关。
进一步地,逐步回归分析的基本思路是通过将自变量逐个引入,检查其偏回归平方和的结果是否显著,若显著,则将变量引入模型当中,每次引入新的自变量时,都会重新测试已经存在的旧变量,并消除从显著变量变为无显著变量的变量,这样一边引入一遍剔除,直到所有自变量都引入且无旧变量可以剔除为止。逐步回归分两种筛选变量的方法,一种是正向法,这种方法的思路是逐个比较变量的显著性,然后将显著的变量引入回归模型中,知道不显著时逐步回归过程停止。另外一种是后向法,首先所有的候选变量建立一个初始数学回归模型,并逐渐消除这个模型贡献最小的候选变量,这个过程一直到模型中变量全部都显著时停止。对于油井数据,可以根据AIC 准则标准来作为选择突出特征变量的准则。AIC基于熵的概念,可用于平衡模型的拟合和复杂性,是测试统计模型是否良好的标准之一。具体而言,此部分使用反向方法根据AIC 的大小自动选择特征。
如图3所示,根据本发明提出的另一个实施例的油气藏产量预测方法,包括以下步骤:
步骤S302:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
步骤S304:获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
步骤S306:对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
步骤S308:对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合;
步骤S310:通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
步骤S312:通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
在该实施例中,在应用油气藏产量预测模型对数据集进行训练之前,对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。对长短期记忆网络模型来说,迭代次数、隐含层节点个数、学习率和批处理大小几个因素会对预测结果产生较大的影响,通过正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合,能够提高预测的准确率。
在一些实施例中,在使用机器学习算法过程当中,针对不同的问题使用不同模型评估标准,主要分为分类与回归两大类。对于回归问题,衡量指标相对直观,主要有均方误差、平均绝对误差和平均相对误差。
如图4所示,根据本发明提出的又一个实施例的油气藏产量预测方法,包括以下步骤:
步骤S402:建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
步骤S404:获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
步骤S406:对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
步骤S408:通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
步骤S410:通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型;
步骤S412:根据最优模型为油气田管理人员提供决策支持。
在该实施例中,在通过指标评价模型对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型后,根据最优模型为油气田管理人员提供决策支持,从而提高预测的准确率。
如图5所示,本申请第二方面的实施例提供了一种油气藏产量预测系统10,包括:预测模型建立模块110,用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;获取模块120,用于获取油藏数据,对油藏数据进行预处理;特征参数筛选模块130,用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集,其中,相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;训练和预测模块140,用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;评估模块150,用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。
在该实施例中,油气藏产量预测系统10包括预测模型建立模块110、获取模块120、特征参数筛选模块130、训练和预测模块140和评估模块150。其中,预测模型建立模块110用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整。获取模块120用于获取油藏数据,对油藏数据进行预处理。特征参数筛选模块130用于对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集。训练和预测模块140用于通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正。评估模块150用于通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到预测油气井日产气的最优模型。由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
如图6所示,本申请第三方面的实施例提供了一种油气藏产量预测系统10,包括:存储器300和处理器400,其中,存储器300上存储有可在处理器400上运行的程序或指令,处理器400执行程序或指令时实现上述方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
如图7所示,举例来说,油气藏产量预测系统10可以通过电子设备1100实现,电子设备1100包括但不限于:射频单元1101、网络模块1102、音频输出单元1103、输入单元1104、传感器1105、显示单元1106、用户输入单元1107、接口单元1108、存储器1109、以及处理器1110等部件。
本领域技术人员可以理解,电子设备1100还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1110用于执行指令或程序,实现以下处理过程:
建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,油气藏产量预测模型包括静态模型和动态调整模型,静态模型通过长短期记忆网络预测油气的产量,动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
获取油藏数据,对油藏数据进行预处理,预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
对预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于特征参数构建数据集;
通过油气藏产量预测模型对数据集进行训练和预测,得出预测结果,其中,数据集作为静态模型的输入,静态模型的输出结果作为卡尔曼滤波的观测集,通过动态调整模型对输出结果进行修正;
通过指标评价模型预测效果,对输出结果和预测结果进行评估分析,得到影响油井日产气的最优模型。
本申请采用长短期记忆网络结合卡尔曼滤波预测油气藏产量,由于长短期记忆网络面对庞大复杂的数据具有很强的学习能力,对于高度并行的时序信息处理能力也很强大,无论输入、输出是否具有线性特性,它都有很好的容错性和鲁棒性,可与卡尔曼滤波算法互补,从而提高预测的准确率。
本申请实施例提供的处理器1110可以实现上述油气藏产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解的是,本申请实施例中,输入单元1104可以包括图形处理器(GraphicsProcessing Unit,GPU)11041和麦克风11042,图形处理器11041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1106可包括显示面板11061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板11061。用户输入单元1107包括触控面板11071以及其他输入设备11072中的至少一种。触控面板11071,也称为触摸屏。触控面板11071可包括触摸检测装置和触摸控制器两个部分。其他输入设备11072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器1109可用于存储软件程序以及各种数据。存储器1109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器1109可以包括易失性存储器或非易失性存储器,或者,存储器1109可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器1109包括但不限于这些和任意其它适合类型的存储器。
处理器1110可包括一个或多个处理单元;可选的,处理器1110集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器1110中。
本申请第四方面的实施例提供了一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述多采样率地震数据重建方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的油气藏产量预测系统中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述油气藏产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述油气藏产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
在本申请中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
本申请的描述中,需要理解的是,术语“上”、“下”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本申请的限制。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种油气藏产量预测方法,其特征在于,包括:
建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,所述油气藏产量预测模型包括静态模型和动态调整模型,所述静态模型通过长短期记忆网络预测油气的产量,所述动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
获取油藏数据,对所述油藏数据进行预处理,所述预处理包括以下之一或其组合:缺失值处理、异常值处理和剔除无关变量;
对所述预处理后的油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于所述特征参数构建数据集,其中,所述相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
通过所述油气藏产量预测模型对所述数据集进行训练和预测,得出预测结果,其中,所述数据集作为所述静态模型的输入,所述静态模型的输出结果作为所述卡尔曼滤波的观测集,通过所述动态调整模型对所述输出结果进行修正;
通过指标评价模型预测效果,对所述输出结果和所述预测结果进行评估分析,得到影响油井日产气的最优模型。
4.根据权利要求1所述的油气藏产量预测方法,其特征在于,
所述静态模型包括滑动窗口模型,所述滑动窗口模型用于预测未来多个时刻的数据;
所述静态模型包括输入层、隐含层和输出层,输入层的神经单元数由输入变量的个数确定。
5.根据权利要求1所述的油气藏产量预测方法,其特征在于,油藏数据包括训练集和预测集,所述训练集用于训练模型,所述预测集用于预测性能模型的预测精度。
6.根据权利要求1所述的油气藏产量预测方法,其特征在于,所述缺失值处理包括以下之一或其组合:删除全空变量、序列均值填充、邻近均值填充、中位数填充和线性插值填充。
8.根据权利要求1至7中任一项所述的油气藏产量预测方法,其特征在于,在所述通过所述油气藏产量预测模型对所述数据集进行训练和预测之前,还包括:
对迭代次数、隐含层节点个数、学习率和批处理大小做正交实验分析误差,以预测误差最小为目标函数筛选出预测性能最优的模型参数组合。
9.根据权利要求8所述的油气藏产量预测方法,其特征在于,所述指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
10.一种油气藏产量预测系统,其特征在于,包括:
预测模型建立模块(110),用于建立基于长短期记忆网络和卡尔曼滤波的油气藏产量预测模型,所述油气藏产量预测模型包括静态模型和动态调整模型,所述静态模型通过长短期记忆网络预测油气的产量,所述动态调整模型通过卡尔曼滤波对预测产量进行动态调整;
获取模块(120),用于获取油藏数据,对所述油藏数据进行预处理;
特征参数筛选模块(130),用于对预处理后的所述油藏数据,通过相关性分析和逐步回归方法筛选出特征参数,基于所述特征参数构建数据集,其中,所述相关性分析基于皮尔逊相关系数或斯皮尔曼秩相关系数;
训练和预测模块(140),用于通过所述油气藏产量预测模型对所述数据集进行训练和预测,得出预测结果,其中,所述数据集作为所述静态模型的输入,所述静态模型的输出结果作为所述卡尔曼滤波的观测集,通过所述动态调整模型对所述输出结果进行修正;
评估模块(150),用于通过指标评价模型预测效果,对所述输出结果和所述预测结果进行评估分析,得到预测油气井日产气的最优模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210864648.8A CN114925623B (zh) | 2022-07-22 | 2022-07-22 | 油气藏产量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210864648.8A CN114925623B (zh) | 2022-07-22 | 2022-07-22 | 油气藏产量预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114925623A true CN114925623A (zh) | 2022-08-19 |
CN114925623B CN114925623B (zh) | 2022-09-23 |
Family
ID=82815851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210864648.8A Active CN114925623B (zh) | 2022-07-22 | 2022-07-22 | 油气藏产量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114925623B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115204532A (zh) * | 2022-09-16 | 2022-10-18 | 中国地质大学(北京) | 基于多变量误差修正组合模型的油气产量预测方法及系统 |
CN115204533A (zh) * | 2022-09-16 | 2022-10-18 | 中国地质大学(北京) | 基于多变量的加权组合模型的油气产量预测方法及系统 |
CN115660221A (zh) * | 2022-12-07 | 2023-01-31 | 西南石油大学 | 基于混合神经网络的油气藏经济可采储量评估方法及系统 |
CN115983088A (zh) * | 2022-10-09 | 2023-04-18 | 中国地质大学(北京) | 一种基于集成学习建立的海相页岩原地气量预测模型 |
CN116151480A (zh) * | 2023-04-04 | 2023-05-23 | 北京科技大学 | 一种页岩油井产量预测方法和装置 |
CN116662569A (zh) * | 2023-05-31 | 2023-08-29 | 东北石油大学 | 基于知识图谱的油气地质评价方法 |
CN116680622A (zh) * | 2023-08-03 | 2023-09-01 | 西安核音智言科技有限公司 | 一种基于残差lstm网络的煤矿出井人员预测方法 |
CN117192063A (zh) * | 2023-11-06 | 2023-12-08 | 山东大学 | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109507733A (zh) * | 2018-12-11 | 2019-03-22 | 中国石油天然气股份有限公司大港油田分公司 | 一种预测烃源岩有机质丰度的方法及装置 |
CN110309616A (zh) * | 2019-07-09 | 2019-10-08 | 精英数智科技股份有限公司 | 构建瓦斯浓度预测模型的方法、装置、系统及存储介质 |
CN111144542A (zh) * | 2019-12-26 | 2020-05-12 | 中国石油大学(北京) | 油井产能预测方法、装置和设备 |
US20210010351A1 (en) * | 2019-07-11 | 2021-01-14 | Halliburton Energy Services, Inc. | Systems and methods for forecasting well productivity |
CN113722997A (zh) * | 2021-09-01 | 2021-11-30 | 北京中地金石科技有限公司 | 一种基于静态油气田数据的新井动态产量预测方法 |
-
2022
- 2022-07-22 CN CN202210864648.8A patent/CN114925623B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109507733A (zh) * | 2018-12-11 | 2019-03-22 | 中国石油天然气股份有限公司大港油田分公司 | 一种预测烃源岩有机质丰度的方法及装置 |
CN110309616A (zh) * | 2019-07-09 | 2019-10-08 | 精英数智科技股份有限公司 | 构建瓦斯浓度预测模型的方法、装置、系统及存储介质 |
US20210010351A1 (en) * | 2019-07-11 | 2021-01-14 | Halliburton Energy Services, Inc. | Systems and methods for forecasting well productivity |
CN111144542A (zh) * | 2019-12-26 | 2020-05-12 | 中国石油大学(北京) | 油井产能预测方法、装置和设备 |
CN113722997A (zh) * | 2021-09-01 | 2021-11-30 | 北京中地金石科技有限公司 | 一种基于静态油气田数据的新井动态产量预测方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115204533A (zh) * | 2022-09-16 | 2022-10-18 | 中国地质大学(北京) | 基于多变量的加权组合模型的油气产量预测方法及系统 |
CN115204532A (zh) * | 2022-09-16 | 2022-10-18 | 中国地质大学(北京) | 基于多变量误差修正组合模型的油气产量预测方法及系统 |
CN115983088A (zh) * | 2022-10-09 | 2023-04-18 | 中国地质大学(北京) | 一种基于集成学习建立的海相页岩原地气量预测模型 |
CN115983088B (zh) * | 2022-10-09 | 2023-08-15 | 中国地质大学(北京) | 一种基于集成学习建立的海相页岩原地气量预测模型 |
CN115660221B (zh) * | 2022-12-07 | 2023-03-21 | 西南石油大学 | 基于混合神经网络的油气藏经济可采储量评估方法及系统 |
CN115660221A (zh) * | 2022-12-07 | 2023-01-31 | 西南石油大学 | 基于混合神经网络的油气藏经济可采储量评估方法及系统 |
CN116151480A (zh) * | 2023-04-04 | 2023-05-23 | 北京科技大学 | 一种页岩油井产量预测方法和装置 |
CN116662569A (zh) * | 2023-05-31 | 2023-08-29 | 东北石油大学 | 基于知识图谱的油气地质评价方法 |
CN116662569B (zh) * | 2023-05-31 | 2024-04-16 | 东北石油大学 | 基于知识图谱的油气地质评价方法 |
CN116680622A (zh) * | 2023-08-03 | 2023-09-01 | 西安核音智言科技有限公司 | 一种基于残差lstm网络的煤矿出井人员预测方法 |
CN116680622B (zh) * | 2023-08-03 | 2023-10-20 | 西安核音智言科技有限公司 | 一种基于残差lstm网络的煤矿出井人员预测方法 |
CN117192063A (zh) * | 2023-11-06 | 2023-12-08 | 山东大学 | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 |
CN117192063B (zh) * | 2023-11-06 | 2024-03-15 | 山东大学 | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114925623B (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114925623B (zh) | 油气藏产量预测方法及系统 | |
CN112036084B (zh) | 一种相似产品寿命迁移筛选方法和系统 | |
Gokceoglu et al. | A neuro-fuzzy model for modulus of deformation of jointed rock masses | |
CN106453293A (zh) | 一种基于改进bpnn的网络安全态势预测方法 | |
CN111030889B (zh) | 一种基于gru模型的网络流量预测方法 | |
CN115513951B (zh) | 一种基于概念漂移检测的电力负荷预测方法及系统 | |
CN111625516A (zh) | 检测数据状态的方法、装置、计算机设备和存储介质 | |
CN111680786B (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN113065703A (zh) | 一种结合多种模型的时间序列预测方法 | |
Aue et al. | Delay times of sequential procedures for multiple time series regression models | |
CN113236228B (zh) | 一种单井产量快速预测方法及系统 | |
CN112733997A (zh) | 基于woa-lstm-mc的水文时间序列预测优化方法 | |
Dong et al. | A deep reinforcement learning (DRL) based approach for well-testing interpretation to evaluate reservoir parameters | |
CN114065653A (zh) | 电力负荷预测模型的构建方法与电力负荷预测方法 | |
CN115204533A (zh) | 基于多变量的加权组合模型的油气产量预测方法及系统 | |
Asadi et al. | Development of optimal fuzzy models for predicting the strength of intact rocks | |
Mohanty et al. | Settlement of shallow foundations on cohesionless soils based on SPT value using multi-objective feature selection | |
CN113449919A (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN112765894B (zh) | 一种基于k-lstm的铝电解槽状态预测方法 | |
CN114330815A (zh) | 一种基于改进goa优化lstm的超短期风电功率预测方法与系统 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
Zhang et al. | Remaining useful life prediction of lithium-ion batteries based on TCN-DCN fusion model combined with IRRS filtering | |
CN116381510A (zh) | 一种锂电池剩余寿命的预测方法、系统及存储介质 | |
CN115204532A (zh) | 基于多变量误差修正组合模型的油气产量预测方法及系统 | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |