CN115204533A - 基于多变量的加权组合模型的油气产量预测方法及系统 - Google Patents

基于多变量的加权组合模型的油气产量预测方法及系统 Download PDF

Info

Publication number
CN115204533A
CN115204533A CN202211125730.5A CN202211125730A CN115204533A CN 115204533 A CN115204533 A CN 115204533A CN 202211125730 A CN202211125730 A CN 202211125730A CN 115204533 A CN115204533 A CN 115204533A
Authority
CN
China
Prior art keywords
model
prediction
weight
neural network
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211125730.5A
Other languages
English (en)
Inventor
郭翠平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences Beijing
Original Assignee
China University of Geosciences Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences Beijing filed Critical China University of Geosciences Beijing
Priority to CN202211125730.5A priority Critical patent/CN115204533A/zh
Publication of CN115204533A publication Critical patent/CN115204533A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Animal Husbandry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Agronomy & Crop Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)

Abstract

本申请提供了一种基于多变量的加权组合模型的油气产量预测方法及系统,属于油气开发技术领域,基于多变量的加权组合模型的油气产量预测方法包括:获取生产数据,对生产数据进行预处理;建立门控循环单元神经网络预测模型,对门控循环单元神经网络预测模型进行训练和预测,得到第一预测值;建立多元回归模型,对多元回归模型进行训练和测试,得到第二预测值;计算权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;根据第一预测值、第二预测值和权重系数得出预测结果。通过本申请的技术方案,能够提高油气产量的预测精度。

Description

基于多变量的加权组合模型的油气产量预测方法及系统
技术领域
本申请涉及油气开发技术领域,具体而言,涉及一种基于多变量的加权组合模型的油气产量预测方法及系统。
背景技术
我国作为能源消耗大国,近年来受工业化进程加快的影响,油气资源的消费需求不断增加。然而,国内油气供给却不足,对外依存度高。在国际政治大背景下,进一步加大油气井勘探力度,提高油气能源自给能力,对制定政策、发展规划至关重要。因此,找到有效的方法精准预测油气产量有着重要的实际意义。现阶段油气产量的预测模型主要集中在统计模型和机器学习模型上,各种单一模型较多,单一的统计模型和机器学习预测模型在反映数据信息上有限,对数据中的信息提取不够完整,预测精度还有提升空间。
发明内容
本申请旨在解决或改善单一模型预测效果精度低的问题。
为此,本申请的第一目的在于提供一种基于多变量的加权组合模型的油气产量预测方法。
本申请的第二目的在于提供一种基于多变量的加权组合模型的油气产量预测系统。
为实现本申请的第一目的,本发明第一方面的技术方案提供了一种基于多变量的加权组合模型的油气产量预测方法,包括:获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;对测试集进行差分平稳处理;将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;建立多元回归模型,将训练集作为输入对多元回归模型进行训练;将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;根据第一预测值、第二预测值和权重系数得出预测结果。
根据本申请提供的基于多变量的加权组合模型的油气产量预测方法,首先获取生产数据,对生产数据进行预处理。对预处理后的生产数据,划分出训练集和测试集。然后建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练。对测试集进行差分平稳处理,把测试集进行差分,转化成平稳的数据进行预测,预测效果较好,减轻了门控循环单元神经网络预测模型预测时间序列数据的滞后性。对于数据中的波动能较好的捕捉到。将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值。建立多元回归模型,将训练集作为输入对多元回归模型进行训练,将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值。多元回归模型对于数据中的波动可较好捕捉,可有效预测油气产量。然后通过算术平均法、误差方差加权平均、相对误差倒数法、最优加权或综合权重计算门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,根据第一预测值、第二预测值、门控循环单元神经网络预测模型权重系数和多元回归模型权重系数计算出预测结果。通过门控循环单元神经网络预测模型和多元回归模型加权组合预测油气产量,比多元回归模型和门控循环单元神经网络预测模型单一模型的预测精度高,预测效果较好。
另外,本申请提供的技术方案还可以具有如下附加技术特征:
上述技术方案中,误差方差加权平均的计算公式为:
Figure 100002_DEST_PATH_IMAGE001
其中,
Figure 838027DEST_PATH_IMAGE002
为单一模型个数,
Figure 100002_DEST_PATH_IMAGE003
表示第
Figure 69288DEST_PATH_IMAGE003
个单一模型,
Figure 421510DEST_PATH_IMAGE004
表示该模型在误差方差排序后的序号,
Figure 100002_DEST_PATH_IMAGE005
为第
Figure 486549DEST_PATH_IMAGE003
个模型的权重。
在该技术方案中,误差方差加权平均方法在确定权重时是根据误差的方差大小来决定的。模型的权重与误差方差成反比,误差方差越大,权重就越小,误差方差越小,权重就越大。在确定模型权重时,首先计算各模型误差的方差,再对方差进行排序。通过误差方差加权平均计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
上述技术方案中,相对误差倒数法的计算公式为:
Figure 183110DEST_PATH_IMAGE006
其中,
Figure 421324DEST_PATH_IMAGE002
为单一模型个数,
Figure 100002_DEST_PATH_IMAGE007
为第
Figure 424790DEST_PATH_IMAGE003
个模型的相对误差,
Figure 191889DEST_PATH_IMAGE005
为第
Figure 110166DEST_PATH_IMAGE003
个模型的权重。
在该技术方案中,相对误差倒数法就是利用模型的相对误差来确定组合模型的加权权重,通过误相对误差倒数法计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
上述技术方案中,最优加权的计算公式为:
Figure 152072DEST_PATH_IMAGE008
Figure 100002_DEST_PATH_IMAGE009
其中,
Figure 150989DEST_PATH_IMAGE010
为权重向量,
Figure 557831DEST_PATH_IMAGE002
为单一模型个数,
Figure 100002_DEST_PATH_IMAGE011
为误差矩阵,
Figure 635509DEST_PATH_IMAGE012
Figure 100002_DEST_PATH_IMAGE013
Figure 917323DEST_PATH_IMAGE014
的转置矩阵,
Figure 100002_DEST_PATH_IMAGE015
为误差平方和。
在该技术方案中,最优加权组合模型是根据某个优化原则构建目标函数,满足某约束条件下的最优化问题。具体地,可以以组合模型的误差平方和为优化目标,在满足模型权重之和等于1的条件下,进行求解。通过最优加权计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
上述技术方案中,综合权重的计算公式为:
Figure 865688DEST_PATH_IMAGE016
其中,
Figure 100002_DEST_PATH_IMAGE017
是第
Figure 36906DEST_PATH_IMAGE003
个模型的最终权重,
Figure 38098DEST_PATH_IMAGE018
是第
Figure 280860DEST_PATH_IMAGE003
个模型用相对误差倒数法确定的权重,
Figure 100002_DEST_PATH_IMAGE019
是第
Figure 349310DEST_PATH_IMAGE003
个模型用最优加权法确定的权重。
在该技术方案中,综合权重通过相对误差倒数法和最优组合两种确定权重的方法进行组合。相对误差倒数是一种非最优加权的方法,一定程度上来讲它是一种信息粗略加工组合,是从平均的角度组合多种模型,不能反应每个数据对模型的贡献。最优加权组合在理论上是最优的,但是也存在把误差放大的缺陷。所以把这两种选择权重的方法进一步组合,将会得到预测精度更高的模型。
上述技术方案中,生产数据包括自变量和因变量,自变量包括日返排液、套压、油压、输压、返排率和水气比,因变量包括日产气。
在该技术方案中,生产数据包括自变量和因变量,自变量包括日返排液、套压、油压、输压、返排率和水气比,因变量包括日产气。可以理解,在影响油气产量的因素中,可以选择累产气、日返排液、累排液、套压、油压、输压、返排率和水气比8个变量为影响变量,日产气作为预测变量。返排率是由日产气和累排液确定的,累产气和累排液只是日产气和日返排液的累加,所以选择返排率作为自变量,去掉累产气和累排液。最终,选出日返排液、套压、油压、输压、水气比和返排率这6个变量为输入变量。
上述技术方案中,基于多变量的加权组合模型的油气产量预测方法还包括:通过指标评价模型对第一预测值、第二预测值、预测结果进行评估,指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
在该技术方案中,基于多变量的加权组合模型的油气产量预测方法还包括通过指标评价模型对第一预测值、第二预测值、预测结果进行评估。其中,指标评价模型包括均方误差、平均绝对误差或平均相对误差。具体地,多元回归模型和门控循环单元神经网络预测模型的五种加权组合模型的均方误差、平均绝对误差和平均相对误差均小于单个多元回归模型和门控循环单元神经网络预测模型,所以加权组合模型的预测精度比单一模型高。
上述技术方案中,门控循环单元神经网络预测模型为:
Figure 894692DEST_PATH_IMAGE020
Figure 100002_DEST_PATH_IMAGE021
Figure 415803DEST_PATH_IMAGE022
Figure 100002_DEST_PATH_IMAGE023
其中,
Figure 101737DEST_PATH_IMAGE024
为重置门输入权重,
Figure 100002_DEST_PATH_IMAGE025
为重置门循环权重,
Figure 290273DEST_PATH_IMAGE026
为重置门偏差,
Figure 100002_DEST_PATH_IMAGE027
为候选状态输入权重,
Figure 537715DEST_PATH_IMAGE028
为候选状态循环权重,
Figure 100002_DEST_PATH_IMAGE029
为候选状态偏差,
Figure 546122DEST_PATH_IMAGE030
为更新门输入权重,
Figure 100002_DEST_PATH_IMAGE031
为更新门循环权重,
Figure 301327DEST_PATH_IMAGE032
为更新门偏差,
Figure 100002_DEST_PATH_IMAGE033
为重置门,
Figure 78790DEST_PATH_IMAGE034
为更新门,
Figure 100002_DEST_PATH_IMAGE035
为在时间步
Figure 497133DEST_PATH_IMAGE036
处的输入向量,
Figure 100002_DEST_PATH_IMAGE037
Figure 727257DEST_PATH_IMAGE036
时刻的候选状态,
Figure 223835DEST_PATH_IMAGE038
为当前隐藏状态,
Figure 100002_DEST_PATH_IMAGE039
为来自上一个单元的输出,
Figure 793488DEST_PATH_IMAGE040
为激活函数。
在该技术方案中,门控循环单元神经网络预测模型包括两个门,即更新门和重置门,用以跟踪序列的状态。更新门负责控制过去信息和添加了多少新的信息。另一方面,重置门控制着过去状态对当前状态的贡献程度。与长短期神经记忆网络相比,门控循环单元神经网络预测模型的一个显著特点是,它不需要内部内存单元,而用隐藏状态传递信息,在这种情况下依然能捕获长时间序列的依赖关系,这种结构可以有效解决梯度消失的问题。其中,
Figure 241787DEST_PATH_IMAGE033
表示重置门,
Figure 129846DEST_PATH_IMAGE034
表示更新门,
Figure 197159DEST_PATH_IMAGE035
是在时间步
Figure 683635DEST_PATH_IMAGE036
处的输入向量,
Figure 568415DEST_PATH_IMAGE037
Figure 507552DEST_PATH_IMAGE036
时刻的候选状态,
Figure 142670DEST_PATH_IMAGE038
为当前隐藏状态,
Figure 218074DEST_PATH_IMAGE039
是来自上一个单元的输出。重置门决定了应该忘记多少过去的信息,它与当前时刻的输入值和上一时刻隐藏状态有关。新的记忆触点使用重置门来存储先前状态的信息。重置门决定了当前的候选状态
Figure 8175DEST_PATH_IMAGE037
和上一时刻的隐藏状态
Figure 700188DEST_PATH_IMAGE039
之间的依赖关系。更新门决定应从当前状态和之前的状态中收集什么信息,它的操作方式与长短期神经记忆网络中的忘记门和输入门相似。新的输入值乘以它的权重值,前一个时间步长的隐藏状态乘以循环权重值,然后两者加和后用sigmoid函数映射。当前时刻新的隐藏状态应存储在最终内存中,作为当前时刻的输出。当前隐藏状态
Figure 843724DEST_PATH_IMAGE038
一部分来自前一时刻的隐藏状态,一部分来自当前时刻候选状态。
上述技术方案中,多元线性回归模型为:
Figure 100002_DEST_PATH_IMAGE041
多元非线性回归模型为:
Figure 357923DEST_PATH_IMAGE042
其中,
Figure 100002_DEST_PATH_IMAGE043
是因变量,
Figure 866396DEST_PATH_IMAGE044
为变换函数,
Figure 100002_DEST_PATH_IMAGE045
是自变量,
Figure 45705DEST_PATH_IMAGE046
是偏回归系数,
Figure 100002_DEST_PATH_IMAGE047
是随机误差。
在该技术方案中,多元回归是研究多个影响因素和因变量之间关系的一种模型。当多个自变量都与因变量呈线性关系时,所进行的回归分析就是多元线性回归。通过多元线性回归模型能够进行油气产量预测。如果自变量与因变量具有非线性关系,或者有的为线性有的为非线性,此时就应该建立多元非线性回归方程。对于一些非线性回归,可设法确定各变量的函数形式,通过变量变换,转化成线性回归模型进行求解。通过多元非线性回归模型能够进行油气产量预测。
为实现本申请的第二目的,本申请第二方面的技术方案提供了一种基于多变量的加权组合模型的油气产量预测系统,包括:获取模块,用于获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;第一模型建立模块,用于建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;数据处理模块,用于对测试集进行差分平稳处理;第一模型预测模块,用于将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;第二模型建立模块,用于建立多元回归模型,将训练集作为输入对多元回归模型进行训练;第二模型预测模块,用于将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;权重计算模块,用于计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;综合预测结果模块,用于根据第一预测值、第二预测值和权重系数得出预测结果。
根据本申请提供的基于多变量的加权组合模型的油气产量预测系统,包括获取模块、第一模型建立模块、数据处理模块、第一模型预测模块、第二模型建立模块、第二模型预测模块、权重计算模块和综合预测结果模块。其中,获取模块用于获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集。第一模型建立模块用于建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练。数据处理模块用于对测试集进行差分平稳处理。第一模型预测模块用于将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值。第二模型建立模块用于建立多元回归模型,将训练集作为输入对多元回归模型进行训练。第二模型预测模块用于将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值。权重计算模块用于计算门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重。综合预测结果模块用于根据第一预测值、第二预测值和权重系数得出预测结果。通过门控循环单元神经网络预测模型和多元回归模型加权组合预测油气产量,比多元回归模型和门控循环单元神经网络预测模型单一模型的预测精度高,预测效果较好。
本申请的附加方面和优点将在下面的描述部分中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的基于多变量的加权组合模型的油气产量预测方法的步骤流程图;
图2为本申请一个实施例的基于多变量的加权组合模型的油气产量预测方法的步骤流程图;
图3为本申请一个实施例的基于多变量的加权组合模型的油气产量预测系统的结构示意框图;
图4为本申请另一个实施例的基于多变量的加权组合模型的油气产量预测系统的结构示意框图;
图5为本申请一个实施例的电子设备的硬件结构示意图。
其中,图3至图5中的附图标记与部件名称之间的对应关系为:
10:基于多变量的加权组合模型的油气产量预测系统;110:获取模块;120:第一模型建立模块;130:数据处理模块;140:第一模型预测模块;150:第二模型建立模块;160:第二模型预测模块;170:权重计算模块;180:综合预测结果模块;300:存储器;400:处理器;1100:电子设备;1101:射频单元;1102:网络模块;1103:音频输出单元;1104:输入单元;11041:图形处理器;11042:麦克风;1105:传感器;1106:显示单元;11061:显示面板;1107:用户输入单元;11071:触控面板;11072:其他输入设备;1108:接口单元;1109:存储器;1110:处理器。
具体实施方式
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
下面参照图1至图5描述本申请一些实施例的基于多变量的加权组合模型的油气产量预测方法及系统。
如图1所示,根据本发明提出的一个实施例的基于多变量的加权组合模型的油气产量预测方法,包括以下步骤:
步骤S102:获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;
步骤S104:建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;
步骤S106:对测试集进行差分平稳处理;
步骤S108:将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;
步骤S110:建立多元回归模型,将训练集作为输入对多元回归模型进行训练;
步骤S112:将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;
步骤S114:计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;
步骤S116:根据第一预测值、第二预测值和权重系数得出预测结果。
根据本实施例提供的基于多变量的加权组合模型的油气产量预测方法,首先获取生产数据,对生产数据进行预处理。对预处理后的生产数据,划分出训练集和测试集。然后建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练。对测试集进行差分平稳处理,把测试集进行差分,转化成平稳的数据进行预测,预测效果较好,减轻了门控循环单元神经网络预测模型预测时间序列数据的滞后性。对于数据中的波动能较好的捕捉到。将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值。建立多元回归模型,将训练集作为输入对多元回归模型进行训练,将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值。多元回归模型对于数据中的波动可较好捕捉,可有效预测油气产量。然后通过算术平均法、误差方差加权平均、相对误差倒数法、最优加权或综合权重计算门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,根据第一预测值、第二预测值、门控循环单元神经网络预测模型权重系数和多元回归模型权重系数计算出预测结果。通过门控循环单元神经网络预测模型和多元回归模型加权组合预测油气产量,比多元回归模型和门控循环单元神经网络预测模型单一模型的预测精度高,预测效果较好。
其中,生产数据包括自变量和因变量,自变量包括日返排液、套压、油压、输压、返排率和水气比,因变量包括日产气。可以理解,在影响油气产量的因素中,可以选择累产气、日返排液、累排液、套压、油压、输压、返排率和水气比8个变量为影响变量,日产气作为预测变量。返排率是由日产气和累排液确定的,累产气和累排液只是日产气和日返排液的累加,所以选择返排率作为自变量,去掉累产气和累排液。最终,选出日返排液、套压、油压、输压、水气比和返排率这6个变量为输入变量。
在一些实施例中,通过误差方差加权平均计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,误差方差加权平均的计算公式为:
Figure 553784DEST_PATH_IMAGE001
其中,
Figure 869359DEST_PATH_IMAGE002
为单一模型个数,
Figure 876629DEST_PATH_IMAGE003
表示第
Figure 277655DEST_PATH_IMAGE003
个单一模型,
Figure 153207DEST_PATH_IMAGE004
表示该模型在误差方差排序后的序号,
Figure 821824DEST_PATH_IMAGE005
为第
Figure 999995DEST_PATH_IMAGE003
个模型的权重。误差方差加权平均方法在确定权重时是根据误差的方差大小来决定的。模型的权重与误差方差成反比,误差方差越大,权重就越小,误差方差越小,权重就越大。在确定模型权重时,首先计算各模型误差的方差,再对方差进行排序。通过误差方差加权平均计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
在一些实施例中,通过相对误差倒数法计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,相对误差倒数法的计算公式为:
Figure 747371DEST_PATH_IMAGE006
其中,
Figure 301980DEST_PATH_IMAGE002
为单一模型个数,
Figure 592148DEST_PATH_IMAGE007
为第
Figure 705335DEST_PATH_IMAGE003
个模型的相对误差,
Figure 815373DEST_PATH_IMAGE005
为第
Figure 439253DEST_PATH_IMAGE003
个模型的权重。相对误差倒数法就是利用模型的相对误差来确定组合模型的加权权重,通过误相对误差倒数法计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
在一些实施例中,通过最优加权计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,最优加权的计算公式为:
Figure 442981DEST_PATH_IMAGE008
Figure 697376DEST_PATH_IMAGE009
其中,
Figure 153765DEST_PATH_IMAGE010
为权重向量,
Figure 283133DEST_PATH_IMAGE002
为单一模型个数,
Figure 282313DEST_PATH_IMAGE011
为误差矩阵,
Figure 97822DEST_PATH_IMAGE012
Figure 182452DEST_PATH_IMAGE013
Figure 476031DEST_PATH_IMAGE014
的转置矩阵,
Figure 329717DEST_PATH_IMAGE015
为误差平方和。具体地,可以以组合模型的误差平方和为优化目标,在满足模型权重之和等于1的条件下,进行求解。通过最优加权计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
在另一些实施例中,通过综合权重计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,综合权重的计算公式为:
Figure 690029DEST_PATH_IMAGE016
其中,
Figure 121010DEST_PATH_IMAGE017
是第
Figure 93646DEST_PATH_IMAGE003
个模型的最终权重,
Figure 660893DEST_PATH_IMAGE018
是第
Figure 959150DEST_PATH_IMAGE003
个模型用相对误差倒数法确定的权重,
Figure 877428DEST_PATH_IMAGE019
是第
Figure 388175DEST_PATH_IMAGE003
个模型用最优加权法确定的权重。综合权重通过相对误差倒数法和最优组合两种确定权重的方法进行组合。相对误差倒数是一种非最优加权的方法,一定程度上来讲它是一种信息粗略加工组合,是从平均的角度组合多种模型,不能反应每个数据对模型的贡献。最优加权组合在理论上是最优的,但是也存在把误差放大的缺陷。所以把这两种选择权重的方法进一步组合,将会得到预测精度更高的模型。
在上述实施例中,多元线性回归模型为:
Figure 75508DEST_PATH_IMAGE041
其中,
Figure 777623DEST_PATH_IMAGE043
是因变量,
Figure 917617DEST_PATH_IMAGE045
是自变量,
Figure 497634DEST_PATH_IMAGE046
是偏回归系数,
Figure 39474DEST_PATH_IMAGE047
是随机误差,
Figure 413954DEST_PATH_IMAGE048
。多元回归是研究多个影响因素和因变量之间关系的一种模型。当多个自变量都与因变量呈线性关系时,所进行的回归分析就是多元线性回归。通过多元线性回归模型能够进行油气产量预测。
在上述实施例中,多元非线性回归模型为:
Figure 41245DEST_PATH_IMAGE042
其中,
Figure 893794DEST_PATH_IMAGE043
是因变量,
Figure 555720DEST_PATH_IMAGE044
为变换函数,
Figure 865216DEST_PATH_IMAGE045
是自变量,
Figure DEST_PATH_IMAGE049
是随机误差,
Figure 651907DEST_PATH_IMAGE048
。如果自变量与因变量具有非线性关系,或者有的为线性有的为非线性,此时就应该建立多元非线性回归方程。对于一些非线性回归,可设法确定各变量的函数形式,通过变量变换,转化成线性回归模型进行求解。通过多元非线性回归模型能够进行油气产量预测。
在一些实施例中,门控循环单元神经网络预测模型为:
Figure 308147DEST_PATH_IMAGE020
Figure 824579DEST_PATH_IMAGE021
Figure 540862DEST_PATH_IMAGE022
Figure 142745DEST_PATH_IMAGE023
其中,
Figure 101211DEST_PATH_IMAGE024
为重置门输入权重,
Figure 472150DEST_PATH_IMAGE025
为重置门循环权重,
Figure 624914DEST_PATH_IMAGE026
为重置门偏差,
Figure 323879DEST_PATH_IMAGE027
为候选状态输入权重,
Figure 712135DEST_PATH_IMAGE028
为候选状态循环权重,
Figure 812946DEST_PATH_IMAGE029
为候选状态偏差,
Figure 995666DEST_PATH_IMAGE030
为更新门输入权重,
Figure 211622DEST_PATH_IMAGE031
为更新门循环权重,
Figure 137989DEST_PATH_IMAGE032
为更新门偏差,
Figure 93307DEST_PATH_IMAGE033
为重置门,
Figure 712507DEST_PATH_IMAGE034
为更新门,
Figure 386065DEST_PATH_IMAGE035
为在时间步
Figure 850544DEST_PATH_IMAGE036
处的输入向量,
Figure 925948DEST_PATH_IMAGE037
Figure 716049DEST_PATH_IMAGE036
时刻的候选状态,
Figure 375439DEST_PATH_IMAGE038
为当前隐藏状态,
Figure 784554DEST_PATH_IMAGE039
为来自上一个单元的输出,
Figure 839098DEST_PATH_IMAGE040
为激活函数。
具体地,门控循环单元神经网络预测模型包括两个门,即更新门和重置门,用以跟踪序列的状态。更新门负责控制过去信息和添加了多少新的信息。另一方面,重置门控制着过去状态对当前状态的贡献程度。与长短期神经记忆网络相比,门控循环单元神经网络预测模型的一个显著特点是,它不需要内部内存单元,而用隐藏状态传递信息,在这种情况下依然能捕获长时间序列的依赖关系,这种结构可以有效解决梯度消失的问题。其中,
Figure 409888DEST_PATH_IMAGE033
表示重置门,
Figure 182672DEST_PATH_IMAGE034
表示更新门,
Figure 395478DEST_PATH_IMAGE035
是在时间步
Figure 304528DEST_PATH_IMAGE036
处的输入向量,
Figure 810334DEST_PATH_IMAGE037
Figure 804835DEST_PATH_IMAGE036
时刻的候选状态,
Figure 821332DEST_PATH_IMAGE038
为当前隐藏状态,
Figure 725834DEST_PATH_IMAGE039
是来自上一个单元的输出。重置门决定了应该忘记多少过去的信息,它与当前时刻的输入值和上一时刻隐藏状态有关。新的记忆触点使用重置门来存储先前状态的信息。重置门决定了当前的候选状态
Figure 763060DEST_PATH_IMAGE037
和上一时刻的隐藏状态
Figure 385803DEST_PATH_IMAGE039
之间的依赖关系。更新门决定应从当前状态和之前的状态中收集什么信息,它的操作方式与长短期神经记忆网络中的忘记门和输入门相似。新的输入值乘以它的权重值,前一个时间步长的隐藏状态乘以循环权重值,然后两者加和后用sigmoid函数映射。当前时刻新的隐藏状态应存储在最终内存中,作为当前时刻的输出。当前隐藏状态
Figure 799467DEST_PATH_IMAGE038
一部分来自前一时刻的隐藏状态,一部分来自当前时刻候选状态。
在上述实施例中,生产数据中有很多的缺失值,这些异常数据在建模之前应进行预处理,否则会影响分析结果。预处理包括处理缺失值、异常值和归一化等环节。处理缺失值的方法有很多,如直接删除法、均值中位数填充法和线性插值等。处理完缺失值后,考虑数据中是否有离群值,这种异常值如果不处理会对模型的预测精度产生影响。首先把处理缺失值后的原始数据可视化,把不在3
Figure 322590DEST_PATH_IMAGE040
范围内的样本判定为异常值。由于每个变量的量纲不同,为了模型预测的准确性,需要进行数据去量纲归一化处理。归一化的方法有很多,如线性归一化、标准差归一化等。
如图2所示,根据本发明提出的另一个实施例的基于多变量的加权组合模型的油气产量预测方法,包括以下步骤:
步骤S202:获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;
步骤S204:建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;
步骤S206:对测试集进行差分平稳处理;
步骤S208:将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;
步骤S210:建立多元回归模型,将训练集作为输入对多元回归模型进行训练;
步骤S212:将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;
步骤S214:计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;
步骤S216:根据第一预测值、第二预测值和权重系数得出预测结果;
步骤S218:通过指标评价模型对第一预测值、第二预测值、预测结果进行评估,指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
在该实施例中,基于多变量的加权组合模型的油气产量预测方法还包括通过指标评价模型对第一预测值、第二预测值、预测结果进行评估。其中,指标评价模型包括均方误差、平均绝对误差或平均相对误差。具体地,多元回归模型和门控循环单元神经网络预测模型的五种加权组合模型的均方误差、平均绝对误差和平均相对误差均小于单个多元回归模型和门控循环单元神经网络预测模型,所以加权组合模型的预测精度比单一模型高。
如图3所示,本申请第二方面的实施例提供了一种基于多变量的加权组合模型的油气产量预测系统10,包括:获取模块110,用于获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;第一模型建立模块120,用于建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;数据处理模块130,用于对测试集进行差分平稳处理;第一模型预测模块140,用于将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;第二模型建立模块150,用于建立多元回归模型,将训练集作为输入对多元回归模型进行训练;第二模型预测模块160,用于将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;权重计算模块170,用于计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;综合预测结果模块180,用于根据第一预测值、第二预测值和权重系数得出预测结果。
在该实施例中,基于多变量的加权组合模型的油气产量预测系统10包括获取模块110、第一模型建立模块120、数据处理模块130、第一模型预测模块140、第二模型建立模块150、第二模型预测模块160、权重计算模块170和综合预测结果模块180。其中,获取模块110用于获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集。第一模型建立模块120用于建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练。数据处理模块130用于对测试集进行差分平稳处理。第一模型预测模块140用于将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值。第二模型建立模块150用于建立多元回归模型,将训练集作为输入对多元回归模型进行训练。第二模型预测模块160用于将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值。权重计算模块170用于计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重。综合预测结果模块180用于根据第一预测值、第二预测值和权重系数得出预测结果。通过门控循环单元神经网络预测模型和多元回归模型加权组合预测油气产量,比多元回归模型和门控循环单元神经网络预测模型单一模型的预测精度高,预测效果较好。
如图4所示,本申请第三方面的实施例提供了一种基于多变量的加权组合模型的油气产量预测系统10,包括:存储器300和处理器400,其中,存储器300上存储有可在处理器400上运行的程序或指令,处理器400执行程序或指令时实现上述方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
如图5所示,举例来说,基于多变量的加权组合模型的油气产量预测系统10可以通过电子设备1100实现,电子设备1100包括但不限于:射频单元1101、网络模块1102、音频输出单元1103、输入单元1104、传感器1105、显示单元1106、用户输入单元1107、接口单元1108、存储器1109、以及处理器1110等部件。
本领域技术人员可以理解,电子设备1100还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器1110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器1110用于执行指令或程序,实现以下处理过程:
获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;
建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;
对测试集进行差分平稳处理;
将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;
建立多元回归模型,将训练集作为输入对多元回归模型进行训练;
将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;
计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;
根据第一预测值、第二预测值和权重系数得出预测结果。
本申请通过门控循环单元神经网络预测模型和多元回归模型加权组合比多元回归模型和门控循环单元神经网络预测模型单一模型的预测精度高,预测效果较好。
本申请实施例提供的处理器1110可以实现上述基于多变量的加权组合模型的油气产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解的是,本申请实施例中,输入单元1104可以包括图形处理器(GraphicsProcessing Unit,GPU)11041和麦克风11042,图形处理器11041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1106可包括显示面板11061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板11061。用户输入单元1107包括触控面板11071以及其他输入设备11072中的至少一种。触控面板11071,也称为触摸屏。触控面板11071可包括触摸检测装置和触摸控制器两个部分。其他输入设备11072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器1109可用于存储软件程序以及各种数据。存储器1109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器1109可以包括易失性存储器或非易失性存储器,或者,存储器1109可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器1109包括但不限于这些和任意其它适合类型的存储器。
处理器1110可包括一个或多个处理单元;可选的,处理器1110集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器1110中。
本申请第四方面的实施例提供了一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述基于多变量的加权组合模型的油气产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的基于多变量的加权组合模型的油气产量预测系统中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述基于多变量的加权组合模型的油气产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述基于多变量的加权组合模型的油气产量预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
在本申请中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
本申请的描述中,需要理解的是,术语“上”、“下”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本申请的限制。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于多变量的加权组合模型的油气产量预测方法,其特征在于,包括:
获取生产数据,对所述生产数据进行预处理,对预处理后的所述生产数据,划分出训练集和测试集;
建立门控循环单元神经网络预测模型,将所述训练集作为输入对所述门控循环单元神经网络预测模型进行训练;
对所述测试集进行差分平稳处理;
将差分平稳处理后的所述测试集作为输入,通过训练后的所述门控循环单元神经网络预测模型进行预测,得到第一预测值;
建立多元回归模型,将所述训练集作为输入对所述多元回归模型进行训练;
将所述测试集作为输入对训练后的所述多元回归模型进行测试,得到第二预测值;
计算权重系数,所述权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,所述权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;
根据所述第一预测值、所述第二预测值和所述权重系数得出预测结果。
2.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述误差方差加权平均的计算公式为:
Figure DEST_PATH_IMAGE001
其中,
Figure 629467DEST_PATH_IMAGE002
为单一模型个数,
Figure DEST_PATH_IMAGE003
表示第
Figure 484291DEST_PATH_IMAGE003
个单一模型,
Figure 670553DEST_PATH_IMAGE004
表示该模型在误差方差排序后的序号,
Figure DEST_PATH_IMAGE005
为第
Figure 439663DEST_PATH_IMAGE003
个模型的权重。
3.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述相对误差倒数法的计算公式为:
Figure 785194DEST_PATH_IMAGE006
其中,
Figure 14181DEST_PATH_IMAGE002
为单一模型个数,
Figure DEST_PATH_IMAGE007
为第
Figure 484477DEST_PATH_IMAGE003
个模型的相对误差,
Figure 214535DEST_PATH_IMAGE005
为第
Figure 289939DEST_PATH_IMAGE003
个模型的权重。
4.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述最优加权的计算公式为:
Figure 814461DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
其中,
Figure 145954DEST_PATH_IMAGE010
为权重向量,
Figure 414124DEST_PATH_IMAGE002
为单一模型个数,
Figure DEST_PATH_IMAGE011
为误差矩阵,
Figure 875193DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
Figure 508299DEST_PATH_IMAGE014
的转置矩阵,
Figure DEST_PATH_IMAGE015
为误差平方和。
5.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述综合权重的计算公式为:
Figure 186143DEST_PATH_IMAGE016
其中,
Figure DEST_PATH_IMAGE017
是第
Figure 398950DEST_PATH_IMAGE003
个模型的最终权重,
Figure 448945DEST_PATH_IMAGE018
是第
Figure 315270DEST_PATH_IMAGE003
个模型用相对误差倒数法确定的权重,
Figure DEST_PATH_IMAGE019
是第
Figure 981875DEST_PATH_IMAGE003
个模型用最优加权法确定的权重。
6.根据权利要求1至5中任一项所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述生产数据包括自变量和因变量,所述自变量包括日返排液、套压、油压、输压、返排率和水气比,所述因变量包括日产气。
7.根据权利要求1至5中任一项所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述基于多变量的加权组合模型的油气产量预测方法还包括:
通过指标评价模型对所述第一预测值、所述第二预测值、所述预测结果进行评估,所述指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
8.根据权利要求1至5中任一项所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述门控循环单元神经网络预测模型为:
Figure 965749DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
Figure 666989DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE023
其中,
Figure 376319DEST_PATH_IMAGE024
为重置门输入权重,
Figure DEST_PATH_IMAGE025
为重置门循环权重,
Figure 264640DEST_PATH_IMAGE026
为重置门偏差,
Figure DEST_PATH_IMAGE027
为候选状态输入权重,
Figure 989889DEST_PATH_IMAGE028
为候选状态循环权重,
Figure DEST_PATH_IMAGE029
为候选状态偏差,
Figure 280056DEST_PATH_IMAGE030
为更新门输入权重,
Figure DEST_PATH_IMAGE031
为更新门循环权重,
Figure 160287DEST_PATH_IMAGE032
为更新门偏差,
Figure DEST_PATH_IMAGE033
为重置门,
Figure 300019DEST_PATH_IMAGE034
为更新门,
Figure DEST_PATH_IMAGE035
为在时间步
Figure 923898DEST_PATH_IMAGE036
处的输入向量,
Figure DEST_PATH_IMAGE037
Figure 334151DEST_PATH_IMAGE036
时刻的候选状态,
Figure 854125DEST_PATH_IMAGE038
为当前隐藏状态,
Figure DEST_PATH_IMAGE039
为来自上一个单元的输出,
Figure 215574DEST_PATH_IMAGE040
为激活函数。
9.根据权利要求1至5中任一项所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述多元回归模型包括多元线性回归模型和多元非线性回归模型,所述多元线性回归模型为:
Figure DEST_PATH_IMAGE041
所述多元非线性回归模型为:
Figure 377565DEST_PATH_IMAGE042
其中,
Figure DEST_PATH_IMAGE043
是因变量,
Figure 376745DEST_PATH_IMAGE044
为变换函数,
Figure DEST_PATH_IMAGE045
是自变量,
Figure 864359DEST_PATH_IMAGE046
是偏回归系数,
Figure DEST_PATH_IMAGE047
是随机误差。
10.一种基于多变量的加权组合模型的油气产量预测系统,其特征在于,包括:
获取模块(110),用于获取生产数据,对所述生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;
第一模型建立模块(120),用于建立门控循环单元神经网络预测模型,将所述训练集作为输入对所述门控循环单元神经网络预测模型进行训练;
数据处理模块(130),用于对所述测试集进行差分平稳处理;
第一模型预测模块(140),用于将差分平稳处理后的所述测试集作为输入,通过训练后的所述门控循环单元神经网络预测模型进行预测,得到第一预测值;
第二模型建立模块(150),用于建立多元回归模型,将所述训练集作为输入对所述多元回归模型进行训练;
第二模型预测模块(160),用于将所述测试集作为输入对训练后的所述多元回归模型进行测试,得到第二预测值;
权重计算模块(170),用于计算权重系数,所述权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,所述权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;
综合预测结果模块(180),用于根据所述第一预测值、所述第二预测值和所述权重系数得出预测结果。
CN202211125730.5A 2022-09-16 2022-09-16 基于多变量的加权组合模型的油气产量预测方法及系统 Withdrawn CN115204533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211125730.5A CN115204533A (zh) 2022-09-16 2022-09-16 基于多变量的加权组合模型的油气产量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211125730.5A CN115204533A (zh) 2022-09-16 2022-09-16 基于多变量的加权组合模型的油气产量预测方法及系统

Publications (1)

Publication Number Publication Date
CN115204533A true CN115204533A (zh) 2022-10-18

Family

ID=83573475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211125730.5A Withdrawn CN115204533A (zh) 2022-09-16 2022-09-16 基于多变量的加权组合模型的油气产量预测方法及系统

Country Status (1)

Country Link
CN (1) CN115204533A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116612836A (zh) * 2023-07-19 2023-08-18 福建德尔科技股份有限公司 三氟甲烷生产的尾气量预测方法和系统
CN116956049A (zh) * 2023-09-19 2023-10-27 中国联合网络通信集团有限公司 工业产能预测模型的训练方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399248A (zh) * 2018-03-02 2018-08-14 郑州云海信息技术有限公司 一种时序数据预测方法、装置及设备
CN111667098A (zh) * 2020-05-14 2020-09-15 湖北工业大学 一种基于多模型组合优化的风力电站输出功率预测方法
CN111783356A (zh) * 2020-06-29 2020-10-16 清华大学深圳国际研究生院 一种基于人工智能的石油产量预测方法和装置
CN114925623A (zh) * 2022-07-22 2022-08-19 中国地质大学(北京) 油气藏产量预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399248A (zh) * 2018-03-02 2018-08-14 郑州云海信息技术有限公司 一种时序数据预测方法、装置及设备
CN111667098A (zh) * 2020-05-14 2020-09-15 湖北工业大学 一种基于多模型组合优化的风力电站输出功率预测方法
CN111783356A (zh) * 2020-06-29 2020-10-16 清华大学深圳国际研究生院 一种基于人工智能的石油产量预测方法和装置
CN114925623A (zh) * 2022-07-22 2022-08-19 中国地质大学(北京) 油气藏产量预测方法及系统

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
付峰等: "采油厂油气产量预测模型研究", 《生产力研究》 *
张乐: "油田产量的最优加权组合预测方法", 《统计与决策》 *
张明禄等: "试油层非线性产量预测模型研究", 《西南石油大学学报(自然科学版)》 *
樊纪香等: "BP网络和多元线性回归在产量预测中的应用", 《计算机工程与应用》 *
王俊奇等: "天然气产量预测的优化组合模型及其应用", 《西安石油大学学报(社会科学版)》 *
王涛等: "油田产量多变量预测模型的优化", 《计算机仿真》 *
连志强: "基于深度学习的油井产量预测", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116612836A (zh) * 2023-07-19 2023-08-18 福建德尔科技股份有限公司 三氟甲烷生产的尾气量预测方法和系统
CN116612836B (zh) * 2023-07-19 2023-10-03 福建德尔科技股份有限公司 三氟甲烷生产的尾气量预测方法和系统
CN116956049A (zh) * 2023-09-19 2023-10-27 中国联合网络通信集团有限公司 工业产能预测模型的训练方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN115204533A (zh) 基于多变量的加权组合模型的油气产量预测方法及系统
CN114925623B (zh) 油气藏产量预测方法及系统
Johari et al. Modelling the mechanical behaviour of unsaturated soils using a genetic algorithm-based neural network
CN115204532A (zh) 基于多变量误差修正组合模型的油气产量预测方法及系统
CN111680786B (zh) 一种基于改进权重门控单元的时序预测方法
He et al. Deep learning for efficient stochastic analysis with spatial variability
CN103168278A (zh) 用于分析建筑物操作传感器数据的系统和方法
CN112733997B (zh) 基于woa-lstm-mc的水文时间序列预测优化方法
CN115271196A (zh) 基于改进卡尔曼滤波的油气藏产量预测方法及系统
Tsioulou et al. Hazard‐compatible modification of stochastic ground motion models
CN117235510A (zh) 节理粗糙度预测方法与节理粗糙度预测模型训练方法
Salami et al. Building energy loads prediction using bayesian-based metaheuristic optimized-explainable tree-based model
CN117934035A (zh) 一种房建工程造价预估方法、装置及存储介质
Aminian et al. New design equations for assessment of load carrying capacity of castellated steel beams: a machine learning approach
CN115204534B (zh) 基于单变量的分阶段组合模型的油气产量预测方法及系统
Syaputra The Implementation of Support Vector Machine Method with Genetic Algorithm in Predicting Energy Consumption for Reinforced Concrete Buildings
CN112184037B (zh) 一种基于加权svdd的多模态过程故障检测方法
CN114140158A (zh) 基于组合预测的配电网投资需求确定方法、装置、设备及存储介质
CN112581250B (zh) 模型生成方法、装置、计算机设备和存储介质
Gao et al. Integrated Deep Neural Networks‐Based Complex System for Urban Water Management
CN114169594A (zh) 一种基于LSTM-LightGBM变权组合模型的瓦斯浓度预测方法
Lu et al. Applying undistorted neural network sensitivity analysis in iris plant classification and construction productivity prediction
Rolland et al. Probabilistic models of profiles for voting by evaluation
Benfenati et al. Validation of the models
Kumar et al. Analysis of Invoice Management System using Regression techniques with improved loss functions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20221018