CN115345352A - 一种基于CNN-Transformer的油井产油量预测方法 - Google Patents

一种基于CNN-Transformer的油井产油量预测方法 Download PDF

Info

Publication number
CN115345352A
CN115345352A CN202210912919.2A CN202210912919A CN115345352A CN 115345352 A CN115345352 A CN 115345352A CN 202210912919 A CN202210912919 A CN 202210912919A CN 115345352 A CN115345352 A CN 115345352A
Authority
CN
China
Prior art keywords
data
cnn
transformer
oil well
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210912919.2A
Other languages
English (en)
Inventor
潘少伟
王树楷
牟昱辉
薛章涛
尹思冉
范文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Shiyou University
Original Assignee
Xian Shiyou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Shiyou University filed Critical Xian Shiyou University
Priority to CN202210912919.2A priority Critical patent/CN115345352A/zh
Publication of CN115345352A publication Critical patent/CN115345352A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Animal Husbandry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Mining & Mineral Resources (AREA)
  • General Health & Medical Sciences (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于CNN‑Transformer的油井产油量预测方法,其特征在于,包括如下步骤:步骤1:输入数据的预处理,得到训练集、测试集;步骤2:建立CNN‑Transformer模型;步骤3:输入训练集进行模型训练;步骤4:输入测试集进行油井产油量预测;该基于CNN‑Transformer模型的油井产油量预测方法,可以将其应用到油井产油量预测任务中,该方法充分地利用了油井开采过程中记录的相关数据信息,并且对原有的油井产油量预测方法进行改进,得到了较好的预测结果。

Description

一种基于CNN-Transformer的油井产油量预测方法
技术领域
本发明属于石油地质中的油井产油量预测技术领域,具体涉及一种基于CNN-Transformer的油井产油量预测方法。
背景技术
石油在工业发展中扮演着重要角色,随着工业的发展,石油需求量随之增加。石油的开采受到诸多方面的影响,开采过程中,在记录油井产量的同时还会记录与之有关的生产信息。这些信息在油井产油量预测中发挥重要作用。
现有的油井产油量预测方法可分为三种:统计学习方法、机器学习方法和深度学习方法。统计学习方法更多的是利用数学模型来预测油井产量,这个方法旨在通过一定的条件把相关生产信息理想化,从而对油井产油量进行预测。在油井生产环境较为复杂、影响因素较多时,无法准确预测油井产量,并且该方法不能满足在不同生产井上的通用性。近年来,机器学习方法在石油地质领域被广泛应用。有研究人员利用支持向量机方法来预油井产油量,但是在数据量较大、生产信息较多时,支持向量机方法效率较低,精确度相对较差,重要的是支持向量机方法无法利用数据间存在的关联。随着深度学习的发展,研究人员利用长短期记忆网络来对油井产油量进行预测,长短期记忆网络可以充分利用生产信息中的时间序列特征。长短期记忆网络在循环神经网络的基础上引入了输入门、遗忘门和输出门,有效避免了在长时间学习时间序列特征时存在的梯度消失和梯度爆炸问题。但是当输入信息较长时长短期记忆网络会出现重要数据信息丢失的现象。
近几年来,Transformer模型被广泛应用在时间序列问题中,Transformer模型中的编码器可以提取输入数据中的时间序列特征,自注意力机制可以提取输入信息中对预测结果影响较大的信息。
发明内容
本发明的目的是解决油井产油量预测精度不足的问题。
为此,本发明提供了一种基于CNN-Transformer的油井产油量预测方法,
包括如下步骤:
步骤1:输入数据的预处理,得到训练集、测试集;
步骤2:建立CNN-Transformer模型;
步骤3:输入训练集进行模型训练;
步骤4:输入测试集进行油井产油量预测。
进一步的,所述步骤1:输入数据的预处理,得到训练集、测试集,包括如下步骤:
步骤201:查找输入数据中是否存在缺失值或者零值,并对缺失值或零值进行平均值填充;
步骤202:利用皮尔逊相关系数查看各属性与油井产量的相关性大小,删除相关性较小的属性;
步骤203:使用最大最小归一化对数据进行归一化处理,公式如(1)所示:
Figure BDA0003774481030000021
式中x′表示输入值的运算结果,x表示输入值,xmin表示数据所在列的最小值,xmax表示数据所在列的最大值;
步骤204:对归一化后的数据进行数据集划分,划分成训练集和测试集。
进一步的,所述步骤3:输入训练集进行模型训练,包括如下步骤:
步骤301:输入训练集数据;
步骤302:利用CNN对输入数据进行特征提取,提取数据中重要的局部特征,得到的数据;
步骤303:将得到的数据输入至池化层,提取卷积后的显著特征;
步骤304:将提取后的数据输入Transformer模型,提取数据中的时间序列信息,并获取到对预测结果影响较大的信息;
步骤305:数据输入回归预测层,进行油井产油量预测。
进一步的,所述步骤4:输入测试集进行油井产油量预测的具体过程是:
步骤401:输入测试集数据;
步骤402:将测试集数据输入到模型中,使用均方根误差、平均绝对误差和平均绝对百分比误差作为评价指标,当测试集在模型中的拟合误差达到要求后,将需要预测油井产油量的数据输入到模型中,得到油井产油量。
进一步的,所述步骤2:建立CNN-Transformer模型主要包括:CNN卷积层、CNN池化层、Transformer层、回归预测层。
本发明提供这种基于CNN-Transformer模型的油井产油量预测方法,可以将其应用到油井产油量预测任务中,该方法充分地利用了石油开采过程中记录的相关数据信息,并且对原有的油井产油量预测方法进行改进,得到了较好的预测结果。
下面结合附图和实施例对本发明做详细说明。
附图说明
图1为基于CNN-Transformer的油井产油量预测方法流程图。
具体实施方式
为进一步阐述本发明达成预定目的所采取的技术手段及功效,以下结合附图及实施例对本发明的具体实施方式、结构特征及其功效,详细说明如下。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
实施例1
本实施例是基于CNN-Transformer的油井产油量预测方法,包括如下步骤:
步骤1:输入数据的预处理,得到训练集、测试集;
步骤2:建立CNN-Transformer模型;
步骤3:输入训练集进行模型训练;
步骤4:输入测试集进行油井产油量预测。
进一步的,所述步骤1:输入数据的预处理,得到训练集、测试集,包括如下步骤:
步骤201:查找输入数据中是否存在缺失值或者零值,并对缺失值或零值进行平均值填充;
步骤202:利用皮尔逊相关系数查看各属性与油井产量的相关性大小,删除相关性较小的属性;
步骤203:使用最大最小归一化对数据进行归一化处理,公式如(1)所示:
Figure BDA0003774481030000051
式中x′表示输入值的运算结果,x表示输入值,xmin表示数据所在列的最小值,xmax表示数据所在列的最大值;
步骤204:对归一化后的数据进行数据集划分,划分成训练集和测试集。
进一步的,所述步骤3:输入训练集进行模型训练,包括如下步骤:
步骤301:输入训练集数据;
步骤302:利用CNN对输入数据进行特征提取,提取数据中重要的局部特征,得到的数据;
步骤303:将得到的数据输入至池化层,提取卷积后的显著特征;
步骤304:将提取后的数据输入Transformer模型,提取数据中的时间序列信息,并获取到对预测结果影响较大的信息;
步骤305:数据输入回归预测层,进行油井产油量预测。
进一步的,所述步骤4:输入测试集进行油井产油量预测的具体过程是:
步骤401:输入测试集数据;
步骤402:将测试集数据输入到模型中,使用均方根误差、平均绝对误差和平均绝对百分比误差作为评价指标,当测试集在模型中的拟合误差达到要求后,将需要预测油井产油量的数据输入到模型中,得到油井产油量。
计算公式为:
Figure BDA0003774481030000061
公式中:yi为预测值,
Figure BDA0003774481030000062
为实际值,n为样本数目。
Figure BDA0003774481030000063
公式中:yi为预测值,
Figure BDA0003774481030000064
为实际值,n为样本数目。
进一步的,所述步骤2:建立CNN-Transformer模型主要包括:CNN卷积层、CNN池化层、Transformer层、回归预测层。
实施例2
本实施例的实验数据来自我国东部某油田采油生产数据,具体包括油层厚度、泵深、日产水量、月产水量、累积产水量、动液面、含水、月产油量、冲程、冲次和日产油量。将日产油量作为预测值,然后利用厚度、泵深、日产水量、月产水量、累积产水量、动液面、含水、月产油量、冲程、冲次和相邻井的相同生产数据作为训练数据,最终一共有6995组训练数据,每组数据的时间序列步长为30,训练过程中的批次大小(batch_size)为50,即训练时每次取出50组数据进行训练。训练集的数据格式为[50,30,8]。实验的模型包含1个卷积层、1个池化层、1个Transformer层和1个回归预测层。卷积层的隐状态为128维,Transformer层中Transformer块为5,模型采用dropout来避免过拟合,dropout设置为0.1,表示丢弃10%的网络节点,迭代次数为50次,每迭代一次使用Adam优化器优化网络模型。
以预测Z2井日产油量为例,训练数据由待预测井的油层厚度、泵深、日产水量、月产水量、累积产水量、动液面、含水、月产油量、冲程、冲次以及相邻井的相同生产数据组成,并且选取多种模型进行实验对比,分别为XGBoost模型、LSTM模型、Transformer模型和CNN_LSTM模型,这些模型均有相同的超参数设置。本实施例采用RMSE和MAE作为预测结果的评价指标,RMSE表示预测值与真实值偏差的平方与观测次数比值的平方根,衡量的是预测值与真实值之间的偏差,并且对数据中的异常值较为敏感;MAE是真实值与预测值的绝对误差的平均值,能表示预测值与真实值之间误差的真实情况。
应用基于CNN-Transformer的油井产油量预测方法对Z2井日产油量预测具体操作过程如下:
步骤101:输入数据的预处理,得到训练集、测试集;
步骤102:建立CNN-Transformer模型;
步骤103:输入训练集进行模型训练;
步骤104:输入测试集进行油井产油量预测。
进一步的,所述步骤101:输入数据的预处理,得到训练集、测试集,首先,查找输入数据中是否存在缺失值或者零值,并对缺失值或零值进行平均值填充;然后,使用皮尔逊相关系数查看各属性与油井产量的相关性,删除相关性小的属性,如月产油量、冲程和冲次;然后,使用最大最小归一化对数据进行归一化处理;将处理完的数据拆分成训练集和测试集,训练集占80%共5356条数据,测试集占20%共1339条数据。
进一步的,所述步骤102:建立CNN-Transformer网络,该网络采用层级堆叠网络结构。第一层为CNN网络层,包含一个一维卷积层和一个最大值池化层,其中一维卷积层卷积核的个数为128个,卷积核大小为128,步长为1,激活函数为ReLU,padding方式选用causal,最大值池化层的池化窗口大小为2,padding方式选用valid,步长为1;第二层为Transformer层;第三层为回归预测层,该层的节点个数为1,整个模型将dropout设置为0.1,来避免过拟合。
进一步的,所述步骤103:输入训练集进行模型训练,
步骤201、输入训练序列数据,训练数据来自我国东部某油田采油生产数据,具体包括油层厚度、泵深、日产水量、月产水量、累积产水量、动液面、含水、月产油量、冲程、冲次和日产油量。将日产油量作为预测值,然后利用厚度、泵深、日产水量、月产水量、累积产水量、动液面、含水、月产油量、冲程、冲次和相邻井的相同生产数据作为训练数据,最终一共有6995组训练数据,每组数据的时间序列步长为30,训练过程中的批次大小(batch_size)为50,即训练时每次取出50组数据进行训练,训练集的数据格式为[50,30,8]。
步骤202、利用CNN对输入数据进行特征提取,提取数据中重要的局部特征;
步骤203:将得到的数据输入至池化层,提取不同卷积映射属性的显著特征;达到进一步过滤信息的作用;
步骤204、将提取后的数据输入Transformer层,提取数据中的时间序列信息,并获取到对预测结果影响较大的信息;
步骤205:数据输入回归预测层,进行油井产油量预测。
进一步的,以上的步骤201至步骤205为一次迭代的训练流程,本实验设置的迭代次数为50次。采用Adam算法来优化网络模型。
进一步的,所述步骤104:输入测试集进行油井产油量预测的具体过程:将测试集数据输入训练好的模型中,会得到与之相对应的油井产油量预测数据,本实验采用RMSE和MAE作为评价指标,利用模型得到预测数据与Z2井中的真实数据可以计算出该模型的RMSE和MAE,当模型对测试集拟合的误差达到要求后将需要预测产油量的数据输入至达到误差要求的模型中,即可得到预测的产油量。
进一步的,不同模型对Z2井的油井产油量预测效果的评价如表1所示,对表1的RMSE和MAE仔细观察可发现:CNN-Transformer模型的RMSE以及MAE均明显小于其他模型的RMSE以及MAE,这表明CNN-Transformer模型的油井产油量预测结果明显优于其他模型的预测结果。因此本实施例提出的方法可以很好地应用于油井产油量预测的任务当中。
表1 Z2号油井产油量产生的RMSE与MAE列表
Figure BDA0003774481030000091
综上所述,该基于CNN-Transformer模型的油井产油量预测方法,可以将其应用到油井产油量预测任务中,该方法充分地利用了石油开采过程中记录的相关数据信息,并且对原有的油井产油量预测方法进行改进,得到了较好的预测结果。
最后需要说明的是本实施例提供的英文缩写的指代如下:
CNN:Convolutional Neural Networks,卷积神经网络;
CNN-Transformer:Convolutional Neural Networks-Transformer,卷积神经网络结合Transformer;
RMSE:Root Mean Square Error,均方根误差;
MAE:Mean Absolute Error,平均绝对误差。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (5)

1.一种基于CNN-Transformer的油井产油量预测方法,其特征在于,
包括如下步骤:
步骤1:输入数据的预处理,得到训练集、测试集;
步骤2:建立CNN-Transformer模型;
步骤3:输入训练集进行模型训练;
步骤4:输入测试集进行油井产油量预测。
2.一种基于CNN-Transformer的油井产油量预测方法,其特征在于:
所述步骤1:输入数据的预处理,得到训练集、测试集,包括如下步骤:
步骤201:查找输入数据中是否存在缺失值或者零值,并对缺失值或零值进行平均值填充;
步骤202:利用皮尔逊相关系数查看各属性与油井产量的相关性大小,删除相关性较小的属性;
步骤203:使用最大最小归一化对数据进行归一化处理,公式如(1)所示:
Figure FDA0003774481020000011
式中x′表示输入值的运算结果,x表示输入值,xmin表示数据所在列的最小值,xmax表示数据所在列的最大值;
步骤204:对归一化后的数据进行数据集划分,划分成训练集和测试集。
3.如权利要求1所述的基于CNN-Transformer的油井产油量预测方法,其特征在于:所述步骤3:输入训练集进行模型训练,包括如下步骤:
步骤301:将训练集数据输入步骤2所述的CNN-Transformer模型中,并设定训练次数为50;
步骤302:利用CNN对输入数据进行特征提取,提取数据中重要的局部特征,得到提取特征后的数据;
步骤303:将步骤302提取特征后的数据输入至池化层,提取卷积后的显著特征;
步骤304:将步骤303中获取的显著特征数据输入Transformer模型,Transformer模型通过其编码器结构提取数据中与时间序列相关的特征;
步骤305:将步骤304中提取时序特征后的数据输入回归预测层,进行油井产油量预测。
4.如权利要求1所述的基于CNN-Transformer的油井产油量预测方法,其特征在于:所述步骤4:输入测试集进行油井产油量预测的具体过程是:
步骤401:输入测试集数据;
步骤402:将测试集数据输入到模型中,使用均方根误差、平均绝对误差和平均绝对百分比误差作为评价指标,当测试集在模型中的拟合误差达到要求后,将需要预测油井产油量的数据输入到模型中,得到油井产油量。
5.如权利要求1所述的基于CNN-Transformer的油井产油量预测方法,其特征在于:所述步骤2:建立CNN-Transformer模型主要包括:CNN卷积层、CNN池化层、Transformer层、回归预测层。第一层为CNN网络层,包含一个一维卷积层和一个最大值池化层,其中一维卷积层卷积核的个数为128个,卷积核大小为128,步长为1,激活函数为ReLU,padding方式选用causal,最大值池化层的池化窗口大小为2,padding方式选用valid,步长为1;第二层为Transformer层;第三层为回归预测层,该层的节点个数为1,整个模型将dropout设置为0.1,来避免过拟合。
CN202210912919.2A 2022-07-31 2022-07-31 一种基于CNN-Transformer的油井产油量预测方法 Pending CN115345352A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210912919.2A CN115345352A (zh) 2022-07-31 2022-07-31 一种基于CNN-Transformer的油井产油量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210912919.2A CN115345352A (zh) 2022-07-31 2022-07-31 一种基于CNN-Transformer的油井产油量预测方法

Publications (1)

Publication Number Publication Date
CN115345352A true CN115345352A (zh) 2022-11-15

Family

ID=83950061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210912919.2A Pending CN115345352A (zh) 2022-07-31 2022-07-31 一种基于CNN-Transformer的油井产油量预测方法

Country Status (1)

Country Link
CN (1) CN115345352A (zh)

Similar Documents

Publication Publication Date Title
CN111144542B (zh) 油井产能预测方法、装置和设备
CN112308269B (zh) 用于低渗透油气藏的产能预测方法及装置
CN114154427B (zh) 基于深度学习的体积压裂裂缝扩展预测方法和系统
CN114154484B (zh) 基于混合深度语义挖掘的施工专业术语库智能构建方法
CN115293197A (zh) 一种基于长短期记忆网络的钻孔应变数据异常检测方法
CN116644284A (zh) 一种地层分类特征因子确定方法、系统、电子设备及介质
CN114819315A (zh) 基于多参数融合健康因子和时间卷积神经网络的轴承退化趋势预测方法
CN116611556A (zh) 一种基于混合神经网络的致密气井单井产量预测方法
CN117708625B (zh) 一种乏数据背景下大坝监测历史数据填补方法
CN115471012A (zh) 一种致密油藏水平井产能预测方法、介质及系统
CN110486008B (zh) 一种径向复合油藏的参数解释方法及系统
CN117578441A (zh) 基于神经网络提高电网负荷预测精度的方法
CN116881640A (zh) 岩心采出程度的预测方法、系统及计算机可读存储介质
CN117037841A (zh) 基于层级过渡网络的声学信号层级空化强度识别方法
CN115345352A (zh) 一种基于CNN-Transformer的油井产油量预测方法
CN116384770A (zh) 一种提液井产量预测方法、系统、设备及介质
CN116244596A (zh) 基于tcn和注意力机制的工业时序数据异常检测方法
CN114862007A (zh) 一种面向碳酸盐岩气井的短周期产气量预测方法及系统
CN111210147B (zh) 基于时序特征提取的烧结过程运行性能评价方法及系统
CN113887049A (zh) 一种基于机器学习的石油钻井的钻速预测方法及系统
WO2024040801A9 (zh) 横波时差预测方法及装置
CN118114812B (zh) 页岩气产量预测方法、计算机设备和存储介质
CN114218862B (zh) 基于hho-rcnn的石油测井油气层识别方法
CN116756619B (zh) 一种基于大数据的设备智能诊断方法及系统
CN118585767A (zh) 一种基于时间LightGBM模型的震级时间序列预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination