CN117349610A - 一种基于时间序列模型的压裂作业多时间步压力预测方法 - Google Patents

一种基于时间序列模型的压裂作业多时间步压力预测方法 Download PDF

Info

Publication number
CN117349610A
CN117349610A CN202311640195.1A CN202311640195A CN117349610A CN 117349610 A CN117349610 A CN 117349610A CN 202311640195 A CN202311640195 A CN 202311640195A CN 117349610 A CN117349610 A CN 117349610A
Authority
CN
China
Prior art keywords
dimension
time
data
matrix
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311640195.1A
Other languages
English (en)
Other versions
CN117349610B (zh
Inventor
钟原
张涛
周静
张小洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202311640195.1A priority Critical patent/CN117349610B/zh
Publication of CN117349610A publication Critical patent/CN117349610A/zh
Application granted granted Critical
Publication of CN117349610B publication Critical patent/CN117349610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B47/00Survey of boreholes or wells
    • E21B47/06Measuring temperature or pressure
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2115Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21BEARTH OR ROCK DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B2200/00Special features related to earth drilling for obtaining oil, gas or water
    • E21B2200/20Computer models or simulations, e.g. for reservoirs under production, drill bits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Mining & Mineral Resources (AREA)
  • Geology (AREA)
  • Environmental & Geological Engineering (AREA)
  • Fluid Mechanics (AREA)
  • Geophysics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于时间序列模型的压裂作业多时间步压力预测方法,包括以下步骤:基于多层感知器构建时间序列模型;利用时间序列模型进行压力预测:将采集的压裂作业数据中的非时间特征进行转化并清洗异常数据,得到标准化数据;利用输入数据的均值对标准化数据进行拆分,实现对输入数据的特征分离;在时间维度上,将提取的特征数据划分为非重叠的长度为n的片段;将片段映射到指定的维度,并与位置编码相加,形成特征编码矩阵,作为编码器的输入;将特征编码矩阵输入时间序列模型,得到井口压力预测结果。本发明利用特征分离模块避免数据集分布偏移。同时,采用改进后的编码器和解码器进行特征提取,降低模型计算复杂度,有效提高预测可靠性。

Description

一种基于时间序列模型的压裂作业多时间步压力预测方法
技术领域
本发明涉及油气井压裂作业下井口压力检测技术领域,具体涉及一种基于时间序列模型的压裂作业多时间步压力预测方法。
背景技术
地层压裂技术是油气开采中常用的方法,通过注入含砂液体改变地层压力,以协助气体开采。在开采过程中,必须严格控制地层压力以预防意外事故。目前,通常采用监控系统以监测压力和其他信息,并通过手动操作来控制压力的变化。然而,由于监控系统与安全事故发生时间存在时间差,当压力急剧变化时,监控系统无法提供足够的缓冲时间来预防安全施工事故。所以,亟需采用更先进和有效的方法来监测和预测地层压力,以确保施工的安全性。
在压裂作业中,采集的数据通常是典型的时间序列数据。目前,时间序列预测技术主要分为基于统计和基于机器学习两类方法。基于统计的方法包括移动平均(MA)模型、自回归(AR)模型、状态空间模型和自回归综合移动平均(ARIMA)模型。然而,这些模型依赖于数据分布和稳定性的假设,在工业应用中存在通用性不足的问题。基于机器学习的方法包括递归神经网络、门控递归单元、长短期记忆网络和基于Transformer网络的模型。随着Transformer的优化改进,它在时间序列上取得了巨大进展,能够捕捉长距离依赖关系,在各种应用中广泛使用。
由于压裂作业数据具有时间变化和高度关联的特点,通常按时间顺序收集数据。在这种情况下,井口压力预测被视为一个多步时间序列预测问题,即利用过去N个数据点的序列来预测未来可能的M个数据点的序列,记作输入N预测M。相对于单步预测方法只预测未来一个值,多步预测面临更多不确定因素,误差的积累和信息的缺乏使得多步预测更具挑战性。就压裂作业井口压力而言,关于多步预测的研究相对较少。况且,井口压裂数据不仅仅只有压力一个变量,还有许多相关的变量。预测未来压力值,不应该只关注于压力这一个变量随时间变化,还应关注其它相关变量对压力值产生的影响。由于目前大多数基于Transformer的模型利用注意力机制建立时间维度的关系,而忽略不同变量维度相互作用对预测效果的影响。因此,如何利用多变量关系实现多步预测,并且提高井口压力预测的准确性,仍然是一个待解决的问题,这对于指导安全高效的压裂作业具有重要意义。
发明内容
本发明的目的之一在于提供一种基于时间序列模型的压裂作业多时间步压力预测方法,以监测和预测地层压力,提高井口压力预测的准确性。
为了实现上述目的,本发明采用的技术方案如下:
一种基于时间序列模型的压裂作业多时间步压力预测方法,包括以下步骤:
基于多层感知器构建时间序列模型;所述时间序列模型包括编码器和解码器,编码器和解码器分别构建有至少两个MLP(Multilayer Perceptron,多层感知器)结构,以实现从时间维度提取特征和从变量维度提取信息;解码器内还构建有多头交叉注意力机制,多头交叉注意力机制用于感知来自编码器的输出信息,使解码器结合输入序列生成输出;
利用时间序列模型进行压力预测:
S1、将采集的压裂作业数据中的非时间特征进行转化,清洗异常数据,并进行特征标准化,得到标准化数据;
S2、利用输入数据的均值对标准化数据进行拆分,实现对输入数据的特征分离;
S3、在时间维度上,将提取的特征数据划分为非重叠的长度为n的片段;将片段映射到指定的维度,并与位置编码相加,形成特征编码矩阵,作为编码器的输入;
S4、将特征编码矩阵输入时间序列模型,得到井口压力预测结果。
进一步的,压裂作业数据包括井口压力值及其相关因素,相关因素包括对应阶段、井口压力、套压、排出排量、阶段排出液体量、累计排出液体量、两种含砂液体浓度和总砂量。
进一步的,利用时间序列模型进行压力预测方法还包括以下步骤:
S0、将传感器获取的数据收集并构建为压裂作业数据集,根据时间序列数据子集划分的原则,将数据集按照连续阶段进行划分。
进一步的,S1步骤中清洗异常数据并进行特征标准化具体包括以下步骤:
S11、无用数据删除:对压裂作业数据中的起始和结束阶段数据进行删除,并将特征全部丢失的样本删除;
S12、数据填充:对于样本特征部分缺失的样本进行特征填充;
S13、数据标准化:采用标准化公式对压裂作业数据进行标准化:
其中,为压裂作业数据,为标准化后的值,为数据均值,为数据 标准差。
进一步的,采用特征提取公式对标准化数据进行拆分,以实现对输入数据的特征分离:
其中,为变量维度,为提取的特征数据,为输入序列样本数据,在时间维度上的均值。
进一步的,S3具体包括以下步骤:
S31、对提取的特征矩阵的每个变量维度划分为长度为n的不重叠分段 数据,其中,是变量维度,是输入的序列长度,为输入的样本空间维 度,为样本经划分后的分段数据的空间维度;表示特征矩阵的维度信 息,表示的维度信息;
S32、将通过线性变换并添加位置编码后得到一个多维矩阵,其 中,为时间维度,是模型维度,为样本经线性变换和添加位置编码后的空间维 度;表示的维度信息。
进一步的,S32通过以下公式实现:
;
其中,为输出嵌入空间的维度,为当前数据在输入序列中的位置,用于 映射到列索引,为输入序列的长度,为多维矩阵,的位置编码信息,均为数据在不同位置的编码方式。
进一步的,MLP结构包括两个线性变换层和一个GELU(Gaussian Error LinearUnit,高斯误差线性单元)激活函数层。
进一步的,S4具体包括以下步骤:
S41、将多维矩阵进行维度转换,得到,其中,表示 批次大小,表示变量维度,表示时间维度,是模型的维度,表示样本当前的空 间维度,表示样本经维度转换后的空间维度,其主要操作是将这两个维度进 行合并为一个维度,即从原来的四维矩阵,转换成三维矩阵,目的是 为了得到只含有时间维度而不含变量维度的矩阵,以便MLP提取时间维度的信息;
S42、通过MLP结构提取中的时间维度信息,得到,其中,表示 批次大小,表示变量维度,表示时间维度,是模型的维度,表示样本当前的空 间维度;
S43、将再次进行维度转换为,其中,表示样 本当前的空间维度,此处操作是将这个维度和这个维度进行合并,从原来含有时间维度 的三维矩阵,转换成含有变量维度的三维矩阵,目的在于将含有时间维度 的矩阵转成含有变量维度的矩阵,以便MLP提取其变量维度的信息;
S44、通过MLP结构提取中变量维度特征信息得到,其中表示样本当前的空间维度;
S45、将再次进行维度转换,得到编码器每一层的输出为编码器的第几层,其中,表示第层编码器输出的结果的维度信息,其操作在于将合并的这一个维度的信息拆成两个维度,使得三维 矩阵重新变回四维矩阵,其目的是为了将只含有的矩阵, 变回含有的矩阵;
S46、在解码器一个可学习的位置嵌入矩阵,进行与步骤S41-S45中 同样的时间维度特征提取和变量维度提取,得到,其中,是预测长度,均代表时间维度,为通过两个MLP从时间维度和变量维度提取出来的特征矩阵,E是 可学习的位置嵌入矩阵,表示样本的空间维度,表示当前的可学习 矩阵的维度信息,指可学习的矩阵从时间维度和变量维度提取后的结果,表 示当前样本的空间维度,表示的维度信息;
S47、将进行维度转换为 进行维 度转换得到 表示经过维度转换后的结果, 表示的维度信息,是第层的编码器输出的结果,表示的维度信 息,表示经过维度转换后的结果, 表示的维度信息,将转成转成的目的是在于得到一个只含有时间维度信息的三维矩阵;
S48、将作为查询向量Q,作为键向量K和值向量V以计算注意力分数A (X),使用多头注意力机制挖掘序列内部的依赖关系,允许解码器在生成输出时考虑整个输 入序列的信息 ,进多头注意力机制计算得到 表 示当前样本的空间维度, 表示进多头注意力机制计算得到的特征矩阵的维 度信息;
S49、将 进行维度转换得到 ,其操作在于将三维 矩阵重新变成四维矩阵,其目的是为了将只含有的矩阵,变回含有的矩 阵,由线性变换层提取特征并映射为解码器每一层的输出,其中是指进过维度转换的结果, 表示的维度信息,是指解码器每一 层的输出结果,表示的维度信息。
进一步的,还包括以下步骤:
利用Adam优化器及正则化方法优化时间序列模型参数。
本发明的有益效果:
(1)本发明在输入数据阶段,利用均值对输入的时序数据进行简单处理,避免数据集具有较大的分布偏移,增强预测效果。
(2)本发明将提取的特征数据划分为非重叠的长度为n的片段;将片段映射到指定的维度,并与位置编码相加,旨在建立多个特征片段,每个片段里聚合了一些相似度高的单个时间点数据,并且保留时间维度和变量维度的信息,增强模型对于局部特征的学习,避免学习到单个时间点数据产生的冗余信息。减少计算复杂性并且还能保留时间和变量维度信息。相较于传统的Transformer通过计算单个时间点数据的相关性,这种方法有效地降低了编码器和解码器的计算复杂度。
(3)本发明在编码器和解码器中使用简单的MLP结构替换自注意力机制,避免自注意力机制产生的二次运算,降低模型计算的复杂性。同时也通过MLP结构更好感知时序数据在时间维度和变量维度的信息。通过这种方式,模型可以从两个维度提取特征,使其能够关注井口压力数据的两个维度信息,并更准确地实现对压力的预测。
(4)为了增强时间序列特征信息在时间维度上的相关性,本发明在解码阶段构建自注意力机制用于感知来自编码器的输出信息,允许解码器在生成输出时考虑到整个输入序列的信息。从而提高井口压力的预测效果。
附图说明
图1为本发明实施例中整体流程图;
图2为本发明实施例中数据集划分图;
图3为本发明实施例中每一层编码器内部结构图;
图4为本发明实施例中每一层解码器内部结构图;
图5为本发明中实验结果部分示意图其一;
图6为本发明中实验结果部分示意图其二。
具体实施方式
以下将参照附图和优选实施例来说明本发明的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
如图1所示,本实施例提供一种基于时间序列模型的压裂作业多时间步压力预测方法,包括以下步骤:
S1、数据获取和构建数据集:通过传感器获取相关特征数据,并将不同特征收集起来构建压裂作业数据。利用压裂作业数据的阶段信息,将数据集按照连续阶段进行划分,以构建多样化的数据集合。
本步骤,其具体实现方式为:
鉴于压裂作业数据来自同一口井的施工流程且样本量较少,为了保持施工流程的时间维度的连续性,并确保数据集中样本数量充足,根据时间序列数据子集划分原则采取了相应的策略。如图2所示,假设样本中包含n个阶段S n 表示数据集S中的第n个数据,首先从第一阶段开始取连续多个阶段,形成新的数据集/>S j 表示数据集S中的第j个数据。然后,在间隔i个阶段的基础上,选取后续几个阶段,形成另一个新的数据集/>,这个过程一直进行,直到形成的数据集中包含了最后一个阶段为止。同时,也保留一个包含所有阶段的数据集。这样的划分方式既可以满足时间序列数据的连续性要求,又可以确保数据集中样本的数量足够。
S2、数据预处理:对压裂作业数据中的非时间特征进行转化,清洗异常数据并进行特征标准化,得到标准化数据。
本步骤,其具体实现方式为:
对实际生产中井口压力数据进行转化,数据转化部分主要是对于非时间特征数据处理。根据施工的工艺流程对无用数据进行筛除,对筛选后的空值、零值等数据进行填充处理,对特征进行标准以避免模型训练的异常。其具体步骤如下:
S21、无用数据删除:删除起始和结束阶段的数据,并对其中样本特征全部丢失的样本删除;在起始阶段中删除数据的原因在于此时地层的状态对压力的变化起主要作用,而不是加砂操作导致的压力变化。在结束阶段中删除数据的原因在于开采过程已经结束,不再进行加砂操作,此时的压力预测在应用中已经没有意义,模型不应该学习到此阶段的压力变化;
S22、数据填充:对于样本特征部分缺失的样本进行特征填充,填充数据的方式是按照前一个样本数据进行相同值补全部分缺失值的样本;由于在采集数据时,传感器发送数据丢失导致的。虽然这些数据的整体数量不大,没有占到总数据量的0.1%,但是由于数据部分缺失导致的数据不全,将其按照前一个样本数据进行相同值补全;
S23、数据标准化:为符合神经网络的输入结构,对数据特征进行标准化处理。对于不同阶段的数据,如当前压裂阶段的操作阶段,使用序列化编码的形式保留阶段类别之间的差异。由于单口井内,段落间是呈现一个叠加状态的,所以针对其中的类别型数据,使用序号编码的形式,保留了类别间的不同。标准化公式如下:
其中,为压裂作业数据,为标准化后的值,为数据均值,为数据 标准差。
S3、特征提取:利用输入数据的均值对标准化数据进行简单拆分,实现对输入数据的特征分离。
本步骤,其具体实现方式为:
为了避免数据集中存在较大的分布偏移,对数据进行简单的加减拆分处理。具体描述如下:
其中,:提取的特征数据,:序列样本数据,:输入序列样本在时间 维度上的均值。
S4、Patch编码阶段:在时间维度上,将提取的特征数据划分为非重叠的长度为n的片段。随后,通过线性变换将这些片段映射到指定的维度,并与位置编码相加,形成特征编码矩阵,作为编码器的输入。这一过程旨在建立多个特征片段,每个片段里聚合了一些相似度高的单个时间点数据,并且保留时间维度和变量维度的信息。相较于传统的Transformer通过计算单个时间点数据的相关性,这种方法有效地降低了编码器和解码器的计算复杂度。
本步骤,其具体实现方式为:
S41、对特征矩阵的每个变量维度划分为长度为n的不重叠分段数据,其中,是变量维度,是输入的序列长度;
S42、通过线性变换层,并添加位置编码得到一个多维矩阵,其中表 示时间维度,是模型的维度,为样本经线性变换和添加位置编码后的空间维度。 位置编码以及特征拼接公式如下:
其中,为输出嵌入空间的维度,为当前数据在输入序列中的位置,用于 映射到列索引,为输入序列的长度,为多维矩阵,的位置编码信息,均为数据在不同位置的编码方式。
S5、设计编码器:构建一个多层的编码器,每个编码器模块里使用两个简单的MLP结构替换原有的多头注意力机制。其中一个MLP用于从时间维度提取相应的特征,另一个MLP从变量维度提取相应的信息。这两个MLP的结构均由两个线性变换层和一个GELU激活函数层构成。
本步骤如图3所示,其具体实现方式如下:
S51、将进行维度转换为,其中,表示批次大小,表示变量维度,表示时间维度,是模型的维度,表示样本当前的空间维度,表示样本经维度转换后的空间维度,其主要操作是将(批次维度)(变量维度) 这两个维度进行合并为一个维度,即从原来的四维矩阵,转换成三维矩阵,目的是为了得到只含有时间维度而不含变量维度的矩阵,以便MLP提取时间维度 的信息;
S52、通过MLP结构提取中的时间维度信息,得到,表达式为:
其中,表示批次大小,表示变量维度,表示时间维度,是模型的维度,表示样本当前的空间维度;
S53、将将再次进行维度转换为;此处操作是将(批 次)这个维度和(变量)这个维度进行合并,从原来含有时间维度的三维矩阵,转 换成含有变量维度的三维矩阵,目的在于将含有时间维度的矩阵转成含有变量维 度的矩阵,以便MLP提取其变量维度的信息;
S54、通过MLP结构提取中变量维度特征信息得到,表达式为:
S55、将再次进行维度转换,得到每一层的输出为 编码器的第几层,其中,表示第层编码器输出的结果的维度信息,其操 作在于将合并的这一个维度的信息拆成两个维度,使得三维矩阵重 新变回四维矩阵,其目的是为了将只含有(变量维度)的矩阵,变回含有 (时间维度)和(变量维度)的矩阵。
S6、设计解码器:构建一个多层的解码器,每个解码器内部不仅包含两个MLP模块代替原有的自注意力机制模块,用于从时间维度和变量维度提取相应的信息,还包含一个多头的交叉注意力机制用于感知来自编码器的输出信息,允许解码器在生成输出时考虑到整个输入序列的信息。
本步骤如图4所示,其具体实现方式如下:
S61、利用一个可学习的位置嵌入矩阵,进行和编码器中同样的方式 提取时间维度和变量维度的相应特征,得到,其中是预测长度,均代 表时间维度;为通过两个MLP从时间维度和变量维度提取出来的特征矩阵,E是可学习 的位置嵌入矩阵,表示样本的空间维度,表示当前的可学习矩阵的 维度信息,指可学习的矩阵从时间维度和变量维度提取后的结果,表示当前 样本的空间维度,表示的维度信息;
S62、将进行维度转换为 也进行 维度转换,得到 表示经过维度转换后的结果, 表示的维度信息,是第层的编码器输出的结果,表示的维度 信息,表示经过维度转换后的结果, 表示的维度信息,将转 成转成的目的是在于得到一个只含有时间维度信息的三维矩阵;
S63、将作为查询向量Q,作为键向量K和值向量V以计算注意力分数A (X),使用多头注意力机制挖掘序列内部的依赖关系,允许解码器在生成输出时考虑整个输 入序列的信息 ,表达式为:
其中为可学习参数,为多头数;
S64、将 进行维度转换得到 ,其操作在于将三维 矩阵重新变成四维矩阵,其目的是为了将只含有(时间维度)的矩阵,变回含有(时间维度)和(变量维度)的矩阵,由线性变换层提取特征并映射为解码器每一层的输 出,其中是指进过维度转换的结果, 表示的 维度信息,是指解码器每一层的输出结果,表示的维度信息。
S7、模型训练:引入Adama优化器,设置所需的参数并训练上述构建的时间序列模型。在得到解码器的输出结果后并进一步处理得到井口压力预测结果。
本步骤,其具体实现方式为:
S71、将输入数据传入基于MLP的堆叠式Encoder-Decoder模块中进行训练;
S72、将输入通过编码器进行特征编码,获得特征编码
S73、将编码特征与可学习的位置嵌入矩阵通过解码器进行特征提取以及进行多头注意力计算,最终获得特征解码
S74、将解码特征相加得到未来多步预测;
S75、通过未来多步预测与真实值进行MSE损失的计算;
S76、设置L2正则化以及Adam优化器,设置其相关参数,利用MSE损失进行反向传播,实现模型参数的优化训练。具体来说,本发明通过求解MSE损失进行参数优化,MSE的计算如下:
在MSE损失上添加L2正则化,其损失函数变更为:
其中,为压裂作业数据,是需要训练的模型参数,是输入数据,是预测结果,是需要预测的时间维度,是需要预测的特征维度,λ为正则化 系数。特别的,L2正则化对于绝对值较大的权重予以很重的惩罚,对于绝对值很小的权重予 以非常非常小的惩罚,当权重绝对值趋近于0时,基本不惩罚。其性质来源于L2的平方项,即 越大的数,其平方越大,越小的数,比如小于1的数,其平方反而越小。
本方法的试验如下:
1、实验设置
本次试验的实验硬件环境为Intel I9系列CPU和NVIDIA Geforce RTX 3080显卡。
为了评价本方法的多步预测的性能,将我们的模型与RNN、LSTM、GRU、Linear、Transformer、Informer、Autoformer进行了对比。其中数据转化使用sklearn包实现,神经网络的模型通过pytorch框架实现。
本次实验所采用的是均方误差和平均绝对误差来评价多步压力预测模型的有效性,所有结果都在GeForce RTX 3080上进行相同的实验次数获取平均值。其中均方误差和平均绝对误差的计算公式如下所示。
其中是真实值,是预测值。MSE计算预测值与真实值的绝对平方误差的平均 值,误差越大,该值越大。MAE用来衡量预测值与真实值之间的平均绝对误差,MAE越小表示 模型越好。
2、实验结果及分析
本发明为了分析多步预测井口压力模型的效果,进行了以下实验。
为了验证模型的有效性,对不同模型进行了三次实验,获得对应MSE和MAE的平均值。其实验结果如表1所示。其中D1、D2、D3和D4代表包含不同阶段的数据集,D4是包含全部阶段的一个数据集。由表1可知,我们的模型相较于原始的Transformer网络具有极大的优势,对于较为新兴的Autoformer网络依旧更优的成绩。对比我们的模型与其他模型的预测效果,我们的模型能达到更加的预测结果。为了更直观地观察模型的训练结果,我们选择了两段压裂数据,并对模型的输出结果与真实值进行可视化展示。如图5和图6所示,我们的模型在D4数据集上面能够拟合真实值,避免了在部分位置的波动差异,证明了模型在实际工程中的有效性。
表1:不同模型对井口压力预测的评价
最后说明的是,以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
以上实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。

Claims (10)

1.一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,包括以下步骤:
基于多层感知器构建时间序列模型,所述时间序列模型包括编码器和解码器,编码器和解码器分别构建有至少两个MLP结构,以实现从时间维度提取特征和从变量维度提取信息;解码器内还构建有多头交叉注意力机制,多头交叉注意力机制用于感知来自编码器的输出信息,使解码器结合输入序列生成输出;
利用时间序列模型进行压力预测:
S1、将采集的压裂作业数据中的非时间特征进行转化,清洗异常数据,并进行特征标准化,得到标准化数据;
S2、利用输入数据的均值对标准化数据进行拆分,实现对输入数据的特征分离;
S3、在时间维度上,将提取的特征数据划分为非重叠的长度为n的片段;将片段映射到指定的维度,并与位置编码相加,形成特征编码矩阵,作为编码器的输入;
S4、将特征编码矩阵输入时间序列模型,得到井口压力预测结果。
2.根据权利要求1的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,压裂作业数据包括井口压力值及其相关因素,相关因素包括对应阶段、井口压力、套压、排出排量、阶段排出液体量、累计排出液体量、两种含砂液体浓度和总砂量。
3.根据权利要求1的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,利用时间序列模型进行压力预测方法还包括以下步骤:
S0、将传感器获取的数据收集并构建为压裂作业数据集,根据时间序列数据子集划分的原则,将数据集按照连续阶段进行划分。
4.根据权利要求1的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,S1步骤中清洗异常数据并进行特征标准化具体包括以下步骤:
S11、无用数据删除:对压裂作业数据中的起始和结束阶段数据进行删除,并将特征全部丢失的样本删除;
S12、数据填充:对于样本特征部分缺失的样本进行特征填充;
S13、数据标准化:采用标准化公式对压裂作业数据进行标准化:
其中,为压裂作业数据,为标准化后的值,为数据均值,为数据标准 差。
5.根据权利要求1的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,采用特征提取公式对标准化数据进行拆分,以实现对输入数据的特征分离:
其中,为变量维度,为提取的特征数据,为输入序列样本数据,在时 间维度上的均值。
6.根据权利要求1的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,S3具体包括以下步骤:
S31、对提取的特征矩阵的每个变量维度划分为长度为n的不重叠分段数据,其中,是变量维度,是输入的序列长度,为输入的样本空间维度,为样本经划分后的分段数据的空间维度;
S32、将通过线性变换并添加位置编码后得到一个多维矩阵,其中, 为时间维度,是模型维度,为样本经线性变换和添加位置编码后的空间维度。
7.根据权利要求6的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,S32通过以下公式实现:
其中,为输出嵌入空间的维度,为当前数据在输入序列中的位置,用于映射 到列索引,为输入序列的长度,为多维矩阵,的位置编码信息,均为数据在不同位置的编码方式。
8.根据权利要求6的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,MLP结构包括两个线性变换层和一个GELU激活函数层。
9.根据权利要求7的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,S4具体包括以下步骤:
S41、将多维矩阵进行维度转换,得到,其中,表示批次大 小,表示变量维度,表示时间维度,是模型的维度,表示样本当前的空间维 度,表示样本经维度转换后的空间维度,其主要操作是将这两个维度进行合 并为一个维度,即从原来的四维矩阵,转换成三维矩阵,目的是为了 得到只含有时间维度而不含变量维度的矩阵,以便MLP提取时间维度的信息;
S42、通过MLP结构提取中的时间维度信息,得到,其中,表示批次大 小,表示变量维度,表示时间维度,是模型的维度,表示样本当前的空间维度;
S43、将再次进行维度转换为,其中,表示样本当 前的空间维度,此处操作是将这个维度和这个维度进行合并,从原来含有时间维度的三 维矩阵,转换成含有变量维度的三维矩阵,目的在于将含有时间维度的矩 阵转成含有变量维度的矩阵,以便MLP提取其变量维度的信息;
S44、通过MLP结构提取中变量维度特征信息得到,其中表示 样本当前的空间维度;
S45、将再次进行维度转换,得到编码器每一层的输出 为编码器的第几层,其中,表示第层编码器输出的结果的维度信息,其 操作在于将合并的这一个维度的信息拆成两个维度,使得三维矩阵 重新变回四维矩阵,其目的是为了将只含有的矩阵,变回含有的矩 阵;
S46、在解码器一个可学习的位置嵌入矩阵,进行与步骤S41-S45中同样的 时间维度特征提取和变量维度提取,得到,其中,是预测长度,均代 表时间维度,为通过两个MLP从时间维度和变量维度提取出来的特征矩阵,E是可学习 的位置嵌入矩阵,表示样本的空间维度,表示当前的可学习矩阵的 维度信息,指可学习的矩阵从时间维度和变量维度提取后的结果,表示当前 样本的空间维度,表示的维度信息;
S47、将进行维度转换为 进行维度转 换得到 表示经过维度转换后的结果, 表示的维度信息,是第层的编码器输出的结果,表示的维度信 息,表示经过维度转换后的结果, 表示的维度信息,将转成转成的目的是在于得到一个只含有时间维度信息的三维矩阵;
S48、将作为查询向量Q,作为键向量K和值向量V以计算注意力分数A(X),使用 多头注意力机制挖掘序列内部的依赖关系,允许解码器在生成输出时考虑整个输入序列的 信息 ,进多头注意力机制计算得到 表示当前样 本的空间维度, 表示进多头注意力机制计算得到的特征矩阵的维度信息;
S49、将 进行维度转换得到 ,其操作在于将三维矩阵重新变成四维矩阵,其目的是为了将只含有的矩阵,变回含有的矩阵,由 线性变换层提取特征并映射为解码器每一层的输出,其中是指进 过维度转换的结果, 表示的维度信息,是指解码器每一层的输出 结果,表示的维度信息。
10.根据权利要求1的一种基于时间序列模型的压裂作业多时间步压力预测方法,其特征在于,还包括以下步骤:
利用Adam优化器及正则化方法优化时间序列模型参数。
CN202311640195.1A 2023-12-04 2023-12-04 一种基于时间序列模型的压裂作业多时间步压力预测方法 Active CN117349610B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311640195.1A CN117349610B (zh) 2023-12-04 2023-12-04 一种基于时间序列模型的压裂作业多时间步压力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311640195.1A CN117349610B (zh) 2023-12-04 2023-12-04 一种基于时间序列模型的压裂作业多时间步压力预测方法

Publications (2)

Publication Number Publication Date
CN117349610A true CN117349610A (zh) 2024-01-05
CN117349610B CN117349610B (zh) 2024-02-09

Family

ID=89371349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311640195.1A Active CN117349610B (zh) 2023-12-04 2023-12-04 一种基于时间序列模型的压裂作业多时间步压力预测方法

Country Status (1)

Country Link
CN (1) CN117349610B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118553035A (zh) * 2024-07-30 2024-08-27 江西师范大学 基于单维卷积门控单元的飞机发动机故障诊断方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3040518A1 (zh) * 2015-09-02 2017-03-03 Halliburton Energy Services Inc
CN108894777A (zh) * 2018-07-06 2018-11-27 西南石油大学 一种分层压裂多层合采油气藏储层物性及裂缝特性参数的确定方法
WO2020139347A1 (en) * 2018-12-27 2020-07-02 Halliburton Energy Services, Inc. Hydraulic fracturing job plan real-time revisions utilizing detected response feature data
CN112818662A (zh) * 2021-01-29 2021-05-18 清华大学 一种基于社交网络媒体的心理压力预测系统及方法
CN114239308A (zh) * 2021-12-24 2022-03-25 西南石油大学 一种多尺度高密度压裂参数优化方法
CN114494314A (zh) * 2021-12-27 2022-05-13 南京大学 时序边界检测方法及时序感知器
CN115204502A (zh) * 2022-07-21 2022-10-18 合肥工业大学 压力预测模型的训练和预测方法、系统、设备及存储介质
CN115222065A (zh) * 2022-06-20 2022-10-21 西南石油大学 一种基于Stacking集成学习的井口压力在线多步预测方法
CN115559712A (zh) * 2022-11-01 2023-01-03 西北大学 一种智能石油勘探系统及其应用方法
US20230041700A1 (en) * 2021-08-04 2023-02-09 Defiant Engineering, Llc LiDAR TOOL FOR OIL AND GAS WELLBORE DATA ACQUISITION
CN116894399A (zh) * 2023-08-09 2023-10-17 西南石油大学 一种基于分布式神经网络的水力压裂施工压力预测方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3040518A1 (zh) * 2015-09-02 2017-03-03 Halliburton Energy Services Inc
CN108894777A (zh) * 2018-07-06 2018-11-27 西南石油大学 一种分层压裂多层合采油气藏储层物性及裂缝特性参数的确定方法
WO2020139347A1 (en) * 2018-12-27 2020-07-02 Halliburton Energy Services, Inc. Hydraulic fracturing job plan real-time revisions utilizing detected response feature data
CN112818662A (zh) * 2021-01-29 2021-05-18 清华大学 一种基于社交网络媒体的心理压力预测系统及方法
US20230041700A1 (en) * 2021-08-04 2023-02-09 Defiant Engineering, Llc LiDAR TOOL FOR OIL AND GAS WELLBORE DATA ACQUISITION
CN114239308A (zh) * 2021-12-24 2022-03-25 西南石油大学 一种多尺度高密度压裂参数优化方法
CN114494314A (zh) * 2021-12-27 2022-05-13 南京大学 时序边界检测方法及时序感知器
CN115222065A (zh) * 2022-06-20 2022-10-21 西南石油大学 一种基于Stacking集成学习的井口压力在线多步预测方法
CN115204502A (zh) * 2022-07-21 2022-10-18 合肥工业大学 压力预测模型的训练和预测方法、系统、设备及存储介质
CN115559712A (zh) * 2022-11-01 2023-01-03 西北大学 一种智能石油勘探系统及其应用方法
CN116894399A (zh) * 2023-08-09 2023-10-17 西南石油大学 一种基于分布式神经网络的水力压裂施工压力预测方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
GUOJIN CHEN等: "DevelSet: Deep Neural Level Set for Instant Mask Optimization", 《IEEE TRANSACTIONS ON COMPUTER-AIDED DESIGN OF INTEGRATED CIRCUITS AND SYSTEMS》, vol. 22, no. 12, 14 June 2023 (2023-06-14), pages 5020 - 5033 *
LILI ZENG等: "Well logging prediction and uncertainty analysis based on recurrent neural network with attention mechanism and Bayesian theory", 《JOURNAL OF PETROLEUM SCIENCE AND ENGINEERING》, vol. 208, 10 September 2021 (2021-09-10), pages 1 - 16, XP086884186, DOI: 10.1016/j.petrol.2021.109458 *
PALASH PANJA等: "Prediction of well performance in SACROC field using stacked Long Short-Term Memory (LSTM) network", 《EXPERT SYSTEMS WITH APPLICATIONS》, vol. 205, 3 June 2022 (2022-06-03), pages 1 - 25 *
WEI ZHANG等: "Graph regression for pressure peak prediction in fracturing processes", 《JOURNAL OF PETROLEUM SCIENCE AND ENGINEERING》, vol. 213, 5 March 2022 (2022-03-05), pages 1 - 8, XP087021790, DOI: 10.1016/j.petrol.2022.110323 *
曾凡辉等: "深层页岩体积压裂缝网动态渗透率模型及其应用", 《天然气地球科学》, vol. 32, no. 07, 10 July 2021 (2021-07-10), pages 941 - 949 *
胡轶敏等: "基于时间序列的汽车发动机冷测试排气压力预测", 《现代零部件》, no. 02, 1 February 2012 (2012-02-01), pages 60 - 63 *
苏善杰: "低渗煤体液氮致裂作用与增透机理研究", 《中国博士学位论文全文数据库 (工程科技Ⅰ辑)》, no. 02, 15 February 2022 (2022-02-15), pages 019 - 22 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118553035A (zh) * 2024-07-30 2024-08-27 江西师范大学 基于单维卷积门控单元的飞机发动机故障诊断方法

Also Published As

Publication number Publication date
CN117349610B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN117349610B (zh) 一种基于时间序列模型的压裂作业多时间步压力预测方法
CN103711523B (zh) 基于局域分解-进化神经网络的瓦斯浓度实时预测方法
Esmael et al. A statistical feature-based approach for operations recognition in drilling time series
CN111523713B (zh) 一种预测油田中剩余油饱和度分布的方法和装置
Shi et al. A new method to detect influx and loss during drilling based on machine learning
CN104794550A (zh) 基于wt-kpca-svr耦合模型的瓦斯涌出量预测方法
CN115994630B (zh) 基于多尺度自注意力的设备剩余使用寿命预测方法及系统
CN114528755A (zh) 一种基于注意力机制结合gru的电力设备故障检测模型
CN118223828B (zh) 用于油气井作业的中性解堵剂使用控制方法及系统
CN116628621A (zh) 多元时序数据异常事件诊断方法、装置、设备及存储介质
CN113553356A (zh) 一种钻井参数预测方法和系统
CN116227562A (zh) 基于图神经网络与Transformer的时序点过程预测方法及系统
CN116680557A (zh) 用于煤层气钻井工程的实时监测系统及其方法
Chen et al. Multivariate time series anomaly detection via dynamic graph forecasting
Huang et al. CausalViT: Domain generalization for chemical engineering process fault detection and diagnosis
Othman et al. Abnormal patterns detection in control charts using classification techniques
CN116910483A (zh) 一种基于遮蔽卷积注意力残差收缩网络的软测量建模方法
Geekiyanage et al. Feature selection for kick detection with machine learning using laboratory data
CN116578944A (zh) 一种基于Transformer的双向自注意力剩余寿命预测方法
CN117034099A (zh) 一种系统日志异常检测方法
CN118296516A (zh) 一种基于层级时间记忆的在线工控异常检测算法
Liu et al. Hybrid Long Short-Term Memory and Convolutional Neural Network Architecture for Electric Submersible Pump Condition Prediction and Diagnosis
CN114330143A (zh) 一种基于多源时空信息的分布式参数系统状态预测方法
Liu et al. Information-based Gradient enhanced Causal Learning Graph Neural Network for fault diagnosis of complex industrial processes
Ou et al. Missing-data imputation with position-encoding denoising auto-encoders for industrial processes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant