CN116383722A - 一种基于门控循环单元神经网络的压裂措施过程监控方法 - Google Patents

一种基于门控循环单元神经网络的压裂措施过程监控方法 Download PDF

Info

Publication number
CN116383722A
CN116383722A CN202310651050.5A CN202310651050A CN116383722A CN 116383722 A CN116383722 A CN 116383722A CN 202310651050 A CN202310651050 A CN 202310651050A CN 116383722 A CN116383722 A CN 116383722A
Authority
CN
China
Prior art keywords
fracturing
data
model
representing
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310651050.5A
Other languages
English (en)
Inventor
张凯
王群力
刘丕养
张文娟
王阳
张黎明
严侠
张华清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao University of Technology
Original Assignee
Qingdao University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao University of Technology filed Critical Qingdao University of Technology
Priority to CN202310651050.5A priority Critical patent/CN116383722A/zh
Publication of CN116383722A publication Critical patent/CN116383722A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于门控循环单元神经网络的压裂措施过程监控方法,属于石油工程技术领域,包括如下步骤:步骤1、采集历史压裂施工中的原始监测数据构建样本数据集,并对原始监测数据的压裂异常类型进行人工标注;步骤2、对样本数据集进行预处理;步骤3、构建基于门控循环单元神经网络的压裂措施过程监控模型;步骤4、对构建的压裂措施过程监控模型进行模型的预训练和参数调优;步骤5、对模型进行评价其性能和效果,将性能评价良好的模型作为最终训练完成的压裂措施过程监控模型;步骤6、采用训练完成的压裂措施过程监控模型实时监控压裂施工过程,实时预测压裂风险。本发明能有效发现压裂施工现场的施工风险并及时预警。

Description

一种基于门控循环单元神经网络的压裂措施过程监控方法
技术领域
本发明属于石油工程风险故障智能识别诊断技术领域,具体涉及一种基于门控循环单元神经网络的压裂措施过程监控方法。
背景技术
目前油气开采不断向深部复杂地层方向发展,压裂作为改造低渗透油气藏、开发深部油气藏的主要手段,在提高油气采收率方面发挥重要作用。因此压裂广泛应用于各类油气井和注水井的增注,并取得了良好的效果。为了保持裂缝形态,提高裂缝导流能力,保持裂缝渗透率,需要将混砂液注入裂缝,但在这个过程中可能由于地层和地下裂缝延伸的复杂性,压裂施工技术人员操作失误,或工艺设计不合理等原因,极易引发各种施工风险事故,如沉砂、砂堵、地层压不开、地层压窜等,其中砂堵是最常见并且后果最严重的风险事故。当压裂施工过程中发生压裂砂堵时,轻则造成高压憋坏管线、损坏设备、压裂液等施工物质材料浪费,解堵处理的作业成本提高,重则造成重大人员伤亡,破坏地层渗流,报废施工井,威胁施工技术人员安全,耗费生产作业时间,额外增加压裂施工成本。
因此对压裂施工进行监测非常有必要,通过研究具有针对性的有效预警方法,对压裂施工过程中存在的风险进行预警,能够及时采取相应的补救措施,防止事故的发生,最大限度地减少造成的经济和油气田生产时间损失,避免人员伤亡,保证压裂施工安全高效地进行。
然而传统的压裂风险识别需要人工判别,从正常工况到事故发生的时间存在极大的不确定性,需要工作人员长时间的精神高度集中,监控人员需要长时间盯守监测屏幕,这样易产生疲劳,难以保证对异常监测信息的有效获取,并且需要做到正确、及时地识别压裂风险,这就要求施工作业人员应有丰富的现场经验和一定的专业知识,所有现场需要达到这样的要求是不现实的。加之目前许多监控系统尚不具备智能分析诊断的功能,对于异常情况或突发事件,无法及时预测预警,智能化程度较低。井下作业工艺种类多且工序复杂,还未全部实现施工工序信息标准化的要求,压裂作业现场产生大量数据,虽然数据进行了初步的应用,但其中大部分数据还未得到智能化的应用。数字智能化转型为实现井下作业智能化管控提供了新方向,提出一种能够及时对压裂施工异常风险进行预测的异常检测模型成为亟待解决的问题。
发明内容
为了解决上述问题,本发明提出了一种基于门控循环单元神经网络的压裂措施过程监控方法,提升现有监控系统智能化程度,有效发现压裂施工现场的施工风险并及时预警,降低对压裂现场人员尤其是压裂专家的技能和经验要求,使其普遍应用于所有施工现场。
本发明的技术方案如下:
一种基于门控循环单元神经网络的压裂措施过程监控方法,包括如下步骤:
步骤1、采集历史压裂施工中的原始监测数据构建样本数据集,并对原始监测数据的压裂异常类型进行人工标注;
步骤2、对样本数据集进行预处理;
步骤3、构建基于门控循环单元神经网络的压裂措施过程监控模型;
步骤4、对构建的压裂措施过程监控模型进行模型的预训练和参数调优;
步骤5、对模型进行评价其性能和效果,将性能评价良好的模型作为最终训练完成的压裂措施过程监控模型;
步骤6、采用训练完成的压裂措施过程监控模型实时监控压裂施工过程,实时预测压裂风险。
进一步地,步骤1的具体过程如下:
步骤1.1、通过实时现场拍摄和现场传回的方式收集监测参数数据和视频监控图像数据构建样本数据集;
步骤1.2、将人工标注的压裂施工样本数据集分成若干个小组,每个小组均按照8:2的比例划分为训练集和测试集,且训练集和测试集互不相交。
进一步地,步骤2的具体过程如下:
步骤2.1、对样本数据集进行特征选择;在输入的训练样本中,从
Figure SMS_1
维的压裂风险特征中选出和风险特征息息相关的/>
Figure SMS_2
维特征子集,且/>
Figure SMS_3
,再将/>
Figure SMS_4
维风险特征及每个风险特征对应的1维的实际风险结果作为一个集合;
步骤2.2、进行数据缺失值填充;采用Python语言工具,利用pandas库中的isnull函数判断缺测值,利用fillna函数将缺失的数据填充为中位数值;
步骤2.3、进行数据异常值处理,纠正错误数据;
选用拉依达准则监测异常值判断,假设压裂监测数据集服从正态分布:
Figure SMS_5
(1);
Figure SMS_6
(2);
Figure SMS_7
(3);
其中,
Figure SMS_8
表示概率,/>
Figure SMS_9
表示原始压裂数据集数据,/>
Figure SMS_10
表示均值,/>
Figure SMS_11
表示标准差,/>
Figure SMS_12
表示数据点的数量, />
Figure SMS_13
表示数据集中第/>
Figure SMS_14
个数据点;
如果
Figure SMS_15
的值超过了/>
Figure SMS_16
区间,就把此数据作为异常数据进行处理,使用平均值来替换异常值;
步骤2.4、删除重复数据,并以时间信息为基准进行数据整合;
步骤2.5、进行归一化处理;
对样本数据集中的数据
Figure SMS_17
进行归一化的公式为:
Figure SMS_18
(4);
其中,
Figure SMS_19
表示归一化后的数据,/>
Figure SMS_20
表示样本数据最大值,/>
Figure SMS_21
表示样本数据最小值。
进一步地,步骤3中,构建的基于门控循环单元神经网络的压裂措施过程监控模型包含时刻输入、重置门、更新门、时刻输出;
压裂措施过程监控模型的输入项包含套压、排量、砂斗余量、井底压力参数、井口有害气体含量、是否憋压、有无泵抽空7项,模型的输入为7项数据的集合,将时刻输入值输入压裂措施过程监控模型后,经过重置门、更新门后得到输出值,输出值为单一输出项,对应压裂风险的诊断结果;
门控循环单元神经网络的内部工作流程为:首先通过上一时刻的隐藏状态和当前时刻的输入得到更新门和重置门的门信号输出,得到门信号后利用重置门对数据进行处理,然后利用
Figure SMS_22
函数把数据直接缩放到0和1,最后用同一个门实现数据的选择性遗忘和选择性存储。
进一步地,步骤3中,基于门控循环单元神经网络的压裂措施过程监控模型的具体预测过程为:
步骤3.1、压裂措施过程监控模型根据输入数据,计算门控循环单元当前时刻
Figure SMS_23
的重置门/>
Figure SMS_24
Figure SMS_25
(5);
其中,
Figure SMS_27
表示重置门的权重矩阵;/>
Figure SMS_28
表示预测模型上一时刻的隐藏状态;/>
Figure SMS_29
表示该预测模型中当前时刻/>
Figure SMS_30
的输入,/>
Figure SMS_31
,/>
Figure SMS_32
表示总时长;/>
Figure SMS_33
表示重置门的偏执项,/>
Figure SMS_26
表示Sigmoid激活函数;
步骤3.2、计算门控循环单元当前时刻
Figure SMS_34
的更新门/>
Figure SMS_35
Figure SMS_36
(6);
其中,
Figure SMS_37
表示更新门的权重矩阵,/>
Figure SMS_38
表示更新门的偏执项;
步骤3.3、计算门控循环单元当前时刻
Figure SMS_39
的用于描述当前输入的单元状态/>
Figure SMS_40
Figure SMS_41
(7);
其中,
Figure SMS_42
表示单元状态权重矩阵,/>
Figure SMS_43
表示单元状态的偏执项,/>
Figure SMS_44
为激活函数;
步骤3.4、计算门控循环单元当前时刻
Figure SMS_45
的输出值/>
Figure SMS_46
Figure SMS_47
(8);
其中,
Figure SMS_48
表示对当前单元的选择性遗忘;/>
Figure SMS_49
表示对当前单元的选择性记忆;
步骤3.5、对输出值进行解码,把输出值作为输入传入全连接层,全连接层将其映射到一个新的向量,该向量维度为1,对该向量应用sigmoid激活函数将值压缩为0到1之间;把sigmoid函数的输出值与阈值0.5比较,大于阈值解码为1,否则解码为0;0和1对应预测的结果,当为0时,表示预测的结果为无压裂风险,当为1时,表示预测的结果为存在压裂风险。
进一步地,步骤4的具体过程如下:
步骤4.1、设定模型参数,初始化网络参数,网络参数包括权重矩阵、偏执项;
步骤4.2、将预处理完成后的训练集输入模型,训练集的每组数据包括多条压裂数据,每条压裂数据包括多维的特征和1维实际的压裂结果;
步骤4.3、模型的门控循环单元接收到传入的多条数据后,进行迭代训练,依次计算当前时刻
Figure SMS_50
的重置门/>
Figure SMS_51
、更新门/>
Figure SMS_52
、单元状态/>
Figure SMS_53
,得到输出值;
步骤4.4、若当前时刻
Figure SMS_54
小于总时长/>
Figure SMS_55
,即/>
Figure SMS_56
,则使/>
Figure SMS_57
,重复执行步骤4.3;若达到总时长/>
Figure SMS_58
,则该时刻的输出值/>
Figure SMS_59
是最后一个时刻的输出值;
在预训练的过程中对于获得的不同的权重矩阵和偏执项记录调整,对于所得模型诊断错误对应的压裂作业施工数据进行分类整理收集后,对该模型进行再次训练和更新,达到了指定的次数结束所有训练。
进一步地,步骤5中,选择的评价指标包括准确率和精确度,准确率和精确度的定义如下:
Figure SMS_60
(9);
Figure SMS_61
(10);
其中,
Figure SMS_62
表示为正样本并被分类为正样本的个数;/>
Figure SMS_63
表示正样本被分类为负的样本数;/>
Figure SMS_64
表示为实际为正样本但被分类为负的样本数;/>
Figure SMS_65
表示负样本但被分类为负样本数。
进一步地,步骤6的具体过程为:将步骤5中性能评价良好的作为输出模型,然后将现场实时采集的压裂施工过程数据输入该模型后,得到压裂风险预测的结果后并将结果及时显示,供压裂工作人员和压裂施工专家查验确认,当风险预测结果为存在压裂风险时,进行及时预警。
本发明所带来的有益技术效果:本发明方法中所提供的压裂措施过程监控方法,通过建立门控循环单元神经网络模型,利用其适用于处理时间上有强关联的压裂作业中的实时监测数据的特性,配合前期对数据集的人工标记和数据预处理手段,然后通过用大量的压裂施工存在的正常样本数据进行训练,确保了网络的性能精度,将压裂施工异常样本进行网络训练,然后微调,确保了网络的性能精度和低时延,保证了整个压裂措施过程监控模型的性能,能最大化提升模型的诊断能力,极大地减少压裂过程中的施工风险和损失。
附图说明
图1为本发明基于门控循环单元神经网络的压裂措施过程监控方法的流程图。
图2为本发明实施例中样本训练和验证过程的拟合效果图。
图3为本发明实施例中样本训练过程的误差损失曲线图。
图4为本发明实施例中样本验证过程的误差损失曲线图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
如图1所示,一种基于门控循环单元神经网络的压裂措施过程监控方法,包括如下步骤:
步骤1、采集历史压裂施工中的原始监测数据构建样本数据集,并对原始监测数据的压裂异常类型进行人工标注。具体过程如下:
步骤1.1、通过实时现场拍摄和现场传回的方式收集监测参数数据和视频监控图像数据构建样本数据集,监测参数数据包括井底压力、排量等参数;
步骤1.2、将人工标注的压裂施工样本数据集分成若干个小组,每个小组均按照8:2的比例划分为训练集和测试集,训练集用于训练模型,测试集用来验证模型实际预测效果,且训练集和测试集互不相交。
步骤2、对样本数据集进行预处理。具体过程如下:
步骤2.1、对样本数据集进行特征选择,即在输入的训练样本中,从
Figure SMS_66
维的压裂风险特征(如砂堵特征)中选出和风险(如砂堵)特征息息相关的/>
Figure SMS_67
维特征子集,且/>
Figure SMS_68
,再将/>
Figure SMS_69
维风险特征及每个风险特征对应的1维的实际风险结果作为一个集合,能够有效表示该训练样本特征,同时减少不相关特征的影响,达到数据格式标准化;
步骤2.2、进行数据缺失值填充;
对样本数据集中的可能由于设备故障、信号中断或记录疏忽等原因而导致的数据集缺测值进行填充,采用Python语言工具,利用pandas库中的isnull函数判断缺测值,利用fillna函数将缺失的数据填充为中位数值。
步骤2.3、进行数据异常值处理,纠正错误数据;
对于监测到的数据已经明显偏离了实际情况的数据,也就是异常值,选用拉依达准则监测异常值判断,假设压裂监测数据集服从正态分布:
Figure SMS_70
(1);
Figure SMS_71
(2);
Figure SMS_72
(3);
其中,
Figure SMS_73
表示概率,/>
Figure SMS_74
表示原始压裂数据集数据,/>
Figure SMS_75
表示均值,/>
Figure SMS_76
表示标准差,/>
Figure SMS_77
表示数据点的数量, />
Figure SMS_78
表示数据集中第/>
Figure SMS_79
个数据点;
如果
Figure SMS_80
的值超过了/>
Figure SMS_81
区间,就把此数据作为异常数据进行处理,使用平均值来替换异常值,最大程度减小异常数据带来的影响。
步骤2.4、删除重复数据,并进行数据合并,合并时以时间信息为基准进行数据整合,确保各条数据均对应唯一的日期;
步骤2.5、进行归一化处理;
采用归一化的方法对样本数据进行预处理。将样本数据归一化至区间[0,1],选取样本数据最大值
Figure SMS_82
和最小值/>
Figure SMS_83
,对样本数据集中的数据/>
Figure SMS_84
进行归一化的公式为:
Figure SMS_85
(4);
其中,
Figure SMS_86
表示归一化后的数据。
步骤3、构建基于门控循环单元神经网络的压裂措施过程监控模型。
构建的压裂措施过程监控模型包含时刻输入、重置门、更新门、时刻输出。
本发明中,根据压裂作业过程中套压、排量、砂斗余量、井底压力参数、井口有害气体含量、是否憋压、有无泵抽空等监测因素,确定压裂措施过程监控模型的输入项为套压、排量、砂斗余量、井底压力参数、井口有害气体含量、是否憋压、有无泵抽空7项,将其作为压裂措施过程监控模型的输入值,即模型输入的数据为7项数据的集合。将时刻输入值输入压裂措施过程监控模型后,经过重置门、更新门后得到输出值,输出值为单一输出项,对应压裂风险的诊断结果。
本发明门控循环单元神经网络GRU的内部工作流程为:首先通过上一时刻的隐藏状态
Figure SMS_87
和当前时刻/>
Figure SMS_88
的输入/>
Figure SMS_89
得到更新门和重置门的门信号输出,得到门信号后利用重置门对数据进行处理,然后利用/>
Figure SMS_90
函数把数据直接缩放到0和1,最后用同一个门实现数据的选择性遗忘和选择性存储。
模型的具体预测过程为:
步骤3.1、压裂措施过程监控模型根据输入数据,计算门控循环单元当前时刻
Figure SMS_91
的重置门/>
Figure SMS_92
Figure SMS_93
(5);
其中,
Figure SMS_95
表示重置门的权重矩阵;/>
Figure SMS_103
表示预测模型上一时刻的隐藏状态;/>
Figure SMS_104
表示该预测模型中当前时刻/>
Figure SMS_105
的输入,/>
Figure SMS_106
,/>
Figure SMS_107
表示总时长;/>
Figure SMS_108
表示重置门的偏执项,/>
Figure SMS_94
表示Sigmoid激活函数。将/>
Figure SMS_96
、/>
Figure SMS_97
作为重置门/>
Figure SMS_98
的输入条件,使/>
Figure SMS_99
处在0-1区间,/>
Figure SMS_100
的值越接近于0,就意味着结果几乎不保留上一时刻隐藏状态的信息,/>
Figure SMS_101
的值越接近于1,则表示保留上一时刻的隐藏状态/>
Figure SMS_102
步骤3.2、计算门控循环单元当前时刻
Figure SMS_109
的更新门/>
Figure SMS_110
Figure SMS_111
(6);
其中,
Figure SMS_112
表示更新门的权重矩阵,/>
Figure SMS_113
表示更新门的偏执项;
步骤3.3、计算门控循环单元当前时刻
Figure SMS_114
的用于描述当前输入的单元状态/>
Figure SMS_115
Figure SMS_116
(7);
其中,
Figure SMS_117
表示单元状态权重矩阵,/>
Figure SMS_118
表示单元状态的偏执项,/>
Figure SMS_119
为激活函数。当前时刻的单元候选状态是由当前时刻的输入/>
Figure SMS_120
和上一时刻的隐藏状态/>
Figure SMS_121
以及重置门
Figure SMS_122
共同计算,并通过/>
Figure SMS_123
激活函数激活得到;
步骤3.4、计算门控循环单元当前时刻
Figure SMS_124
的输出值/>
Figure SMS_125
Figure SMS_126
(8);
其中
Figure SMS_127
表示对当前单元的选择性遗忘;/>
Figure SMS_128
表示对当前单元的选择性记忆;
步骤3.5、对输出值进行解码,把输出值作为输入传入全连接层,全连接层将其映射到一个新的向量,该向量维度为1,对该向量应用sigmoid激活函数将值压缩为0到1之间;把sigmoid函数的输出值与阈值0.5比较,大于阈值解码为1,否则解码为0;0和1对应预测的结果,当为0时,表示预测的结果为无压裂风险,当为1时,表示预测的结果为存在压裂风险。模型使用图形处理器GPU加速训练。
步骤4、对构建的压裂措施过程监控模型进行模型的预训练和参数调优。具体过程为:
步骤4.1、设定模型参数,初始化网络参数,网络参数主要包括权重矩阵、偏执项;
步骤4.2、将预处理完成后的训练集输入模型,训练集的每组数据包括多条压裂数据,每条压裂数据包括多维的特征和1维实际的压裂结果;
步骤4.3、模型的门控循环单元接收到传入的多条数据后,进行迭代训练,依次计算当前时刻
Figure SMS_129
的重置门/>
Figure SMS_130
、更新门/>
Figure SMS_131
、单元状态/>
Figure SMS_132
,得到输出值;
步骤4.4、若当前时刻
Figure SMS_133
小于总时长/>
Figure SMS_134
,即/>
Figure SMS_135
,则使/>
Figure SMS_136
,重复执行步骤4.3;若达到总时长/>
Figure SMS_137
,即/>
Figure SMS_138
,则该时刻的输出值/>
Figure SMS_139
是最后一个时刻的输出值。
在预训练的过程中对于获得的不同的权重矩阵和偏执项记录调整,对于所得模型诊断错误对应的压裂作业施工数据进行分类整理收集后,对该模型进行再次训练和更新,此次训练设置执行20个迭代次数epoch,即使用数据集的全部样本完成地训练20次,模型训练的迭代次数epoch达到了指定的次数结束所有训练。
步骤5、对模型进行评价其性能和效果,将性能评价良好的模型作为最终训练完成的压裂措施过程监控模型。
本发明评价指标包括准确率和精确度,准确率和精确度的定义如下:
Figure SMS_140
(9);
Figure SMS_141
(10);
其中,
Figure SMS_142
表示为正样本并被分类为正样本的个数;/>
Figure SMS_143
表示正样本被分类为负的样本数;/>
Figure SMS_144
表示为实际为正样本但被分类为负的样本数;/>
Figure SMS_145
表示负样本但被分类为负样本数。
步骤6、采用训练完成的压裂措施过程监控模型实时监控压裂施工过程,实时预测压裂风险。
将步骤5中性能评价良好的作为输出模型,然后将现场实时采集的压裂施工过程数据输入该模型后,得到压裂风险预测的结果后并将结果及时显示,供压裂工作人员和压裂施工专家查验确认,当风险预测结果为存在压裂风险时,进行及时预警。本发明预警功能通过连接一个警报装置实现,当风险预测结果为存在压裂风险时,及时触发警报装置。本发明利用数据库技术集成不同源类型监测数据,保证异构数据交互实时性,利用数据库技术建立压裂风险数据库,为之后模型建立与训练准备数据。
为了证明本发明的可行性,给出如下实施例。
获取某一油田实际压裂监测数据作为样本数据对本发明的预警方法进行测试。基于该油田实际压裂监测数据进行预警的具体过程为:
步骤1、收集实际压裂监测数据以及历史的压裂施工数据样本,初步筛选可以获得800个可用样本,分为8组,每组100个,样本间差异性足够,并按照8:2的比例将样本集合划分为训练集和测试集。
步骤2、对样本数据集进行预处理,然后利用pandas库中的isnull和fillna函数将数据集缺测值填充为中位数;再然后进行数据异常值处理,删除了重复数据,并进行数据合并;最后对样本数据进行了归一化处理。本实施例中,归一化处理时直接使用了Python工具sklearn依赖包中提供的MinMaxScaler函数实现。
本实施例中数据集过大可能导致内存爆炸,因此在归一化处理后得到numpy数据后,将处理好的numpy数据类型转化成tensor数据类型,然后添加数据加载器,以防止数据集过大,直接加载到内存中导致内存爆炸,因此使用数据加载器分批次加载数据。
步骤3、构建基于门控循环单元神经网络的压裂措施过程监控模型,根据输入数据计算时刻
Figure SMS_146
的重置门/>
Figure SMS_147
和更新门/>
Figure SMS_148
,然后计算当前时刻用于描述当前输入的单元状态/>
Figure SMS_149
和输出值/>
Figure SMS_150
,最后进行输出值解码并在GPU上加速训练。
步骤4、对构建的压裂措施过程监控模型进行模型的预训练,设定模型参数,随机初始化网络参数,网络参数权重矩阵和偏执项默认值均为0,本模型采用门控循环单元GRU加全连接层的设置,网络层数共计4层,批次大小为32,在预训练的过程中对于获得的不同的权重矩阵和偏执项记录调整,对于所得模型诊断错误对应的压裂作业施工数据进行分类整理收集后,对该模型进行再次训练和更新。在模型训练后加入了模型验证,防止过拟合,让模型有更好的泛化性和鲁棒性,模型训练完成后需要在测试集进行验证,如果损失下降,则保留次轮训练的模型。
模型的优化器采用的是Adam优化器,基本学习率设置为0.001,并在后续循环中将至0.0001和0.00001之间。在模型中定义损失函数,用于比较预测值和真实值,也反映了模型的性能如何。
步骤5、对模型性能进行评价,其中,评价指标包括准确和误差损失。
图2为本发明实施例样本训练和验证过程的拟合效果图。由图2能够看出,循环迭代在70次到85次区间内,模型的测试和预测曲线极为接近,后续迭代过程虽然略微有波动,但预测曲线基本维持为测试曲线的走势。
图3是本发明实施例样本训练过程的误差损失曲线图,从图中可以看出,当循环迭代到10次之后,训练损失几乎接近0.001,且前期损失降低迅速,而在后续训练过程中,误差损失也是保持较为平稳,效果略有提升。
图4是本发明实施例样本测试验证过程的误差损失曲线图,从图中可以看出,循环迭代达到10次前,曲线出现了上升,但有快速下降,迭代达到10次之后验证损失更是接近0.025。
根据根训练和验证两个阶段的实验结果可以看出,本发明设计的基于门控循环单元神经网络的压裂措施过程监控模型在全样本预测任务中表现出优异的性能。
步骤6、输出评价性能良好的压裂措施过程监控模型,实时采集压裂作业施工监测数据,输入模型,实时输出压裂风险预测结果。
目前油气开采不断向深部复杂地层方向发展,底层复杂程度不断提升,人工监测判别反应速度慢,且会因为精力有限出现漏判,如何快速识别风险,有效降低损失颇有研究价值。本发明通过训练好的基于门控循环单元神经网络的压裂措施过程监控模型能够快速且准确预测压裂曲线的变化,为专家快速诊断预测提供帮助。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (8)

1.一种基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,包括如下步骤:
步骤1、采集历史压裂施工中的原始监测数据构建样本数据集,并对原始监测数据的压裂异常类型进行人工标注;
步骤2、对样本数据集进行预处理;
步骤3、构建基于门控循环单元神经网络的压裂措施过程监控模型;
步骤4、对构建的压裂措施过程监控模型进行模型的预训练和参数调优;
步骤5、对模型进行评价其性能和效果,将性能评价良好的模型作为最终训练完成的压裂措施过程监控模型;
步骤6、采用训练完成的压裂措施过程监控模型实时监控压裂施工过程,实时预测压裂风险。
2.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤1的具体过程如下:
步骤1.1、通过实时现场拍摄和现场传回的方式收集监测参数数据和视频监控图像数据构建样本数据集;
步骤1.2、将人工标注的压裂施工样本数据集分成若干个小组,每个小组均按照8:2的比例划分为训练集和测试集,且训练集和测试集互不相交。
3.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤2的具体过程如下:
步骤2.1、对样本数据集进行特征选择;在输入的训练样本中,从
Figure QLYQS_1
维的压裂风险特征中选出和风险特征息息相关的/>
Figure QLYQS_2
维特征子集,且/>
Figure QLYQS_3
,再将/>
Figure QLYQS_4
维风险特征及每个风险特征对应的1维的实际风险结果作为一个集合;
步骤2.2、进行数据缺失值填充;采用Python语言工具,利用pandas库中的isnull函数判断缺测值,利用fillna函数将缺失的数据填充为中位数值;
步骤2.3、进行数据异常值处理,纠正错误数据;
选用拉依达准则监测异常值判断,假设压裂监测数据集服从正态分布:
Figure QLYQS_5
(1);
Figure QLYQS_6
(2);
Figure QLYQS_7
(3);
其中,
Figure QLYQS_8
表示概率,/>
Figure QLYQS_9
表示原始压裂数据集数据,/>
Figure QLYQS_10
表示均值,/>
Figure QLYQS_11
表示标准差,/>
Figure QLYQS_12
表示数据点的数量, />
Figure QLYQS_13
表示数据集中第/>
Figure QLYQS_14
个数据点;
如果
Figure QLYQS_15
的值超过了/>
Figure QLYQS_16
区间,就把此数据作为异常数据进行处理,使用平均值来替换异常值;
步骤2.4、删除重复数据,并以时间信息为基准进行数据整合;
步骤2.5、进行归一化处理;
对样本数据集中的数据
Figure QLYQS_17
进行归一化的公式为:
Figure QLYQS_18
(4);
其中,
Figure QLYQS_19
表示归一化后的数据,/>
Figure QLYQS_20
表示样本数据最大值,/>
Figure QLYQS_21
表示样本数据最小值。
4.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤3中,构建的基于门控循环单元神经网络的压裂措施过程监控模型包含时刻输入、重置门、更新门、时刻输出;
压裂措施过程监控模型的输入项包含套压、排量、砂斗余量、井底压力参数、井口有害气体含量、是否憋压、有无泵抽空7项,模型的输入为7项数据的集合,将时刻输入值输入压裂措施过程监控模型后,经过重置门、更新门后得到输出值,输出值为单一输出项,对应压裂风险的诊断结果;
门控循环单元神经网络的内部工作流程为:首先通过上一时刻的隐藏状态和当前时刻的输入得到更新门和重置门的门信号输出,得到门信号后利用重置门对数据进行处理,然后利用
Figure QLYQS_22
函数把数据直接缩放到0和1,最后用同一个门实现数据的选择性遗忘和选择性存储。
5.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤3中,基于门控循环单元神经网络的压裂措施过程监控模型的具体预测过程为:
步骤3.1、压裂措施过程监控模型根据输入数据,计算门控循环单元当前时刻
Figure QLYQS_23
的重置门/>
Figure QLYQS_24
Figure QLYQS_25
(5);
其中,
Figure QLYQS_26
表示重置门的权重矩阵;/>
Figure QLYQS_27
表示预测模型上一时刻的隐藏状态;/>
Figure QLYQS_28
表示该预测模型中当前时刻/>
Figure QLYQS_29
的输入,/>
Figure QLYQS_30
,/>
Figure QLYQS_32
表示总时长;/>
Figure QLYQS_33
表示重置门的偏执项,/>
Figure QLYQS_31
表示Sigmoid激活函数;
步骤3.2、计算门控循环单元当前时刻
Figure QLYQS_34
的更新门/>
Figure QLYQS_35
Figure QLYQS_36
(6);
其中,
Figure QLYQS_37
表示更新门的权重矩阵,/>
Figure QLYQS_38
表示更新门的偏执项;
步骤3.3、计算门控循环单元当前时刻
Figure QLYQS_39
的用于描述当前输入的单元状态/>
Figure QLYQS_40
Figure QLYQS_41
(7);
其中,
Figure QLYQS_42
表示单元状态权重矩阵,/>
Figure QLYQS_43
表示单元状态的偏执项,/>
Figure QLYQS_44
为激活函数;
步骤3.4、计算门控循环单元当前时刻
Figure QLYQS_45
的输出值/>
Figure QLYQS_46
Figure QLYQS_47
(8);
其中,
Figure QLYQS_48
表示对当前单元的选择性遗忘;/>
Figure QLYQS_49
表示对当前单元的选择性记忆;
步骤3.5、对输出值进行解码,把输出值作为输入传入全连接层,全连接层将其映射到一个新的向量,该向量维度为1,对该向量应用sigmoid激活函数将值压缩为0到1之间;把sigmoid函数的输出值与阈值0.5比较,大于阈值解码为1,否则解码为0;0和1对应预测的结果,当为0时,表示预测的结果为无压裂风险,当为1时,表示预测的结果为存在压裂风险。
6.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤4的具体过程如下:
步骤4.1、设定模型参数,初始化网络参数,网络参数包括权重矩阵、偏执项;
步骤4.2、将预处理完成后的训练集输入模型,训练集的每组数据包括多条压裂数据,每条压裂数据包括多维的特征和1维实际的压裂结果;
步骤4.3、模型的门控循环单元接收到传入的多条数据后,进行迭代训练,依次计算当前时刻
Figure QLYQS_50
的重置门/>
Figure QLYQS_51
、更新门/>
Figure QLYQS_52
、单元状态/>
Figure QLYQS_53
,得到输出值;
步骤4.4、若当前时刻
Figure QLYQS_54
小于总时长/>
Figure QLYQS_55
,即/>
Figure QLYQS_56
,则使/>
Figure QLYQS_57
,重复执行步骤4.3;若达到总时长/>
Figure QLYQS_58
,则该时刻的输出值/>
Figure QLYQS_59
是最后一个时刻的输出值;
在预训练的过程中对于获得的不同的权重矩阵和偏执项记录调整,对于所得模型诊断错误对应的压裂作业施工数据进行分类整理收集后,对该模型进行再次训练和更新,达到了指定的次数结束所有训练。
7.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤5中,选择的评价指标包括准确率和精确度,准确率和精确度的定义如下:
Figure QLYQS_60
(9);
Figure QLYQS_61
(10);
其中,
Figure QLYQS_62
表示为正样本并被分类为正样本的个数;/>
Figure QLYQS_63
表示正样本被分类为负的样本数;/>
Figure QLYQS_64
表示为实际为正样本但被分类为负的样本数;/>
Figure QLYQS_65
表示负样本但被分类为负样本数。
8.根据权利要求1所述基于门控循环单元神经网络的压裂措施过程监控方法,其特征在于,所述步骤6的具体过程为:将步骤5中性能评价良好的作为输出模型,然后将现场实时采集的压裂施工过程数据输入该模型后,得到压裂风险预测的结果后并将结果及时显示,供压裂工作人员和压裂施工专家查验确认,当风险预测结果为存在压裂风险时,进行及时预警。
CN202310651050.5A 2023-06-05 2023-06-05 一种基于门控循环单元神经网络的压裂措施过程监控方法 Pending CN116383722A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310651050.5A CN116383722A (zh) 2023-06-05 2023-06-05 一种基于门控循环单元神经网络的压裂措施过程监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310651050.5A CN116383722A (zh) 2023-06-05 2023-06-05 一种基于门控循环单元神经网络的压裂措施过程监控方法

Publications (1)

Publication Number Publication Date
CN116383722A true CN116383722A (zh) 2023-07-04

Family

ID=86971522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310651050.5A Pending CN116383722A (zh) 2023-06-05 2023-06-05 一种基于门控循环单元神经网络的压裂措施过程监控方法

Country Status (1)

Country Link
CN (1) CN116383722A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116861800A (zh) * 2023-09-04 2023-10-10 青岛理工大学 一种基于深度学习的油井增产措施优选及效果预测方法
CN117408165A (zh) * 2023-12-14 2024-01-16 中国石油大学(华东) 一种基于机器学习的压裂过程复杂事件智能预警优化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533163A (zh) * 2019-08-02 2019-12-03 中国石油集团长城钻探工程有限公司 基于长短时记忆神经网络的压裂砂堵预警方法
CN113744873A (zh) * 2021-11-08 2021-12-03 浙江大学 一种基于任务分解策略的发热待查辅助鉴别诊断系统
CN115994608A (zh) * 2022-10-21 2023-04-21 中国石油大学(北京) 基于双向门控循环单元的压裂井产量预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533163A (zh) * 2019-08-02 2019-12-03 中国石油集团长城钻探工程有限公司 基于长短时记忆神经网络的压裂砂堵预警方法
CN113744873A (zh) * 2021-11-08 2021-12-03 浙江大学 一种基于任务分解策略的发热待查辅助鉴别诊断系统
CN115994608A (zh) * 2022-10-21 2023-04-21 中国石油大学(北京) 基于双向门控循环单元的压裂井产量预测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XUECHEN LI等: "Application of Gated Recurrent Unit (GRU) Neural Network for Smart Batch Production Prediction", 《MDPI》, pages 1 - 22 *
周于皓等: "基于循环神经网络的缝洞型油藏油井产量预测", 《计算物理》, vol. 35, no. 06, pages 668 - 674 *
王俊等: "基于门控循环单元神经网络的储层孔渗饱参数预测", 《石油物探》, vol. 59, no. 04, pages 616 - 627 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116861800A (zh) * 2023-09-04 2023-10-10 青岛理工大学 一种基于深度学习的油井增产措施优选及效果预测方法
CN116861800B (zh) * 2023-09-04 2023-11-21 青岛理工大学 一种基于深度学习的油井增产措施优选及效果预测方法
CN117408165A (zh) * 2023-12-14 2024-01-16 中国石油大学(华东) 一种基于机器学习的压裂过程复杂事件智能预警优化方法
CN117408165B (zh) * 2023-12-14 2024-03-15 中国石油大学(华东) 一种基于机器学习的压裂过程复杂事件智能预警优化方法

Similar Documents

Publication Publication Date Title
CN110148285B (zh) 一种基于大数据技术的油井参数智能预警系统及其预警方法
US9280517B2 (en) System and method for failure detection for artificial lift systems
CN116383722A (zh) 一种基于门控循环单元神经网络的压裂措施过程监控方法
CN109508827B (zh) 一种基于时间递归神经网络的钻井事故预警方法
EP1982046B1 (en) Methods, systems, and computer-readable media for real-time oil and gas field production optimization using a proxy simulator
CN112926273A (zh) 一种多元退化设备剩余寿命预测方法
Leng et al. A hybrid data mining method for tunnel engineering based on real-time monitoring data from tunnel boring machines
CN114707234B (zh) 一种基于贝叶斯深度学习的航空发动机剩余寿命预测方法
CN116227365B (zh) 一种基于改进vmd-tcn的滑坡位移预测方法
CN112882909A (zh) 燃料电池系统故障预测方法、装置
CN111827982A (zh) 钻井溢流漏失工况预测方法及装置
CN114444582A (zh) 基于卷积神经网络与贝叶斯网络的机械设备故障诊断方法
CN115983465A (zh) 一种基于小样本学习的冲击地压时序预测模型构建方法
CN115545272A (zh) 冲击地压矿井微震频次和能量长短期智能预测预警方法
CN116777085B (zh) 基于数据分析和机器学习技术的煤矿水害预测系统
Geekiyanage et al. Feature selection for kick detection with machine learning using laboratory data
Chen et al. Spatio‐temporal data mining method for joint cracks in concrete dam based on association rules
CN112861422A (zh) 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统
CN117493798A (zh) 一种气象环境数据分析方法及系统
Tan et al. The health index prediction model and application of PCP in CBM wells based on deep learning
Hou et al. A multi-target prediction model for dam seepage field
Yang et al. Machine Learning in Process Safety and Asset Integrity Management
Coussirou et al. Anomaly detections on the oil system of a turbofan engine by a neural autoencoder.
Shaohu et al. Prediction of drilling plug operation parameters based on incremental learning and CNN-LSTM
Noori et al. Condition monitoring system for internal blowout prevention (ibop) in top drive assembly system using discrete event systems and deep learning approaches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination