CN112861422B - 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统 - Google Patents

一种深度学习的煤层气螺杆泵井健康指数预测方法及系统 Download PDF

Info

Publication number
CN112861422B
CN112861422B CN202110028154.1A CN202110028154A CN112861422B CN 112861422 B CN112861422 B CN 112861422B CN 202110028154 A CN202110028154 A CN 202110028154A CN 112861422 B CN112861422 B CN 112861422B
Authority
CN
China
Prior art keywords
health index
screw pump
health
model
coal bed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110028154.1A
Other languages
English (en)
Other versions
CN112861422A (zh
Inventor
檀朝东
王松
宋健
冯钢
宋文容
马丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yadan Petroleum Technology Co ltd
Xi'an Zhongkong Tiandi Technology Development Co ltd
China University of Petroleum Beijing
Original Assignee
Beijing Yadan Petroleum Technology Co ltd
Xi'an Zhongkong Tiandi Technology Development Co ltd
China University of Petroleum Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yadan Petroleum Technology Co ltd, Xi'an Zhongkong Tiandi Technology Development Co ltd, China University of Petroleum Beijing filed Critical Beijing Yadan Petroleum Technology Co ltd
Priority to CN202110028154.1A priority Critical patent/CN112861422B/zh
Publication of CN112861422A publication Critical patent/CN112861422A/zh
Application granted granted Critical
Publication of CN112861422B publication Critical patent/CN112861422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及一种深度学习的煤层气螺杆泵井健康指数预测方法,包括以下步骤中的一个或几个:从煤层气螺杆泵井采集的多个原始参数中选取至少一个作为主控参数;对至少一个主控参数进行合并处理以构建健康指数;根据健康指数将煤层气螺杆泵井健康状态划分为至少两个不同阶段;提取煤层气螺杆泵井的健康指数数据作为样本数据,采用长短时记忆神经网络构建健康指数预测模型;应用健康指数预测模型,预测煤层气螺杆泵井的健康状态变化。

Description

一种深度学习的煤层气螺杆泵井健康指数预测方法及系统
技术领域
本发明涉及采油工程采气技术领域,尤其涉及一种深度学习的煤层气螺杆泵井健康指数预测方法及系统。
背景技术
煤层气产出是解吸—扩散—渗流过程的有机统一,通过持续排出煤层(或是侵入煤层)中的水,降低储层压力,使储层压力降低至甲烷的解吸压力后,吸附在煤基质孔隙中的甲烷气体解吸,后经过扩散、渗流进入井筒中。螺杆泵是煤层气井中排采举升方法之一。螺杆泵在煤层气井中运行常发生故障,产量损失大,设备寿命短。因此,煤层气井螺杆泵运行健康状态监测、诊断、预警已引起了研究人员和现场工程师越来越多的关注。
在由Liang Yaning等人发表的《A Case Study on Application of ProgressiveCavity Pump in Coalbed Methane Wells》文章中,为了将煤粉对生产的影响降到最低,分析了澳大利亚某煤层气田167口生产井修井的主要原因,指出压力传感器故障是导致螺杆泵相关修井作业的主要原因,同时对煤层气井螺杆泵的选择和应用提供了良好的建议。在由Vora等人发表的《Novel Idea for Optimization of a Progressive Cavity Pump PCPSystem at Different Stages of Coal Bed Methane CBM Well Life》文章中,根据现场经验,提出了一种在煤层气井生命周期的不同阶段优化螺杆泵生产系统的新思路,该方法降低了煤层气的生产成本。依靠经验和统计法,虽然提出了延长泵使用寿命的方法,但是不能够对泵未来一段时间的健康状态进行评估,没有能够实现预测性维修。还有一部分学者,基于机器学习方法提出了一些关于PCP健康管理措施。例如在由Saghir,F.等人发表的《Machine Learning for Progressive Cavity Pump Performance Analysis:A CoalSeam Gas Case Study》文章中,讨论了如何使用从自动化系统收集的数据,将数据逼近和无监督机器学习方法应用于时间序列数据集,以帮助分析PCP性能和检测异常泵行为。例如在由Hoday,J.P.等人发表的《Diagnosing PCP Failure Characteristics usingException Based Surveillance in CSG》文章中,提出了一种基于异常监视的方法来表征螺杆泵故障,使监测每口井的作业条件的信息价值最大化,并使作业成本最小化。在由Saghir,F.等人发表的《Converting Time Series Data into Images:An InnovativeApproach to Detect Abnormal Behavior of Progressive Cavity Pumps Deployed inCoal Seam Gas Wells》文章中,提出了将从时间序列数据中提取的特征转换为图像,从而有助于自主检测螺杆泵异常行为。在由Prosper,C.等人发表的《Case Study AppliedMachine Learning to Optimise PCP Completion Design in a CBM Field》文章中,提出了一种机器学习框架的使用,该框架可用于自定义每个修井配置,从而优化PCP的使用寿命,同时兼顾油井的异质性和寿命。
基于机器学习的这些方法,虽然提出了一些实时监测螺杆泵健康状态的方法,但是都是基于对煤层气井采集的参数进行监视,由于煤层气采集的参数较多,所以不能够实现对螺杆泵健康状态进行定量评估且评估结果不准确。也有一部分学者通过一些新的技术对螺杆泵进行健康管理。例如在由Hickset al等人发表的《New Technology ReducesFlushbys&Extends PCP Run Life in Australia》文章中,其在PCP上方使用一种称为压力致动安全阀(PAR阀)的工具,以消除停机期间的固体沉降。在由Caballeroa,D.等人发表的《PCP Run Life Improvement in Orinoco Belt With New PCP Technology》文章中,开发了一种液压调节PCP技术,该技术延长了PCP的使用寿命。在TAN Chaodong等人发表的《Intelligent decision making on PCP production parameters of CBM wells basedon reinforcement learning》文章中,为了实现煤层气井螺杆泵排采参数的连续决策和连续控制,以煤层气井螺杆泵生产周期内最大累积产气量为优化目标,提出了一种具有动作自寻优能力的螺杆泵排采强化模型的框架和Q学习及Sarsa、Sarsa(lambda)算法。基于以上技术方法,虽然能够延长PCP的使用寿命,提高煤层气井的产量,但是不能够对举升设备PCP的健康状态进行实时评估与预测。
事实上健康状态评估在其他设备系统中也得到了广泛的研究与应用,大多数是利用当前检测数据及历史运行数据,对设备系统或子系统当前健康状态做出评估,例如现有技术中公开号为CN102169337B的专利文献所提出的一种煤层气螺杆泵井监控系统,包括:太阳能控制装置、传感器、多参数记录仪、电流互感器、电参数采集器、无线控制器、液面自动监测仪、中控计算机、便携式数据采集器、监测诊断软件。多参数记录仪通过电流互感器、电参数采集器可以测量螺杆泵井的电压、电流参数,并能够计算出有功功率、功率因数等其他电参数。在中控计算机中安装数据监测诊断软件,接收测试数据,形成数据库,对数据库中的各测试参数进行综合分析诊断,结合历史数据参数自动描绘出煤层气井各参数变化情况。所有参数数据历史记录曲线采用K线图形式表现,可以方便查看每一口井、每天、以及任意一段时间内的参数变化。该系统通过模块化结构管理对泵井中的各项参数进行实时监控,及时发现泵井内出现的异常,并通过准确记录参数数值为泵井储备参数信息,以备后续使用。
然而,从煤层气螺杆泵井所采集到的相关数据的数量非常庞大,将使得目前如上述现有技术所提出的煤层气螺杆泵井监控系统所需的数据处理量非常巨大,无法快速准确地反映出泵井的异常;并且,该煤层气螺杆泵井监控系统对数据的处理非常单一,仅仅能够体现多项数据的实时变化,滞后性严重,无法提前故障预警。
此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于申请人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申请人保留在背景技术中增加相关现有技术之权利。
发明内容
针对煤层气井螺杆泵目前所存在的管理不及时、缺少有效的测试设备而导致故障率偏高的问题,现有技术中如公开号为CN102169337B的专利文献提出了一种煤层气螺杆泵井监控系统,其利用接收到的测试数据形成数据库,对数据库中的各测试参数进行综合分析诊断,结合历史数据参数自动描绘出煤层气井各参数变化情况。然而,从煤层气螺杆泵井所采集到的相关数据的数量非常庞大,将使得目前如上述现有技术所提出的煤层气螺杆泵井监控系统所需的数据处理量非常巨大,无法快速准确地反映出泵井的异常;并且,该煤层气螺杆泵井监控系统对数据的处理非常单一,仅仅能够体现多项数据的实时变化,滞后性严重,无法提前故障预警。
针对上述煤层气井螺杆泵在健康状态实时评估和故障预警方面所面临的问题,本申请提出了一种基于深度学习的方法及系统,构建了煤层气螺杆泵井健康指数计算模型和预测模型,不仅能够有效地反映煤层气螺杆泵井健康状况的前后关联趋势,并且实现了煤层气井螺杆泵运行健康状态的实时、定量、精确的评估与预测。本申请至少具有以下优点:
(1)本申请提出了一种深度学习的煤层气螺杆泵井健康指数预测方法及系统,建立了故障预测五步法:即数据预处理、主控参数优选、健康指数构建、健康阶段划分和健康状态预测。
(2)本申请通过对煤层气螺杆泵井多项生产参数进行数据预处理和主控参数优选,确定了若干项能够反映煤层气螺杆泵井健康状态的主控参数,基于此,构建了一个能够反映煤层气螺杆泵井健康状态的综合指标即健康指数,并将煤层气螺杆泵井健康状态划分为至少两个不同阶段。
(3)本申请应用长短时记忆神经网络(LSTM)对样本集进行训练,得到了健康指数的机器学习模型,能够实时准确地对煤层气螺杆泵井的运行健康状态进行预测,实现对煤层气螺杆泵井故障预警。
(4)构建的健康指数模型和LSTM预测模型能够兼顾煤层气井健康状况的变化趋势和前后关联,具有较高的预测精度,实现煤层气螺杆泵井运行健康状态的实时定量评估、故障识别、精确预测。
并且,本申请还以SURAT盆地某煤层气田30口螺杆泵故障井和6口正常井的生产数据为研究对象,确定了4项能够反映煤层气螺杆泵井健康状态的主控参数,计算和预测了健康指数,判别了煤层气螺杆泵井故障类型和健康程度。研究表明,构建的健康指数模型和LSTM预测模型能够反映煤层气螺杆泵井健康状况的前后关联趋势,具有较高的预测精度,实现煤层气井螺杆泵运行健康状态的实时、定量、精确的评估与预测,对煤层气螺杆井生产性能分析和故障预警具有较好的指导作用,也为其他油气举升设备健康状态评估和预警提供了一种新的方法。
所述煤层气螺杆泵井健康指数预测方法包括以下步骤中的一个或几个:从煤层气螺杆泵井采集的多个原始参数中选取至少一个作为主控参数;对至少一个主控参数进行合并处理以构建健康指数;根据健康指数将煤层气螺杆泵井健康状态划分为至少两个不同阶段;提取煤层气螺杆泵井的健康指数数据作为样本数据,采用长短时记忆神经网络构建健康指数预测模型;应用健康指数预测模型,预测煤层气螺杆泵井的健康状态变化。
根据一种优选实施方式,主控参数是通过对煤层气螺杆泵井采集的多个原始参数进行数据预处理与主控参数优选所选取的,其中,主控参数优选的步骤包括:利用皮尔逊相关系数法对至少一个参数进行相关性分析;将经过皮尔逊相关系数筛选后的参数进行主成分分析,确定至少一个主控参数。
根据一种优选实施方式,构建健康指数的步骤包括:将采集的所有煤层气故障井的主控参数进行合并;采用主成分分析计算n项主控参数的协方差矩阵A;对协方差矩阵A进行对角化处理,并将得到的协方差矩阵A的特征值作为各项主控参数的权重;将n项主控参数的权重分别与其参数相乘后相加,并进行归一化处理,得到健康指数。
根据一种优选实施方式,根据健康指数的变化趋势将煤层气螺杆泵井健康状态划分为健康、亚健康和故障三个阶段。
根据一种优选实施方式,根据煤层气螺杆泵井的健康指数数据,统计所有样本井中与各健康状态阶段分别对应的健康指数的范围,并根据统计结果,得出健康指数由健康到亚健康以及由亚健康到故障的阈值,作为故障报警的依据。
根据一种优选实施方式,所述健康指数预测模型的构建包括以下步骤:调用接口创建长短时记忆神经网络模型,设置初始参数;根据模型结构,建立煤层气螺杆泵故障井健康指数训练集和测试集;通过网格搜索方法,选择出模型最佳超参数以及激活函数与优化函数;利用训练集数据进行模型训练,利用测试集数据进行模型预测精度评价,根据预测精度调整和优选超参数。
根据一种优选实施方式,所述健康指数预测模型选用tanh函数作为激活函数,Adam函数作为优化函数。
根据一种优选实施方式,所述方法还包括通过分析健康指数曲线变化的缓慢程度,判别故障的严重程度。
根据一种优选实施方式,所述方法至少包括以下步骤:设某一时刻t输入的主控参数值为Xt=(x1t,x2t,…,xnt),采用下式计算得出t时刻的综合指数CIt:CIt=λXt T,式中:λ为由协方差矩阵A的特征值组成的特征值向量,λ=(λ12,…λn);采用下式计算得出T时段内每个时刻的综合指数CI:CI=(CI0,CI1,…,CIt);将得到的综合指数CI进行归一化处理,即得到健康指数HI。
本申请还提出了一种深度学习的煤层气螺杆泵井健康指数预测系统,包括:第一数据处理模块,其被配置为从煤层气螺杆泵井采集的多个原始参数中选取至少一个作为主控参数;第二数据处理模块,其被配置为对至少一个主控参数进行合并处理以构建健康指数;第三数据处理模块,其被配置为根据健康指数将煤层气螺杆泵井健康状态划分为至少两个不同阶段;第四数据处理模块,其被配置为提取煤层气螺杆泵井的健康指数数据作为样本数据,采用长短时记忆神经网络构建健康指数预测模型;第五数据处理模块,其被配置为应用健康指数预测模型,预测煤层气螺杆泵井的健康状态变化。第一至第五数据处理模块依次连接,第二数据处理模块还与第四数据处理模块连接。上述与单个模块所对应的可执行语句可以是由单个或两个及以上的模块所完成,单个模块可以对应完成上述一条或两条及以上的可执行语句。
附图说明
图1是本发明中提供的健康指数随螺杆泵故障严重程度不同所呈现出的变化趋势示意图;
图2是本发明中提供的LSTM的Cell结构简化示意图;
图3是本发明中提供的参数相关性分析图;
图4是本发明中提供的参数权重分析图;
图5是本发明中提供的主控参数统计图;
图6是本发明中提供的E001井的四项主控参数随时间变化趋势示意图;
图7是本发明中提供的E001井的健康指数随时间变化趋势示意图;
图8是本发明中提供的部分故障井的健康指数随时间变化趋势示意图;
图9是本发明中提供的在正常工况下健康指数随时间变化趋势示意图;
图10是本发明中提供的在油管断脱工况下健康指数随时间变化趋势示意图;
图11是本发明中提供的在泵干磨工况下健康指数随时间变化趋势示意图;
图12是本发明中提供的LSTM模型训练集损失函数随训练次数的变化过程图;
图13是本发明中提供的训练集与测试集的预测值与真实值对比曲线图。
具体实施方式
下面结合附图进行详细说明。
本申请提出了一种深度学习的煤层气螺杆泵井健康指数预测方法及系统,或为一种基于人工智能的煤层气螺杆泵井健康状态预测方法。该方法包括以下步骤(该系统中至少一个数据处理模块被配置为执行以下步骤中的一个或几个):
S1:从煤层气井采集的多个参数中选择至少一个参数作为主控参数,构成健康指数计算模型的输入变量。
煤层气井采集的参数较多,然而在这些参数中,有一部分参数变化的趋势相同,表现出强相关性;还有一部分参数不能够表征螺杆泵是否发生故障或影响程度较小。因此,在螺杆泵故障预警预测前,有必要进行主控参数优选。本申请利用皮尔逊相关系数法进行相关性分析,将经过皮尔逊相关系数筛选后的参数进行主成分分析,选择至少一个主控参数。
皮尔逊相关系数也称为皮尔逊积矩相关系数(Pearson product-momentcorrelation coefficient),是一种线性相关系数,记为γ,用来反映两个变量X和Y的线性相关程度,γ值介于-1~1之间,其绝对值越大表明相关性越强。γ的计算公式为:
Figure BDA0002889318330000071
γ还可以由(Xi,Yi)样本点的标准分数均值估计得到与上式等价的表达式:
Figure BDA0002889318330000081
式中:
Figure BDA0002889318330000082
与/>
Figure BDA0002889318330000083
分别为Xi和Yi样本的标准分数;/>
Figure BDA0002889318330000084
和/>
Figure BDA0002889318330000085
分别为Xi和Yi样本的平均值;σx和σy分别为Xi和Yi样本的标准差;n为样本数量;i为样本点的序号。
皮尔逊相关系数与相关性程度的关系如表1所示。
表1 相关性强弱关系表
皮尔逊相关系数 相关性
0.8—1.0 极强相关
0.6—0.8 强相关
0.4—0.6 中等程度相关
0.2—0.4 弱相关
0.0—0.2 极弱相关或无相关
在本申请中,规定煤层气螺杆泵井生产参数之间的相关系数γ大于0.9则为极强相关。
主成分分析(Principal Component Analysis,PCA),是把原来多个变量简化为少数几个综合指标的一种统计分析方法。从数学角度看,主成分分析是一种降维处理技术。煤层气螺杆泵井自动采集的参数较多,将大量因素作为模型输入参数无疑会增加分析问题的难度和复杂性。对此,在本申请中,利用各个因素之间的相关关系,用降维后的主成分代替原来较多的影响因素。
其输入输出如下:
输入:n维样本集D=(x(1),x(2),…,x(n)),要降低到n′维(其中x(i)表示每项参数,i=1,2,…n)。
输出:降维后的样本集D′。
降维具体的算法流程:
(1)对所有的样本进行中心化
Figure BDA0002889318330000086
(2)计算样本的协方差矩阵XXT
(3)对协方差矩阵XXT进行特征值分解,其特征值结果为W=(w1,w2,…wn)。
(4)计算各参数权重大小,其计算公式为:
Figure BDA0002889318330000091
得到权重结果为Ω=(ω12,…,ωn)。
(5)设定主控参数阈值。将各参数权重从大到小进行相加,当权重和大于95%时,则认为这些参数能够表征所有特征,去掉剩余参数。
煤层气井采集的原始参数经过数据预处理与主控参数优选后,选择出n项参数作为预测煤层气螺杆泵井健康程度的主控参数。
S2:对煤层气故障井的主控参数进行处理得到健康指数。
首先,将采集的所有煤层气故障井的主控参数进行合并,采用主成分分析计算n项主控参数的协方差矩阵A。将协方差矩阵A进行对角化处理,得到协方差矩阵A的特征值,即为各项主控参数的权重。将n项主控参数的权重分别与其参数相乘后相加,得到一个能够反映螺杆泵健康状态的综合指标,进行归一化处理得到健康指数(HI)。
具体地:假设由n项参数所构建的主控参数数据集如表2所示。
表2 假设数据集
Figure BDA0002889318330000092
主成分分析方法采用方差度量信息量,样本集合为{X=[X1j,X2j,…,Xnj]T 0≤j≤m-1},n为主控参数个数,m为某时刻t=m,Xnj=[xn1,xn2,…,xnj]。将所有的样本构建成一个n×m的矩阵,即为协方差矩阵,令协方差矩阵为A,则:
Figure BDA0002889318330000093
式中:xnj——数据集中第n个主控参数在t=j时刻所对应的样本属性值;
Figure BDA0002889318330000101
——主控参数n所有属性值的平均值,/>
Figure BDA0002889318330000102
令矩阵A的一组特征向量为υ,特征向量为υ所对应的特征值为λi(i=1,2,…,n),于是可以得出矩阵、特征值与特征向量之间的关系为:
Av=λiυ (4)
构建求解特征矩阵的特征值公式:
iE-A|=0 (5)
式中:E——单位矩阵。
设某一时刻t输入的主控参数值为Xt=(x1tx2t,…,xnt),则综合指数(CIt)计算公式为:
CIt=λXt T (6)
式中:λ——矩阵A的特征值组成的特征值向量,λ=(λ12,…λn)。
计算得出T时段内每个时刻的综合指数为:
CI=(CI0,CI1,…,CIt) (7)
将得到的综合指数进行归一化处理,即得到健康指数(HI)。
t时刻健康指数的计算公式为:
Figure BDA0002889318330000103
于是得到T时段内每个时刻的健康指数为:
HI=(HI0,HI1,…,HIt) (9)
S3:煤层气螺杆泵井健康程度的分级划分。
随着螺杆泵故障严重程度不同,健康指数会呈现出不同的变化趋势,在进行健康状态预测前,应根据健康指数的变化趋势将健康状态划分为不同的程度,即如图1所示的健康(healthy)、亚健康(Sub-health)和故障(Fault),图1中横坐标times(minutes)为时刻(分钟),纵坐标Health-indicators为健康指数HI。根据现有的数据,统计所有样本井健康、亚健康和故障的健康指数的范围。根据所统计的范围,得出HI由健康到亚健康、亚健康到故障的阈值,作为故障报警的依据。
S4:建立健康指数预测模型。
针对煤层气井生产数据及螺杆泵程度随时间变化的特征,本申请选用长短时记忆神经网络(LSTM),建立健康指数预测模型。LSTM是在通用循环神经网络(RNN)的基础上,在各隐藏层神经单元中加入记忆单元(LSTM_cell),实现时间序列上的记忆信息可控,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,是一种基于深度学习的人工智能预测算法。
为便于理解,如下先对LSTM的原理进行说明:为解决梯度消失问题及保持隐藏层的长期记忆,LSTM在RNN的基础上进行了改进。LSTM使用了三个“门控”来控制不同时刻的状态和输出,通过“门控”结构将短期记忆与长期记忆结合起来,可以缓解梯度消失的问题。LSTM结构在时间上的展开与RNN完全一致,区别在于其中Cell的不同,LSTM的Cell计算节点包含更多结构,包括更新门(update gate)、遗忘门(forget gate)和输出门(outputgate),如图2所示,各项计算公式如下:
Figure BDA0002889318330000111
Figure BDA0002889318330000112
Figure BDA0002889318330000113
Figure BDA0002889318330000114
Figure BDA0002889318330000115
Figure BDA0002889318330000116
其中,
Figure BDA0002889318330000117
代表遗忘门,如果遗忘门中的一个单元的值接近于0,LSTM将“忘记”先前单元状态对应单元中的存储状态,如果遗忘门中的一个单元的值接近1,LSTM将在存储状态中主要记住相应的值;/>
Figure BDA0002889318330000118
代表候选值,候选值是一个张量包含当前时间可能存储在Cell状态中的信息;/>
Figure BDA0002889318330000119
代表更新门,用来决定将候选值/>
Figure BDA00028893183300001110
哪些信息加入到c<t>中;c<t>是当前Cell状态信息的记录,信息用于在后续时间步骤中传递;输出门/>
Figure BDA00028893183300001111
决定哪些信息用于当前时间步骤的预测;a〈t>包含当前隐节点信息,用于传递到下一个时间步骤计算各个门的值和用于标签预测计算。
通过在隐藏层的计算节点中引入门控机制,LSTM在结构上天然地克服了梯度消失的问题,具有更多的参数来控制模型;通过四倍于RNN的参数量,可以更加精细地预测时间序列变量。设备健康指数的预测是一个长期的时序信息处理过程,因此,本申请选用LSTM作为健康指数预测模型。
健康指数预测模型的建立、训练及验证方法包括以下步骤:
(1)调用接口创建模型,设置初始参数。调用TensorFlow上的接口创建LSTM模型,设置神经网络层数(layers)、时间序列步长(timesteps)、神经元个数(neurons)、训练循环次数(epochs)、批量大小(batchsize)等超参数,并设置激活函数与优化函数。
(2)根据模型结构,建立训练集和测试集。按照LSTM模型结构,提取螺杆泵健康指数数据,设置时间序列,根据设定输入时间长度对样本数据进行分割处理,创建煤层气螺杆泵故障井HI训练集和测试集。其中每口样本井80%数据用于模型训练,20%数据用于模型测试。
(3)模型调参。通过网格搜索方法,选择出模型最佳超参数以及激活函数与优化函数。
(4)模型训练。利用训练集数据进行模型训练,利用测试集数据进行模型预测精度评价,根据预测精度调整和优选超参数。健康指数预测模型选用tanh函数作为激活函数、Adam函数作为优化函数。
(5)验证模型。对煤层气螺杆泵井健康指数预测模型效果进行评价时,设置该模型的预测总量为n,预测值为ypre,真实值为yt。可以选用表3的回归模型评价指标对模型准确率进行评价。
表3 回归模型评价指标
Figure BDA0002889318330000121
Figure BDA0002889318330000131
(6)模型发布。
用测试集数据评价健康指数预测模型的预测精度,当预测结果的精度达到预先所设定的要求时,模型训练完成,发布为正式预测模型。
实施例1
本实施例收集了澳大利亚SURAT盆地某煤层气区块中30口螺杆泵故障井和6口正常工况井从2017年6月到2020年1月的生产实时动态数据,包括井底流压、动液面、产气量、产水量、电流、电压、扭矩、油压、套压、转速和电压等10项参数,数据采集密度为1min。收集的故障井的故障类型有泵干磨、油管堵塞、定子堵塞、油管断脱、连接处断脱、泵效降低等6种故障。下面主要以E001井为例,进行生产特征分析、健康指数计算、故障诊断预警。
1>对煤层气螺杆泵井的生产特征进行分析,选取适应整个区块井的至少一个主控参数。
在数据预处理中,将原始数据进行了删(剔除噪点)、增(缺失值处理)操作,将煤层气井采集的10项参数处理成了8项。将这8项参数进行皮尔逊相关系数分析,如图3所示。图中r表示对应横纵坐标两参数之间的相关性系数,其中r为正数时表示参数之间正相关,正数越大,表示正相关越强;r为负数时表示参数之间负相关,负数越小,表示负相关越强。定义参数两两之间的相关性大于0.9为强相关。图3中,parameter correlation analysis指参数相关性分析,dh_press指井底流压,fluid_level指动液面、gas_flow_rate指产气量,water_flow_rate指产水量,motor_current指电流,torque指扭矩,tubing_press指油压,gas_press指套压。
从图3中可以看出,井底流压(dh_press)与动液面(fluid_level)之间的相关系数为0.99,电流(motor_current)与扭矩(torque)之间的相关系数为1,因此在井底流压与动液面、电流与扭矩两组中分别可以删除其中一项。本实施例中剔除动液面与扭矩。
将经过皮尔逊相关系数筛选后的参数进行主成分分析(parameter weightanalysis),得到如图4所示的权重分析图。图4中横坐标principal components为主成分,纵坐标为explained variance ratio(%)为方差解释率。图中各柱状图表示各参数所占的权重大小(individual explained variance),折线图表示各参数权重的加和(cumulativeexplained variance)。定义当参数的权重加和大于95%时所取得参数就能够完全表示所有参数的特征。在本实施例中,从图4中可以看出,当选取井底流压(dh_press),产气量(gas_flow_rate),套压(gas_press)和电流(motor_current)等前4项参数时,其累计权重大于95%。因此在E001井中选取了这四个参数作为主控参数。
为了使得所得到的主控参数适应整个区块井,统计分析了30口故障井的主控参数,如图5所示。选取了井底流压(dh_press)、产气量(gas_flow_rate)、套压(gas_press)、油压(tubing_press)四项参数作为主控参数。通过皮尔逊相关系数和PCA进行每口井主控参数优选,发现不同的井的主控参数有微小差异,于是统计了如图5中30口井的多项主控参数,并按照参数的重要性对多项主控参数进行编号(1,2,3,4,5)。编号体现在图中所示的例如dh_press1、gas_flow_rate2、motor_current3中的数字。上述跟在各参数后的数字编号,表示该参数在与之对应的井中被选中作为主控参数的优先顺序。例如E001号井所对应的dh_press1表示在选择E001号井的主控参数时第一选择为dh_press参数。
2>健康指数结果分析。
利用收集整理的30口故障样本井的4项主控参数,建立4×30的样本矩阵,代入式(3),计算得到能够适用于整个区块井的协方差矩阵A为:
Figure BDA0002889318330000141
由式(4)和(6)可以得到矩阵A的特征值主成的特征值向量:
λ=(2.65,1.06,0.10,0.18)
选取E001井故障发生前后4000个点的数据进行健康指数分析,其主控参数随时间变化如图6所示。图6中将四项主控参数分别作为竖轴,以时刻(分钟)作为横轴,得到图中分别对应四项主控参数的四条曲线。由公式(8)~(11)可以计算出E001井故障发生前后的健康指数,如图7所示,在故障发生前,健康指数在0.7~1.0之间来回波动,开始发生故障时,健康指数开始下降,直到最低值,在0~0.2区间波动。
对30口故障井和6口正常井进行健康指数计算,部分故障井健康指数如图8所示,可以得出:当螺杆泵正常运行时,健康指数处于0.7~1,当故障发生过程中,健康指数都会逐渐降低,因此能够准确地反映螺杆泵运行的健康状态。
统计了30口故障井的健康指数变化范围,见表4。可以看出:大多数井正常范围健康指数在0.7-1之间,故障范围在0~0.4之间。健康指数为0.7~1时,螺杆泵为健康;健康指数为0.4~0.7时,螺杆泵为亚健康;健康指数为0~0.4时,螺杆泵为故障。因此,当健康指数低于0.7时,故障预警;低于0.4时,故障报警。
表4 故障井阈值统计表
Figure BDA0002889318330000151
Figure BDA0002889318330000161
3>工况类型健康指数分析。
不同类型工况下的健康指数的变化情况也不尽相同,下面以正常、油管断脱和泵干磨三种工况为例进行分析,其健康指数如图9~图11所示。
从图9可以看出,当煤层气螺杆泵井正常运行时,健康指数在0.8~1.0之间上下波动,符合健康程度划分的范围;在图10~图11中,均为相同的时间段内两种不同故障健康指数的变化情况。机理分析和数据分析都证实,油管断脱属于一个瞬间发生,过程快,健康指数的变化表现为突然下降;泵干磨属于一个缓慢发生,过程时间长,健康指数的变化表现为缓慢下降。本实施例按不同故障类型统计了所有井从开始发生故障到结束故障所需要的大致时间,如表5所示。
表5 不同类型故障故障时间段统计
Figure BDA0002889318330000162
Figure BDA0002889318330000171
分析表5可得出,健康指数除了能够准确地表征煤层气螺杆泵井的实时健康状况,还可以进行故障诊断。发生泵干磨时,从开始到完全故障的时间段均大于3000分钟,其他故障从开始到完全故障的时间段均小于3000分钟。因此,可以通过分析健康指数曲线变化的缓慢程度去判别故障的严重程度。如果健康指数突然下降,可以得出此类故障属于严重故障,如果健康指数缓慢下降,此类属于轻微故障。
4>故障预警。
首先随机初始化LSTM神经网络参数,设置神经网络层数(layers)为2、时间序列步长(timesteps)为200分钟、神经元个数(neurons)均为8、训练循环次数(epochs)为8、批量大小(batchsize)为8。然后使用训练数据进行模型训练,模型训练完成后在验证集上通过网格搜索和绘制学习曲线,得到LSTM模型最优的网络结构参数:epochs=10;batch_size=256;time_step=200;第一层神经元个数为64;第二层神经元个数为16。训练过程中模型损失函数(training loss)随训练次数的变化过程如图12所示。图12中横坐标代表训练次数,纵坐标表示健康指数HI,single steptraining loss表示单次训练损失。
从图12可知,模型的损失函数随训练次数的增加而逐渐减小并趋于0,说明LSTM预测模型没有出现过拟合或欠拟合的现象,模型具有较好的泛化能力,可用于抽油井功率预测。利用LSTM模型的训练与预测效果如图13所示,图13中real data表示真实值,slimation表示拟合,prediction表示预测值,图中横坐标代表时刻,纵坐标代表健康指数HI。图中slimation对应曲线与real data对应曲线基本相重合,prediction曲线与real data对应曲线基本相重合。基于模型评价方法,得出LSTM模型评价结果如表6所示。
表6 LSTM模型评价结果
MAPE MAD RMSE TIC R2
训练集 0.6 0.005 0.013 0.007 0.98
测试集 32.8 0.009 0.012 0.024 0.98
可以看出该模型在训练集和测试集上平均百分比误差MAPE分别为0.6和32.8,平均绝对误差MAD、均方根误差RMSE、希尔不等系数TIC均接近于0,评价系数R2在测试集和训练集上均为0.98,接近于1。因此,该LSTM预测模型准确掌握了健康指数变化的趋势和前后的关联性,能够实时准确预测煤层气螺杆泵井的健康状态变化。
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。本发明说明书包含多项发明构思,诸如“优选地”、“根据一个优选实施方式”或“可选地”均表示相应段落公开了一个独立的构思,申请人保留根据每项发明构思提出分案申请的权利。

Claims (6)

1.一种深度学习的煤层气螺杆泵井健康指数预测方法,其特征在于,包括以下步骤中的一个或几个:
从煤层气螺杆泵井采集的多个原始参数中选取至少一个作为主控参数;
对至少一个主控参数进行合并处理以构建健康指数;
根据健康指数将煤层气螺杆泵井健康状态划分为至少两个不同阶段;
提取煤层气螺杆泵井的健康指数数据作为样本数据,采用长短时记忆神经网络构建健康指数预测模型;
应用健康指数预测模型,预测煤层气螺杆泵井的健康状态变化;
其中,对至少一个主控参数进行合并处理以构建健康指数包括:
将采集的所有煤层气故障井的主控参数进行合并,采用主成分分析计算n项主控参数的协方差矩阵A,将协方差矩阵A进行对角化处理,得到协方差矩阵A的特征值,即为各项主控参数的权重,将n项主控参数的权重分别与其参数相乘后相加,得到一个反映螺杆泵健康状态的综合指标,进行归一化处理得到健康指数HI;
主成分分析方法采用方差度量信息量,样本集合为{X=[X1jX2j,…,Xnj]T0≤j≤m-1},n为主控参数个数,m为某时刻t=m,Xnj=[xn1,xn2,…,xnj],将所有的样本构建成一个n×m的矩阵,即为协方差矩阵,令协方差矩阵为A,则:
Figure FDA0004174870310000011
式中:xnj——数据集中第n个主控参数在t=j时刻所对应的样本属性值;
Figure FDA0004174870310000012
——主控参数n所有属性值的平均值,/>
Figure FDA0004174870310000013
令矩阵A的一组特征向量为υ,特征向量为υ所对应的特征值为λi,其中,i=1,2,…,n,于是得出矩阵、特征值与特征向量之间的关系为:
Aυ=λiυ
构建求解特征矩阵的特征值公式:
iE-A|=0
式中:E——单位矩阵;
设某一时刻t输入的主控参数值为Xt=(x1t,x2t,…,xnt),则综合指数CIt计算公式为:
CIt=λXt T
式中:λ——矩阵A的特征值组成的特征值向量,λ=(λ1,λ2,…λn);
计算得出T时段内每个时刻的综合指数为:
CI=(CI0,CI1,…,CIt)
将得到的综合指数进行归一化处理,即得到健康指数HI;
t时刻健康指数的计算公式为:
Figure FDA0004174870310000021
/>
于是得到T时段内每个时刻的健康指数为:
HI=(HI0,HI1,…,HIt);
其中,健康指数预测模型的建立、训练及验证方法包括以下步骤:
(1)调用接口创建模型,设置初始参数,调用TensorFlow上的接口创建LSTM模型,设置神经网络层数、时间序列步长、神经元个数、训练循环次数、批量大小的超参数,并设置激活函数与优化函数;
(2)根据模型结构,建立训练集和测试集,按照LSTM模型结构,提取螺杆泵健康指数数据,设置时间序列,根据设定输入时间长度对样本数据进行分割处理,创建煤层气螺杆泵故障井HI训练集和测试集,其中每口样本井80%数据用于模型训练,20%数据用于模型测试;
(3)模型调参,通过网格搜索方法,选择出模型最佳超参数以及激活函数与优化函数;
(4)模型训练,利用训练集数据进行模型训练,利用测试集数据进行模型预测精度评价,根据预测精度调整和优选超参数,健康指数预测模型选用tanh函数作为激活函数、Adam函数作为优化函数;
(5)验证模型,对煤层气螺杆泵井健康指数预测模型效果进行评价时,设置该模型的预测总量为n,预测值为ypre,真实值为yt
(6)模型发布,用测试集数据评价健康指数预测模型的预测精度,当预测结果的精度达到预先所设定的要求时,模型训练完成,发布为正式预测模型。
2.如权利要求1所述的方法,其特征在于,主控参数是通过对煤层气螺杆泵井采集的多个原始参数进行数据预处理与主控参数优选所选取的,其中,主控参数优选的步骤包括:
利用皮尔逊相关系数法对至少一个参数进行相关性分析;
将经过皮尔逊相关系数筛选后的参数进行主成分分析,确定至少一个主控参数。
3.如权利要求2所述的方法,其特征在于,根据健康指数的变化趋势将煤层气螺杆泵井健康状态划分为健康、亚健康和故障三个阶段。
4.如权利要求3所述的方法,其特征在于,根据煤层气螺杆泵井的健康指数数据,统计所有样本井中与各健康状态阶段分别对应的健康指数的范围,并根据统计结果,得出健康指数由健康到亚健康以及由亚健康到故障的阈值,作为故障报警的依据。
5.如权利要求4所述的方法,其特征在于,所述方法还包括通过分析健康指数曲线变化的缓慢程度,判别故障的严重程度。
6.一种执行根据权利要求1至5之一的深度学习的煤层气螺杆泵井健康指数预测方法的深度学习的煤层气螺杆泵井健康指数预测系统,其特征在于,包括:
第一数据处理模块,其被配置为从煤层气螺杆泵井采集的多个原始参数中选取至少一个作为主控参数;
第二数据处理模块,其被配置为对至少一个主控参数进行合并处理以构建健康指数;
第三数据处理模块,其被配置为根据健康指数将煤层气螺杆泵井健康状态划分为至少两个不同阶段;
第四数据处理模块,其被配置为提取煤层气螺杆泵井的健康指数数据作为样本数据,采用长短时记忆神经网络构建健康指数预测模型;
第五数据处理模块,其被配置为应用健康指数预测模型,预测煤层气螺杆泵井的健康状态变化。
CN202110028154.1A 2021-01-08 2021-01-08 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统 Active CN112861422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110028154.1A CN112861422B (zh) 2021-01-08 2021-01-08 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110028154.1A CN112861422B (zh) 2021-01-08 2021-01-08 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统

Publications (2)

Publication Number Publication Date
CN112861422A CN112861422A (zh) 2021-05-28
CN112861422B true CN112861422B (zh) 2023-05-19

Family

ID=76002130

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110028154.1A Active CN112861422B (zh) 2021-01-08 2021-01-08 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统

Country Status (1)

Country Link
CN (1) CN112861422B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642618B (zh) * 2021-07-27 2024-03-01 上海展湾信息科技有限公司 一种用于螺杆装置状态预测模型训练的方法及设备
CN114048932A (zh) * 2022-01-13 2022-02-15 西南石油大学 一种基于lstm的煤层气井产气量预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726524A (zh) * 2019-03-01 2019-05-07 哈尔滨理工大学 一种基于cnn和lstm的滚动轴承剩余使用寿命预测方法
CN111985610A (zh) * 2020-07-15 2020-11-24 中国石油大学(北京) 一种基于时序数据的抽油机井泵效预测系统和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150095100A1 (en) * 2013-09-30 2015-04-02 Ge Oil & Gas Esp, Inc. System and Method for Integrated Risk and Health Management of Electric Submersible Pumping Systems
BR112019017301A2 (pt) * 2017-10-09 2020-04-22 Bl Technologies, Inc. métodos e sistemas inteligentes para diagnóstico de saúde de uma estação de tratamento de água, detecção e controle de anomalia

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726524A (zh) * 2019-03-01 2019-05-07 哈尔滨理工大学 一种基于cnn和lstm的滚动轴承剩余使用寿命预测方法
CN111985610A (zh) * 2020-07-15 2020-11-24 中国石油大学(北京) 一种基于时序数据的抽油机井泵效预测系统和方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A recurrent neural network based health indicator for remaining useful life prediction of bearings;Liang Guo 等;《Neurocomputing》;第240卷;98-109 *
基于循环神经网络的机械设备健康状态预测方法;王锴烨;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》(第8期);C029-205 *
深度学习在煤层气测井解释中的应用研究;向旻 等;《地质与勘探》;第56卷(第6期);1305-1312 *

Also Published As

Publication number Publication date
CN112861422A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN113255848B (zh) 基于大数据学习的水轮机空化声信号辨识方法
CN112861422B (zh) 一种深度学习的煤层气螺杆泵井健康指数预测方法及系统
CN108344564A (zh) 一种基于深度学习的主轴特性试验台状态识别及预测方法
CN113777496A (zh) 基于时间卷积神经网络的锂离子电池剩余寿命预测方法
CN112926273A (zh) 一种多元退化设备剩余寿命预测方法
CN112000015B (zh) 一种基于lstm和生物激励神经网络的重型燃机控制系统控制器模块智能bit设计方法
CN111985610A (zh) 一种基于时序数据的抽油机井泵效预测系统和方法
CN114218872B (zh) 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法
CN114282443B (zh) 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法
CN112434390B (zh) 基于多层网格搜索的pca-lstm轴承剩余寿命预测方法
CN116050665B (zh) 供热设备故障预测方法
CN116383722A (zh) 一种基于门控循环单元神经网络的压裂措施过程监控方法
TW202119298A (zh) 結合因子隱藏式馬可夫模型(fhmm)與發電量預測之太陽能板發電系統異常診斷分析裝置與方法
Huang et al. Bayesian neural network based method of remaining useful life prediction and uncertainty quantification for aircraft engine
CN112734131B (zh) 一种基于深度学习算法的风机叶片覆冰状态预测方法
CN114444582A (zh) 基于卷积神经网络与贝叶斯网络的机械设备故障诊断方法
CN112580254B (zh) 一种基于多级决策融合的换流变多维度分析和预警方法
Tan et al. The health index prediction model and application of PCP in CBM wells based on deep learning
CN117171700A (zh) 一种基于深度学习的钻井溢流预测组合模型及模型适时静默更新与迁移学习方法
CN115204362A (zh) 一种机械设备剩余寿命区间预测方法
Wang et al. Similarity-based echo state network for remaining useful life prediction
CN115310746A (zh) 一种风力发电机组主传动系统状态评估方法及系统
Dui et al. Reliability Evaluation and Prediction Method with Small Samples.
CN111859798A (zh) 基于双向长短时神经网络的流程工业故障诊断方法
CN114741948B (zh) 一种基于序列重构的残差堆叠卷积网络的航空发动机退化趋势预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant