CN115640329A - 一种基于多源数据分析的油井故障智能诊断方法 - Google Patents

一种基于多源数据分析的油井故障智能诊断方法 Download PDF

Info

Publication number
CN115640329A
CN115640329A CN202110821003.1A CN202110821003A CN115640329A CN 115640329 A CN115640329 A CN 115640329A CN 202110821003 A CN202110821003 A CN 202110821003A CN 115640329 A CN115640329 A CN 115640329A
Authority
CN
China
Prior art keywords
oil well
source data
neural network
data analysis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110821003.1A
Other languages
English (en)
Inventor
张雷
张中慧
肖姝
王振
金鑫
姜忠新
马俊华
杭发琴
岳振玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Petroleum and Chemical Corp
Sinopec Research Institute of Petroleum Engineering Shengli Co
Original Assignee
China Petroleum and Chemical Corp
Sinopec Research Institute of Petroleum Engineering Shengli Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Petroleum and Chemical Corp, Sinopec Research Institute of Petroleum Engineering Shengli Co filed Critical China Petroleum and Chemical Corp
Priority to CN202110821003.1A priority Critical patent/CN115640329A/zh
Publication of CN115640329A publication Critical patent/CN115640329A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于多源数据分析的油井故障智能诊断方法,包括以下步骤:油井多源数据的搜集和整理;油井故障多源数据样本库的建立;油井多源数据分析神经网络的建立;油井多源数据分析神经网络的训练和优化;油井多源数据分析神经网络的部署应用,本发明适用于石油开采技术领域,能够充分利用油井生产监测过程中产生的海量数据,通过多源头数据的综合利用,所建立的油井故障智能诊断方法能够有效区分示功图形状相似的油井故障,进一步提升油井故障诊断的准确率,能够突破现有技术的局限,引领油井故障诊断技术进入新的阶段;通过应用基于数据分析的油井故障智能诊断方法,有助于油井故障隐患诊断和生产管理的精准化、远程化、智能化和标准化。

Description

一种基于多源数据分析的油井故障智能诊断方法
技术领域
本发明属于石油开采技术领域,具体是一种基于多源数据分析的油井故障智能诊断方法。
背景技术
油井故障诊断作为石油生产中的关键问题之一,长期以来一直面临很大的困难。由于油井分布分散,抽油杆、抽油泵等大量重要装备位于数千米深的油井内,不可视、不可及,其故障难以直观判断。同时,受系统结构复杂性和井下腐蚀、砂、蜡、气、水等因素的影响,油井可能出现的故障种类十分多样,监测指标和故障间的响应关系复杂且不清晰。尽管国内外学者研究提出了一系列方法,但大都只实现了部分常见的、单一型工况的诊断,现场应用效果不够理想,仍未摆脱依靠人工分析的局面。
当前,油田信息化建设的不断深入,大量传感器装配在油井生产系统中,实时采集油井的温度、压力、电流等数据并源源不断的传入油田数据中心,形成油井生产监测大数据。以中石化胜利油田为例,目前各油井实时采集的数据达70余种,采集频率包括1min/次和30min/次两种,每口油井每天产生的数据近1500组,年累积数据达50余万组。如何充分挖掘和利用大数据中的价值信息,突破现有故障诊断方法的局限,成为目前亟需解决的问题。
经过几十年的研究、实践和探索,油井生产工况分析与诊断技术有了很大程度的进步。总结来说,油井生产工况诊断技术大致经历了人工识别、自动化诊断和人工智能诊断三个阶段。人工诊断依赖专家经验,费事费力;各类自动化诊断方法能够解决人工分析效率低的问题,但仍然难以有效处理大量复杂工况的诊断,方法灵活性不强;现有智能化诊断方法,大都依赖示功图等单一数据进行诊断,存在大量示功图形状相似的工况仍然难以准确区分。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种基于多源数据分析的油井故障智能诊断方法。
为实现上述目的,本发明采用了如下技术方案:
一种基于多源数据分析的油井故障智能诊断方法,包括以下步骤:
油井多源数据的搜集和整理;
油井故障多源数据样本库的建立;
油井多源数据分析神经网络的建立;
油井多源数据分析神经网络的训练和优化;
油井多源数据分析神经网络的部署应用。
优选的,所述油井多源数据的搜集和整理,包括:
从多个数据源头搜集油井生产监测数据并进行处理,搜集和整理的数据至少来自3个不同源头,包括但不限于:示功图、电流、功率、功图面积、温度、压力、产量、动液面、冲程、冲次。
优选的,所述油井故障多源数据样本库的建立,包括:
针对每组多源数据,获取其所指代的油井和时间点,结合相应油井在相应时间点的实际运行状态,对该组多源数据所处的故障状态进行标记。
优选的,所述油井多源数据分析神经网络的建立,包括:
针对不同数据源头不同类型的油井生产监测数据,结合其数据特点,选择并设计恰当的神经网络实现其数据特征的提取;
针对示功图等图像型数据,选用卷积神经网络方法进行数据特征提取;
针对冲程、冲次等数值型数据,选用BP神经网络方法进行数据特征提取;
针对电流、产量等时间序列型数据,选用循环神经网络或长短时记忆网络进行数据特征提取;
利用不同神经网络方法实现不同数据源头的油井数据的特征提取后,设计一个神经网络拼合层,将多源数据提取的特征向量进行拼接,实现多源数据特征的组合。
优选的,所述油井多源数据分析神经网络的训练和优化,包括:
设定神经网络的损失函数、优化器和内置参数、训练次数和批次大小等参数;
编制神经网络算法程序并在深度学习平台上部署,随机抽取样本库中60%~90%的样本开展训练,剩余样本作为验证;
训练完成后,分析并评价神经网络的时间复杂度、空间复杂度、训练准确率、验证准确率、欠拟合/过拟合状况等指标;
以油井多源数据分析神经网络架构参数和训练参数作为优化变量,以各参数上下限作为约束条件,以验证准确率最高作为优化目标,反复设定不同的神经网络架构参数和训练参数组合并利用样本库进行重新训练,寻找验证准确率最高时对应的神经网络架构参数和训练参数组合。
优选的,所述油井多源数据分析神经网络的部署应用,包括:
将训练完成的油井多源数据分析神经网络进行封装,与数据库连接实现新采集数据的实时诊断并将诊断结果写入数据库;
设计系统前端功能与界面布局,包括诊断结果展示、统计、查询、报警、反馈等功能;
完成系统前端开发,将系统前端和后端部署在平台上,实现油井多源数据分析神经网络的部署应用。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明的实施与应用,能够充分利用油井生产监测过程中产生的海量数据,避免“大数据、低价值”的问题,同时,通过多源头数据的综合利用,所建立的油井故障智能诊断方法能够有效区分示功图形状相似的油井故障,进一步提升油井故障诊断的准确率,能够突破现有技术的局限,引领油井故障诊断技术进入新的阶段;通过应用基于数据分析的油井故障智能诊断方法,有助于油井故障隐患诊断和生产管理的精准化、远程化、智能化和标准化。
附图说明
图1是本发明一种基于多源数据分析的油井故障智能诊断方法的流程图。
具体实施方式
以下结合附图1,进一步说明本发明一种基于多源数据分析的油井故障智能诊断方法的具体实施方式。本发明一种基于多源数据分析的油井故障智能诊断方法不限于以下实施例的描述。
实施例1:
本实施例给出一种基于多源数据分析的油井故障智能诊断方法的具体结构,如图1所示,包括以下步骤:
油井多源数据的搜集和整理;
油井故障多源数据样本库的建立;
油井多源数据分析神经网络的建立;
油井多源数据分析神经网络的训练和优化;
油井多源数据分析神经网络的部署应用。
具体地,油井多源数据的搜集和整理,包括:
从多个数据源头搜集油井生产监测数据并进行处理,搜集和整理的数据至少来自3个不同源头,包括但不限于:示功图、电流、功率、功图面积、温度、压力、产量、动液面、冲程、冲次。
具体地,油井故障多源数据样本库的建立,包括:
针对每组多源数据,获取其所指代的油井和时间点,结合相应油井在相应时间点的实际运行状态,对该组多源数据所处的故障状态进行标记。
具体地,油井多源数据分析神经网络的建立,包括:
针对不同数据源头不同类型的油井生产监测数据,结合其数据特点,选择并设计恰当的神经网络实现其数据特征的提取;
针对示功图等图像型数据,选用卷积神经网络方法进行数据特征提取;
针对冲程、冲次等数值型数据,选用BP神经网络方法进行数据特征提取;
针对电流、产量等时间序列型数据,选用循环神经网络或长短时记忆网络进行数据特征提取;
利用不同神经网络方法实现不同数据源头的油井数据的特征提取后,设计一个神经网络拼合层,将多源数据提取的特征向量进行拼接,实现多源数据特征的组合。
进一步的,油井多源数据分析神经网络的训练和优化,包括:
设定神经网络的损失函数、优化器和内置参数、训练次数和批次大小等参数;
编制神经网络算法程序并在深度学习平台上部署,随机抽取样本库中60%~90%的样本开展训练,剩余样本作为验证;
训练完成后,分析并评价神经网络的时间复杂度、空间复杂度、训练准确率、验证准确率、欠拟合/过拟合状况等指标;
以油井多源数据分析神经网络架构参数和训练参数作为优化变量,以各参数上下限作为约束条件,以验证准确率最高作为优化目标,反复设定不同的神经网络架构参数和训练参数组合并利用样本库进行重新训练,寻找验证准确率最高时对应的神经网络架构参数和训练参数组合。
进一步的,油井多源数据分析神经网络的部署应用,包括:
将训练完成的油井多源数据分析神经网络进行封装,与数据库连接实现新采集数据的实时诊断并将诊断结果写入数据库;
设计系统前端功能与界面布局,包括诊断结果展示、统计、查询、报警、反馈等功能;
完成系统前端开发,将系统前端和后端部署在平台上,实现油井多源数据分析神经网络的部署应用。
实施例2:
本实施例给出一种基于多源数据分析的油井故障智能诊断方法的具体结构,如图1所示,包括以下几个步骤:
步骤一:油井多源数据的搜集和整理
从多个数据源头搜集油井生产监测数据,包括但不限于:示功图、电流、功率、功图面积、温度、压力、产量、动液面、冲程、冲次等。
对从多个数据源头搜集到的数据进行清洗,采用删除或者插补的方法对于缺失值和异常值进行处理,将多个数据源头的数据按照井号和数据采集时间进行组合,每口井每个采集时间对应一组多源数据。
步骤二:油井故障多源数据样本库的建立
针对每组多源数据,获取其所指代的油井和时间点,结合相应油井在相应时间点的实际运行状态,对该组多源数据所处的故障状态进行标记,如0代表健康,1代表杆断,2代表泵漏等。所标记的故障状态包括但不限于上述类型。
对足够多的多源数据进行标记,即形成油井故障多源数据样本库。该样本库包含两部分:一部分为每组多源数据,也称数据集;另一部分为各组多源数据所对应的故障状态标记,也称标签集。
步骤三:油井多源数据分析神经网络的建立
针对不同数据源头不同类型的油井生产监测数据,结合其数据特点,选择并设计恰当的神经网络实现其数据特征的提取:
针对示功图等图像型数据,选用卷积神经网络方法进行数据特征提取,以示功图图像作为输入层,后续连接数层卷积层和池化层,实现示功图图像的内含特征的提取,之后连接一层光栅化层,将提取的图像特征转化为一个向量,之后连接数层隐含层,实现特征向量的进一步降维。
针对冲程、冲次等数值型数据,选用BP神经网络方法进行数据特征提取,以各数值型参数作为输入层,后续连接数层隐含层,实现数值特征的提取。BP神经网络中,神经元的数学模型如下:
Figure BDA0003171936440000081
其中,yi(t)为第i个神经元的输出,θi为第i个神经元的阈值,uk(t)(k=1,2,…,M)为外部输入,aij,bik为权值。
针对电流、产量等时间序列型数据,选用循环神经网络或长短时记忆网络进行数据特征提取,以各时间序列作为输入层,后续连接数层包含循环神经元的网络层,实现时间序列数据特征的提取。
所考虑的油井数据、神经网络方法包括但不限于上述方法。
利用不同神经网络方法实现不同数据源头的油井数据的特征提取后,设计一个神经网络拼合层,将多源数据提取的特征向量进行拼接,实现多源数据特征的组合。
在神经网络拼合层后连接数层隐含层,最后连接一个输出层,输出层神经元数量等于油井故障多源数据样本库中故障类型数量,以此作为油井故障的神经网络分类器。
由此,便建立了完整的油井多源数据分析神经网络。
步骤四:油井多源数据分析神经网络的训练和优化
设定神经网络的损失函数(交叉熵损失、均方差损失、Hinge损失等),设定神经网络优化器(随机梯度下降、RMSprop、Adagrad等)和内置参数(学习率、衰减率等),设定训练次数和批次大小等。
交叉熵损失的计算按照如下公式:
Figure BDA0003171936440000091
其中,C为交叉熵损失,n为样本总数量,ai为第i个样本的神经网络计算输出值,yi代表第i个样本的标签值。
编制的神经网络算法程序并在深度学习平台上部署,随机抽取样本库中60%~90%的样本开展训练,剩余样本作为验证。
训练完成后,分析并评价神经网络的时间复杂度、空间复杂度、训练准确率、验证准确率、欠拟合/过拟合状况等指标。
训练准确率和验证准确率的计算分别按照以下公式计算:
Figure BDA0003171936440000101
Figure BDA0003171936440000102
Figure BDA0003171936440000103
其中,Pt和Pv分别代表训练准确率和验证准确率,nt和nv分别代表训练样本总数和验证样本总数,f(yi,ai)为统计函数,用于统计神经网络计算输出值和样本标签值相符的样本数量,argmax()为最大值对应的标签序号。
以油井多源数据分析神经网络架构参数和训练参数作为优化变量,以各参数上下限作为约束条件,以验证准确率最高作为优化目标,反复设定不同的神经网络架构参数和训练参数组合并利用样本库进行重新训练,寻找验证准确率最高时对应的神经网络架构参数和训练参数组合。
步骤五:油井多源数据分析神经网络的部署应用
编写程序实现与油田数据库的连接和多源数据的远程实时采集。将训练完成的油井多源数据分析神经网络进行封装,与数据库连接实现新采集数据的实时诊断并将诊断结果写入数据库。
设计系统前端功能与界面布局,包括诊断结果展示、统计、查询、报警、反馈等功能。完成系统前端开发,将系统前端和后端部署在平台上,实现油井多源数据分析神经网络的部署应用。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (6)

1.一种基于多源数据分析的油井故障智能诊断方法,其特征在于,包括以下步骤:
油井多源数据的搜集和整理;
油井故障多源数据样本库的建立;
油井多源数据分析神经网络的建立;
油井多源数据分析神经网络的训练和优化;
油井多源数据分析神经网络的部署应用。
2.如权利要求1所述的一种基于多源数据分析的油井故障智能诊断方法,其特征在于,所述油井多源数据的搜集和整理,包括:
从多个数据源头搜集油井生产监测数据并进行处理,搜集和整理的数据至少来自3个不同源头,包括但不限于:示功图、电流、功率、功图面积、温度、压力、产量、动液面、冲程、冲次。
3.如权利要求1所述的一种基于多源数据分析的油井故障智能诊断方法,其特征在于,所述油井故障多源数据样本库的建立,包括:
针对每组多源数据,获取其所指代的油井和时间点,结合相应油井在相应时间点的实际运行状态,对该组多源数据所处的故障状态进行标记。
4.如权利要求1所述的一种基于多源数据分析的油井故障智能诊断方法,其特征在于,所述油井多源数据分析神经网络的建立,包括:
针对不同数据源头不同类型的油井生产监测数据,结合其数据特点,选择并设计恰当的神经网络实现其数据特征的提取;
针对示功图等图像型数据,选用卷积神经网络方法进行数据特征提取;
针对冲程、冲次等数值型数据,选用BP神经网络方法进行数据特征提取;
针对电流、产量等时间序列型数据,选用循环神经网络或长短时记忆网络进行数据特征提取;
利用不同神经网络方法实现不同数据源头的油井数据的特征提取后,设计一个神经网络拼合层,将多源数据提取的特征向量进行拼接,实现多源数据特征的组合。
5.如权利要求1所述的一种基于多源数据分析的油井故障智能诊断方法,其特征在于,所述油井多源数据分析神经网络的训练和优化,包括:
设定神经网络的损失函数、优化器和内置参数、训练次数和批次大小等参数;
编制神经网络算法程序并在深度学习平台上部署,随机抽取样本库中60%~90%的样本开展训练,剩余样本作为验证;
训练完成后,分析并评价神经网络的时间复杂度、空间复杂度、训练准确率、验证准确率、欠拟合/过拟合状况等指标;
以油井多源数据分析神经网络架构参数和训练参数作为优化变量,以各参数上下限作为约束条件,以验证准确率最高作为优化目标,反复设定不同的神经网络架构参数和训练参数组合并利用样本库进行重新训练,寻找验证准确率最高时对应的神经网络架构参数和训练参数组合。
6.如权利要求1所述的一种基于多源数据分析的油井故障智能诊断方法,其特征在于,所述油井多源数据分析神经网络的部署应用,包括:
将训练完成的油井多源数据分析神经网络进行封装,与数据库连接实现新采集数据的实时诊断并将诊断结果写入数据库;
设计系统前端功能与界面布局,包括诊断结果展示、统计、查询、报警、反馈等功能;
完成系统前端开发,将系统前端和后端部署在平台上,实现油井多源数据分析神经网络的部署应用。
CN202110821003.1A 2021-07-20 2021-07-20 一种基于多源数据分析的油井故障智能诊断方法 Pending CN115640329A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110821003.1A CN115640329A (zh) 2021-07-20 2021-07-20 一种基于多源数据分析的油井故障智能诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110821003.1A CN115640329A (zh) 2021-07-20 2021-07-20 一种基于多源数据分析的油井故障智能诊断方法

Publications (1)

Publication Number Publication Date
CN115640329A true CN115640329A (zh) 2023-01-24

Family

ID=84939460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110821003.1A Pending CN115640329A (zh) 2021-07-20 2021-07-20 一种基于多源数据分析的油井故障智能诊断方法

Country Status (1)

Country Link
CN (1) CN115640329A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116011351A (zh) * 2023-03-28 2023-04-25 中国石油大学(华东) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116011351A (zh) * 2023-03-28 2023-04-25 中国石油大学(华东) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法
CN116011351B (zh) * 2023-03-28 2023-06-13 中国石油大学(华东) 一种基于聚类算法和WideDeep网络的油井合理沉没度确定方法

Similar Documents

Publication Publication Date Title
CN109272123B (zh) 一种基于卷积-循环神经网络的有杆泵工况预警方法
CN113723838B (zh) 基于卷积神经网络的随钻安全风险智能识别方法
CN109635461B (zh) 一种应用随钻参数来自动识别围岩级别的方法和系统
CN111860952B (zh) 一种突出煤层关键开采参数快速优选方法
CN103996077B (zh) 一种基于多维时间序列的电气设备故障预测方法
CN113537585B (zh) 基于随机森林和梯度提升决策树的油田增产措施推荐方法
CN111222683B (zh) 一种基于pca-knn的tbm施工围岩综合分级预测方法
CN113157732A (zh) 一种基于pso-bp神经网络的地下铲运机故障诊断方法
CN109614669A (zh) 网级桥梁结构性能评估预测方法
CN117251700B (zh) 基于人工智能的环境监测传感器数据分析方法及系统
CN112926839A (zh) 一种用于油气井钻井过程的溢漏风险协同监测方法及系统
CN115860197A (zh) 一种基于数据驱动的煤层气产量预测方法及系统
CN115640329A (zh) 一种基于多源数据分析的油井故障智能诊断方法
CN113029619A (zh) 基于c4.5决策树算法的地下铲运机故障诊断方法
CN115438823A (zh) 一种井壁失稳机制分析与预测方法及系统
CN113496302A (zh) 一种对钻井风险进行智能识别预警的方法与系统
CN114611958A (zh) 一种基于机器学习的石油钻井大数据处理方法和装置
CN111144433A (zh) 基于svm模型油井工况智能诊断分析方法及装置
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
CN118095878A (zh) 油井解堵双级选井方法、装置、计算设备及存储介质
CN111340275B (zh) 基于随钻探测技术的隧道支护模式选型实时预测方法
CN117271675A (zh) 基于大数据挖掘的tbm掘进岩体可掘性识别方法与装置
CN115630571A (zh) 一种基于集成学习的油井示功图自动诊断方法
CN115629188A (zh) 一种岩心产能模拟实验系统
CN116244596A (zh) 基于tcn和注意力机制的工业时序数据异常检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination