CN115641495A - 一种基于卷积神经网络的异常抽油机井检测方法 - Google Patents

一种基于卷积神经网络的异常抽油机井检测方法 Download PDF

Info

Publication number
CN115641495A
CN115641495A CN202211327287.XA CN202211327287A CN115641495A CN 115641495 A CN115641495 A CN 115641495A CN 202211327287 A CN202211327287 A CN 202211327287A CN 115641495 A CN115641495 A CN 115641495A
Authority
CN
China
Prior art keywords
domain
target
indicator diagram
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211327287.XA
Other languages
English (en)
Inventor
潘少伟
尹思冉
范文静
郭智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Shiyou University
Original Assignee
Xian Shiyou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Shiyou University filed Critical Xian Shiyou University
Priority to CN202211327287.XA priority Critical patent/CN115641495A/zh
Publication of CN115641495A publication Critical patent/CN115641495A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种基于卷积神经网络的异常抽油机井检测方法,其特征在于,包括如下步骤:步骤1:准备源域与目标域数据集,绘制示功图;步骤2:对示功图进行预处理;步骤3:划分数据集;步骤4:构建二支路域分离卷积神经网络模型,设计损失函数;步骤5:使用抽油机异常诊断模型构建系统;该基于卷积神经网络的异常抽油机井诊断方法,深度学习中的卷积神经网络可以使用大量的历史数据和出色的计算能力通过对特征的自动提取和学习,弥补了人工提取特征可能出现人为错误这一缺点。同时本发明可以实现抽油机井故障的智能诊断,确保采油井工况诊断的准确率,提升抽油机井故障诊断的效率,满足抽油机井工况智能诊断的现场实际需求。

Description

一种基于卷积神经网络的异常抽油机井检测方法
技术领域
本发明属于异常抽油机井检测技术领域,具体涉及一种基于卷积神经网络的异常抽油机井检测方法。
背景技术
油井是现代石油开发的基础,而油井异常故障诊断一直是石油工业生产中的重点与难点。在传统的油田管理模式下,我国对于抽油机井普遍采用使用维修策略,即当出现的故障影响到工业的正常生产时,才进行维修。此种方式需要频繁的设备检查,不仅增加时间成本,还有可能扩大部分抽油机井的待业时间,造成石油产量的下降。依照异常井管理法精细化、信息化等大趋势,再加上近些年人工智能技术的迅猛发展,利用计算机技术进行异常井的诊断获得了学者与研究人员的重视,例如专家系统、支持向量机、模糊理论等都被应用在异常井诊断的方法中。
然而这些方法的主要流程都是先进行样本特征的人工提取,再使用分类方法进行模式分类。特征提取一般采用的是数据降维的技术,把复杂数据简单化,会通过数据转换或者映射得到一个新的特征,并且可以保持原有数据的全部信息。人工提取特征的过程存在信息丢失和提取信息错误等风险,影响后续分类算法的性能。
发明内容
针对传统异常井诊断方法中效率低下与改进方法中人工提取特征的弊端等亟待解决的问题,本发明的目的是提供一种基于卷积神经网络的异常抽油机井检测方法。
为此,本发明提供了一种基于卷积神经网络的异常抽油机井检测方法,包括如下步骤:
步骤1:准备源域与目标域数据集,将目标域每个运动周期内的载荷和位移绘制成示功图;
步骤2:对示功图进行预处理;
步骤3:使用Adaboost令源域与目标域构成相似的分布,根据抽油机井的生产运行特性确定油井的工况,标注示功图对应工况,划分数据集;
步骤4:构建二支路域分离卷积神经网络模型,同时重新设计损失函数;
步骤5:使用抽油机异常诊断模型构建系统。
进一步的,一种基于卷积神经网络的异常抽油机井检测方法,所述步骤2:对示功图进行预处理的具体过程是:
步骤201、数据去重:使用python的imagededup包,利用哈希算法删除示功图数据集中精确重复的图片;
步骤202、图像增强:为使样本去除冗余干扰而凸显出重要的信息需要进行数据增强;常用的数据增强方法会改变示功图的特征,如翻转、Mixup(将随机的两张样本按比例混合,分类的结果按比例分配)、CutOut(随机将样本的部分区域删掉,并补充0像素值)和CutMi(将一部分区域删掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值)等操作会改变示功图的完整性,因此,本发明针对于示功图采取的强化方法有二值化、线条扭曲、随机放缩和中心位移等,同时此步骤还可以一定程度上增加样本的数量,具体步骤为:
①通过OpenCV中threshold函数进行图像的二值化,高于阈值的像素值确定为255,低于阈值的像素值更改为0,之后对图像进行归一化并将其大小绘制成224*224;
②对示功图的像素坐标进行正弦变换,映射到对应坐标从而完成随机线条扭曲操作;
③对示功图进行随机的放缩、拉伸操作,放缩操作是将目标图片放缩为一随机大小,之后使用像素填充方法填充到224*224大小,拉伸操作即把目标图片随机拉伸到一个大小,之后使用裁剪操作裁剪到224*224大小。为了保证示功图的完整性,本发明的拉伸程度设置在(0.82-1.18)之间;
④对示功图样本进行随机垂直、水平位移操作,随机位移即将目标图片上的所有像素值沿着某一个方向随机水平或者垂直移动,同时需要保证图像的大小没有改变。但是这会造成一些原有的像素点会被移除图片外,那么就会有一块区域的像素值需要重新设置,在本发明中,为了使得示功图保持完整性,设置水平位移的像素值区间为负50到50,垂直位移的像素值区间为负100到100,这样可以保证示功图的重要信息不会被位移出图像,同时在需要设置像素值的区域使用黑色进行填充。
步骤203、数针对示功图各个类别的特性可以通过旋转等类间转化方法,大量扩充数据集图像:
①对于如图2中(a)类似的工作正常示功图,旋转180度之后,还可以作为工作正常的示功图放入数据集。但在实际的油井工作中,异常示功图数据较少,而正常的示功图是比较多的,为了保证模型的泛化能力和数据的均衡,本发明对正常状况的示功图进行了随机删除操作;
②如图2(b)下碰泵和上碰泵的数据可以进行旋转180度进行转换;
③如图2(c)游动阀漏和如图2(d)固定阀漏示功图可以旋转180度进行相互转化;
④部分如图2(f)游动阀关闭迟缓示功图和如图2(e)供液不足示功图两者存在相似性,需经仔细筛选后进行二者的转化,转化方法依然为旋转180度。
进一步的,所述步骤3:使用Adaboost令源域与目标域构成相似的分布,根据抽油机井的生产运行特性确定油井的工况,标注示功图对应工况,划分数据集,包括如下步骤:
步骤301:样本迁移,针对数据集类间不平衡问题,利用Adaboost算法通过赋予样本不同权值的方式将源域中与目标域差别极大的样本过滤掉,之后在源域中重新加权,来构成与目标域相似的分布。先令源域的权值为wsource,目标域的权值为wtarget,具体形式如下:
Figure BDA0003908366440000041
Figure BDA0003908366440000042
之后循环进行源域与目标域的权值更新操作:
Figure BDA0003908366440000043
式(3)中源域中β记为βsource;目标域中β记为βtarget,公式如下:
Figure BDA0003908366440000044
Figure BDA0003908366440000045
βtarget中每个弱分类器G(x)在目标数据集中的错误率为:
Figure BDA0003908366440000046
步骤302:对于目标域数据集的划分:将扩充后的示功图根据类别不同,分为工作正常示功图、供液不足示功图、气体影响示功图等多个类别,将每张示功图存入到txt文件中,命名格式为图片“路径标签”,如(img/1/a001.jpg),以便模型进行读取。将不同类别的示功图存入不同文件夹,即得到类别个数,并存入txt文件的文件夹。存入后将文件顺序进行随机打乱操作,之后随机抽取70%作为训练集,30%作为测试集。
进一步的,所述步骤4:构建二支路域分离卷积神经网络模型,同时重新设计损失函数中构建的二支路域分离卷积神经网络模型为Vgg16模型,所述Vgg16模型的网络顶层中Softmax激活函数如下:
Figure BDA0003908366440000051
其中,ak是输出层中第k个输入信号,i为输出节点的个数;
MMD的经验估计可表示为:
Figure BDA0003908366440000052
进一步的,所述损失函数包括差异损失、相似损失和分类损失;
差异损失函数为
Figure BDA0003908366440000053
其中λ为正则项,用于平衡差异损失、分类损失和MMD值,同时
Figure BDA0003908366440000054
其中k(xi,yj)为核函数,通常选择径向积函数计算。
分类损失函数取两个分别针对源域与目标域进行分类任务的分类器损失函数的总和,具体公式为:
Figure BDA0003908366440000061
其中Lsource和Ltarget分别为源域和目标域的分类损失,n为源域的类别,ypi为分类器预测样本的类别;m为目标域的类别,ypj为分类器预测样本的类别。
进一步的,所述二支路域分离卷积神经网络模型更新的具体步骤是:
步骤601、将源域和目标域数据同时输入到网络中;
步骤602、使用共享参数的网络结构提取共有特征,使用独立网络结构提取源域与目标域的私有特征;
步骤603、根据提取出来的特征,再结合MMD数值,计算出模型总的损失函数。
进一步的,所述二支路域分离卷积神经网络模型精度水平通过下式计算总体损失值,进行确定:
Loss=αLd+βLs+γLc (12)
其中α、β、γ为各个损失的系数,用来控制各个损失值的权值。
本发明提供这种基于卷积神经网络的异常抽油机井诊断方法,深度学习中的卷积神经网络可以使用大量的历史数据和出色的计算能力通过对特征的自动提取和学习,弥补了人工提取特征可能出现人为错误这一缺点。同时本发明可以实现抽油机井故障的智能诊断,确保采油井工况诊断的准确率,提升抽油机井故障诊断的效率,满足抽油机井工况智能诊断的现场实际需求,为故障诊断技术的研究带来了新的活力。
下面结合附图和实施例对本发明做详细说明。
附图说明
图1为本发明中基于卷积神经网络的异常抽油机井诊断方法的流程图。
图2为不同类别的示功图。
图3为Vgg16结构图。
图4为设计的用于网络训练的结构图。
图5为新顶层结构图。
具体实施方式
为进一步阐述本发明达成预定目的所采取的技术手段及功效,以下结合附图及实施例对本发明的具体实施方式、结构特征及其功效,详细说明如下。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本实施例提供了一种如图1所示的基于卷积神经网络的异常抽油机井检测方法,包括如下步骤:
步骤1:准备源域与目标域数据集,将目标域每个运动周期内的载荷和位移绘制成示功图;
步骤2:对示功图进行预处理;
步骤3:使用Adaboost令源域与目标域构成相似的分布,根据抽油机井的生产运行特性确定油井的工况,标注示功图对应工况,划分数据集;
步骤4:构建二支路域分离卷积神经网络模型,同时重新设计损失函数;
步骤5:使用抽油机异常诊断模型构建系统。
进一步的,步骤1、准备相关数据集:包括作为源域的imagenet数据集和作为目标域的抽油机示功图数据集。当目标域数据集为数据量较多且自带标签的数值型数据时,需将载荷的单位统一为千牛(KN)、位移数据的单位统一为米(M)存入CSV文件方便后续使用。之后使用CSV文件中的数据作为原始数据,令图像横轴为位移,图像纵轴为载荷,使用python中的第三方库matplotlib将原始数据绘制示功图;
进一步的,所述步骤2:对示功图:为减少样本对模型的负面影响,从而使模型的准确率更高,需要对第一步中生成的示功图样本进行三个方面的预处理:进行预处理的具体过程是:
步骤201、数据去重:使用python的imagededup包,利用哈希算法删除示功图数据集中精确重复的图片;
步骤202、图像增强:为使样本去除冗余干扰而凸显出重要的信息需要进行数据增强;常用的数据增强方法会改变示功图的特征,如翻转、Mixup(将随机的两张样本按比例混合,分类的结果按比例分配)、CutOut(随机将样本的部分区域删掉,并补充0像素值)和CutMi(将一部分区域删掉但不填充0像素而是随机填充训练集中的其他数据的区域像素值)等操作会改变示功图的完整性,因此,本发明针对于示功图采取的强化方法有二值化、线条扭曲、随机放缩和中心位移等,同时此步骤还可以一定程度上增加样本的数量,具体步骤为:
①通过OpenCV中threshold函数进行图像的二值化,高于阈值的像素值确定为255,低于阈值的像素值更改为0,之后对图像进行归一化并将其大小绘制成224*224;
②对示功图的像素坐标进行正弦变换,映射到对应坐标从而完成随机线条扭曲操作;
③对示功图进行随机的放缩、拉伸操作,放缩操作是将目标图片放缩为一随机大小,之后使用像素填充方法填充到224*224大小,拉伸操作即把目标图片随机拉伸到一个大小,之后使用裁剪操作裁剪到224*224大小。为了保证示功图的完整性,本发明的拉伸程度设置在(0.82-1.18)之间;
④对示功图样本进行随机垂直、水平位移操作,随机位移即将目标图片上的所有像素值沿着某一个方向随机水平或者垂直移动,同时需要保证图像的大小没有改变。但是这会造成一些原有的像素点会被移除图片外,那么就会有一块区域的像素值需要重新设置,在本发明中,为了使得示功图保持完整性,设置水平位移的像素值区间为负50到50,垂直位移的像素值区间为负100到100,这样可以保证示功图的重要信息不会被位移出图像,同时在需要设置像素值的区域使用黑色进行填充。
步骤203、数针对示功图各个类别的特性可以通过旋转等类间转化方法,大量扩充数据集图像:
①对于如图2中(a)类似的工作正常示功图,旋转180度之后,还可以作为工作正常的示功图放入数据集。但在实际的油井工作中,异常示功图数据较少,而正常的示功图是比较多的,为了保证模型的泛化能力和数据的均衡,本发明对正常状况的示功图进行了随机删除操作;
②如图2(b)下碰泵和上碰泵的数据可以进行旋转180度进行转换;
③如图2(c)游动阀漏和如图2(d)固定阀漏示功图可以旋转180度进行相互转化;
④部分如图2(f)游动阀关闭迟缓示功图和如图2(e)供液不足示功图两者存在相似性,需经仔细筛选后进行二者的转化,转化方法依然为旋转180度。
进一步的,所述步骤3:使用Adaboost令源域与目标域构成相似的分布,根据抽油机井的生产运行特性确定油井的工况,标注示功图对应工况,划分数据集,包括如下步骤:
步骤301:样本迁移,针对数据集类间不平衡问题,利用Adaboost算法通过赋予样本不同权值的方式将源域中与目标域差别极大的样本过滤掉,之后在源域中重新加权,来构成与目标域相似的分布。先令源域的权值为wsource,目标域的权值为wtarget,具体形式如下:
Figure BDA0003908366440000101
Figure BDA0003908366440000102
之后循环进行源域与目标域的权值更新操作:
Figure BDA0003908366440000103
式(3)中源域中β记为βsource;目标域中β记为βtarget,公式如下:
Figure BDA0003908366440000104
Figure BDA0003908366440000105
βtarget中每个弱分类器G(x)在目标数据集中的错误率为:
Figure BDA0003908366440000111
步骤302:对于目标域数据集的划分:将扩充后的示功图根据类别不同,分为工作正常示功图、供液不足示功图、气体影响示功图等多个类别,将每张示功图存入到txt文件中,命名格式为图片“路径标签”,如(img/1/a001.jpg),以便模型进行读取。将不同类别的示功图存入不同文件夹,即得到类别个数,并存入txt文件的文件夹。存入后将文件顺序进行随机打乱操作,之后随机抽取70%作为训练集,30%作为测试集。
进一步的,步骤4:构建以Vgg16为基础的二支路域分离卷积神经网络模型,同时重新设计损失函数;
基于迁移学习思想,设计用于训练的卷积神经网络与贴合需求的网络损失函数:卷积神经网络模型由Vgg16改造而成,选自InceptionV3、Vgg16、Resnet-v2和Xception,在四个不同的初始模型中Vgg16虽准确率不是最优,但结合模型体积对比,为本发明的最优选择,具体信息如表1。
表1.四种不同的初始模型信息
Figure BDA0003908366440000112
将Vgg16网络结构以Maxpooling池化层作为分界,则其可被看作由6个模块组成,如图3所示,每个块结构中的通道数相同。由于源域与目标域存在差异,本发明以Vgg16为基础使用其前5个模块设计了二支路域分离卷积神经网络。结构主要分为三部分:特征提取、适配层和分类,其结构如图4所示。
特征提取以Vgg16为基础结构,设计目标域与源域的私有编码结构和共享编码结构,使用私有编码结构提取私有特征,共享编码结构来提取共有特征。在私有编码结构中使用Vgg模型1至5模块分别对源域和目标域图像进行特征提取;在共享编码结构中将Vgg模型1至4模块分别在源域数据集、目标域数据集训练,并共享参数,第5模块提取对应图像的高层特征。
第5模块后衔接新顶层,如图5所示新顶层被设计为一个神经元个数为512的dense层和一个Softmax输出层。所述Vgg16模型的网络顶层中Softmax激活函数如下:
Figure BDA0003908366440000121
其中,ak是输出层中第k个输入信号,i为输出节点的个数;
由于源域与目标域的特征分布存在一定差异性,如果仅通过特征提取层分别提取图像特征不能较好地减少两类特征分布差异,因此在新顶层添加适配层,引入MMD准则学习域不变特征表示,在训练过程中通过最小化自适应度量来缩小两个域之间的差异,同时当目标域数据标签较少时,也可以保证模型的高质量运行,设为一个样本空间的连续函数集,则MMD的经验估计可表示为:
Figure BDA0003908366440000122
当适配层计算出MMD距离后,将其与损失函数一起作为网络的优化目标,通过最小化源域和目标域的特征分布差异和分类器损失,进一步提高网络的识别效果。所述损失函数包括差异损失、相似损失和分类损失。
差异损失函数为通过私有和共享领域特征之间的软子空间正交性约束定义,使共享和私有编码去编码输入的不同方面;该损失函数的输入为目标域私有编码结构得到的目标域图像特征和源域私有编码结构得到的源域图像特征,具体公式为:
Figure BDA0003908366440000131
其中,
Figure BDA0003908366440000132
为源域公有特征矩阵,
Figure BDA0003908366440000133
为源域私有特征矩阵,
Figure BDA0003908366440000134
为目标域公有特征矩阵,
Figure BDA0003908366440000135
为目标域私有特征矩阵;
相似损失函数以MMD距离衡量,具体公式为:
Ls=λMMD2[F,X,Y] (10)
其中λ为正则项,用于平衡差异损失、分类损失和MMD值,同时
Figure BDA0003908366440000136
其中k(xi,yj)为核函数,通常选择径向积函数计算。
分类损失函数取两个分别针对源域与目标域进行分类任务的分类器损失函数的总和,具体公式为:
Figure BDA0003908366440000137
其中Lsource和Ltarget分别为源域和目标域的分类损失,n为源域的类别,ypi为分类器预测样本的类别;m为目标域的类别,ypj为分类器预测样本的类别。
进一步的,所述二支路域分离卷积神经网络模型精度水平通过下式计算总体损失值,进行确定:
Loss=αLd+βLs+γLc (12)
其中α、β、γ为各个损失的系数,用来控制各个损失值的权值。
如图4所示,所述二支路域分离卷积神经网络模型更新的具体步骤是:
步骤601、将源域和目标域数据同时输入到网络中;
步骤602、使用共享参数的网络结构提取共有特征,使用独立网络结构提取源域与目标域的私有特征;
步骤603、根据提取出来的特征,再结合MMD数值,计算出模型总的损失函数。判断诊断模型是否达到预设精度,若未达到预设精度则调整初始化参数,继续执行上述步骤,直至诊断模型到达预设精度。本发明的预设精度标准为输出结果或损失几乎不变。若达到预设精度,则对已达到预设精度的诊断模型进行验证,得到验证精度。
步骤5、以基于卷积神经网络的异常抽油机井诊断方法为核心,构建异常抽油机井诊断系统,输入示功图,输出识别诊断结果,并给出相应建议,例如当输入示功图,系统诊断结果为油井出沙,则给出相应处理措施:安装沙锚、参数优化、洗井或循环抽油。
综上所述,该基于卷积神经网络的异常抽油机井诊断方法,深度学习中的卷积神经网络可以使用大量的历史数据和出色的计算能力通过对特征的自动提取和学习,弥补了人工提取特征可能出现人为错误这一缺点。同时本发明可以实现抽油机井故障的智能诊断,确保采油井工况诊断的准确率,提升抽油机井故障诊断的效率,满足抽油机井工况智能诊断的现场实际需求,为故障诊断技术的研究带来了新的活力。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (7)

1.一种基于卷积神经网络的异常抽油机井检测方法,其特征在于,包括如下步骤:
步骤1:准备源域与目标域数据集,将目标域每个运动周期内的载荷和位移绘制成示功图;
步骤2:对示功图进行预处理;
步骤3:使用Adaboost令源域与目标域构成相似的分布,根据抽油机井的生产运行特性确定油井的工况,标注示功图对应工况,划分数据集;
步骤4:构建二支路域分离卷积神经网络模型,同时重新设计损失函数;
步骤5:使用抽油机异常诊断模型构建系统。
2.如权利要求1所述的基于卷积神经网络的异常抽油机井检测方法,其特征在于:所述步骤2:对示功图进行预处理的具体过程是:
步骤201、数据去重:使用python的imagededup包,利用哈希算法删除示功图数据集中精确重复的图片;
步骤202、图像增强:对于示功图采取的强化方法有二值化、线条扭曲、随机放缩和中心位移,具体步骤为:
①通过OpenCV中threshold函数进行图像的二值化,高于阈值的像素值确定为255,低于阈值的像素值更改为0,之后对图像进行归一化并将其大小绘制成224*224;
②对示功图的像素坐标进行正弦变换,映射到对应坐标从而完成随机线条扭曲操作;
③对示功图进行随机的放缩、拉伸操作,放缩操作是将目标图片放缩为一随机大小,之后使用像素填充方法填充到224*224大小,拉伸操作即把目标图片随机拉伸到一个大小,之后使用裁剪操作裁剪到224*224大小,拉伸程度设置在(0.82-1.18)之间;
④对示功图样本进行随机垂直、水平位移操作,随机位移即将目标图片上的所有像素值沿着某一个方向随机水平或者垂直移动,同时需要保证图像的大小没有改变;设置水平位移的像素值区间为负50到50,垂直位移的像素值区间为负100到100;
步骤203、针对示功图各个类别的特性通过旋转等类间转化方法,扩充数据集图像。
3.如权利要求1所述的基于卷积神经网络的异常抽油机井检测方法,其特征在于:所述步骤3:使用Adaboost令源域与目标域构成相似的分布,根据抽油机井的生产运行特性确定油井的工况,标注示功图对应工况,划分数据集,包括如下步骤:
步骤301:样本迁移,针对数据集类间不平衡问题,利用Adaboost算法通过赋予样本不同权值的方式将源域中与目标域差别极大的样本过滤掉,之后在源域中重新加权,来构成与目标域相似的分布;先令源域的权值为wsource,目标域的权值为wtarget,具体形式如下:
Figure FDA0003908366430000021
Figure FDA0003908366430000022
之后循环进行源域与目标域的权值更新操作:
Figure FDA0003908366430000023
式(3)中源域中β记为βsource;目标域中β记为βtarget,公式如下:
Figure FDA0003908366430000031
Figure FDA0003908366430000032
βtarget中每个弱分类器G(x)在目标数据集中的错误率为:
Figure FDA0003908366430000033
步骤302:对于目标域数据集的划分:将扩充后的示功图根据类别不同,分为工作正常示功图、供液不足示功图、气体影响示功图,将每张示功图存入到txt文件中,并进行命名,命名格式为图片“路径标签”,以便模型进行读取;将不同类别的示功图存入不同文件夹;存入后将文件顺序进行随机打乱操作,之后随机抽取70%作为训练集,30%作为测试集。
4.如权利要求1所述的基于卷积神经网络的异常抽油机井检测方法,其特征在于:所述步骤4:构建二支路域分离卷积神经网络模型,同时重新设计损失函数中所构建的二支路域分离卷积神经网络模型以Vgg16为基础,所述Vgg16模型的网络顶层中Softmax激活函数如下:
Figure FDA0003908366430000034
其中,ak是输出层中第k个输入信号,i为输出节点的个数;
MMD的经验估计可表示为:
Figure FDA0003908366430000035
5.如权利要求4所述的基于卷积神经网络的异常抽油机井检测方法,其特征在于:所述损失函数包括差异损失、相似损失和分类损失;
差异损失函数为
Figure FDA0003908366430000041
其中,
Figure FDA0003908366430000042
为源域公有特征矩阵,
Figure FDA0003908366430000043
为源域私有特征矩阵,
Figure FDA0003908366430000044
为目标域公有特征矩阵,
Figure FDA0003908366430000045
为目标域私有特征矩阵;
相似损失函数以MMD距离衡量,具体公式为:
Ls=λMMD2[F,X,Y] (10)
其中λ为正则项,用于平衡差异损失、分类损失和MMD值,同时
Figure FDA0003908366430000046
其中k(xi,yj)为核函数,通常选择径向积函数计算
分类损失函数取两个分别针对源域与目标域进行分类任务的分类器损失函数的总和,具体公式为:
Figure FDA0003908366430000047
其中Lsource和Ltarget分别为源域和目标域的分类损失,n为源域的类别,ypi为分类器预测样本的类别;m为目标域的类别,ypj为分类器预测样本的类别。
6.如权利要求4所述的基于卷积神经网络的异常抽油机井检测方法,其特征在于:所述二支路域分离卷积神经网络模型更新的具体步骤是:
步骤601、将源域和目标域数据同时输入到网络中;
步骤602、使用共享参数的网络结构提取共有特征,使用独立网络结构提取源域与目标域的私有特征;
步骤603、根据提取出来的特征,再结合MMD数值,计算出模型总的损失函数。
7.如权利要求4所述的基于卷积神经网络的异常抽油机井检测方法,其特征在于:所述二支路域分离卷积神经网络模型精度水平通过下式计算总体损失值,进行确定:
Loss=αLd+βLs+γLc (12)
其中α、β、γ为各个损失的系数,用来控制各个损失值的权值。
CN202211327287.XA 2022-10-25 2022-10-25 一种基于卷积神经网络的异常抽油机井检测方法 Pending CN115641495A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211327287.XA CN115641495A (zh) 2022-10-25 2022-10-25 一种基于卷积神经网络的异常抽油机井检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211327287.XA CN115641495A (zh) 2022-10-25 2022-10-25 一种基于卷积神经网络的异常抽油机井检测方法

Publications (1)

Publication Number Publication Date
CN115641495A true CN115641495A (zh) 2023-01-24

Family

ID=84946260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211327287.XA Pending CN115641495A (zh) 2022-10-25 2022-10-25 一种基于卷积神经网络的异常抽油机井检测方法

Country Status (1)

Country Link
CN (1) CN115641495A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152548A (zh) * 2023-11-01 2023-12-01 山东理工大学 一种抽油机井实测电功图工况识别方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152548A (zh) * 2023-11-01 2023-12-01 山东理工大学 一种抽油机井实测电功图工况识别方法及系统
CN117152548B (zh) * 2023-11-01 2024-01-30 山东理工大学 一种抽油机井实测电功图工况识别方法及系统

Similar Documents

Publication Publication Date Title
CN111311059B (zh) 基于知识图谱的水车室故障诊断方法
CN110542819B (zh) 一种基于半监督dbnc的变压器故障类型诊断方法
CN111723738A (zh) 一种基于迁移学习的煤岩壳质组显微图像分类方法及系统
CN106930751A (zh) 一种有杆泵抽油井故障分离方法
CN112163496B (zh) 一种基于语义分割的嵌入式终端水库水位预警方法
CN114092832A (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN110009030A (zh) 基于stacking元学习策略的污水处理故障诊断方法
CN108765374A (zh) 一种宫颈涂片图像中异常核区域筛查的方法
CN115641495A (zh) 一种基于卷积神经网络的异常抽油机井检测方法
CN115205672A (zh) 一种基于多尺度区域注意力的遥感建筑物语义分割方法及系统
CN116704137B (zh) 一种海上石油钻井平台点云深度学习逆向建模方法
CN114970326A (zh) 一种基于改进胶囊神经网络的油井故障诊断方法
CN114639102B (zh) 基于关键点与尺寸回归的细胞分割方法和装置
CN113935237A (zh) 一种基于胶囊网络的输电线路故障类型判别方法及系统
Dong et al. Land cover semantic segmentation of port area with high resolution SAR images based on SegNet
CN115794805B (zh) 一种中低压配网量测数据补齐方法
CN108898157B (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
Hu et al. Research on the fault identification method of oil pumping unit based on residual network
CN113486599B (zh) 一种抽油机有效冲程的计算方法
CN112801955B (zh) 种群分布不平衡条件下的浮游生物检测方法
CN114298413A (zh) 一种水电机组振摆趋势预测方法
CN113191556A (zh) 一种核电Loca事件故障预测与诊断方法
CN114120043A (zh) 一种基于生产动态数据和示功图检测异常抽油井的方法
Tagirova et al. Data mining of the Dynamometry of oil Production Sucker Rod Pumping Unit
Li et al. Tight Sandstone Image Augmentation for Image Identification Using Deep Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination