CN117349726A - 故障诊断方法、计算设备及可读存储介质 - Google Patents

故障诊断方法、计算设备及可读存储介质 Download PDF

Info

Publication number
CN117349726A
CN117349726A CN202311284299.3A CN202311284299A CN117349726A CN 117349726 A CN117349726 A CN 117349726A CN 202311284299 A CN202311284299 A CN 202311284299A CN 117349726 A CN117349726 A CN 117349726A
Authority
CN
China
Prior art keywords
data
fault diagnosis
load
stroke
working condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311284299.3A
Other languages
English (en)
Inventor
刘道星
叶舟
童兴
吴凡
周志忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yungu Technology Co Ltd
Original Assignee
Zhongke Yungu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Yungu Technology Co Ltd filed Critical Zhongke Yungu Technology Co Ltd
Priority to CN202311284299.3A priority Critical patent/CN117349726A/zh
Publication of CN117349726A publication Critical patent/CN117349726A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本申请公开了一种故障诊断方法、计算设备及可读存储介质,包括:获取待故障诊断的目标设备对应的目标多源工况数据;对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征;将所述至少一多模态特征输入已训练的多模态特征融合故障诊断模型,以获得对所述抽油机的故障诊断结果;所述多模态特征融合故障诊断模型是基于多源工况数据和对应的故障诊断数据训练得到的。如此,基于从目标设备的多源工况数据中提取的多模态特征,通过具有多故障诊断能力的多模态特征融合故障诊断模型进行故障诊断,能够对目标设备的复合故障进行准确诊断,识别精度和效率高。

Description

故障诊断方法、计算设备及可读存储介质
技术领域
本发明涉及故障诊断技术领域,特别是涉及一种故障诊断方法、计算设备及可读存储介质。
背景技术
传统抽油机等设备的故障诊断主要方式依赖于是相关从业人员的人工巡检。但是,由于抽油机及油井分散,现场环境恶劣等原因,易造成巡检不到位、漏检、不准时等问题。此外,在当前的抽油机工作过程中,存在多达几十种的常见故障类型,且常常会出现复合故障。因此,若对故障的检测不及时且不准确,将影响油田的生产效率和安全性,同时增加了人力成本和资源消耗。然而,如何对抽油机进行自动故障诊断一直处于研究之中。
发明内容
本申请的目的在于提供一种故障诊断方法、计算设备及计算机可读存储介质,能够对目标设备的复合故障进行准确诊断,识别精度和效率高。
为达到上述目的:
第一方面,本申请实施例提供了一种故障诊断方法,所述方法包括:
获取待故障诊断的目标设备对应的目标多源工况数据;
对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征;
将所述至少一多模态特征输入已训练的多模态特征融合故障诊断模型,以获得对所述抽油机的故障诊断结果;所述多模态特征融合故障诊断模型是基于多源工况数据和对应的故障诊断数据训练得到的。
在一实施方式中,所述目标设备包括抽油机;所述多源工况数据包括:单冲程载荷数据、单冲程位移数据、油井运行数据、油井音频数据;
所述多模态特征包括:示功图、负载特征、油井运行特征、声音频谱特征。
在一实施方式中,所述方法还包括多模态特征融合故障诊断模型的训练步骤,所述训练步骤包括:
获取训练样本,所述训练样本包括样本多源工况数据以及已标注故障类别的样本标签;
对所述样本多源工况数据进行多模态特征提取,获得至少一样本多模态特征;
将所述示功图输入卷积神经网络,并将所述卷积神经网络的输出结果、所述负载特征、所述声音频谱特征以及所述油井运行特征作为全连接神经网络的输入,构建初始的多模态特征融合故障诊断模型;
通过初始的多模态特征融合故障诊断模型,对所述样本多模态特征进行预测处理,得到样本预测结果;所述样本预测结果表征针对所述样本多源工况数据的故障诊断结果;
基于所述样本预测结果与所述样本标签之间的差异,调整所述初始的多模态特征融合故障诊断模型的参数并继续训练,直至满足训练条件时停止训练,得到已训练的多模态特征融合故障诊断模型。
在一实施方式中,所述训练步骤还包括:
在模型训练阶段,通过量化和蒸馏处理对所述多模态特征融合故障诊断模型进行轻量化调优。
在一实施方式中,所述对所述目标多源工况数据进行多模态特征提取,获得多模态特征,包括:
根据所述单冲程载荷数据和所述单冲程位移数据,绘制所述抽油机对应的示功图;
对所述单冲程载荷数据和所述单冲程位移数据进行分割,获得负载特征;
对所述油井音频数据进行频域变换处理,获得声音频谱特征;
对所述油井运行数据进行特征提取,获得油井运行特征。
在一实施方式中,所述对所述单冲程载荷数据和所述单冲程位移数据进行分割,获得负载特征,包括:
基于最大位移点对所述单冲程载荷数据和所述单冲程位移数据进行上下冲程分割,并提取上冲程载荷和下冲程载荷的时域特征以及上冲程位移和下冲程位移的时域特征;
基于最小位移点和最大载荷点对所述单冲程载荷数据和所述单冲程位移数据进行增载过程分割,并提取增载过程中载荷和位移分别对应的时域特征和斜率;
基于最大位移点和最小载荷点对所述单冲程载荷数据和所述单冲程位移数据进行卸载过程分割,并提取卸载过程中载荷和位移分别对应的时域特征和斜率。
在一实施方式中,所述对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征之前,还包括:
对所述目标多源工况数据进行数据异常处理,以删除数据异常点和补偿数据异常段。
在一实施方式中,所述对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征之前,还包括:
对所述目标多源工况数据进行降噪处理。
第二方面,本申请实施例提供一种计算设备,包括处理器和存储有计算机程序的存储器;所述处理器执行所述计算机程序时实现第一方面所述的故障诊断方法的步骤。
第三方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的故障诊断方法的步骤。
本申请实施例提供的故障诊断方法、计算设备及计算机可读存储介质,所述方法包括:获取待故障诊断的目标设备对应的目标多源工况数据;对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征;将所述至少一多模态特征输入已训练的多模态特征融合故障诊断模型,以获得对所述抽油机的故障诊断结果;所述多模态特征融合故障诊断模型是基于多源工况数据和对应的故障诊断数据训练得到的。如此,基于从目标设备的多源工况数据中提取的多模态特征,通过具有多故障诊断能力的多模态特征融合故障诊断模型进行故障诊断,能够对目标设备的复合故障进行准确诊断,识别精度和效率高。
附图说明
图1为本发明实施例提供的故障诊断方法的流程示意图;
图2为本发明实施例提供的故障诊断方法的架构示意图;
图3为本发明实施例中多模态特征融合故障诊断模型的构建过程示意图;
图4为本发明实施例提供的计算设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在……时"或"当……时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
需要说明的是,在本文中,采用了诸如S1、S2等步骤代号,其目的是为了更清楚简要地表述相应内容,不构成顺序上的实质性限制,本领域技术人员在具体实施时,可能会先执行S2后执行S1等,但这些均应在本申请的保护范围之内。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。
参阅图1,为本申请实施例提供的一种故障诊断方法,该故障诊断方法可以由本申请实施例提供的一种故障诊断装置来执行,该故障诊断装置可以采用软件和/或硬件的方式来实现,本实施例中以该故障诊断方法的执行主体为服务器、计算机等计算设备为例,本实施例提供的故障诊断方法包括:
步骤S1、获取待故障诊断的目标设备对应的目标多源工况数据。
其中,待故障诊断的目标设备可以为需要进行故障诊断的任意设备,本实施例中以目标设备为抽油机为例。目标多源工况数据是指需要故障诊断的抽油机在当前或预设时长内的多源工况数据。其中,多源工况数据包括:单冲程载荷数据、单冲程位移数据、油井运行数据、油井音频数据。这里,单冲程载荷数据为抽油机的抽油泵在往复运动中单次运动(即单次冲程)的载荷,单冲程位移数据为抽油机的抽油泵在往复运动中单次运动的位移序列。油井运行数据可用于表征抽油机油管内成分组成及压力等信息,包括但不限于如单次冲程的日产液量、日产油量、日产水量、含水率、最高油压、最高套压、最高流压、井口温度、冲次等信息。油井音频数据为对抽油机的各关键部件在单次冲程过程中所收集的声音信号,具体可以通过设置于油井的声音采集装置进行获取。
步骤S2、对目标多源工况数据进行多模态特征提取,获得至少一多模态特征。
其中,由于目标多源工况数据比较抽象,可能无法准确表示故障表征,因此,可对目标多源工况数据进行多模态特征提取,以获得具备更强的故障表征能力的多模态特征,从而有效提高在类别多且具有复合故障时的故障识别精度。其中,多模态特征包括:示功图、负载特征、油井运行特征、声音频谱特征。
在一实施方式中,所述对目标多源工况数据进行多模态特征提取,获得至少一多模态特征,包括:
根据单冲程载荷数据和单冲程位移数据,绘制抽油机对应的示功图;
对单冲程载荷数据和单冲程位移数据进行分割,获得负载特征;
对油井音频数据进行频域变换处理,获得声音频谱特征;
对油井运行数据进行特征提取,获得油井运行特征。
其中,对目标多源工况数据进行多模态特征提取,也可以称为对所述目标多源工况数据进行多模态特征构建,目的是从采集的原始多源工况数据中生成新特征,以便发现潜在的、对故障预测更有利的特征。其中,以位移为x轴、载荷为y轴,将单冲程载荷数据和单冲程位移数据绘制在二维图上,可生成抽油机对应的示功图。如此,基于单冲程载荷和单冲程位移数据给示功图上色,可提升示功图的故障表征能力。其中,对于油井音频数据,可采用Hamming窗、快速傅里叶变换(FFT)等频域变换处理方法进行声音频谱特征提取,比如可以提取油井音频数据中排名靠前的幅度及其对应的频率值,或者提取梅尔频率倒谱系数(MFCC)等。这里,负载特征可以根据实际情况需要进行设置,包括但不限于上/下冲程的时域特征、增载时域特征、增载斜率等,而时域特征可包括幅度、频率、相位等。
在一实施方式中,所述对单冲程载荷数据和单冲程位移数据进行分割,获得负载特征,包括:
基于最大位移点对单冲程载荷数据和单冲程位移数据进行上下冲程分割,并提取上冲程载荷和下冲程载荷的时域特征以及上冲程位移和下冲程位移的时域特征;
基于最小位移点和最大载荷点对单冲程载荷数据和单冲程位移数据进行增载过程分割,并提取增载过程对应的时域特征和斜率;
基于最大位移点和最小载荷点对单冲程载荷数据和单冲程位移数据进行卸载过程分割,并提取卸载过程对应的时域特征和斜率。
其中,由于单冲程载荷数据和单冲程位移数据都是序列数据且长度相同,基于单冲程位移数据中的最大位移点,可对单冲程载荷数据和单冲程位移数据进行上下冲程分割,以获得上冲程载荷数据、下冲程载荷数据、上冲程位移数据和下冲程位移数据,接着可分别提取上冲程载荷、下冲程载荷、上冲程位移和下冲程位移的时域特征。例如,假设单冲程载荷数据包括a1、a2、a3、…、a10共10个载荷点,单冲程位移数据包括b1、b2、b3、…、b10共10个位移点,若最大位移点为b4,则将a1~a4作为上冲程载荷数据、a5~a10作为下冲程载荷,b1~b4作为上冲程位移数据,b5~b10作为下冲程位移数据。
其中,基于单冲程位移数据中的最小位移点和单冲程载荷数据中的最大载荷点,可对单冲程载荷数据和单冲程位移数据进行增载过程分割,以获得增载过程对应的载荷数据和位移数据,进而从增载过程对应的载荷数据和位移数据中,提取出增载过程中载荷和位移分别对应的时域特征和斜率。例如,假设单冲程载荷数据包括a1、a2、a3、…、a10共10个载荷点,单冲程位移数据包括b1、b2、b3、…、b10共10个位移点,若最小位移点为b1,最大载荷点为a6,则将a1~a6作为增载过程对应的载荷数据,提取出增载过程中载荷对应的时域特征和斜率,以及将b1~b6作为增载过程对应的位移数据,提取出增载过程中位移对应的时域特征和斜率。
其中,基于单冲程位移数据中的最大位移点和单冲程载荷数据中的最小载荷点,可对单冲程载荷数据和单冲程位移数据进行卸载过程分割,以获得卸载过程对应的载荷数据和位移数据,进而从卸载过程对应的载荷数据和位移数据中,提取出卸载过程中载荷和位移分别对应的时域特征和斜率。例如,假设单冲程载荷数据包括a1、a2、a3、…、a10共10个载荷点,单冲程位移数据包括b1、b2、b3、…、b10共10个位移点,若最大位移点为b4,最小载荷点为a8,则将a4~a8作为卸载过程对应的载荷数据,提取出卸载过程中载荷对应的时域特征和斜率,以及将b4~b8作为卸载过程对应的位移数据,提取出卸载过程中位移对应的时域特征和斜率。需要说明的是,负载特征还可以是上下冲程的最小曲率、上下冲程的分段积分、上下冲程的积分等特征。如此,通过对单冲程载荷数据和单冲程位移数据进行分割,并基于获得的负载特征构建多模态特征,能够有效提高在类别多且具有复合故障时的故障识别精度,进一步提高了对抽油机的复合故障进行诊断的准确度。
步骤S3、将至少一多模态特征输入已训练的多模态特征融合故障诊断模型,以获得对目标设备的故障诊断结果;多模态特征融合故障诊断模型是基于多源工况数据和对应的故障诊断数据训练得到的。
其中,计算设备可以将至少一多模态特征输入已训练的多模态特征融合故障诊断模型,而该多模态特征融合故障诊断模型是预先基于不同的历史多源工况数据以及对应的历史故障诊断数据所生成的,该已训练的多模态特征融合故障诊断模型通过对目标多源工况数据和历史故障诊断数据进行故障诊断预测处理,输出针对目标多源工况数据的故障诊断结果。
其中,上述多模态特征融合故障诊断模型可以预先根据大量训练样本对基于人工智能算法构建的多模态特征融合故障诊断模型进行训练得到,因此,已训练的多模态特征融合故障诊断模型具有多故障诊断能力,能够精准地学习和预测出与目标多源工况数据匹配的故障诊断结果。在一实施方式中,所述方法还包括多模态特征融合故障诊断模型的训练步骤,所述训练步骤包括:获取训练样本,训练样本包括样本多源工况数据以及已标注故障类别的样本标签;对样本多源工况数据进行多模态特征提取,获得至少一样本多模态特征;将示功图输入卷积神经网络,并将卷积神经网络的输出结果、负载特征、声音频谱特征以及油井运行特征作为全连接神经网络的输入,构建初始的多模态特征融合故障诊断模型;通过初始的多模态特征融合故障诊断模型,对样本多模态特征进行预测处理,得到样本预测结果;样本预测结果表征针对样本多源工况数据的故障诊断结果;基于样本预测结果与样本标签之间的差异,调整初始的多模态特征融合故障诊断模型的参数并继续训练,直至满足训练条件时停止训练,得到已训练的多模态特征融合故障诊断模型。
其中,训练样本是指用于训练多模态特征融合故障诊断模型的数据,包括样本多源工况数据和已标注故障类别的样本标签。具体地,训练样本可以是基于历史采集的多源工况数据和故障类别信息获得的。在训练多模态特征融合故障诊断模型时,可以预先对训练样本进行样本标签的标注,给出在不同的多源工况数据下对应的故障类别数据。比如,以对样本标签进行二值编码为例,假设抽油机的故障类别包括气锁、固定凡尔漏失和游动凡尔漏失,若训练样本的多源工况数据对应的故障类别只包括气锁,则可以将该训练样本的样本标签编码为“100”;若训练样本的多源工况数据对应的故障类别包括气锁和固定凡尔漏失,则可以将该训练样本的样本标签编码为“110”;若训练样本的多源工况数据对应的故障类别包括固定凡尔漏失和游动凡尔漏失,则可以将该训练样本的样本标签编码为“011”,以此类推。
这里,多模态特征融合故障诊断模型可基于卷积神经网络和全连接神经网络建立,具体地,可将示功图作为卷积神经网络的输入,并将卷积神经网络的输出结果、负载特征、声音频谱特征以及油井运行特征作为全连接神经网络的输入,而全连接神经网络的输出为故障诊断结果,以构建初始的多模态特征融合故障诊断模型。
接着,将训练样本输入初始的多模态特征融合故障诊断模型,以由初始的多模态特征融合故障诊断模型对训练样本进行预测处理,得到表征针对样本多源工况数据的故障诊断结果的样本预测结果。接着,将样本预测结果输入误差函数,与样本标签比较得到差异损失值,基于差异损失值调整初始的多模态特征融合故障诊断模型的参数,并继续对多模态特征融合故障诊断模型进行迭代训练,直到完成设定次数的迭代或差异损失值不再下降,即可视为满足训练条件,得到已训练的多模态特征融合故障诊断模型。此外,也可通过交叉验证进行多模态特征融合故障诊断模型的参数优化。例如,可以将训练样本平均划分为多份,每次按照预设比例从其中选取训练集和测试集,通过训练集训练多模态特征融合故障诊断模型,并通过测试集对训练的多模态特征融合故障诊断模型进行验证,重复一定次数,进而根据验证结果优化多模态特征融合故障诊断模型的参数,以使得最终获得的多模态特征融合故障诊断模型确定满足预设条件。其中,建立的多模态特征融合故障诊断模型包括但不限于深度神经网络模型、遗传算法模型等。如此,通过从不同多源工况数据下采集的训练样本对多模态特征融合故障诊断模型进行训练,可以提高故障诊断的准确性。
综上,上述实施例提供的故障诊断方法中,基于从目标设备的多源工况数据中提取的多模态特征,通过具有多故障诊断能力的多模态特征融合故障诊断模型进行故障诊断,能够对目标设备的复合故障进行准确诊断,识别精度和效率高。
在一实施方式中,所述对目标多源工况数据进行多模态特征提取,获得至少一多模态特征之前,还包括:
对目标多源工况数据进行数据异常处理,以删除数据异常点和补偿数据异常段。
可以理解,受到外界环境等因素的影响,目标多源工况数据可能出现不符合正常规律的数据,为了保证多模态特征融合故障诊断模型的故障诊断结果的准确性,可对超量程、数据值突变等数据异常点进行删除,并对数据异常段进行补偿。其中,数据异常点可通过量程判别、3δ原则、箱型图分析等异常检测算法进行检测,而可使用线性插值、多项式插值等填补缺失值。如此,通过删除数据异常点和补偿数据异常段,进一步提高了故障诊断结果的准确性。
在一实施方式中,所述训练步骤还包括:在模型训练阶段,通过量化和蒸馏处理对多模态特征融合故障诊断模型进行轻量化调优。其中,在模型训练阶段,通过量化和蒸馏处理等技术手段对多模态特征融合故障诊断模型进行轻量化调优,可有效地减少模型大小和计算复杂性,同时保证模型具有强大的边缘集成能力和保持较高的分类精度,便于在实际场景下进行嵌入式部署。
在一实施方式中,所述对目标多源工况数据进行多模态特征提取,获得至少一多模态特征之前,还包括:
对目标多源工况数据进行降噪处理。
可选地,可基于小波滤波等算法对目标多源工况数据进行降噪处理。此外,还可对目标多源工况数据进行归一化处理等。可以理解,由于目标多源工况数据可能包含噪声等数据,因此,可通过滤波算法对目标多源工况数据进行降噪处理,以使得预处理后的目标多源工况数据更加便于被处理,同时减少非必要干扰,进一步提高了故障诊断准确性。
基于前述实施例相同的发明构思,下面通过一具体示例对前述实施例进行详细说明,本示例中以目标设备为抽油机为例。
在当前的油田生产过程中,存在多达几十种的常见故障类型,且常常会出现复合故障。针对这些特点,本实施例提供了一种基于多模态特征融合的抽油机多标签多分类故障诊断方案。这个方案的主要价值点在于:1)强大的故障表征能力:融合基于多源数据构建的多模态特征,具备更强的故障表征能力,有效提升识别精度。2)轻量化模型设计:模型轻量化处理,强大的边缘集成能力,适合在各种设备上高效运行。3)灵活的故障编码方式:采用了多标签二值编码来表示不同故障种类,可以灵活地处理多标签、多分类的故障,体现复合故障与单一故障之间的联系。
针对上述问题,参阅图2,本实施例提供的故障诊断方法主要包括以下过程:
1、多源数据采集
采集的数据包含但不限于:1)抽油泵往复运动中单次运动(单次冲程)的载荷、位移序列。2)油井运行数据,表征抽油机油管内成分组成及压力等信息。如单次冲程的日产液量、日产油量、日产水量、含水率、最高油压、最高套压、最高流压、井口温度、冲次等。3)抽油机各关键部件单次冲程的收集的声音信号。
2、模型训练
在模型训练阶段,面临的是一个多标签多分类问题。为了有效利用融合多源信息,进行以下步骤:
1)预处理
以处理数据异常,满足机器学习算法对数据的要求。包括:数据异常处理、降噪处理和多模态特征构建。
(1)数据异常处理。对超量程、数据值突变等数据点异常进行删除,并对数据段异常进行补偿。数据异常通过量程判别、3δ原则、箱型图分析等异常检测算法检测。使用线性插值、多项式插值等填补缺失值。
(2)降噪处理。使波滤波算法减少噪声影响。
(3)多模态特征构建。从采集原始数据中生成新特征,以便发现潜在的、对故障预测更有利的特征。包括但不限于:示功图;上/下冲程载荷、位移的典型时域特征(包括均值、方差、极值、峰度、偏度等);对音频数据进行傅里叶变换等频域变换,提取频域信息。
示功图:以位移为x轴、载荷为y轴,将单次冲程内的位移、载荷数据绘制在二维图上形成的散点图,每个点的RGB色值如式(1)所示。图像大小256*256,使用自动缩放,确保示功图图形能充满整个图像。
式中,loadi、displacementi为该次冲程内的第i个点的载荷、位移,max(load)、max(displacement)为所有样本去除异常值后的载荷、位移的最大值。
上/下冲程分割:根据抽油机工作原理,通过最大位移点,将单次冲程分为上、下冲程。针对分割后的载荷、位移序列,分别提取典型时域特征。
增载过程分割:根据抽油机工作原理,初始最小位移点-最大载荷点定义为增载过程。针对增载过程的载荷、位移序列,分别提取典型时域特征、斜率等。
卸载过程分割:根据抽油机工作原理,最大位移点-最小载荷点定义为卸载过程。针对卸载过程的载荷、位移序列,分别提取典型时域特征、斜率等。
音频数据的频谱特征:采用Hamming窗、快速傅里叶变换(FFT)提取音频信号的top10幅度及其对应频率值,提取梅尔频率倒谱系数(MFCC)等。
2)模型确定
(1)故障编码。对于多标签多分类问题,可采用多标签二值编码。例如,第23次冲程出现“气锁”,“固定凡尔漏失”两个故障,那么该次冲程的故障可以编码为表1所示的值。
表1
编号 气锁 固定凡尔漏失 ...... 砂影响 游动凡尔漏失
23 1 1 ...... 0 0
(2)实现多模态特征融合的故障诊断模型的构建,如图3所示。采用卷积神经网络(CNN)提取的RGB图像特征,与油井运行特征、负载特征(上/下冲程时域特征、增载时域特征、增载斜率等)、声音频谱特征等合并后连接全连接神经网络(NN),端到端实现多模态特征融合故障诊断模型构建和训练。
(3)损失函数。由于故障类别多,故障样本数据不平衡,部分样本难识别,因此采用多标签多分类的Focal Loss损失函数,给故障样本少的类别赋予更高权重,给难识别的样本赋予更高权重,以此让模型在训练过程中关注故障样本少的类别和难识别的样本,提高模型的分类精度。
(4)模型轻量化调优。首先,基于深度学习框架训练上述模型。其次,对神经网络进行量化和蒸馏,有效地减少模型大小和计算复杂性,保持较高的分类精度,便于在实际场景下进行嵌入式部署。。
在模型训练及轻量化处理时,使用的评价指标如下式所示。同时,为证明模型的结果具有普适性,通常使用K-Fold交叉验证。
score=(0.8*Fβ-macro+0.2*Sscore)*100
式中,TPtotal、FNtotal、FPtotal、FNtotal的定义如下所示:
式中,TPtotal、FNtotal、FPtotal、FNtotal分别表示第i个样本标签中模型预测为正的正标签、被模型预测为负的负标签、被模型预测为正的负标签、被模型预测为负的正标签的占比。
3、故障诊断
1)预处理。与模型训练时的预处理方式一致,输入的数据是实时的多源数据。
2)模型预测。将实时数据的预处理结果输入多模态特征融合故障诊断模型,得到实时故障类别编码,以供查阅抽油机的实时状况。
综上,本实施例提供的故障诊断方法中,通过融合基于多源数据构建的多模态特征,具备更强的故障表征能力,在类别多且具有复合故障时,有效提升了识别精度。同时,进行模型轻量化处理,保证在边缘端的集成与高效运行。此外,采用了多标签二值编码,灵活地处理多标签多分类故障问题,体现复合故障与单一故障之间的联系。并且,基于载荷、位移数值给示功图上色,大大提升了示功图的故障表征能力。
基于前述实施例相同的发明构思,本发明实施例提供了一种计算设备,如图4所示,该设备包括:处理器310和存储有计算机程序的存储器311;其中,图4中示意的处理器310并非用于指代处理器310的个数为一个,而是仅用于指代处理器310相对其他器件的位置关系,在实际应用中,处理器310的个数可以为一个或多个;同样,图4中示意的存储器311也是同样的含义,即仅用于指代存储器311相对其他器件的位置关系,在实际应用中,存储器311的个数可以为一个或多个。在所述处理器310运行所述计算机程序时,实现上述故障诊断方法。
该设备还可包括:至少一个网络接口312。该设备中的各个组件通过总线系统313耦合在一起。可理解,总线系统313用于实现这些组件之间的连接通信。总线系统313除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统313。
其中,存储器311可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器311旨在包括但不限于这些和任意其它适合类型的存储器。
本发明实施例中的存储器311用于存储各种类型的数据以支持该设备的操作。这些数据的示例包括:用于在该设备上操作的任何计算机程序,如操作系统和应用程序;联系人数据;电话簿数据;消息;图片;视频等。其中,操作系统包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。这里,实现本发明实施例方法的程序可以包含在应用程序中。
基于前述实施例相同的发明构思,本实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,计算机可读存储介质可以是磁性随机存取存储器(FRAM,ferromagnetic random access memory)、只读存储器(ROM,Read OnlyMemory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、快闪存储器(FlashMemory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory)等存储器;也可以是包括上述存储器之一或任意组合的各种设备,如移动电话、计算机、平板设备、个人数字助理等。所述计算机可读存储介质中存储的计算机程序被处理器运行时,实现上述故障诊断方法。所述计算机程序被处理器执行时实现的具体步骤流程请参考图1所示实施例的描述,在此不再赘述。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,除了包含所列的那些要素,而且还可包含没有明确列出的其他要素。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种故障诊断方法,其特征在于,包括:
获取待故障诊断的目标设备对应的目标多源工况数据;
对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征;
将所述至少一多模态特征输入已训练的多模态特征融合故障诊断模型,以获得对所述目标设备的故障诊断结果;所述多模态特征融合故障诊断模型是基于多源工况数据和对应的故障诊断数据训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述目标设备包括抽油机;所述多源工况数据包括:单冲程载荷数据、单冲程位移数据、油井运行数据、油井音频数据;
所述多模态特征包括:示功图、负载特征、油井运行特征、声音频谱特征。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括多模态特征融合故障诊断模型的训练步骤,所述训练步骤包括:
获取训练样本,所述训练样本包括样本多源工况数据以及已标注故障类别的样本标签;
对所述样本多源工况数据进行多模态特征提取,获得至少一样本多模态特征;
将所述示功图输入卷积神经网络,并将所述卷积神经网络的输出结果、所述负载特征、所述声音频谱特征以及所述油井运行特征作为全连接神经网络的输入,构建初始的多模态特征融合故障诊断模型;
通过初始的多模态特征融合故障诊断模型,对所述样本多模态特征进行预测处理,得到样本预测结果;所述样本预测结果表征针对所述样本多源工况数据的故障诊断结果;
基于所述样本预测结果与所述样本标签之间的差异,调整所述初始的多模态特征融合故障诊断模型的参数并继续训练,直至满足训练条件时停止训练,得到已训练的多模态特征融合故障诊断模型。
4.根据权利要求3所述的方法,其特征在于,所述训练步骤还包括:
在模型训练阶段,通过量化和蒸馏处理对所述多模态特征融合故障诊断模型进行轻量化调优。
5.根据权利要求2或3所述的方法,其特征在于,所述对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征,包括:
根据所述单冲程载荷数据和所述单冲程位移数据,绘制所述抽油机对应的示功图;
对所述单冲程载荷数据和所述单冲程位移数据进行分割,获得负载特征;
对所述油井音频数据进行频域变换处理,获得声音频谱特征;
对所述油井运行数据进行特征提取,获得油井运行特征。
6.根据权利要求5所述的方法,其特征在于,所述对所述单冲程载荷数据和所述单冲程位移数据进行分割,获得负载特征,包括:
基于最大位移点对所述单冲程载荷数据和所述单冲程位移数据进行上下冲程分割,并提取上冲程载荷和下冲程载荷的时域特征以及上冲程位移和下冲程位移的时域特征;
基于最小位移点和最大载荷点对所述单冲程载荷数据和所述单冲程位移数据进行增载过程分割,并提取增载过程中载荷和位移分别对应的时域特征和斜率;
基于最大位移点和最小载荷点对所述单冲程载荷数据和所述单冲程位移数据进行卸载过程分割,并提取卸载过程中载荷和位移分别对应的时域特征和斜率。
7.根据权利要求2或3所述的方法,其特征在于,所述对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征之前,还包括:
对所述目标多源工况数据进行数据异常处理,以删除数据异常点和补偿数据异常段。
8.根据权利要求2或3所述的方法,其特征在于,所述对所述目标多源工况数据进行多模态特征提取,获得至少一多模态特征之前,还包括:
对所述目标多源工况数据进行降噪处理。
9.一种计算设备,其特征在于,包括处理器和存储有计算机程序的存储器;所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的故障诊断方法的步骤。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至8中任一项所述的故障诊断方法的步骤。
CN202311284299.3A 2023-09-30 2023-09-30 故障诊断方法、计算设备及可读存储介质 Pending CN117349726A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311284299.3A CN117349726A (zh) 2023-09-30 2023-09-30 故障诊断方法、计算设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311284299.3A CN117349726A (zh) 2023-09-30 2023-09-30 故障诊断方法、计算设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN117349726A true CN117349726A (zh) 2024-01-05

Family

ID=89360516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311284299.3A Pending CN117349726A (zh) 2023-09-30 2023-09-30 故障诊断方法、计算设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN117349726A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117544963A (zh) * 2024-01-04 2024-02-09 四川大学 一种基于FTGan-Yolo的跨模态通信信号的辐射源识别方法及设备
CN118213058A (zh) * 2024-05-22 2024-06-18 山东拓庄医疗科技有限公司 一种基于数据分析的医疗器械故障检测管理系统及方法
CN118522083A (zh) * 2024-07-18 2024-08-20 广汽埃安新能源汽车股份有限公司 一种汽车传动系统的故障诊断方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117544963A (zh) * 2024-01-04 2024-02-09 四川大学 一种基于FTGan-Yolo的跨模态通信信号的辐射源识别方法及设备
CN117544963B (zh) * 2024-01-04 2024-03-26 四川大学 一种基于FTGan-Yolo的跨模态通信信号的辐射源识别方法及设备
CN118213058A (zh) * 2024-05-22 2024-06-18 山东拓庄医疗科技有限公司 一种基于数据分析的医疗器械故障检测管理系统及方法
CN118522083A (zh) * 2024-07-18 2024-08-20 广汽埃安新能源汽车股份有限公司 一种汽车传动系统的故障诊断方法及装置
CN118522083B (zh) * 2024-07-18 2024-10-25 广汽埃安新能源汽车股份有限公司 一种汽车传动系统的故障诊断方法及装置

Similar Documents

Publication Publication Date Title
CN117349726A (zh) 故障诊断方法、计算设备及可读存储介质
Khanam et al. A comprehensive review of convolutional neural networks for defect detection in industrial applications
CN110277144B (zh) 使用累积的化学数据创建具有期望性质的新化学化合物以构建用于合成的新化学结构
CN112655003A (zh) 用于细胞图像的分析的计算机实现的方法、计算机程序产品以及系统
Azad et al. Delamination detection in CFRP laminates using deep transfer learning with limited experimental data
Yan et al. Research on fault diagnosis of hydraulic pump using convolutional neural network
CN112257263B (zh) 基于自注意力机制的设备剩余寿命预测系统
CN115184054B (zh) 机械设备半监督故障检测分析方法、装置、终端及介质
Liu et al. A lightweight fault diagnosis method of beam pumping units based on dynamic warping matching and parallel deep network
CN119006965A (zh) 工件表面质量的预测方法及系统
CN119513713A (zh) 一种时序状态数据多步预测方法、装置及设备
CN109543571A (zh) 一种面向复杂产品异形加工特征的智能识别与检索方法
KR102150204B1 (ko) 변형 vgg 모델의 전처리를 이용한 부품도면 문자 인식 방법
CN117593514B (zh) 一种基于深层主成分分析辅助的图像目标检测方法及系统
Wang et al. Rolling bearing remaining useful life prediction using deep learning based on high-quality representation
CN114612527B (zh) 图像配准方法、装置、电子设备及存储介质
CN117132536A (zh) 一种表面缺陷检测方法、系统、存储介质和电子设备
CN116721097A (zh) 轴承故障诊断方法、装置及电子设备
CN117058592A (zh) 一种视频的场景边界检测方法
Abdurakipov et al. Diagnostics of oil well pumping equipment by using machine learning
Rao et al. Pothole Identification and Dimension Approximation with YOLO Darknet CNN
Avendano et al. Transfer learning for anomaly detection using bearings’ vibration signals
CN119167992B (zh) 一种Transformer模型演化方法及系统
Gao et al. Missing-data filling method based on improved Informer model for mechanical-bearing fault diagnosis
JP7697125B2 (ja) スライドイメージング装置及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination