CN114662541A - 故障诊断模型构建方法、装置及电子设备 - Google Patents

故障诊断模型构建方法、装置及电子设备 Download PDF

Info

Publication number
CN114662541A
CN114662541A CN202210308574.XA CN202210308574A CN114662541A CN 114662541 A CN114662541 A CN 114662541A CN 202210308574 A CN202210308574 A CN 202210308574A CN 114662541 A CN114662541 A CN 114662541A
Authority
CN
China
Prior art keywords
sample data
feature vector
data
positive
jth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210308574.XA
Other languages
English (en)
Inventor
聂泳忠
刘木莞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xilenma Shenzhen Technology Co ltd
Original Assignee
Xilenma Shenzhen Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xilenma Shenzhen Technology Co ltd filed Critical Xilenma Shenzhen Technology Co ltd
Priority to CN202210308574.XA priority Critical patent/CN114662541A/zh
Publication of CN114662541A publication Critical patent/CN114662541A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/005Testing of complete machines, e.g. washing-machines or mobile phones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明实施例涉及一种故障诊断模型构建、故障诊断的方法、装置及电子设备,该方法包括:获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。通过该方式,可以基于无标签样本数据对模型进行迭代训练,从而进行故障诊断。

Description

故障诊断模型构建方法、装置及电子设备
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种故障诊断模型构建、故障诊断的方法、装置及电子设备。
背景技术
故障诊断技术通过监测设备的信号参数来发现设备的异常情况,并在发现异常情况后对故障进行分类诊断,其目的是判断机器设备是否存在故障或潜在故障,防止因设备老化或其他原因导致故障,造成不必要的经济损失。传统的信号特征处理技术,是根据设备运行积累的状态信号记录进行判断,需要专业人才来判断设备是否存在故障,判断的准确性也不高。
由于深度学习在特征提取上表现优异,尤其近些年在计算机视觉、自然语言处理方面大放异彩。目前深度学习在计算机视觉方面的应用主要属于监督学习范畴,这意味着训练数据需要大量的人工标注,耗时费力。故障诊断的难点是数据量少,并且标注需要专业的人来进行,导致难以标注。
因此,依靠人工标注通过机器学习的方法进行诊断,因为需要大量的标注的标签样本导致获取成本太高,造成人力资源成本的浪费。
发明内容
本申请提供了一种故障诊断模型构建、故障诊断的方法、装置及电子设备,以解决现有技术中用无标签信号数据进行故障诊断的问题。
第一方面,本申请提供了一种故障诊断模型构建方法,该方法包括:获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。
第二方面,本申请提供了一种故障诊断的方法,该方法被第一方面所介绍的故障诊断模型执行,包括:
获取待诊断设备对应的异常数据;
将异常数据进行分割,获取多个异常子数据;
将每一个异常子数据输入故障诊断模型,获取每一个故障诊断结果;
基于所有的故障诊断结果确认待诊断设备的故障原因。
第三方面,本申请提供了一种故障诊断模型构建装置,该装置包括:
获取模块,用于获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;
提取模块,对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;
处理模块,根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。
第四方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例的故障诊断模型构建方法的步骤。
第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一项实施例的故障诊断模型构建方法的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例提供的该方法,获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型。通过该方式,可以基于无标签样本数据对模型进行迭代训练,将每个数据样本作为一个类别,缩小相似样本之间的相似度距离,扩大不相似样本之间的相似度距离,从而得到故障诊断模型。避免因为缺少有标签样本数据而导致无法获取有效诊断模型的情况发生,大大节约了人工标注样本数据的人力成本。
附图说明
图1为本发明实施例提供的一种故障诊断模型构建方法流程示意图;
图2为本发明提供的训练样本数据的生成方法流程示意图;
图3为本发明提供的故障诊断模型构建及故障诊断方法流程示意图;
图4本发明提供的原始数据分割示意图;
图5为本发明提供的对时域波形图进行小波变换处理的方法示意图;
图6为本发明提供的对小波时频图进行数据增强处理的方法示意图;
图7为本发明提供的利用深度残差网络提取特征的方法示意图;
图8为本发明提供的深度卷积网络的结构单元示意图;
图9为本发明提供的MoCo算法结构示意图;
图10为本发明实施例提供的一种故障诊断方法流程示意图;
图11为本发明提供的另一种故障诊断方法流程示意图;
图12为本发明实施例提供的一种故障诊断模型构建装置结构示意图;
图13为本发明实施例提供的一种故障诊断装置结构示意图;
图14为本发明实施例提供一种电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
针对背景技术中所提及的技术问题,本申请实施例提供了一种故障诊断模型构建方法,具体参见图1所示,图1为本发明实施例提供的一种故障诊断模型构建方法流程示意图,该方法应用于一种信号设备,具体应用场景可以是一种旋转信号设备。
在介绍该方法步骤之前,首先介绍该故障诊断模型的构建和故障诊断流程,如图3所示。具体的,获取原始信号数据,原始信号数据由海量的采样点构成,为数值型数据,考虑到原始信号数据的数据量太大会影响计算机处理速度的情况,可以将原始信号数据进行分割,得到信号区间子数据,当然,如果原始采样数据量不大,则也可以采集N笔原始信号数据而不进行分割处理,具体如何操作依据实际情况而定。将原始信号区间子数据利用小波变换技术,得到子区间小波时频图,对原始区间小波时频图进行特征提取,获取锚点图片特征,即基准样本特征向量。对原始区间小波时频图进行数据增强处理,获取增强样本时频图,对增强样本时频图进行特征提取,将与锚点图片对应的增强时频图提取的特征,作为正样本特征向量,将其他增强样本时频图提取的特征,作为负样本特征向量,得到正负样本图片特征向量。将基准样本特征向量与正负样本特征向量输入自监督模型进行迭代训练,计算基准特征向量与正样本特征向量的相似度距离,与基准特征向量与负样本特征向量的相似度距离的对比损失,得到故障诊断模型。
在获取到故障诊断模型后,对待诊断设备进行故障诊断,具体的,将待诊断的异常数据进行分割,获取N个异常子区间数据,将N个异常子区间数据输入故障诊断模型,获取N个子区间故障诊断结果,然后基于所有的故障诊断结果判断待诊断设备的故障诊断结果。
该方法实施例的具体实施过程可以参见下文。具体的,该方法步骤包括:
步骤110,获取第i组第一样本数据。
具体的,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据。
因为本发明的实现过程需要训练多组数据,每组数据的获取及处理方式相同,因此本实施例选取其中一组训练数据予以说明,也即是第i组数据。
在旋转设备信号采集的过程中,一方面,原始采样数据每笔的数据量很大,可能是十万、百万个数据点级别,给计算机的处理速度造成很大压力,进而影响后续所有处理过程的处理效率。另一方面,原始的采样数据是数值型数据,而第一样本数据是图格式数据,因此,需要将原始采样数据进行数据处理,转换成可以用于特征提取的样本数据。
在一个可选的例子中,获取第i组第一样本数据,具体包括:
步骤210,从多个原始采样数据中,随机选取第j个原始采样数据进行数据转换处理,获取与第j个原始采样数据对应的第j个基准样本数据。
在一个可选的例子中,在进行转换处理之前,需要将原始采样数据进行分割,以便提升训练效率。
例如对信号设备按48k的采样频率,采样5秒,这样,一笔数据的采样数据量将会达到240,000(S),也即是240000个数值型数据,同时,将这笔原始采样数据以时域波形图的形式保存。然后,可以将这笔原始采样数据以n为数据区间,分割为N=S/n笔子数据,得到N笔采样子数据,其中,n可以是1024或者其他任何整数,这个完全依据现实情况而定。分割过程如图4所示,在将原始采样数据进行分割后,得到如图4所示的多N笔原始采样子数据。
原始采样子数据的时域波形图代表该笔信号数据的时域特征,而后续的优化训练需要信号数据的频域特征,因此,需要一种方式,将原始子数据的时域特征转换为频域特征,并且尽可能的保留原始的特征信息。
在一个实现的例子中,例如可以是利用小波变换技术。小波变换是信号特征处理的重要内容,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。小波变换通过变换能够充分突出问题某些方面的特征。鉴于此,本发明采用小波变换技术尽可能地提取原始信号保留的特征信息,将这些信息转换为频域特征信息,并以小波变换时频图的形式保存,如图5所示。
然后,从所有的小波变换时频图中,随机选取一个,也就是第j个小波变换时频图,作为第j个基准样本数据。
步骤220,对第j个基准样本数据进行数据增强处理,获取与第j个基准样本数据对应的第j个正样本数据。
具体的,正样本数据指的是与基准样本数据相似的数据。
在一个可选的例子中,例如,可以对基准样本数据进行数据增强处理,获得与原始采样子数据相似的图片,将数据增强后的图片作为正样本数据,以便后续根据基准数据和正样本数据,计算基准数据与正样本数据之间的相似度距离。
在一个可选的例子中,数据增强处理,可以是对原始图片进行平移、旋转、调节亮度等包括但不限于上述操作,经过数据增强处理后,就可以获取与原始采样子数据对应的相似图片,如图6所示,也即是,获取与第j个基准样本数据对应的第j个正样本数据。
步骤230,将多个原始采样数据中,除第j个原始采样数据之外的其他原始采样数据,构成负样本数据组。
其中,第i组第一样本数据包括第j个基准样本数据、第j个正样本数据,以及负样本数据组中的任一个负样本数据,其中,j为正整数。
具体的,第i组训练数据包括多个三元组,而每个三元组由一个基准样本数据、一个正样本数据和一个负样本数据组成,在构成第i组训练数据时,将第i个基准样本数据和第i个正样本数据,分别与负样本数据组中的每一个负样本数据组成多个三元组,用于后续将每个三元组提取出的特征输入模型进行训练。
步骤120,对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量。
具体的,将每个由一个基准样本数据、一个正样本数据和一个负样本数据组成的多个三元组中的每一个样本数据利用神经网络分别进行特征提取,获取与每一个基准样本数据对应的基准特征向量、与每一个正样本数据对应的正样本特征向量和与每一个负样本对应的负样本特征向量。
在一个可选的例子中,对每个三元组合中的每个数据进行特征提取,例如,可以利用深度卷积神经网络中的深度残差网络(Residual Network,简称ResNet),其特点是该网络第i层的输入除了接收i-1层网络的非线性输出F(x)以外,也接收i-1层网络的原始输入x。这样的结构使得ResNet可以增强特征复用,减轻深度学习的反向传播中容易出现梯度消失的情况,防止网络拟合能力退化,可以最大程度的保留原始信号的特征。
将原始采样数据的小波时频图输入ResNet网络,经过ResNet的特征提取过程,获取到每一个样本数据对应的特征向量,如图7和图8所示。
图7示出了将样本数据输入ResNet网络进行特征提取的过程。图8示出了ResNet网络的一个基本结构单元及其计算过程。ResNet技术为现有技术,因此对其内部的处理过程不做详细说明。
步骤130,根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练。
具体的,在一个可选的例子中,例如,将步骤120中提取的每个三元组特征向量,分别输入自监督模型进行迭代训练。
需要说明的是,自监督模型,无需人工标注标签,其让海量数据自身产生伪标签,将伪标签作为监督信号,训练特征提取器,训练得到的特征提取器将用于下游任务,例如图像分割、目标检测、图像分类等任务。本方法采用的自监督学习方法是MoCo(MomentumContrast for Unsupervised Visual Representation Learning,简称MoCo)算法。MoCo算法的核心思想是使用基于对比学习的方式自监督训练一个图片编码器,能更好的对图片进行编码并应用于下游任务中,如图9所示。
在一个具体的实施例中,每次在MoCo算法的一个分支网络(具体是图9所示左边分支网络)中输入基准样本特征向量xquerg,在另一个分支网络(具体是图9所示右边分支网络)输入一个正样本特征向量
Figure BDA0003563247520000081
和一个负样本特征向量
Figure BDA0003563247520000091
将训练数据中的多组三元组迭代输入到该自监督模型中进行迭代训练。
步骤140,当预设模型达到预设标准时,确认预设模型为故障诊断模型。
具体的,随着训练的进行,缩小基准特征向量与正样本特征向量的相似度距离,放大基准特征向量与多个负样本特征向量的相似度距离,拟合出一个故障诊断模型的损失函数方程:
Figure BDA0003563247520000092
q·k+表示一组训练数据中基准特征向量与正样本特征向量的相似度距离,q·ki表示一组训练数据中基准特征向量与k个负样本中的每一个负样本特征向量的相似度距离,k表示一组训练数据中负样本特征向量的数量,Lq表示损失函数的函数值。
通过不断地迭代计算,损失函数值Lq越来越小。
在一个可选的例子中,代入基准样本特征向量、正样本特征向量和负样本特征向量到损失函数方程中,随着训练的进行,基准样本向量q与正样本特征向量ki相似度距离越小,使exp(q·k+/τ)值小,基准样本向量q与负样本特征向量相似ki的相似度距离越大,使exp(q·ki/τ)的值大,从而最小化损失函数,当损失函数值不再变化时,确认该损失函数达到小值,停止训练,得到有效故障诊断模型。
本发明实施例提供的故障诊断模型构建方法,获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。通过该方式,可以基于无标签样本数据对模型进行迭代训练,将每个数据样本作为一个类别,缩小相似样本之间的相似度距离,扩大不相似样本之间的相似度距离。从而得到故障诊断模型。避免因为缺少有标签样本数据而导致无法获取有效诊断模型的情况发生,大大节约了人工标注样本数据的人力成本。
图10为本发明实施例提供的一种故障诊断方法流程示意图,该方法由上文中任意实施例所对应的故障诊断模型执行,方法包括:
步骤1010,获取待诊断设备对应的异常数据。
具体的,异常数据用以指示当设备发生异常时,产生的异常信号数据,由多个数据点组成。
步骤1020,将异常数据进行分割,获取多个异常子数据。
具体的,将异常信号数据以n个数据点为单位进行分割,获取N个异常子数据,需要说明的是n为正整数,具体的数值完全可以根据实际情况而定。
步骤1030,将每一个异常子数据输入故障诊断模型,获取每一个故障诊断结果。
在一个具体的例子中,将N个异常子数据分别输入故障诊断模型,获取N个故障诊断结果。
步骤1040,基于所有的故障诊断结果确认待诊断设备的故障原因。
在一个具体的例子中,判断N个故障诊断结果,当某一故障诊断结果最多或者该故障诊断结果的占比达到设定阈值时,确定该故障诊断结果为最终故障诊断结果,其中,设定阈值可以是0.9、0.5等根据实际情况设定的阈值。
图11为本发明提供的另一种故障诊断流程示意图。在如图11所示的流程图中,待诊断设备的原始数据进行数据分割,获取N笔子数据,考虑到如果N笔子数据太多导致模型计算时间太长的情况,可以从N笔子数据中随机选取K笔子数据,将K笔子数据分别输入故障诊断模型,得到K个诊断结果,例如可能是X个故障a结果,Y个故障b结果,Z个故障n结果等,基于K个故障诊断结果进行判断,当某一种故障诊断结果最多或者某种故障诊断结果达到设定阈值,例如0.9,则判断该故障诊断结果为最终的故障结果。
本发明实施例提供的故障诊断的方法,可以基于无标签样本数据对模型进行迭代训练,将每个数据样本作为一个类别,缩小相似样本之间的相似度距离,扩大不相似样本之间的相似度距离,从而得到故障诊断模型。避免因为缺少有标签样本数据而导致无法获取有效诊断模型的情况发生,大大节约了人工标注样本数据的人力成本。
以上,为本申请所提供的故障诊断模型构建几个方法实施例,下文中则介绍说明本申请所提供的故障诊断模型构建其他实施例,具体参见如下。
图12为本发明实施例提供的一种故障诊断模型构建装置,该装置包括:
获取模块1201,用于获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;
提取模块1202,对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;
处理模块1203,根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。
可选的,还包括:数据增强模块1204、构成模块1205和训练模块1206。
获取模块1201,还用于从多个原始采样数据中,随机选取第j个原始采样数据进行数据转换处理,获取与第j个原始采样数据对应的第j个基准样本数据;
数据增强模块1204,用于对第j个基准样本数据进行数据增强处理,获取与第j个基准样本数据对应的第j个正样本数据;
构成模块1205,用于将多个原始采样数据中,除第j个原始采样数据之外的其他原始采样数据,构成负样本数据组。
可选的,还包括:
训练模块1206,用于将基准特征向量、正样本特征向量,以及第i个负样本特征向量输入到预设模型中,分别获取基准特征向量与正样本特征向量之间的第一相似度距离,以及基准特征向量与第j个负样本特征之间的第二相似度距离;
根据第一相似度距离和所有的第二相似度距离,对预设模型进行迭代优化训练,直至确定预设模型达到预设标准时结束。
可选的,还包括:
处理模块1203,还用于根据第一相似度距离和所有的第二相似度距离确定损失函数,以便根据损失函数,对预设模型进行迭代优化训练。
图13为本发明实施例提供的一种故障诊断装置,该装置包括:获取模块1301和处理模块1302。
获取模块1301,用于获取与待诊断设备对应的异常数据;
处理模块1302,用于将异常数据进行分割,获取多个异常子数据;
将每一个异常子数据输入故障诊断模型,获取每一个故障诊断结果;
基于所有的故障诊断结果确认待诊断设备的故障原因。
本发明实施例提供的故障诊断模型构建装置中各部件所执行的功能均已在上述任一方法实施例中做了详细的描述,因此这里不再赘述。
本发明实施例提供的一种故障诊断模型构建装置,获取第i组第一样本数据,其中,第i组第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;对基准样本数据、正样本数据,以及第i个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。通过该方式,可以基于无标签样本数据对模型进行迭代训练,将每个数据样本作为一个类别,缩小相似样本之间的相似度距离,扩大不相似样本之间的相似度距离。避免因为缺少有标签样本数据而导致无法获取有效诊断模型的情况发生,大大节约了人工标注样本数据的人力成本。
如图14所示,本申请实施例提供了一种电子设备,包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信。
存储器113,用于存放计算机程序;
在本申请一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的故障诊断模型构建方法,包括:获取第i组第一样本数据,其中,第i组第一样本数据包括第i个基准样本数据、第i个正样本数据,和第i组负样本数据;其中,第i个基准样本数据和第i个正样本数据均为无标签的样本数据,第i组负样本数据中的每一个负样本数据均为具有标签的样本数据;对第i个基准样本数据、第i个正样本数据,以及第i组负样本数据中的每一个负样本数据分别进行特征提取,获取与基准样本数据对应的基准特征向量,与正样本数据对应的正样本特征向量,以及与第i组的负样本数据中的每一个负样本数据对应的负样本特征向量;根据基准特征向量、正样本特征向量,以及负样本特征向量,对预设模型进行迭代优化训练;当预设模型达到预设标准时,确认预设模型为故障诊断模型,其中,i为正整数。
可选的,获取第i组第一样本数据,具体包括:
获取第i组第一样本数据,具体包括:从多个原始采样数据中,随机选取第j个原始采样数据进行数据转换处理,获取与第j个原始采样数据对应的第j个基准样本数据;
对第j个基准样本数据进行数据增强处理,获取与第j个基准样本数据对应的第j个正样本数据;
将多个原始采样数据中,除第j个原始采样数据之外的其他原始采样数据,构成负样本数据组,其中,第i组第一样本数据包括第j个基准样本数据、第j个正样本数据,以及负样本数据组中的任一个负样本数据,其中,j为正整数。
可选的,根据基准特征向量、正样本特征向量、负样本特征向量,对预设模型进行迭代优化训练,具体包括:
将基准特征向量、正样本特征向量,以及第i个负样本特征向量输入到预设模型中,分别获取基准特征向量与正样本特征向量之间的第一相似度距离,以及基准特征向量与第j个负样本特征之间的第二相似度距离;
根据第一相似度距离和所有的第二相似度距离,对预设模型进行迭代优化训练,直至确定预设模型达到预设标准时结束。
可选的,根据第一相似度距离和所有的第二相似度距离,对预设模型进行迭代优化训练,具体包括:
根据第一相似度距离和所有的第二相似度距离确定损失函数;
根据损失函数,对预设模型进行迭代优化训练。
可选的,还包括一种故障诊断的方法,具体的:
获取待诊断设备对应的异常数据;
将异常数据进行分割,获取多个异常子数据;
将每一个异常子数据输入故障诊断模型,获取每一个故障诊断结果;
基于所有的故障诊断结果确认待诊断设备的故障原因。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述任意一个方法实施例提供的故障诊断模型构建方法的步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种故障诊断模型构建方法,其特征在于,所述方法包括:
获取第i组第一样本数据,其中,第i组所述第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;
对所述基准样本数据、所述正样本数据,以及第i个所述负样本数据分别进行特征提取,获取与所述基准样本数据对应的基准特征向量,与所述正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量;
根据所述基准特征向量、所述正样本特征向量,以及所述负样本特征向量,对所述预设模型进行迭代优化训练;
当所述预设模型达到预设标准时,确认所述预设模型为故障诊断模型,其中,i为正整数。
2.根据权利要求1所述的方法,其特征在于,所述获取第i组第一样本数据,具体包括:
从多个原始采样数据中,随机选取第j个原始采样数据进行数据转换处理,获取与第j个所述原始采样数据对应的第j个基准样本数据;
对第j个所述基准样本数据进行数据增强处理,获取与第j个所述基准样本数据对应的第j个正样本数据;
将多个原始采样数据中,除所述第j个所述原始采样数据之外的其他原始采样数据,构成所述负样本数据组,其中,所述第i组第一样本数据包括第j个所述基准样本数据、第j个所述正样本数据,以及所述负样本数据组中的任一个负样本数据,其中,j为正整数。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述基准特征向量、所述正样本特征向量、所述负样本特征向量,对所述预设模型进行迭代优化训练,具体包括:
将所述基准特征向量、所述正样本特征向量,以及第i个所述负样本特征向量输入到所述预设模型中,分别获取所述基准特征向量与所述正样本特征向量之间的第一相似度距离,以及所述基准特征向量与第j个负样本特征之间的第二相似度距离;
根据所述第一相似度距离和所有的所述第二相似度距离,对所述预设模型进行迭代优化训练,直至确定所述预设模型达到预设标准时结束。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一相似度距离和所有的所述第二相似度距离,对所述预设模型进行迭代优化训练,具体包括:
根据所述第一相似度距离和所有的所述第二相似度距离确定损失函数;
根据所述损失函数,对所述预设模型进行迭代优化训练。
5.一种故障诊断的方法,其特征在于,所述方法被如权利要求1-4任一项所述的故障诊断模型执行,所述方法包括:
获取与待诊断设备对应的异常数据;
将所述异常数据进行分割,获取多个异常子数据;
将每一个所述异常子数据输入所述故障诊断模型,获取每一个故障诊断结果;
基于所有的故障诊断结果确认所述待诊断设备的故障原因。
6.一种故障诊断模型的构建装置,其特征在于,所述装置包括:
获取模块,用于获取第i组第一样本数据,其中,第i组所述第一样本数据包括基准样本数据、正样本数据,和第i个负样本数据;
提取模块,用于对所述基准样本数据、所述正样本数据,以及第i个所述负样本数据分别进行特征提取,获取与所述基准样本数据对应的基准特征向量,与所述正样本数据对应的正样本特征向量,以及与第i个负样本数据对应的负样本特征向量,其中,i为正整数;
处理模块:根据所述基准特征向量、所述正样本特征向量,以及所述负样本特征向量,对所述预设模型进行迭代优化训练;当所述预设模型达到预设标准时,确认所述预设模型为故障诊断模型。
7.根据权利要求6所述的装置,其特征在于,所述获取模块,具体用于从多个原始采样数据中,随机选取第j个原始采样数据进行数据转换处理,获取与第j个所述原始采样数据对应的第j个基准样本数据;
对第j个所述基准样本数据进行数据增强处理,获取与第j个所述基准样本数据对应的第j个正样本数据;
将多个原始采样数据中,除所述第j个所述原始采样数据之外的其他原始采样数据,构成所述负样本数据组,其中,所述第i组第一样本数据包括第j个所述基准样本数据、第j个所述正样本数据,以及所述负样本数据组中的任一个负样本数据,其中,j为正整数。
8.根据权利要求6所述的装置,其特征在于,所述处理模型,具体还用于将所述基准特征向量、所述正样本特征向量,以及第i个所述负样本特征向量输入到所述预设模型中,分别获取所述基准特征向量与所述正样本特征向量之间的第一相似度距离,以及所述基准特征向量与第j个负样本特征之间的第二相似度距离;
根据所述第一相似度距离和所有的所述第二相似度距离,对所述预设模型进行迭代优化训练,直至确定所述预设模型达到预设标准时结束。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一项所述的跨集群迁移云物理机的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4任一项所述的故障诊断模型构建方法的步骤。
CN202210308574.XA 2022-03-24 2022-03-24 故障诊断模型构建方法、装置及电子设备 Pending CN114662541A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210308574.XA CN114662541A (zh) 2022-03-24 2022-03-24 故障诊断模型构建方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210308574.XA CN114662541A (zh) 2022-03-24 2022-03-24 故障诊断模型构建方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114662541A true CN114662541A (zh) 2022-06-24

Family

ID=82032713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210308574.XA Pending CN114662541A (zh) 2022-03-24 2022-03-24 故障诊断模型构建方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114662541A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115935265A (zh) * 2023-03-03 2023-04-07 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法、风险识别方法及对应装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020100027A4 (en) * 2019-11-20 2020-02-20 Nanjing University Of Posts And Telecommunications Electroencephalogram-based negative emotion recognition method and system for aggressive behavior prediction
CN112508105A (zh) * 2020-12-11 2021-03-16 南京富岛信息工程有限公司 一种采油机故障检测与检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020100027A4 (en) * 2019-11-20 2020-02-20 Nanjing University Of Posts And Telecommunications Electroencephalogram-based negative emotion recognition method and system for aggressive behavior prediction
CN112508105A (zh) * 2020-12-11 2021-03-16 南京富岛信息工程有限公司 一种采油机故障检测与检索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115935265A (zh) * 2023-03-03 2023-04-07 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法、风险识别方法及对应装置

Similar Documents

Publication Publication Date Title
CN108573225B (zh) 一种局部放电信号模式识别方法及系统
JP6289400B2 (ja) 周期定常背景雑音を受ける信号内にイベントを検出する方法およびシステム
CN109214349B (zh) 一种基于语义分割增强的物体检测方法
Hao et al. Underdetermined source separation of bearing faults based on optimized intrinsic characteristic-scale decomposition and local non-negative matrix factorization
CN110890102A (zh) 一种基于rnn声纹识别的发动机缺陷检测算法
CN111985533B (zh) 一种基于多尺度信息融合的增量式水声信号识别方法
CN106778851B (zh) 基于手机取证数据的社交关系预测系统及其方法
CN111709295A (zh) 一种基于SSD-MobileNet的实时手势检测和识别方法及系统
CN112861575A (zh) 一种行人结构化方法、装置、设备和存储介质
CN110020658B (zh) 一种基于多任务深度学习的显著目标检测方法
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN112881942B (zh) 基于小波分解与经验模态分解的异常电流诊断方法和系统
CN108197647A (zh) 一种汽车起动机耐久测试数据的快速聚类方法
CN114170184A (zh) 一种基于嵌入特征向量的产品图像异常检测方法及装置
CN114662541A (zh) 故障诊断模型构建方法、装置及电子设备
CN116778935A (zh) 水印生成、信息处理、音频水印生成模型训练方法和装置
CN110619216B (zh) 一种对抗性网络的恶意软件检测方法及系统
CN111289251A (zh) 一种滚动轴承细粒度故障识别方法
CN113705650B (zh) 一种人脸图片集的处理方法、装置、介质和计算设备
CN108898619B (zh) 一种基于pvanet神经网络的目标跟踪方法
CN107894837A (zh) 动态情感分析模型样本处理方法及装置
CN112560925A (zh) 一种复杂场景目标检测数据集构建方法及系统
CN115061196B (zh) 基于经验模态分解imf引导的微震信号识别方法
CN114533084B (zh) 脑电特征提取方法、装置、电子设备和存储介质
CN110728316A (zh) 一种课堂行为检测方法、系统、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220624

RJ01 Rejection of invention patent application after publication