CN110555478B - 基于难样本挖掘的深度度量网络的风机多故障诊断方法 - Google Patents

基于难样本挖掘的深度度量网络的风机多故障诊断方法 Download PDF

Info

Publication number
CN110555478B
CN110555478B CN201910835384.1A CN201910835384A CN110555478B CN 110555478 B CN110555478 B CN 110555478B CN 201910835384 A CN201910835384 A CN 201910835384A CN 110555478 B CN110555478 B CN 110555478B
Authority
CN
China
Prior art keywords
sample
data
training
depth measurement
difficult
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910835384.1A
Other languages
English (en)
Other versions
CN110555478A (zh
Inventor
刘金海
刘晓媛
曲福明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910835384.1A priority Critical patent/CN110555478B/zh
Publication of CN110555478A publication Critical patent/CN110555478A/zh
Application granted granted Critical
Publication of CN110555478B publication Critical patent/CN110555478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/02Gearings; Transmission mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Wind Motors (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提供一种基于难样本挖掘的深度度量网络的风机多故障诊断方法,涉及风力涡轮机故障诊断技术领域。该方法首先针对一个风力涡轮机z种不同类型的SCADA数据构建难样本数据集,将构造的难样本数据集进行图像化处理,优化各类SCADA数据变量,使数据变量之间的排列在时间空间上连续,最终得到优化后的训练样本,构造基于改进三元组训练样本集损失函数的深度度量网络模型;最后将三元组样本通过深度度量网络映射得到的特征向量作为训练集输入到SVM模型中,进行风力涡轮机故障诊断。该方法基于三元组模型进行样本生成,提出一个运用单模型诊断多故障的方法,运用改进的三元组损失函数训练模型,提高了多故障诊断的准确性。

Description

基于难样本挖掘的深度度量网络的风机多故障诊断方法
技术领域
本发明涉及风力涡轮机故障诊断技术领域,尤其涉及一种基于难样本挖掘的深度度量网络的风机多故障诊断方法。
背景技术
近年来,由于矿产、石油等资源的日益枯竭,无法满足人类对能源日益增长的需求,绿色环保可持续的风能成为再生资源的主力军,其在整个能源体系的地位也日益增长。全球风能理事会(GWEC)发布的数据显示:2018年全球新增装机容量为51.3GW,总装机容量为591GW,与2017年相比增长了9%,预计到2023年,陆上和海上的新增装机容量每年将超过55GW。
随着风力发电技术的迅速发展,越来越多的风电场和风力涡轮机投入使用,风电机组遭遇的问题也原来越多。风电场一般位于风力资源较丰富的偏远地区或者近诲区域,交通不便,风电场内风电机组分布面积广、数量多、工作环境恶劣、受气候和环境影响大,风速极不稳定,在交变荷载的作用下,机组的一些关键部件容易损坏,因此风力发电机在发电过程中很容易出现故障,并且维修难度和成本很高,据悉运营和维修服务是发电成本的25-35%。无论从安全的角度,还是从经济效益出发,风电机组的故障分析和建立完备的故障诊断系统是具有极其重要的实际意义的。
目前针对风力涡轮机(即风机)的故障诊断方法主要包括以下三类:基于信号的方法、基于模型的方法、基于数据驱动的方法。其中,基于数据驱动的方法对信号噪声鲁棒性较好,因此数据驱动方法在故障诊断中被广泛使用。然而,大多数风力涡轮机故障检测方法只能检测风力涡轮机的一类故障,在实际中,故障种类是多种多样的,单模型诊断单故障会导致信息混乱、计算量增大、时效性降低等问题,因此提出一种利用单模型解决多故障的方法具有重要的意义和研究价值。
在理论研究中,有很多基于数据驱动的故障诊断方法可以实现单模型对多故障的诊断,其中包括人工神经网络(ANN)、支持向量机(SVM)、模糊逻辑系统(FLS)。这些方法可以通过训练进而从输入故障数据中识别出不同的故障类型,因而可以用来实现多故障诊断。然而现有的单模型诊断多故障方法性能差,且这些方法严重依赖于风力涡轮机领域知识,因此能够检测到的故障类型数量有限。由上所述,可见,如何建立单模型来诊断多故障,并提高诊断的精度,是当前风力涡轮机故障诊断领域亟需解决的难题之一。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于难样本挖掘的深度度量网络的风机多故障诊断方法,实现风力涡轮机的多种故障诊断,并提高多故障诊断的精度。
为解决上述技术问题,本发明所采取的技术方案是:基于难样本挖掘的深度度量网络的风机多故障诊断方法,包括以下步骤:
步骤1:构建难训练样本挖掘模型;针对一个风力涡轮机z种不同类型的SCADA数据集,D=[D1,D2,...,Dz]T,其中每一类型包括正常数据Rn、异常数据Rf;为了选择训练精度高的样本集,将异常数据Rf分为早期故障数据Sef和故障数据Sf,对正常数据和异常数据进行样本均衡化,构成难样本集A=Rn∪Rf
步骤1.1:生成正常数据训练样本集Rn,如下公式所示:
Rn=Sn∪Sv∪So
其中,Sn为临近早期故障数据的正常数据,Sv为不同环境条件下的正常数据,So为不同操作条件下的正常数据;
步骤1.2:生成异常数据训练样本集Rf;针对某一类SCADA数据在一定时间范围内的变化数值,用k-means聚类方法对该时间范围内每段异常数据F进行聚类,形成早期故障样本Fef和故障样本Ff,用公式表示为ψ(F)=[Fef,Ff],F∈D,ψ表示聚类方法;将形成早期故障样本Fef和故障样本Ff,通过等间隔采样生成训练样本数据Sef(w)和Sf(w),且使早期故障样本Fef数量多于故障样本数量Ff
Sef(w)=Fef(w+1),Fef(w+2),…,Fef(w+ω),w=0,λef,2λef,…,pλef
Sf(w)=Ff(w+1),Ff(w+2),…,Ff(w+ω),w=0,λf,2λf,…,qλf
其中,λef和λf均为采样间隔,且λef<λf,Fef(w+ω)为SCADA数据中其中一类早期故障数据在w+ω时刻下的值,Ff(w+ω)为SCADA数据中其中一类故障数据在w+ω时刻下的值,ω为采样区间长度,p为生成的Sef个数,q为生成的Sf个数;
经过对异常样本数据等间隔采样处理,生成异常数据训练样本集Rf=Sef∪Sf
步骤1.3:由得到的异常数据训练样本集Rf=Sef∪Sf和正常数据训练样本集Rn=Sn∪Sv∪So构成难样本数据集A=Rn∪Rf
步骤2:构造难样本数据集的优化模型;将构造的难样本数据集进行图像化处理,图像矩阵的横轴为时间轴,纵轴为各类SCADA数据变量;为了提高深度度量网络卷积层对图像卷积的精度,优化各类SCADA数据变量,使数据变量之间的排列在时间空间上连续,最终得到优化后的训练样本集X;
步骤2.1:采用遗传算法优化难样本数据集A,目标函数Oσ如下公式所示:
Figure BDA0002192059920000031
其中,Oσ为任意时刻δ下的目标函数,
Figure BDA0002192059920000032
为任意时刻δ下第h个SCADA数据变量,n为难样本数据集A中SCADA变量总数,pcc为皮尔逊相关系数;
步骤2.2:通过优化,得到优化后的异常数据训练样本集
Figure BDA0002192059920000033
和正常数据训练样本集
Figure BDA0002192059920000034
如下公式所示:
Figure BDA0002192059920000035
其中,opt=(O1∪O2∪…∪Oδ)为优化函数;
步骤2.3:构成难样本数据集优化后的训练样本集
Figure BDA0002192059920000036
步骤3:构造基于改进三元组训练样本集损失函数的深度度量网络模型;从优化后的训练样本集X中选出训练正样本,训练锚样本、训练负样本,分别记作xp、xa、xn,构成训练样本三元组数据集;所述训练正样本和训练锚样本为同类样本,训练锚样本和训练负样本为异类样本;建立三个权值共享且结构相同的深度度量网络作为度量判别网络,在最大边界α指导下,将输入到深度度量网络的三元组数据集映射到特征空间,进而得到特征向量f(xi p)、f(xi a)、f(xi n);通过改进的三元组训练样本集的损失函数反向更新深度度量网络参数,使同类样本的特征向量f(xi a)和f(xi p)距离变小,异类样本的特征向量f(xi a)和f(xi n)距离变大;
步骤3.1:从优化后的训练样本集X中选出训练正样本xp,训练锚样本xa和训练负样本xn,构成训练样本三元组数据集;
步骤3.2:建立三个权值共享且结构相同的深度度量网络作为度量判别网络,在最大边界α指导下,将输入到深度度量网络的三元组数据集映射到特征空间,进而得到特征向量f(xi p)、f(xi a)、f(xi n),i=1,2,...,ρ,ρ为训练样本三元组数据集中三元组的组数;
步骤3.3:对训练样本三元组数据集的损失函数进行改进,进而实现对深度度量网络的训练;
步骤3.3.1:计算三元组训练样本集中任两类样本特征向量之间的距离,如下公式所示:
Figure BDA0002192059920000041
其中,
Figure BDA0002192059920000042
b=p或n,fθ(·)为经过改进的损失函数反向更新参数后的深度度量网络,
Figure BDA0002192059920000043
为三元组样本
Figure BDA0002192059920000044
在通过改进损失函数后经过深度度量网络映射得到的特征向量之间的距离;
步骤3.3.2:根据三元组训练样本集中同类样本特征向量之间的距离与异类样本特征向量之间的距离,得到三元组训练样本集改进后的损失函数,如下公式所示:
Figure BDA0002192059920000045
步骤3.4:通过改进的损失函数反向更新深度度量网络参数,重新执行步骤3.2直至损失函数收敛至零,得到训练好的深度度量网络;
步骤4:采用SVM构造多故障诊断模型,进而实现对风力涡轮机故障诊断;
步骤4.1:将三元组样本通过训练好的深度度量网络映射得到的特征向量fθ(xi p)、fθ(xi a)、fθ(xi n)作为训练集输入到SVM模型中,训练SVM模型,使其实现对m类风力涡轮机数据进行分类;
步骤4.2:从SCADA数据集D内,任取20%数据作为测试样本数据,对未经过难样本挖掘模型的SCADA数据进行步骤2的优化,将优化后的三元组样本数据输入到已经训练好的深度度量网络中,最后将得到的特征向量输入到SVM模型中,实现对风力涡轮机的故障诊断。
采用上述技术方案所产生的有益效果在于:本发明提供的基于难样本挖掘的深度度量网络的风机多故障诊断方法,基于三元组模型进行样本生成,提出一个运用单模型诊断多故障的方法,运用三元组预训练模型,提高了多故障诊断的准确性;同时,提出的难样本挖掘模型,根据风机SCADA数据正常数据Rn和异常数据Rf,构造了难样本数据集A,提高了三元组预训练模型的精度;改进了三元组训练样本集的损失函数,将SCADA数据中训练样本通过映射空间得到特征向量,从而使同类样本特征向量之间的距离更近,异类样本特征向量之间的距离更远。
附图说明
图1为本发明实施例提供的基于难样本挖掘的深度度量网络的风机多故障诊断方法的流程图;
图2为本发明实施例提供的难样本挖掘模型的示意图;
图3为本发明实施例提供的基于难样本挖掘模型的SCADA数据样本生成示意图;
图4为本发明实施例提供的难训练样本集优化结果示意图,其中,(a)为故障一优化结果,(b)为故障二优化结果,(c)为故障三优化结果,(d)为故障四优化结果,(e)为故障五优化结果,(f)为正常数据优化结果;
图5为本发明实施例提供的三元组训练样本集的分类原理示意图;
图6为本发明实施例提供的基于改进三元组损失函数的训练深度度量网络的过程示意图;
图7为本发明实施例提供的运用分类模型SVM实现故障分类的结果示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
基于难样本挖掘的深度度量网络的风机多故障诊断方法,如图1所示,包括以下步骤:
步骤1:构建难训练样本挖掘模型;针对一个风力涡轮机z种不同类型的SCADA(Supervisory Control And Data Acquisition,即数据采集与监视控制系统数据)数据集,D=[D1,D2,...,Dz]T,其中每一类型包括正常数据Rn、异常数据Rf;为了选择训练精度高的样本集,将异常数据Rf分为早期故障数据Sef和故障数据Sf,对正常数据和异常数据进行样本均衡化,构成难样本集A=Rn∪Rf;所述风力涡轮机的z种不同类型的SCADA数据包括齿轮油温、齿轮箱前轴承温度、齿轮箱后轴承温度、发电机前轴承温度、发电机后轴承温度、发电机定子绕组温度、液压油温度及安全油缸压力等;本实施例中,部分SCADA数据如表1所示:
表1部分SCADA数据
Figure BDA0002192059920000051
Figure BDA0002192059920000061
步骤1.1:生成正常数据训练样本集Rn,如下公式所示:
Rn=Sn∪Sv∪So
其中,Sn为临近早期故障数据的正常数据,Sv为不同环境条件下的正常数据,So为不同操作条件下的正常数据;
步骤1.2:生成异常数据训练样本集Rf;针对某一类SCADA数据在一定时间范围内的变化数值,用k-means聚类方法对该时间范围内每段异常数据F进行聚类,形成早期故障样本Fef和故障样本Ff,用公式表示为ψ(F)=[Fef,Ff],F∈D,ψ表示聚类方法;将形成早期故障样本Fef和故障样本Ff,通过等间隔采样生成训练样本数据Sef(w)和Sf(w),且使早期故障样本Fef数量多于故障样本数量Ff
Sef(w)=Fef(w+1),Fef(w+2),…,Fef(w+ω),w=0,λef,2λef,…,pλef
Sf(w)=Ff(w+1),Ff(w+2),…,Ff(w+ω),w=0,λf,2λf,…,qλf
其中,λef和λf均为采样间隔,且λef<λf,Fef(w+ω)为SCADA数据中其中一类早期故障数据在w+ω时刻下的值,Ff(w+ω)为SCADA数据中其中一类故障数据在w+ω时刻下的值,ω为采样区间长度,p为生成的Sef个数,q为生成的Sf个数;
经过对异常样本数据等间隔采样处理,生成异常数据训练样本集Rf=Sef∪Sf
步骤1.3:由得到的异常数据训练样本集Rf=Sef∪Sf和正常数据训练样本集Rn=Sn∪Sv∪So构成难样本数据集A=Rn∪Rf
本实施例中,根据如图2所示的三元组难样本模型示意图,为了选择训练精度高的样本集,根据三元组难样本选择原理,构建基于三元组难样本挖掘模型生成如图3所示的SCADA数据样本;
步骤2:构造难样本数据集的优化模型;将构造的难样本数据集进行图像化处理,图像矩阵的横轴为时间轴,纵轴为各类SCADA数据变量;为了提高深度度量网络卷积层对图像卷积的精度,优化各类SCADA数据变量,使数据变量之间的排列在时间空间上连续,最终得到优化后的训练样本集X;
步骤2.1:采用遗传算法优化难样本数据集A,目标函数Oσ如下公式所示:
Figure BDA0002192059920000071
其中,Oσ为任意时刻δ下的目标函数,
Figure BDA0002192059920000072
为任意时刻δ下第h个SCADA数据变量,n为难样本数据集A中SCADA变量总数,pcc为皮尔逊相关系数,如下公式所示:
Figure BDA0002192059920000073
步骤2.2:通过优化,得到优化后的异常数据训练样本集
Figure BDA0002192059920000074
和正常数据训练样本集
Figure BDA0002192059920000075
如下公式所示:
Figure BDA0002192059920000076
其中,opt=(O1∪O2∪…∪Oδ)为优化函数;
步骤2.3:构成难样本数据集优化后的训练样本集
Figure BDA0002192059920000077
本实施例中,对如图3所示的SCADA数据样本进行优化的结果如图4所示。
步骤3:构造基于改进三元组训练样本集损失函数的深度度量网络模型;从优化后的训练样本集X中选出训练正样本Positive,训练锚样本Anchor、训练负样本Negative,分别记作xp、xa、xn,构成训练样本三元组数据集;所述训练正样本和训练锚样本为同类样本,训练锚样本和训练负样本为异类样本;建立三个权值共享且结构相同的深度度量网络作为度量判别网络,在最大边界α指导下,将输入到深度度量网络的三元组数据集映射到特征空间,进而得到特征向量f(xi p)、f(xi a)、f(xi n);通过改进的三元组训练样本集的损失函数反向更新深度度量网络参数,使同类样本的特征向量f(xi a)和f(xi p)距离变小,异类样本的特征向量f(xi a)和f(xi n)距离变大;
步骤3.1:从优化后的训练样本集X中选出训练正样本xp,训练锚样本xa和训练负样本xn,构成训练样本三元组数据集;
步骤3.2:建立三个权值共享且结构相同的深度度量网络作为度量判别网络,在最大边界α指导下,将输入到深度度量网络的三元组数据集映射到特征空间,进而得到特征向量f(xi p)、f(xi a)、f(xi n,i=1,2,...,ρ,ρ为训练样本三元组数据集中三元组的组数;
步骤3.3:对训练样本三元组数据集的损失函数进行改进,进而实现对深度度量网络的训练;
步骤3.3.1:计算三元组训练样本集中任两类样本特征向量之间的距离,如下公式所示:
Figure BDA0002192059920000081
其中,
Figure BDA0002192059920000082
b=p或n,fθ(·)为经过改进的损失函数反向更新参数后的深度度量网络,
Figure BDA0002192059920000083
为三元组样本
Figure BDA0002192059920000085
Figure BDA0002192059920000086
在通过改进损失函数后经过深度度量网络映射得到的特征向量之间的距离;
步骤3.3.2:根据三元组训练样本集中同类样本特征向量之间的距离与异类样本特征向量之间的距离,得到三元组训练样本集改进后的损失函数,如下公式所示:
Figure BDA0002192059920000084
步骤3.4:通过改进的损失函数反向更新深度度量网络参数,重新执行步骤3.2直至损失函数收敛至零,得到训练好的深度度量网络;实际计算过程中,损失函数无法收敛至零,只能无限趋近于零。
本实施例中,基于如图5所示的三元组分类原理对三元组数据进行分类,通过改进三元组损失函数进而反向更新深度度量网络参数,改进三元组损失函数训练深度度量网络的过程图如图6所示,最终使得同类样本的特征向量之间的距离更小,异类样本的特征向量之间的距离更大,从而将两类样本成功分类。
步骤4:采用SVM构造多故障诊断模型,进而实现对风力涡轮机故障诊断;
步骤4.1:将三元组样本通过训练好的深度度量网络映射得到的特征向量fθ(xi p)、fθ(xi a)、fθ(xi n)作为训练集输入到SVM模型中,训练SVM模型,使其实现对m类风力涡轮机数据进行分类;
步骤4.2:从SCADA数据集D内,任取20%数据作为测试样本数据,对未经过难样本挖掘模型的SCADA数据进行步骤2的优化,将优化后的三元组样本数据输入到已经训练好的深度度量网络中,最后将得到的特征向量输入到SVM模型中,实现对风力涡轮机的故障诊断。
本实施例中,使用训练好的SVM模型,对测试样本数据中故障进行分类结果如图7所示。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (5)

1.一种基于难样本挖掘的深度度量网络的风机多故障诊断方法,其特征在于:包括以下步骤:
步骤1:构建难训练样本挖掘模型;针对一个风力涡轮机z种不同类型的SCADA数据集,D=[D1,D2,...,Dz]T,其中每一类型包括正常数据Rn、异常数据Rf;将异常数据Rf分为早期故障数据Sef和故障数据Sf,对正常数据和异常数据进行样本均衡化,构成难样本集A=Rn∪Rf
步骤2:构造难样本数据集的优化模型;将构造的难样本数据集进行图像化处理,图像矩阵的横轴为时间轴,纵轴为各类SCADA数据变量;为了提高深度度量网络卷积层对图像卷积的精度,优化各类SCADA数据变量,使数据变量之间的排列在时间空间上连续,最终得到优化后的训练样本集X;
步骤3:构造基于改进三元组训练样本集损失函数的深度度量网络模型;从优化后的训练样本集X中选出训练正样本,训练锚样本、训练负样本,分别记作xp、xa、xn,构成训练样本三元组数据集;所述训练正样本和训练锚样本为同类样本,训练锚样本和训练负样本为异类样本;建立三个权值共享且结构相同的深度度量网络作为度量判别网络,在最大边界α指导下,将输入到深度度量网络的三元组数据集映射到特征空间,进而得到特征向量f(xi p)、f(xi a)、f(xi n);通过改进的三元组训练样本集的损失函数反向更新深度度量网络参数,使同类样本的特征向量f(xi a)和f(xi p)距离变小,异类样本的特征向量f(xi a)和f(xi n)距离变大;
步骤3.1:从优化后的训练样本集X中选出训练正样本xp,训练锚样本xa和训练负样本xn,构成训练样本三元组数据集;
步骤3.2:建立三个权值共享且结构相同的深度度量网络作为度量判别网络,在最大边界α指导下,将输入到深度度量网络的三元组数据集映射到特征空间,进而得到特征向量f(xi p)、f(xi a)、f(xi n),i=1,2,...,ρ,ρ为训练样本三元组数据集中三元组的组数;
步骤3.3:对训练样本三元组数据集的损失函数进行改进,进而实现对深度度量网络的训练;
步骤3.4:通过改进的损失函数反向更新深度度量网络参数,重新执行步骤3.2直至损失函数收敛至零,得到训练好的深度度量网络;
步骤4:采用SVM构造多故障诊断模型,将三元组样本通过训练好的深度度量网络映射得到的特征向量作为训练集输入到SVM模型中,训练SVM模型,使其实现对m类风力涡轮机数据进行分类,进而实现对风力涡轮机进行故障诊断。
2.根据权利要求1所述的基于难样本挖掘的深度度量网络的风机多故障诊断方法,其特征在于:所述步骤1的具体方法为:
步骤1.1:生成正常数据训练样本集Rn,如下公式所示:
Rn=Sn∪Sv∪So
其中,Sn为临近早期故障数据的正常数据,Sv为不同环境条件下的正常数据,So为不同操作条件下的正常数据;
步骤1.2:生成异常数据训练样本集Rf;针对某一类SCADA数据在一定时间范围内的变化数值,用k-means聚类方法对该时间范围内每段异常数据F进行聚类,形成早期故障样本Fef和故障样本Ff,用公式表示为
Figure FDA0002192059910000021
F∈D,ψ表示聚类方法;将形成早期故障样本Fef和故障样本Ff,通过等间隔采样生成训练样本数据Sef(w)和Sf(w),且使早期故障样本Fef数量多于故障样本数量Ff
Sef(w)=Fef(w+1),Fef(w+2),...,Fef(w+ω),w=0,λef,2λef,...,pλef
Sf(w)=Ff(w+1),Ff(w+2),...,Ff(w+ω),w=0,λf,2λf,...,qλf
其中,λef和λf均为采样间隔,且λef<λf,Fef(w+ω)为SCADA数据中其中一类早期故障数据在w+ω时刻下的值,Ff(w+ω)为SCADA数据中其中一类故障数据在w+ω时刻下的值,ω为采样区间长度,p为生成的Sef个数,q为生成的Sf个数;
经过对异常样本数据等间隔采样处理,生成异常数据训练样本集Rf=Sef∪Sf
步骤1.3:由得到的异常数据训练样本集Rf=Sef∪Sf和正常数据训练样本集Rn=Sn∪Sv∪So构成难样本数据集A=Rn∪Rf
3.根据权利要求2所述的基于难样本挖掘的深度度量网络的风机多故障诊断方法,其特征在于:所述步骤2的具体方法为:
步骤2.1:采用遗传算法优化难样本数据集A,目标函数Oσ如下公式所示:
Figure FDA0002192059910000031
其中,Oσ为任意时刻δ下的目标函数,
Figure FDA0002192059910000032
为任意时刻δ下第h个SCADA数据变量,n为难样本数据集A中SCADA变量总数,pcc为皮尔逊相关系数;
步骤2.2:通过优化,得到优化后的异常数据训练样本集
Figure FDA0002192059910000033
和正常数据训练样本集
Figure FDA0002192059910000034
如下公式所示:
Figure FDA0002192059910000035
其中,opt=(O1∪O2∪…∪Oδ)为优化函数;
步骤2.3:构成难样本数据集优化后的训练样本集
Figure FDA0002192059910000036
4.根据权利要求3所述的基于难样本挖掘的深度度量网络的风机多故障诊断方法,其特征在于:所述步骤3.3的具体方法为:
步骤3.3.1:计算三元组训练样本集中任两类样本特征向量之间的距离,如下公式所示:
Figure FDA0002192059910000037
其中,
Figure FDA0002192059910000038
b=p或n,fθ(·)为经过改进的损失函数反向更新参数后的深度度量网络,
Figure FDA0002192059910000039
为三元组样本
Figure FDA00021920599100000310
在通过改进损失函数后经过深度度量网络映射得到的特征向量之间的距离;
步骤3.3.2:根据三元组训练样本集中同类样本特征向量之间的距离与异类样本特征向量之间的距离,得到三元组训练样本集改进后的损失函数,如下公式所示:
Figure FDA00021920599100000311
5.根据权利要求4所述的基于难样本挖掘的深度度量网络的风机多故障诊断方法,其特征在于:所述步骤4的具体方法为:
步骤4.1:将三元组样本通过训练好的深度度量网络映射得到的特征向量fθ(xi p)、fθ(xi a)、fθ(xi n)作为训练集输入到SVM模型中,训练SVM模型,使其实现对m类风力涡轮机数据进行分类;
步骤4.2:从SCADA数据集D内,任取20%数据作为测试样本数据,对未经过难样本挖掘模型的SCADA数据进行步骤2的优化,将优化后的三元组样本数据输入到已经训练好的深度度量网络中,最后将得到的特征向量输入到SVM模型中,实现对风力涡轮机的故障诊断。
CN201910835384.1A 2019-09-05 2019-09-05 基于难样本挖掘的深度度量网络的风机多故障诊断方法 Active CN110555478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910835384.1A CN110555478B (zh) 2019-09-05 2019-09-05 基于难样本挖掘的深度度量网络的风机多故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910835384.1A CN110555478B (zh) 2019-09-05 2019-09-05 基于难样本挖掘的深度度量网络的风机多故障诊断方法

Publications (2)

Publication Number Publication Date
CN110555478A CN110555478A (zh) 2019-12-10
CN110555478B true CN110555478B (zh) 2023-02-03

Family

ID=68739114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910835384.1A Active CN110555478B (zh) 2019-09-05 2019-09-05 基于难样本挖掘的深度度量网络的风机多故障诊断方法

Country Status (1)

Country Link
CN (1) CN110555478B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111426950B (zh) * 2020-03-19 2020-11-27 燕山大学 多尺度时空卷积深度信念网络的风力发电机故障诊断方法
CN111623905B (zh) * 2020-05-21 2022-05-13 国电联合动力技术有限公司 风电机组轴承温度预警方法及装置
CN114548366A (zh) * 2022-01-12 2022-05-27 湖南大学 基于难样本挖掘的深度网络模型构建方法及系统
CN114593917A (zh) * 2022-03-08 2022-06-07 安徽理工大学 一种基于三元组模型的小样本轴承故障诊断方法
CN114359854A (zh) * 2022-03-21 2022-04-15 上海闪马智能科技有限公司 一种对象的识别方法、装置、存储介质及电子装置
CN116010896B (zh) * 2023-02-03 2024-06-18 南京南瑞继保电气有限公司 基于对抗训练与Transformer的风力发电机故障诊断方法
CN118211136B (zh) * 2024-05-22 2024-08-06 哈尔滨工业大学(威海) 基于围栏损失函数的数据处理方法及装备故障诊断方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399428A (zh) * 2018-02-09 2018-08-14 哈尔滨工业大学深圳研究生院 一种基于迹比准则的三元组损失函数设计方法
WO2018201647A1 (zh) * 2017-05-05 2018-11-08 平安科技(深圳)有限公司 视网膜病变程度等级检测方法、装置及存储介质
CN109858352A (zh) * 2018-12-26 2019-06-07 华中科技大学 一种基于压缩感知与改进多尺度网络的故障诊断方法
WO2019128367A1 (zh) * 2017-12-26 2019-07-04 广州广电运通金融电子股份有限公司 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201647A1 (zh) * 2017-05-05 2018-11-08 平安科技(深圳)有限公司 视网膜病变程度等级检测方法、装置及存储介质
WO2019128367A1 (zh) * 2017-12-26 2019-07-04 广州广电运通金融电子股份有限公司 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质
CN108399428A (zh) * 2018-02-09 2018-08-14 哈尔滨工业大学深圳研究生院 一种基于迹比准则的三元组损失函数设计方法
CN109858352A (zh) * 2018-12-26 2019-06-07 华中科技大学 一种基于压缩感知与改进多尺度网络的故障诊断方法

Also Published As

Publication number Publication date
CN110555478A (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN110555478B (zh) 基于难样本挖掘的深度度量网络的风机多故障诊断方法
CN111237134B (zh) 一种基于GRA-LSTM-stacking模型的海上双馈风力发电机故障诊断方法
Mian et al. A literature review of fault diagnosis based on ensemble learning
Yang et al. Fault detection of wind turbine generator bearing using attention-based neural networks and voting-based strategy
CN106230377B (zh) 一种光伏电池板热斑故障检测方法
CN111709448A (zh) 一种基于迁移关系网络的机械故障诊断方法
Zaki et al. Deep‐learning–based method for faults classification of PV system
CN109829236A (zh) 一种基于XGBoost特征提取的压缩机故障诊断方法
CN108549962B (zh) 基于历史分段序列搜索和时序稀疏化的风电功率预测方法
CN116821774B (zh) 一种基于人工智能的发电故障诊断方法
Shi et al. Graph embedding deep broad learning system for data imbalance fault diagnosis of rotating machinery
CN113255209B (zh) 一种齿轮箱轴承剩余寿命的预测方法
CN113157732A (zh) 一种基于pso-bp神经网络的地下铲运机故障诊断方法
CN108092623A (zh) 一种光伏阵列多传感器故障检测定位方法
CN109325553B (zh) 一种风电齿轮箱故障检测方法、系统、设备及介质
CN116187508A (zh) 一种融合知识图谱和深度学习的风电机组故障预测方法
CN114118138A (zh) 一种基于多标签领域自适应模型的轴承复合故障诊断方法
Xu et al. Total process of fault diagnosis for wind turbine gearbox, from the perspective of combination with feature extraction and machine learning: A review
CN115146718B (zh) 基于深度表示的风电机组异常检测方法
CN109615109A (zh) 基于小样本数据的深度学习风电告警信息分析方法
CN114861778B (zh) 一种改进宽度迁移学习的不同负载下滚动轴承状态快速分类方法
Zhao et al. A capsnet-based fault diagnosis method for a digital twin of a wind turbine gearbox
CN111122160B (zh) 一种基于堆栈降噪自编码器的异常信号检测方法
CN110674893B (zh) 一种旋转机械故障诊断知识库中诊断经验自适应修正方法
CN117520779A (zh) 基于多指标图注意力网络的水电机转轮状态关联分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant