CN110766175A - 一种基于最优间隔分布机的变桨系统故障检测方法及装置 - Google Patents

一种基于最优间隔分布机的变桨系统故障检测方法及装置 Download PDF

Info

Publication number
CN110766175A
CN110766175A CN201911025038.3A CN201911025038A CN110766175A CN 110766175 A CN110766175 A CN 110766175A CN 201911025038 A CN201911025038 A CN 201911025038A CN 110766175 A CN110766175 A CN 110766175A
Authority
CN
China
Prior art keywords
parameter
data set
fault detection
correlation coefficient
pitch system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911025038.3A
Other languages
English (en)
Inventor
唐明珠
彭巨
匡子杰
陈冬林
龙文
李泽文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia Green Electric Cloud Power Service Co Ltd
Changsha University of Science and Technology
Original Assignee
Inner Mongolia Green Electric Cloud Power Service Co Ltd
Changsha University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia Green Electric Cloud Power Service Co Ltd, Changsha University of Science and Technology filed Critical Inner Mongolia Green Electric Cloud Power Service Co Ltd
Priority to CN201911025038.3A priority Critical patent/CN110766175A/zh
Publication of CN110766175A publication Critical patent/CN110766175A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了一种基于最优间隔分布机的变桨系统故障检测方法及装置,通过Pearson相关系数分析方法,进行变桨系统的特征选择得到样本数据集,使用代价敏感最优间隔分布机训练得到变桨系统的故障检测模型,解决了变桨系统故障样本类别不平衡、分布复杂,从而难以有效进行分类的问题,提高了使用故障检测模型进行故障检测的准确性。方法包括:获取风电机组的运行参数的运行数据集;根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集;根据训练集对代价敏感最优间隔分布机进行构建训练,得到变桨系统的故障检测模型;根据测试集及故障检测模型,预测得到变桨系统的故障检测结果。

Description

一种基于最优间隔分布机的变桨系统故障检测方法及装置
技术领域
本发明涉及风力发电领域,特别是涉及一种基于最优间隔分布机的变桨系统故障检测方法及装置。
背景技术
风力发电机组通常运行在复杂多变的不稳定自然环境中,常年受到阳光、雨水、风沙等侵蚀,同时,由于风电机组运行于高空,其主要零部件也都在位于空中的机舱内,所以在日常运行过程中,会有许多故障隐患。另一方面,一旦风电机组因故障而引起长时间停机,将会带来不小的人力维护检修花费以及零件更换的材料成本,风电场发电效率降低,引起巨大的经济损失。
变桨距系统是风电机组中的重要部分,其主要包括叶片、轮毂等主要部件,这些部件在平均维修时间、材料成本以及所需技术人员数量中,属于高占比部件,因此,保障风电机组变桨系统的安全平稳运行就显得尤为重要。及时有效地针对变桨系统进行状态监测和故障检测,对于风力发电行业来说,具有良好的经济效益以及工程实用价值。
当前风电机组故障检测工作主要建立在风电数据采集与监视控制系统(Supervisory Control And Data Acquisition,SCADA)的数据分析基础上,通过分析机组运行过程中产生的数据,如功率、振动、温度等,得到机组运行状态、故障情况等信息,从而达到故障检测的目的。
支持向量机(Support Vector Machine,SVM)作为一种以统计学理论为基础的机器学习方法,有较好的学习性能,在多分类识别、回归预测等很多领域得到了成功的应用,其在风电机组的故障检测研究中也深受研究者的青睐。例如,包括将对角谱和聚类二叉树同SVM相结合,对风电机组齿轮箱进行故障检测;还包括基于多级模糊支持向量机分类器的风力发电机组故障诊断方法,在振动信号中通过经验模态分解法提取故障特征向量,并对模糊聚类算法的核函数参数进行优化,通过多级模糊支持向量机实现风电机组的故障诊断;还包括基于最小二乘支持向量机的变桨系统故障预测方法,采用粒子群优化算法对多类最小二乘支持向量机分类器进行特征参数优化,从而实现变桨系统故障预测。
但是,在SVM中,由于其分类过程是建立在寻找最小间隔最大化的超平面的基础上,泛化性能不高,并且面对复杂的非线性多分类问题时,可能导致最终的优化过程成为不可微分的非凸过程。因此,在变桨系统故障检测中使用SVM,不能有效的解决变桨系统中数据类别不平衡、分布复杂的问题,导致故障检测率不高,从而影响到了风电机组的运维成本和风场的生产效率。
发明内容
本发明的目的是提供一种基于最优间隔分布机的变桨系统故障检测方法及装置,通过Pearson相关系数分析方法,进行变桨系统的特征选择得到样本数据集,从而删选掉了与变桨系统的故障检测不相关的数据,减少了故障检测过程的时耗,使用代价敏感最优间隔分布机训练得到变桨系统的故障检测模型,解决了变桨系统故障样本类别不平衡、分布复杂,从而难以有效进行分类的问题,提高了使用故障检测模型进行故障检测的准确性。
本发明第一方面提供一种基于最优间隔分布机的变桨系统故障检测方法,包括:
获取风电机组的运行参数的运行数据集,运行参数至少为一个;
根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,样本数据集包括训练集和测试集;
根据训练集对代价敏感最优间隔分布机进行构建训练,得到变桨系统的故障检测模型;
根据测试集及故障检测模型,预测得到变桨系统的故障检测结果。
进一步的,获取风电机组的运行参数的运行数据集,包括:
获取风电机组的运行参数的原始数据集;
根据数据清洗规则对原始数据集进行数据清洗,得到第一数据集;
根据风电机组的故障时间,按照预置故障时间范围从第一数据集中选取出第二数据集;
对第二数据集进行归一化处理得到运行数据集。
进一步的,根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,包括:
根据变桨系统的运行参数故障影响度,选取风电机组的机组功率输出作为第一运行参数;
通过Pearson相关系数分析方法,将第一运行参数与风电机组的所有运行参数分别进行相关性分析,得到第一运行参数与每一个运行参数的相关度系数值;
选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据第二运行参数得到样本数据集,样本数据集包括训练集和测试集。
进一步的,选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据第二运行参数得到样本数据集,包括:
选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数;
使用Pearson相关系数分析方法,将第一运行参数与第二运行参数进行相关度分析,得到一运行参数与第二运行参数的相关度系数值;
选取相关度系数值低于预置相关度最高阈值的运行参数作为第三运行参数;
根据第三运行参数得到样本数据集,样本数据集包括训练集和测试集。
进一步的,根据训练集对代价敏感最优间隔分布机进行构建训练,得到变桨系统的故障检测模型,包括:
获取最优间隔分布机的第一表达式,第一表达式包括第一偏差参数、第二偏差参数、间隔参数和间隔均值参数,第一偏差参数为间隔参数和间隔均值参数的正偏差,第二偏差参数为间隔参数和间隔均值参数的负偏差;
为第一偏差参数的平方值赋予第一代价敏感参数,为第二偏差参数的平方值赋予第二代价敏感参数,得到第二表达式,第二表达式为代价敏感最优间隔分布机的表达式,第一代价敏感参数和第二代价敏感参数根据网格搜索法获取得到;
根据训练集和第二表达式进行构建训练,得到变桨系统的故障检测模型。
本发明第二方面提供一种基于最优间隔分布机的变桨系统故障检测装置,包括:
获取模块,用于获取风电机组的运行参数的运行数据集,运行参数至少为一个;
分析模块,用于根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,样本数据集包括训练集和测试集;
故障检测模型训练模块,用于根据训练集对代价敏感最优间隔分布机进行构建训练,得到变桨系统的故障检测模型;
故障预测模块,用于根据测试集及故障检测模型,预测得到变桨系统的故障检测结果。
进一步的,获取模块包括:
获取单元,用于获取风电机组的运行参数的原始数据集;
数据清洗单元,用于根据数据清洗规则对原始数据集进行数据清洗,得到第一数据集;
数据处理单元,用于根据风电机组的故障时间,按照预置故障时间范围从第一数据集中选取出第二数据集;
归一化处理单元,用于对第二数据集进行归一化处理得到运行数据集。
进一步的,分析模块包括:
运行参数选取单元,用于根据变桨系统的运行参数故障影响度,选取风电机组的机组功率输出作为第一运行参数;
Pearson相关系数分析单元,用于通过Pearson相关系数分析方法,将第一运行参数与风电机组的所有运行参数分别进行相关性分析,得到第一运行参数与每一个运行参数的相关度系数值;
样本生成单元,用于选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据第二运行参数得到样本数据集,样本数据集包括训练集和测试集。
进一步的,
运行参数选取单元,还用于选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数;
Pearson相关系数分析单元,还用于使用Pearson相关系数分析方法,将第一运行参数与第二运行参数进行相关度分析,得到一运行参数与第二运行参数的相关度系数值;
运行参数选取单元,还用于选取相关度系数值低于预置相关度最高阈值的运行参数作为第三运行参数;
样本生成单元,还用于根据第三运行参数得到样本数据集,样本数据集包括训练集和测试集。
进一步的,故障检测模型训练模块,包括:
表达式获取单元,用于获取最优间隔分布机的第一表达式,第一表达式包括第一偏差参数、第二偏差参数、间隔参数和间隔均值参数,第一偏差参数为间隔参数和间隔均值参数的正偏差,第二偏差参数为间隔参数和间隔均值参数的负偏差;
代价敏感参数赋予单元,用于为第一偏差参数的平方值赋予第一代价敏感参数,为第二偏差参数的平方值赋予第二代价敏感参数,得到第二表达式,第二表达式为代价敏感最优间隔分布机的表达式,第一代价敏感参数和第二代价敏感参数根据网格搜索法获取得到;
故障检测模型构建单元,用于根据训练集和第二表达式进行构建训练,得到变桨系统的故障检测模型。
由上可见,本发明中基于最优间隔分布机的变桨系统故障检测方法及装置,获取风电机组的运行参数的运行数据集,运行参数至少为一个,根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,样本数据集包括训练集和测试集,根据训练集对代价敏感最优间隔分布机进行构建训练,得到变桨系统的故障检测模型,根据测试集及故障检测模型,预测得到变桨系统的故障检测结果。在本发明中通过Pearson相关系数分析方法,进行变桨系统的特征选择得到样本数据集,从而删选掉了与变桨系统的故障检测不相关的数据,减少了故障检测过程的时耗;并且使用代价敏感最优间隔分布机训练得到变桨系统的故障检测模型,解决了变桨系统故障样本类别不平衡、分布复杂,从而难以有效进行分类的问题,提高了使用故障检测模型进行故障检测的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于最优间隔分布机的变桨系统故障检测方法的一个实施例的流程示意图;
图2为本发明提供的变桨系统的主电源的故障检测准确率比较图;
图3为本发明提供的基于最优间隔分布机的变桨系统故障检测装置的一个实施例的结构示意图;
图4为本发明提供的基于最优间隔分布机的变桨系统故障检测装置的另一个实施例的结构示意图;
图5为本发明提供的基于最优间隔分布机的变桨系统故障检测装置的又一个实施例的结构示意图;
图6为本发明提供的基于最优间隔分布机的变桨系统故障检测装置的再一个实施例的结构示意图。
具体实施方式
本发明的核心是提供一种基于最优间隔分布机的变桨系统故障检测方法及装置,通过Pearson相关系数分析方法,进行变桨系统的特征选择得到样本数据集,从而删选掉了与变桨系统的故障检测不相关的数据,减少了故障检测过程的时耗,使用代价敏感最优间隔分布机训练得到变桨系统的故障检测模型,解决了变桨系统故障样本类别不平衡、分布复杂,从而难以有效进行分类的问题,提高了使用故障检测模型进行故障检测的准确性。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种基于最优间隔分布机的变桨系统故障检测方法,包括:
101、获取风电机组的运行参数的运行数据集,运行参数至少为一个;
本实施例中,风力发电机组的变桨距系统,作用是当风轮对风时,改变叶片的迎风面积,从而控制风轮旋转扭矩,配合偏航系统,使得风电机组在不同风环境下保持稳定的发电效率。当前风力发电机的变桨系统主要分为液压变桨系统和电动变桨系统。液压变桨系统通过一套曲柄滑动结构,驱动每个叶片同步变桨。该套系统对变桨信号响应频率快,变桨扭矩大,有利于集中布置和集成化,多用于大型风力发电机组中,但是其结构相对复杂,属于非线性系统,可能存在液压油泄露、卡顿等问题。电动变桨系统对每个叶片设立了独立的控制机构,由变桨控制器、伺服驱动器、备用电源组成,能实现每个叶片单独变桨。传动结构相对简单,运行稳定,可靠性高,但是其动态特性较差,有较大的惯性,当风速变化较快时,频繁变桨可能导致控制器过热从而损坏机体。一旦风电机组变桨系统发生故障,将会导致叶片变距异常,风轮旋转扭矩处于非期望值,转速过低会影响风能捕获率,旋转机械能通过齿轮箱传动链到达发电机,致使发电机转速异常,最终影响机组功率输出。所以,变桨系统的安全稳定运行,对于风力发电机组平稳高效发电有着重要意义。而变桨系统的故障检测所需的参数需要通过风电数据采集与监视控制系统(Supervisory Control And DataAcquisition,SCADA)获取得到风电机组的运行参数的运行数据集。运行参数的数量至少为一个。
102、根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,样本数据集包括训练集和测试集;
本实施例中,Pearson相关系数分析方式是由英国统计学家Karl Pearson 于20世纪提出的。它可以反映了两个变量之间的相关程度,其计算公式为:
Figure BDA0002248368940000081
其中,cov(X,Y)表示两个变量的协方差,μX、μY和σX、σY分别为两变量的均值和标准差。
上式定义了总体相关系数,当变量X,Y的样本量为n时,则样本Pearson相关系数可以写为:
Figure BDA0002248368940000082
其中,r描述的是两个变量之间线性相关强弱的程度,r的取值在-1与+1之间,即-1≤r≤+1,其性质如下:
当0<r<1时,两变量正相关,且r越接近1,变量正相关性越大;
当-1<r<0时,两变量负相关,且r越接近-1,变量负相关性越大;
当|r|=1时,两变量完全线性相关;
当r=0时,两变量线性无关。
而根据变桨系统的机理分析可知,当变桨系统故障时,最终影响的主要状态参数是机组的功率输出。因此进行特征选择时,通过Pearson相关系数,将其他风电机组运行参数与机组功率输出做相关性分析,删除与变桨系统相关度较低的参数,从而得到样本数据集。由于需要根据样本数据集来训练得到变桨系统的最优间隔分布机故障检测模型,而且需要对最优间隔分布机故障检测模型进行测试,那么就需要将样本数据集划分为训练集和测试集。
103、根据训练集对代价敏感最优间隔分布机进行构建训练,得到变桨系统的故障检测模型;
本实施例中,最优间隔分布机(Multi-Class Optimal Margin DistributionMachine,mcODM)的原理已经确定了,但是代价敏感最优间隔分布机是由mcODM的原理上发展得到的,具体如下:
1、获取最优间隔分布机的第一表达式,第一表达式包括第一偏差参数、第二偏差参数、间隔参数和间隔均值参数,第一偏差参数为间隔参数和间隔均值参数的正偏差,第二偏差参数为间隔参数和间隔均值参数的负偏差;
设一个特征的集合为X=[x1,...,xk],其对应的类别标签集为Y=[K],其中[K]={1,...,k}。给定一个训练集S={(x1,y1),(x2,y2),...,(xm,ym)}。定义一个映射函数
Figure BDA0002248368940000091
通过核函数κ将样本集映射至高维空间
Figure BDA0002248368940000092
对应权向量为ω1,...,ωk。对每个权向量ωl定义一个记分函数
Figure BDA0002248368940000093
每个样本的特征值和其对应的标签,会使得该样本的记分函数值达到最大,即
Figure BDA0002248368940000095
从而引出间隔定义:
Figure BDA0002248368940000096
因此,当分类器进行分类时,计算产生一个负间隔时分类错误。
Figure BDA00022483689400000913
表示间隔的平均值,所以最优间隔分布机的第一表达式可以如下表示:
Figure BDA0002248368940000097
Figure BDA0002248368940000098
Figure BDA0002248368940000099
其中Ω(ω)是正则项,η和λ是平衡参数,间隔γh(xj,yj)作为间隔参数,间隔均值
Figure BDA00022483689400000910
作为间隔均值参数,ξj表示第一偏差参数为间隔参数和间隔均值参数的正偏差,εj表示第二偏差参数为间隔参数和间隔均值参数的负偏差,为方差。
2、为第一偏差参数的平方值赋予第一代价敏感参数,为第二偏差参数的平方值赋予第二代价敏感参数,得到第二表达式,第二表达式为代价敏感最优间隔分布机的表达式,第一代价敏感参数和第二代价敏感参数根据网格搜索法获取得到;
第二表达式为代价敏感最优间隔分布机的表达式,可以如下表示:
Figure BDA00022483689400000912
Figure BDA0002248368940000101
Figure BDA0002248368940000102
其中Ω(ω)是正则项,η和λ是平衡参数,间隔γh(xj,yj)作为间隔参数,间隔均值
Figure BDA0002248368940000103
作为间隔均值参数,ξi表示第一偏差参数为间隔参数和间隔均值参数的正偏差,εj表示第二偏差参数为间隔参数和间隔均值参数的负偏差,
Figure BDA0002248368940000104
为方差,C1,C2为代价敏感参数。
对ω进行缩放,间隔均值可以固定为1,所以样本(xj,yj)与间隔均值的偏差为|γh(xj,yj)-1|,所以该代价敏感最优间隔分布机的第二表达式可改写为:
Figure BDA0002248368940000105
s.t.γh(xj,yj)≥1-θ-ξj
其中,τ∈[0,1)是平衡两种不同偏差的参数(大于或小于间隔均值),θ∈[0,1)是零损失参数,它可以控制支持向量的个数,即解的稀疏性,(1-θ)2是为了将上述第二项成为0-1损失的替代损失。
对于多分类问题,将正则项
Figure BDA0002248368940000107
结合间隔定义,mcODM的第二表达式如下:
Figure BDA0002248368940000108
Figure BDA0002248368940000109
Figure BDA00022483689400001010
其中,λ、τ和θ是前面所述的平衡参数。
参数采用网格搜索法选取,λ从序列[20,22,24,...,220]中确定,τ和θ从[0.2,0.4,0.6,0.8]中确定,C1,C2从序列[20,22,24,...,210]中确定。
3、根据训练集和第二表达式进行构建训练,得到变桨系统的故障检测模型。
因此,在得到了步骤102中得到的样本数据集之后,将样本数据集中的训练集作为S={(x1,y1),(x2,y2),...,(xm,ym)},与代价敏感最优间隔分布机的第二表达式进行计算就能够构建训练得到故障检测模型。
104、根据测试集及最优间隔分布机故障检测模型,预测得到变桨系统的故障检测结果。
本实施例中,通过测试集对最优间隔分布故障检测模型进行测试,预测得到变桨系统的故障检测结果。通过将本发明的最优间隔分布机故障检测模型(mcODM)与一对多SVM(one-versus-rest SVM,ovrSVM)和一对一SVM(one-versus-one SVM,ovoSVM)进行对比,如图2所示,情境为变桨系统的主电源的故障检测准确率比较图图,可以看出本发明的最优间隔分布机故障检测模型(mcODM)准确率明显的高于ovrSVM和ovoSVM。
本发明实施例中,通过Pearson相关系数分析方法,进行变桨系统的特征选择得到样本数据集,从而删选掉了与变桨系统的故障检测不相关的数据,减少了故障检测过程的时耗,使用最优间隔分布机训练得到变桨系统的最优间隔分布机故障检测模型,解决了变桨系统故障样本类别不平衡、分布复杂,从而难以有效进行分类的问题,提高了使用故障检测模型进行故障检测的准确性。
可选的,如图1所示的实施例,本发明的一些实施例中,获取风电机组的运行参数的运行数据集,包括:
获取风电机组的运行参数的原始数据集;
根据数据清洗规则对原始数据集进行数据清洗,得到第一数据集;
根据风电机组的故障时间,按照预置故障时间范围从第一数据集中选取出第二数据集;
对第二数据集进行归一化处理得到运行数据集。
本发明实施例中,获取某风电场实际风电机组运行数据,数据包含机组正常运行时刻、变桨系统故障时刻的传感器监测数据,由于实际运行工况中存在不稳定环境因素、传感器异常等问题,会导致信息处理出错、数据缺失、数据异常等问题。因此,对于获取的原始数据通过以下方法进行清洗与预处理,具体包括:
剔除数据集中包含“无数据”变量的时刻;
剔除所有数据都是“0”的状态变量;
根据风电机组的故障时间,选取故障开始发生前半小时至故障结束后半小时的数据;
利用
Figure BDA0002248368940000121
进行样本数据归一化处理,其中,X是一个状态参数,Xmin和Xmax分别表示该状态变量中的最小值和最大值,X′表示归一化后的数据。
归一化可以使得模型在寻找最优解的过程中变得平缓,更容易收敛到最优解。
可选的,本发明的一些实施例中,根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,包括:
根据变桨系统的运行参数故障影响度,选取风电机组的机组功率输出作为第一运行参数;
通过Pearson相关系数分析方法,将第一运行参数与风电机组的所有运行参数分别进行相关性分析,得到第一运行参数与每一个运行参数的相关度系数值;
选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据第二运行参数得到样本数据集,样本数据集包括训练集和测试集。
为了进一步降低样本规模,减少模型计算复杂度,避免模型过拟合,将第一次筛选出来的第二运行参数进行二次Pearson相关系数分析,具体如下:
可选的,本发明的一些实施例中,选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据第二运行参数得到样本数据集,包括:
选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数;
使用Pearson相关系数分析方法,将第一运行参数与第二运行参数进行相关度分析,得到一运行参数与第二运行参数的相关度系数值;
选取相关度系数值低于预置相关度最高阈值的运行参数作为第三运行参数;
根据第三运行参数得到样本数据集,样本数据集包括训练集和测试集。
在以上的实施例中对基于最优间隔分布机的变桨系统故障检测方法进行了详细的说,下面通过实施例对应用该方法的基于最优间隔分布机的变桨系统故障检测装置进行详细的说明,具体如下:
如图3所示,本发明实施例提供一种基于最优间隔分布机的变桨系统故障检测装置,包括:
获取模块301,用于获取风电机组的运行参数的运行数据集,运行参数至少为一个;
分析模块302,用于根据Pearson相关系数分析方法对运行数据集进行变桨系统的特征选择,得到样本数据集,样本数据集包括训练集和测试集;
故障检测模型训练模块303,用于根据训练集对最优间隔分布机进行构建训练,得到变桨系统的最优间隔分布机故障检测模型;
故障预测模块304,用于根据测试集及最优间隔分布机故障检测模型,预测得到变桨系统的故障检测结果。
本发明实施例中,获取模块301获取风电机组的运行参数的运行数据集,分析模块302通过Pearson相关系数分析方法,进行变桨系统的特征选择得到样本数据集,从而删选掉了与变桨系统的故障检测不相关的数据,减少了故障检测过程的时耗,故障检测模型训练模块303根据训练集对最优间隔分布机进行构建训练,得到变桨系统的最优间隔分布机故障检测模型,故障预测模块304根据测试集及最优间隔分布机故障检测模型,预测得到变桨系统的故障检测结果。由于是使用最优间隔分布机训练得到变桨系统的最优间隔分布机故障检测模型,解决了变桨系统故障样本类别不平衡、分布复杂,从而难以有效进行分类的问题,提高了使用故障检测模型进行故障检测的准确性。
可选的,结合图3所示的实施例,如图4所示,本发明的一些实施例中,获取模块301包括:
获取单元401,用于获取风电机组的运行参数的原始数据集;
数据清洗单元402,用于根据数据清洗规则对原始数据集进行数据清洗,得到第一数据集;
数据处理单元403,用于根据风电机组的故障时间,按照预置故障时间范围从第一数据集中选取出第二数据集;
归一化处理单元404,用于对第二数据集进行归一化处理得到运行数据集。
可选的,结合图4所示的实施例,如图5所示,分析模块302包括:
运行参数选取单元501,用于根据变桨系统的运行参数故障影响度,选取风电机组的机组功率输出作为第一运行参数;
Pearson相关系数分析单元502,用于通过Pearson相关系数分析方法,将第一运行参数与风电机组的所有运行参数分别进行相关性分析,得到第一运行参数与每一个运行参数的相关度系数值;
样本生成单元503,用于选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据第二运行参数得到样本数据集,样本数据集包括训练集和测试集。
可选的,结合图5所示的实施例,本发明的一些实施例中,
运行参数选取单元501,还用于选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数;
Pearson相关系数分析单元502,还用于使用Pearson相关系数分析方法,将第一运行参数与第二运行参数进行相关度分析,得到一运行参数与第二运行参数的相关度系数值;
运行参数选取单元501,还用于选取相关度系数值低于预置相关度最高阈值的运行参数作为第三运行参数;
样本生成单元503,还用于根据第三运行参数得到样本数据集,样本数据集包括训练集和测试集。
可选的,结合图5所示的实施例,如图6所示,本发明的一些实施例中,故障检测模型训练模块303,包括:
表达式获取单元601,用于获取最优间隔分布机的第一表达式,第一表达式包括第一偏差参数、第二偏差参数、间隔参数和间隔均值参数,第一偏差参数为间隔参数和间隔均值参数的正偏差,第二偏差参数为间隔参数和间隔均值参数的负偏差;
代价敏感参数赋予单元602,用于为第一偏差参数的平方值赋予第一代价敏感参数,为第二偏差参数的平方值赋予第二代价敏感参数,得到第二表达式,第二表达式为代价敏感最优间隔分布机的表达式,第一代价敏感参数和第二代价敏感参数根据网格搜索法获取得到;
故障检测模型构建单元603,用于根据训练集和第二表达式进行构建训练,得到变桨系统的故障检测模型。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于最优间隔分布机的变桨系统故障检测方法,其特征在于,包括:
获取风电机组的运行参数的运行数据集,所述运行参数至少为一个;
根据Pearson相关系数分析方法对所述运行数据集进行变桨系统的特征选择,得到样本数据集,所述样本数据集包括训练集和测试集;
根据所述训练集对代价敏感最优间隔分布机进行构建训练,得到所述变桨系统的故障检测模型;
根据所述测试集及所述机故障检测模型,预测得到所述变桨系统的故障检测结果。
2.根据权利要求1所述的方法,其特征在于,所述获取风电机组的运行参数的运行数据集,包括:
获取风电机组的运行参数的原始数据集;
根据数据清洗规则对所述原始数据集进行数据清洗,得到第一数据集;
根据所述风电机组的故障时间,按照预置故障时间范围从所述第一数据集中选取出第二数据集;
对所述第二数据集进行归一化处理得到运行数据集。
3.根据权利要求1所述的方法,其特征在于,所述根据Pearson相关系数分析方法对所述运行数据集进行变桨系统的特征选择,得到样本数据集,包括:
根据变桨系统的运行参数故障影响度,选取所述风电机组的机组功率输出作为第一运行参数;
通过Pearson相关系数分析方法,将所述第一运行参数与所述风电机组的所有运行参数分别进行相关性分析,得到所述第一运行参数与每一个运行参数的相关度系数值;
选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据所述第二运行参数得到样本数据集,所述样本数据集包括训练集和测试集。
4.根据权利要求3所述的方法,其特征在于,所述选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据所述第二运行参数得到样本数据集,包括:
选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数;
使用Pearson相关系数分析方法,将所述第一运行参数与所述第二运行参数进行相关度分析,得到所述一运行参数与所述第二运行参数的相关度系数值;
选取相关度系数值低于预置相关度最高阈值的运行参数作为第三运行参数;
根据所述第三运行参数得到样本数据集,所述样本数据集包括训练集和测试集。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述训练集对代价敏感最优间隔分布机进行构建训练,得到所述变桨系统的故障检测模型,包括:
获取最优间隔分布机的第一表达式,所述第一表达式包括第一偏差参数、第二偏差参数、间隔参数和间隔均值参数,所述第一偏差参数为所述间隔参数和所述间隔均值参数的正偏差,所述第二偏差参数为所述间隔参数和所述间隔均值参数的负偏差;
为所述第一偏差参数的平方值赋予第一代价敏感参数,为所述第二偏差参数的平方值赋予第二代价敏感参数,得到第二表达式,所述第二表达式为代价敏感最优间隔分布机的表达式,所述第一代价敏感参数和所述第二代价敏感参数根据网格搜索法获取得到;
根据所述训练集和所述第二表达式进行构建训练,得到所述变桨系统的故障检测模型。
6.一种基于最优间隔分布机的变桨系统故障检测装置,其特征在于,包括:
获取模块,用于获取风电机组的运行参数的运行数据集,所述运行参数至少为一个;
分析模块,用于根据Pearson相关系数分析方法对所述运行数据集进行变桨系统的特征选择,得到样本数据集,所述样本数据集包括训练集和测试集;
故障检测模型训练模块,用于根据所述训练集对代价敏感最优间隔分布机进行构建训练,得到所述变桨系统的故障检测模型;
故障预测模块,用于根据所述测试集及所述故障检测模型,预测得到所述变桨系统的故障检测结果。
7.根据权利要求6所述的装置,其特征在于,所述获取模块包括:
获取单元,用于获取风电机组的运行参数的原始数据集;
数据清洗单元,用于根据数据清洗规则对所述原始数据集进行数据清洗,得到第一数据集;
数据处理单元,用于根据所述风电机组的故障时间,按照预置故障时间范围从所述第一数据集中选取出第二数据集;
归一化处理单元,用于对所述第二数据集进行归一化处理得到运行数据集。
8.根据权利要求7所述的装置,其特征在于,所述分析模块包括:
运行参数选取单元,用于根据变桨系统的运行参数故障影响度,选取所述风电机组的机组功率输出作为第一运行参数;
Pearson相关系数分析单元,用于通过Pearson相关系数分析方法,将所述第一运行参数与所述风电机组的所有运行参数分别进行相关性分析,得到所述第一运行参数与每一个运行参数的相关度系数值;
样本生成单元,用于选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数,根据所述第二运行参数得到样本数据集,所述样本数据集包括训练集和测试集。
9.根据权利要求8所述的装置,其特征在于,
所述运行参数选取单元,还用于选取相关度系数值超过预置相关度最低阈值的运行参数作为第二运行参数;
所述Pearson相关系数分析单元,还用于使用Pearson相关系数分析方法,将所述第一运行参数与所述第二运行参数进行相关度分析,得到所述一运行参数与所述第二运行参数的相关度系数值;
所述运行参数选取单元,还用于选取相关度系数值低于预置相关度最高阈值的运行参数作为第三运行参数;
所述样本生成单元,还用于根据所述第三运行参数得到样本数据集,所述样本数据集包括训练集和测试集。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述故障检测模型训练模块,包括:
表达式获取单元,用于获取最优间隔分布机的第一表达式,所述第一表达式包括第一偏差参数、第二偏差参数、间隔参数和间隔均值参数,所述第一偏差参数为所述间隔参数和所述间隔均值参数的正偏差,所述第二偏差参数为所述间隔参数和所述间隔均值参数的负偏差;
代价敏感参数赋予单元,用于为所述第一偏差参数的平方值赋予第一代价敏感参数,为所述第二偏差参数的平方值赋予第二代价敏感参数,得到第二表达式,所述第二表达式为代价敏感最优间隔分布机的表达式,所述第一代价敏感参数和所述第二代价敏感参数根据网格搜索法获取得到;
故障检测模型构建单元,用于根据所述训练集和所述第二表达式进行构建训练,得到所述变桨系统的故障检测模型。
CN201911025038.3A 2019-10-25 2019-10-25 一种基于最优间隔分布机的变桨系统故障检测方法及装置 Pending CN110766175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911025038.3A CN110766175A (zh) 2019-10-25 2019-10-25 一种基于最优间隔分布机的变桨系统故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911025038.3A CN110766175A (zh) 2019-10-25 2019-10-25 一种基于最优间隔分布机的变桨系统故障检测方法及装置

Publications (1)

Publication Number Publication Date
CN110766175A true CN110766175A (zh) 2020-02-07

Family

ID=69333725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911025038.3A Pending CN110766175A (zh) 2019-10-25 2019-10-25 一种基于最优间隔分布机的变桨系统故障检测方法及装置

Country Status (1)

Country Link
CN (1) CN110766175A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112114214A (zh) * 2020-09-08 2020-12-22 贵州电网有限责任公司 一种变压器故障诊断方法
CN112257015A (zh) * 2020-10-28 2021-01-22 华润电力技术研究院有限公司 一种火电机组数据获取方法、系统及数据处理方法
CN112613554A (zh) * 2020-12-21 2021-04-06 国家电投集团江苏新能源有限公司 一种风力发电机变桨系统故障预测方法和系统
CN113238530A (zh) * 2021-04-25 2021-08-10 中国核电工程有限公司 监测系统显示功能设计方法及系统、验证方法、显示方法
CN113447813A (zh) * 2020-09-03 2021-09-28 鲁能集团有限公司 海上风力发电机组的故障诊断方法及设备
CN114037127A (zh) * 2021-10-25 2022-02-11 华能射阳新能源发电有限公司 风电机组的故障预测方法及装置
CN114139449A (zh) * 2021-11-29 2022-03-04 国网湖南省电力有限公司 基于间隔分布机的超特高压换流阀故障检测方法及系统
CN114659785A (zh) * 2021-12-27 2022-06-24 三一重能股份有限公司 一种风力发电机传动链的故障检测方法及装置
CN114818904A (zh) * 2022-04-21 2022-07-29 桂林电子科技大学 基于Stack-GANs模型的风机故障检测方法及存储介质
CN116773234A (zh) * 2023-05-05 2023-09-19 华电莱州发电有限公司 一种磨煤机故障监测系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106482967A (zh) * 2016-10-09 2017-03-08 湖南工业大学 一种代价敏感支持向量机机车车轮检测系统及方法
WO2018013148A1 (en) * 2016-07-15 2018-01-18 University Of Connecticut Systems and methods for outage prediction
CN109506907A (zh) * 2018-11-06 2019-03-22 西安交通大学 一种基于振动响应信息的螺栓连接结构松动状态识别方法
CN110262460A (zh) * 2019-07-01 2019-09-20 山东浪潮人工智能研究院有限公司 一种结合聚类思想进行特征提取的砼活塞故障预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018013148A1 (en) * 2016-07-15 2018-01-18 University Of Connecticut Systems and methods for outage prediction
CN106482967A (zh) * 2016-10-09 2017-03-08 湖南工业大学 一种代价敏感支持向量机机车车轮检测系统及方法
CN109506907A (zh) * 2018-11-06 2019-03-22 西安交通大学 一种基于振动响应信息的螺栓连接结构松动状态识别方法
CN110262460A (zh) * 2019-07-01 2019-09-20 山东浪潮人工智能研究院有限公司 一种结合聚类思想进行特征提取的砼活塞故障预测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FANYONG CHENG等: "Cost-Sensitive Large margin Distribution Machine for classification of imbalanced data", 《 PATTERN RECOGNITION LETTERS》 *
向建平等: "基于SCADA系统的风电机组主轴承故障预警方法", 《电力科学与技术学报》 *
解铮等: "基于代价敏感间隔分布优化的软件缺陷定位", 《软件学报》 *
陈加略: "基于间隔分布的脊回归和主动学习", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
高阳等: "高斯过程隐变量模型与多类最优边际分配机在故障诊断中的应用", 《机械科学与技术》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113447813B (zh) * 2020-09-03 2022-09-13 中国绿发投资集团有限公司 海上风力发电机组的故障诊断方法及设备
CN113447813A (zh) * 2020-09-03 2021-09-28 鲁能集团有限公司 海上风力发电机组的故障诊断方法及设备
CN112114214A (zh) * 2020-09-08 2020-12-22 贵州电网有限责任公司 一种变压器故障诊断方法
CN112114214B (zh) * 2020-09-08 2022-12-27 贵州电网有限责任公司 一种变压器故障诊断方法
CN112257015A (zh) * 2020-10-28 2021-01-22 华润电力技术研究院有限公司 一种火电机组数据获取方法、系统及数据处理方法
CN112257015B (zh) * 2020-10-28 2023-08-15 华润电力技术研究院有限公司 一种火电机组数据获取方法、系统及数据处理方法
CN112613554A (zh) * 2020-12-21 2021-04-06 国家电投集团江苏新能源有限公司 一种风力发电机变桨系统故障预测方法和系统
CN112613554B (zh) * 2020-12-21 2024-03-22 国家电投集团江苏新能源有限公司 一种风力发电机变桨系统故障预测方法和系统
CN113238530A (zh) * 2021-04-25 2021-08-10 中国核电工程有限公司 监测系统显示功能设计方法及系统、验证方法、显示方法
CN114037127A (zh) * 2021-10-25 2022-02-11 华能射阳新能源发电有限公司 风电机组的故障预测方法及装置
CN114139449A (zh) * 2021-11-29 2022-03-04 国网湖南省电力有限公司 基于间隔分布机的超特高压换流阀故障检测方法及系统
CN114659785A (zh) * 2021-12-27 2022-06-24 三一重能股份有限公司 一种风力发电机传动链的故障检测方法及装置
CN114818904A (zh) * 2022-04-21 2022-07-29 桂林电子科技大学 基于Stack-GANs模型的风机故障检测方法及存储介质
CN114818904B (zh) * 2022-04-21 2024-03-15 桂林电子科技大学 基于Stack-GANs模型的风机故障检测方法及存储介质
CN116773234A (zh) * 2023-05-05 2023-09-19 华电莱州发电有限公司 一种磨煤机故障监测系统

Similar Documents

Publication Publication Date Title
CN110766175A (zh) 一种基于最优间隔分布机的变桨系统故障检测方法及装置
CN106682814B (zh) 一种基于故障知识库的风电机组故障智能诊断方法
Li et al. Fault diagnosis of rotating machinery based on combination of deep belief network and one-dimensional convolutional neural network
Laouti et al. Support vector machines for fault detection in wind turbines
Kusiak et al. A data-mining approach to monitoring wind turbines
Wang et al. SCADA data based condition monitoring of wind turbines
Hu et al. Using domain knowledge features for wind turbine diagnostics
CN103808509A (zh) 一种基于人工智能算法的风机齿轮箱故障诊断方法
CN110362045B (zh) 一种考虑海洋气象因素的海上双馈风电机组故障判别方法
WO2023278942A1 (en) Method and system for building prescriptive analytics to prevent wind turbine failures
Joshuva et al. A comparative study of Bayes classifiers for blade fault diagnosis in wind turbines through vibration signals
Joshuva et al. A study of various blade fault conditions on a wind turbine using vibration signals through histogram features
Joshuva et al. Wind turbine blade fault diagnosis using vibration signals through decision tree algorithm
Joshuva et al. Selection of a meta classifier-data model for classifying wind turbine blade fault conditions using histogram features and vibration signals: a data-mining study
CN109325553B (zh) 一种风电齿轮箱故障检测方法、系统、设备及介质
CN116484751A (zh) 一种风电机组部件的疲劳寿命评估方法及装置
Vives Vibration analysis for fault detection in wind turbines using machine learning techniques
Liu et al. Semi-supervised deep learning recognition method for the new classes of faults in wind turbine system
CN116578908A (zh) 一种风电齿轮箱的跨域故障诊断方法、系统、介质及设备
Yao et al. Power curve modeling for wind turbine using hybrid-driven outlier detection method
Cao et al. A novel method for detection of wind turbine blade imbalance based on multi-variable spectrum imaging and convolutional neural network
CN117151684A (zh) 风电风机数据分析预警方法、系统、装置及可读存储介质
CN116505556A (zh) 基于一次调频的风电场功率控制系统及方法
Pang et al. Multi kernel fusion convolutional neural network for wind turbine fault diagnosis
Joshuva et al. Logistic model tree classifier for condition monitoring of wind turbine blades

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207