CN114623050A - 风电机组的运行数据异常检测方法、系统及介质 - Google Patents
风电机组的运行数据异常检测方法、系统及介质 Download PDFInfo
- Publication number
- CN114623050A CN114623050A CN202210261000.1A CN202210261000A CN114623050A CN 114623050 A CN114623050 A CN 114623050A CN 202210261000 A CN202210261000 A CN 202210261000A CN 114623050 A CN114623050 A CN 114623050A
- Authority
- CN
- China
- Prior art keywords
- data
- wind turbine
- turbine generator
- parameter
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 73
- 239000000523 sample Substances 0.000 claims abstract description 50
- 238000012216 screening Methods 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 24
- 239000000203 mixture Substances 0.000 claims abstract description 22
- 239000013074 reference sample Substances 0.000 claims abstract description 22
- 238000001514 detection method Methods 0.000 claims description 59
- 238000009826 distribution Methods 0.000 claims description 52
- 230000008859 change Effects 0.000 claims description 28
- 230000005856 abnormality Effects 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 230000036541 health Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 6
- 238000004140 cleaning Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013024 troubleshooting Methods 0.000 description 2
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D17/00—Monitoring or testing of wind motors, e.g. diagnostics
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Sustainable Development (AREA)
- Sustainable Energy (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Wind Motors (AREA)
Abstract
本申请提出了一种风电机组的运行数据异常检测方法、系统及介质,该方法包括:从目标风电机组的历史运行数据中剔除异常数据以及非稳态数据;通过等间隔分类对历史运行数据进行工况划分,并通过高斯混合模型对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准筛选出基准样本;基于条件变分自编码器构建目标风电机组在变工况下的基准模型,并通过基准样本进行训练;通过训练完成的基准模型计算重构概率,并获取所述目标风电机组的实时运行数据,根据重构概率以及实时运行参数的偏离度定位出异常的运行数据。该方法可以在变工况的条件下建立精确的基准模型,提高了机组在变工况下运行状态评估的准确性,并可精确定位异常参数。
Description
技术领域
本申请涉及风力发电技术领域,尤其涉及一种风电机组的运行数据异常检测方法、系统及介质。
背景技术
随着风力发电的普及率不断提升,人们开始更加关注维护风电机组安全稳定生产,对风电机组健康状态的监测与评估是确保风电机组安全稳定生产的重要基础。其中,风力发电机组运行数据异常检测是对机组在当前工况下运行状态是否异常进行衡量,也是开展风力发电机组的健康维护工作的前提,同时,机组处于健康运行状态下的运行数据是风电机组发电功率预测的基础。目前,一般是通过监测并分析风电机组的实时运行数据,比较当前数据与基准数据的差异,从而进行异常判别。因此风电机组运行状况异常检测的核心内容是基准模型的建立。
相关技术中,通常是先进行风电机组的性能试验,根据试验结果结合相关的数学模型搭建机组运行状态评价的基准模型。然而,由于风电机组运行参数间相互耦合,并且受到外部边界条件的影响,呈现出高维、动态且非线性的特点。此外,随着风电机组设备老化以及外界条件的改变,机组的实际基准状态与设计值往往偏差较大。因此,上述相关技术组中的方式无法满足风电机组在工况变换的情况下进行基准建模的需求,建立的模型不适用于实际应用中的变工况场景,导致对风电机组的运行状态进行异常检测的准确性较低,无法及时发现机组存在的异常。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种风电机组的运行数据异常检测方法,该方法采用变自编码器模型对变工况的数据进行重构,建立了多特征参数融合的异常检测模型,实现对风电机组在变工况条件下健康状况的实时动态评估,从而可以在变工况的条件下建立精确的基准模型,提高了机组在变工况下运行状态评估的准确性,并可精确定位异常参数。
本申请的第二个目的在于提出一种风电机组的运行数据异常检测系统;
本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请的第一方面实施例在于提出一种风电机组的运行数据异常检测方法,该方法包括以下步骤:
获取待检测的目标风电机组的历史运行数据,从所述历史运行数据中剔除不符合风电机组输出特性的异常数据以及非稳态数据;
选取运行工况特征参数,通过等间隔分类对所述历史运行数据进行工况划分,并通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本;
对风电机组在变工况下的运行状态进行分析,基于条件变分自编码器构建所述目标风电机组在变工况下的基准模型,并通过所述基准样本对所述条件变分自编码器进行训练,获取训练完成的基准模型;
通过所述训练完成的基准模型计算重构概率作为异常检测的特征指标,并获取所述目标风电机组的实时运行数据,根据所述重构概率以及所述实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据。
可选地,在本申请的一个实施例中,从所述历史运行数据中剔除非稳态数据,包括:将所述目标风电机组的输出功率表示为包含功率的变化速率的表达式;计算相邻两个时刻输出功率的差值;通过时间窗口内样本统计量的均值对所述功率的变化速率进行估计;通过区间估计确定所述功率的变化速率的真实值位于的置信区间;根据所述置信区间内是否不包括零,判断所述目标风电机组在所述时间窗口内是否处于非稳态工况,若是,则将非稳态数据剔除。
可选地,在本申请的一个实施例中,选取的运行工况特征参数包括:风速、风向、扭矩、转速、环境温度和负荷,所述通过等间隔分类对所述历史运行数据进行工况划分,包括:确定每个所述运行工况特征参数在自身变化范围内的最大值和最小值,并获取预设的每个所述运行工况特征参数的工况划分间隔;通过以下公式进行等间隔工况划分:
Ci=(Si,Si+ΔS)∩(Di,Di+ΔD)∩(Mi,Mi+ΔM)∩(Ni,Ni+ΔN)∩(Ti,Ti+ΔT)∩(Pi,Pi+ΔP)
s.t.Si<<Smin,Si+ΔS>>Smax,Di<<Dmin,Di+ΔD>>Dmax,Mi<<Mmin,Mi+ΔM>>Mmax,Ni<<Nmin,Ni+ΔN>>Nmax,Ti<<Tmin,Ti+ΔT>>Tmax,Pi<<Pmin,Pi+ΔP>>Pmax
其中,S是风速,D是风向,M是扭矩,N是转速,T是环境温度,P是负荷;从划分后的全部工况中剔除无效工况,直至剩余有效工况的数目大于理论工况总数的预设比例。
可选地,在本申请的一个实施例中,通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,包括:通过最大期望值算法估计所述高斯混合模型GMM的参数;通过赤池信息准则AIC确定所述高斯混合模型的子模型个数,以对所述目标风电机组的状态类别进行聚类;所述根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本,包括:比较每个聚类簇下的数据样本,选择平均运行效率最高的目标数据组作为基准样本;通过所述高斯混合模型GMM将似然远小于平均似然的样本点剔除。
可选地,在本申请的一个实施例中,通过所述训练完成的基准模型计算重构概率,包括:获取测试样本,通过所述条件变分自编码器的编码器获取每个隐变量的高斯分布中的第一参数和第二参数,并对每个隐变量采样预设数量个样本点;通过所述条件变分自编码器的解码器计算每个隐变量对应的重构变量似然分布中的第三参数和第四参数;基于所述第三参数和所述第四参数,统计在隐变量条件下所述测试样本的对数似然的平均值。
可选地,在本申请的一个实施例中,根据所述重构概率以及所述实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据,包括:通过核密度估计KDE统计训练样本的重构概率分布,将置信度等于预设数值时对应的置信区间的下限,作为异常检测的阈值;根据所述异常检测的阈值判断所述实时运行数据的重构概率是否异常,在检测到重构概率异常的情况下,通过以下公式计算所述实时运行数据中每个参数的偏离度:
为达上述目的,本申请的第二方面实施例还提出了一种风电机组的运行数据异常检测系统,包括以下模块:
获取模块,用于获取待检测的目标风电机组的历史运行数据,从所述历史运行数据中剔除不符合风电机组输出特性的异常数据以及非稳态数据;
筛选模块,用于选取运行工况特征参数,通过等间隔分类对所述历史运行数据进行工况划分,并通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本;
构建模块,用于对风电机组在变工况下的运行状态进行分析,基于条件变分自编码器构建所述目标风电机组在变工况下的基准模型,并通过所述基准样本对所述条件变分自编码器进行训练,获取训练完成的基准模型;
检测模块,用于通过所述训练完成的基准模型计算重构概率作为异常检测的特征指标,并获取所述目标风电机组的实时运行数据,根据所述重构概率以及所述实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据。
可选地,在本申请的一个实施例中,获取模块,具体用于:将所述目标风电机组的输出功率表示为包含功率的变化速率的表达式;计算相邻两个时刻输出功率的差值;通过时间窗口内样本统计量的均值对所述功率的变化速率进行估计;通过区间估计确定所述功率的变化速率的真实值位于的置信区间;根据所述置信区间内是否不包括零,判断所述目标风电机组在所述时间窗口内是否处于非稳态工况,若是,则将非稳态数据剔除。
可选地,在本申请的一个实施例中,选取的运行工况特征参数包括:风速、风向、扭矩、转速、环境温度和负荷,所述筛选模块,具体用于:确定每个所述运行工况特征参数在自身变化范围内的最大值和最小值,并获取预设的每个所述运行工况特征参数的工况划分间隔;
通过以下公式进行等间隔工况划分:
Ci=(Si,Si+ΔS)∩(Di,Di+ΔD)∩(Mi,Mi+ΔM)∩(Ni,Ni+ΔN)∩(Ti,Ti+ΔT)∩(Pi,Pi+ΔP)
s.t.Si<<Smin,Si+ΔS>>Smax,Di<<Dmin,Di+ΔD>>Dmax,Mi<<Mmin,Mi+ΔM>>Mmax,Ni<<Nmin,Ni+ΔN>>Nmax,Ti<<Tmin,Ti+ΔT>>Tmax,Pi<<Pmin,Pi+ΔP>>Pmax
其中,S是风速,D是风向,M是扭矩,N是转速,T是环境温度,P是负荷;从划分后的全部工况中剔除无效工况,直至剩余有效工况的数目大于理论工况总数的预设比例。
为了实现上述实施例,本申请第三方面实施例还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的风电机组的运行数据异常检测方法。
本申请的实施例提供的技术方案至少带来以下有益效果:本申请先启动数据清洗流程,建立了稳态判别、工况划分和基准筛选模型,将风电机组历史数据中混有的无效异常数据、非稳态数据和少量的微小异常数据点剔除,清洗后的数据用于后续异常检测模型的训练,可以提高训练出的异常检测模型的检测异常数据的准确性。然后,针对风电机组状态信息的动态复杂性,以数据驱动方式解析数据中多元参数间的关联关系,采用变自编码器模型对变工况的数据进行重构,建立了多特征参数融合的异常检测模型,实现对风电机组在变工况条件下健康状况的实时动态评估。从而,该方法可以在工况发生变换和偏离设计工况的场景下建立精确的基准模型,有利于在变工况下及时准确的检测出异常参数,提高了对风电机组在变工况下进行运行状态评估的准确性,并可以精确定位到具体的异常参数,有利于工作人员获取到更加细致的异常信息,便于及时排除故障。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例提出的一种风电机组的运行数据异常检测方法的流程图;
图2为本申请实施例提出的一种对风电机组的历史运行数据进行稳态筛选的方法的流程图;
图3为本申请实施例提出的一种风电机组的基准样本的筛选方法的流程图;
图4为本申请实施例提出的一种风电机组在变工况下特征指标间关系的示意图;
图5为本申请实施例提出的一种CVAE模型的结构示意图;
图6为本申请实施例提出的一种具体的风电机组的运行数据异常检测方法的流程图;
图7为本申请实施例提出的一种风电机组的运行数据异常检测系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图详细描述本发明实施例所提出的一种风电机组的运行数据异常检测方法、系统。
图1为本申请实施例提出的一种风电机组的运行数据异常检测方法的流程图,如图1所示,该方法包括以下步骤:
步骤S101,获取待检测的目标风电机组的历史运行数据,从历史运行数据中剔除不符合风电机组输出特性的异常数据以及非稳态数据。
其中,异常数据是指风电机组在运行过程中由于弃风限电、通信设备故障、极端天气、叶片污染和风速传感器失灵等原因,导致测量得到的风电机组的运行数据中存在的大量不符合风力发电机组正常输出特性的异常点。非稳态数据是指是风电机组处于非预期因素导致的非稳态工况下产生的数据。
具体的,首先通过不同的方式获取获取需要进行运行数据异常检测的目标风电机组的历史运行数据。比如,在风电机组系统中预先设置数据采集与监视控制系统(Supervisory Control And Data Acquisition,简称SCADA)对机组的各个设备进行监测,再获取SCADA采集到的机组在不同时刻下的运行数据。
进一步的,从获取到的历史运行数据中剔除不符合风电机组输出特性的异常数据。作为一种可能的实现方式,先确定待剔除的异常数据,具体可以参考确定风力发电机组处于正常运转情况的行业标准,将以下五类场景下产生的运行数据:除风速外的外部条件超出了风力发电机组的工作范围情况下的数据、故障发生导致风机无法运行期间的数据、风力发电机组被手动关机或者处于测试或维修操作状态下的数据、测试设备故障或者性能退化例如,叶片结冰和污染等期间的数据和风向超出了规定的测量扇区情况下的数据作为不符合风电机组输出特性的异常数据。然后从历史运行数据将该五种情况对应的时间段内产生的全部运行数据剔除。
由此,本申请通过在训练检测模型进行运行状态异常检测前,先排除异常数据,确保用于后续异常检测模型训练的数据是风电机组处于健康状态下运行时产生的,后续用于分析的数据均是在风力发电机组正常运转情况下采集的没有损坏的数据,从而有利于提高本申请的异常检测结果的准确性。
更进一步的,再从历史运行数据中剔除非稳态数据。具体的,在风电机组实际发电生产过程中,由于风机启停、障碍物遮挡以及风速快速变化等天气因素的影响,风电机组运行时可能存在非稳态工况与稳态工况交替出现的场景,导致历史运行数据中混有大量非稳态数据,而在非稳态工况下系统的输入与输出参数之间不能保证较强的一致性,因此,本申请在建立运行状态异常检测模型之前需要剔除非稳态数据。
在本申请一个实施例中,为了更加清楚的说明本申请剔除非稳态数据的具体实现过程,下面以本申请实施例中提出的一种对风电机组的历史运行数据进行稳态筛选的方法进行示例性说明,如图2所示,该方法包括以下步骤:
步骤S201,将目标风电机组的输出功率表示为包含功率的变化速率的表达式。
需要说明的是,由于风电机组的输出功率具有在稳态过程中波动较小、在非稳态过程中波动较大的特点,因此,本申请选用输出功率作为稳态判别的特征指标。具体进行判别时,先将风电机组的输出功率以公式的形式进行表示,将输出功率表示为如下公式(1)所示的包含功率的变化速率的表达式:
其中,pt为t时刻功率的测量值,μ为功率的初始真实值,m为功率的变化速率,ε为功率的随机误差,且ε服从正态分布。
步骤S202,计算相邻两个时刻输出功率的差值。
具体的,风电机组在稳态运行与非稳态运行过程的区别在于负荷响应速率是否等于0,而负荷响应速率可以通过功率的变化速率m体现。在本实施例中,为了便于对m值大小进行估计,计算相邻两个时刻功率的差值Δp,即将上述公式(1)在两个相邻两个时刻下相减得到差值,如下公式(2)所示:
Δp=pt-pt-1=m+(εt-εt-1) (2)
步骤S203,通过时间窗口内样本统计量的均值对功率的变化速率进行估计。
具体的,由于εt~N(0,σ2),统计量Δp的期望为m,即Δp~N(m,2σ2)。根据时间序列的性质,m可以采用时间窗口内样本统计量的均值进行估计,即可通过如下所示的公式(3)进行估计:
其中,h为滑动时间窗口内的样本数目。
步骤S204,通过区间估计确定功率的变化速率的真实值位于的置信区间。
步骤S205,根据置信区间内是否不包括零,判断目标风电机组在时间窗口内是否处于非稳态工况,若是,则将非稳态数据剔除。
具体的,为了保证估计的可靠性,本实施例采用区间估计的方式进行估计,即如下公式(4)所示:
其中,和是在给定显著性水平α下的两个统计量。存在(1-α)的置信水平认为m的真实值位于置信区间内。因此,根据置信区间内是否不包括零,判断目标风电机组在时间窗口t-1至t内是否处于非稳态工况,即如果置信区间不包括0,则判断风电机组在该时间段内处于非稳态工况,该时间段内的运行数据为非稳态数据,并将该时间段内的非稳态数据剔除。
由此,通过本申请实施例的剔除非稳态数据的方法,将不满足较强的一致性的非稳态工况下生成的非稳态数据剔除,降低了后续根据历史运行数据进行建模和训练过程的复杂程度,减少了精确建模耗费的时间和精力,提高了本申请的异常检测方法的便利性。
步骤S102,选取运行工况特征参数,通过等间隔分类对历史运行数据进行工况划分,并通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本。
其中,运行工况特征参数是对风电机组的状态特征参数有直接或间接影响的运行参数,运行工况特征参数可用于区分不同工况,即可近似看作工况划分的边界条件。高斯混合模型(Gaussian Mixture Model,简称GMM)是多个高斯分布函数的线性组合,可以通过高斯概率密度函数精确地量化事物。
在本申请的一个实施例中,在进行工况划分时,先选取相应数量的运行工况特征参数建立工况特征集,作为一种示例,本申请通过比较历史数据中各参数对机组的状态特征的影响程度,选取风速、风向、扭矩、转速、环境温度和负荷六个运行工况特征参数。
然后,遍历筛选后的历史运行数据,通过比较确定每个运行工况特征参数在自身变化范围内的最大值和最小值,再获取预设的每个运行工况特征参数的工况划分间隔。其中,特征参数的工况划分间隔可以根据当前风电机组自身的特性、各参数的实际变换范围和数据分布特点以及异常检测的精确度的需要和进行设置,比如,当精确度要求较高时,对工况划分更为细致,则可以设置各个运行工况特征参数的工况划分间隔较短。
在确定每个特征参数划分的间隔后,通过以下公式进行等间隔工况划分:
Ci=(Si,Si+ΔS)∩(Di,Di+ΔD)∩(Mi,Mi+ΔM)∩(Ni,Ni+ΔN)∩(Ti,Ti+ΔT)∩(Pi,Pi+ΔP)
其中,S是风速,D是风向,M是扭矩,N是转速,T是环境温度,P是负荷。由该公式和上述特征参数的描述可知,Tmin和Tmax分别表示环境温度的最小值与最大值,Pmin与Pmax分别表示负荷的最小值与最大值,ΔT和ΔP分别表示环境温度和负荷的工况划分间隔,其他特征参数可以此类推,此处不再赘述。
由上述工况划分公式(5)可知,本申请划分出的第i个工况Ci是由每个运行工况特征参数划分条件的交集确定的,根据各运行工况特征参数在各自划分间隔内的交集划分出对应的工况。
需要说明的是,由于基于等间隔的工况划分常常会出现部分没有样本或样本数目较少的无效工况,因此,在本实施例中进行等间隔工况划分后,还对部分无效工况进行剔除。具体的,检测划分后每个工况内的样本数量,若样本数量低于预设的阈值,则判定该工况为无效工况,从划分后的全部工况中剔除无效工况,直至剩余有效工况的数目大于理论工况总数的预设比例,比如,当剩余有效工况的数目大于理论工况总数的30%时,判断收集的数据样本相对于目前的工况划分结果是有意义的,从而完成工况划分。
进一步的,从划分工况后的历史运行数据中筛选出基准样本。
其中,基准样本是风电机组处于正常状态或健康运行状态下的数据样本。然而,由于外界条件的影响,在不同的工况场景下正常运行状态的边界是变化的,较难统一界定正常运行状态的标尺。为此,本申请进行了工况划分,并借助高斯混合模型GMM可以精确地量化事物的特性,通过GMM对单一工况下的数据样本依据相似性进行聚类,根据事先定义的筛选标准选择某一类或者某几类聚类簇中数据作为基准样本。其中,GMM融合了参数估计法与非参数估计法的优点,不局限于特定的概率密度函数形式,在子模型数量足够多的情况下,可以以任意精度逼近任意的连续分布,因此,本申请通过GMM确定历史运行数据集合下包含的多个不同的分布,即生成不同的聚类簇。
具体实施时,在本申请一个实施例中,为了更加清楚的说明本申请通过GMM筛选出基准样本的具体实现过程,下面以本申请实施例中提出的一种风电机组的基准样本的筛选方法进行示例性说明,对于每一种单一工况,均可以通过该方法进行基准样本筛选。如图3所示,该方法包括以下步骤:
步骤S301,通过最大期望值算法估计高斯混合模型GMM的参数。
具体的,最大期望值(Expectation-Maximization algorithm,简称EM)算法是一种迭代算法,通过EM算法可进行含有隐变量的概率模型的参数估计,通过迭代求取极大似然的参数值,本申请采用的EM算法的目标函数如下公式(6)所示:
在本实施例中,通过EM算法估计GMM参数时,先估计GMM参数的粗略值,再使用获取的粗略值最大化似然函数。
举例而言,本申请实施例先计算出GMM的似然函数,假设GMM模型中有N个参数需要估计,则先分别求解出这N个参数的最大似然函数,然后通过EM算法估计GMM参数即最大化这N个参数的最大似然函数,具体可以先指定这N个参数的的初始值,通过EM算法进行迭代直至这N个参数或对数似然函数收敛,获得估计出的参数值。
步骤S302,通过赤池信息准则AIC确定高斯混合模型的子模型个数,以对目标风电机组的状态类别进行聚类。
其中,GMM子模型数目对应的物理意义是风电机组状态类别的数目。当GMM子模型数目取1时等价于高斯分布,考虑到本申请中风电机组的运行水平的变化,运行过程中发生故障,以及机组在正常条件下的缓慢老化,历史数据样本可能包含多个运行模式,本申请将概率分布表现为多个高斯分布的叠加组合。
具体的,为了确定GMM子模型个数,在本申请实施例中选用AIC评价准则。赤池信息准则(Akaike’s Information Criterion,简称AIC)是建立在熵的概念上,用于权衡模型复杂度与拟合数据优良的评价办法,其定义如以下公式(7)所示:
AIC=2K-2ln(L)
其中,K是子模型个数,ln(L)代表模型的对数似然函数。
需要说明的是,随着子模型个数的增加,模型复杂度也随之增加,AIC的值会减小后增大。因此,本申请实施例选择AIC最小时对应的子模型个数,作为GMM的最佳子模型个数。由此,本申请实施例通过对GMM的参数估计并结合AIC准则确定子模型个数,对单一工况下的数据样本依据相似性进行聚类。进而通过GMM可依次对划分后的每个工况下的数据样本进行聚类。
步骤S303,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本。
在本申请实施例中,将基准定义为在当前运行边界条件下,实际可达到的最高机组运行效率对应的参数值,因此,本申请预设的筛选标准可以是选取运行效率最高的数据作为基准样本。具体筛选基准样本时,针对每种工况,可以比较GMM确定的不同的聚类簇下的数据样本,选择平均运行效率最高的一组数据作为基准样本,并可进一步估计其概率密度分布,确定基准区间。进而通过相同的方式依次筛选出划分后的每个工况下的基准样本。
需要说明的是,本申请将反映机组正常运行状态的历史数据视为基准样本,在机组的历史数据覆盖的时段内,机组可能偏离最佳运行状态,存在一些微小异常,这些微小异常较难发现,或者即便怀疑机组存在异常但认为只要异常不继续发展,这部分疑似数据仍也可作为基准样本。因此,本申请筛选出基准样本后,基于训练后的GMM,将似然远小于平均似然的样本点视作异常样本进行剔除,从而进一步排除异常数据,提高后续构建的异常检测模型的精确性。
步骤S103,对风电机组在变工况下的运行状态进行分析,基于条件变分自编码器构建目标风电机组在变工况下的基准模型,并通过基准样本对条件变分自编码器进行训练,获取训练完成的基准模型。
其中,变工况是指风电机组处在工况发生变化,或偏离设计工况的运行场景下。本申请先通过对风电机组在变工况下的运行状态进行分析,确定在变工况下的搭建基准模型的方式。
具体的,由于风电机组绝大部分的运行状态特征指标与边界条件有关,且彼此间存在耦合关系,因此风电机组可监测运行参数的变化不仅与机组本身的健康状况有关,也会受到外部工况条件的影响。因此,在本申请一个实施例中,对风电机组变工况运行状态分析时,先通过分析历史运行数据,构建出如图4所示的风电机组在变工况条件下的特征指标与边界变量间的关系。在图4中,X表示可直接监测的一次参数,可以通过布置在风电机组各位置处的传感器测点直接获取,包括:温度、风速、振动等。Y表示二次性能指标,需要通过参数软测量得到,二次性能指标对于机组状态的变化更加敏感,能快速定位异常发生的位置。C表示外部工况变量,包括:环境参数与机组的转速。Z表示机组状态变量,反映了机组自身的健康状况和原有设计能力。
基于图4所示的关系,将风电机组变工况下运行状态模型用条件概率分布的形式表示成logpθ(x,y|c),表明在给定工况变量C条件下,预测特征指标X和Y的值。在确定需要监测的特征指标后,利用筛选后的数据样本辨识概率模型的参数,选择具有代表性的极大似然估计求解,具体可通过如下所示的公式(8)所示:
其中,N表示训练样本个数,在不引起歧义的情况下,为表达简洁,在本申请中将x(i)表示为x。由于运行参数和性能指标还受到除工况变量外的机组状态变量Z影响,概率模型中既含有观测变量,又含有隐变量,直接求解logpθ(x,y|c)较为困难,不适合由数据直接学习条件概率分布。因此,本申请根据贝叶斯定理,将可观测变量的概率分布借助隐变量的条件概率分布实现,即将logpθ(x,y|c)可以表示成如以下公式所示的形式。
logpθ(x,y|c)=logpθ(x,y|z,c)+logpθ(z|c)-logpθ(z|x,y,c) (9)
结合该式可知,当机组的特征指标间相互耦合时,变量间存在复杂的非线性关系,隐变量z的后验概率logpθ(z|x,y,c)不是简单的概率分布。特别是当该式中的条件概率logpθ(z|x,y,c)中参数是通过神经网络计算得到时,EM算法不再适用。因此,本申请采用改进的条件变自编码器建立机组变工况下的基准模型。
由此,本申请通过对风电机组在变工况下的运行状态进行分析,确定了在变工况下更适合使用基于条件变分自编码器构建基准模型。为了更加清楚的说明本申请采用改进的条件变自编码器建立机组变工况下的基准模型的原理,下面先对变分自编码器进行介绍:
变分自编码器(Variational Auto-Encoder,简称VAE)是一种深度学习生成模型,在概率模型的基础上,整合了深度学习的优势,能够自主学习数据服从的概率分布并生成相似的数据。VAE的网络结构分为编码器和解码器两部分。
其中,编码器也叫做推理网络,其作用是通过pθ(z|x)将原始数据x映射到低维隐空间,编码成隐变量z,实现特征提取和降维。解码器也叫做生成网络,其作用是从隐变量分布pθ(z)采样z,通过pθ(x|z)重构原始数据x。
解码器pθ(x|z)整合多层神经网络,可以提高对复杂非线性关系的表达能力,但是隐变量z的后验概率pθ(z|x)也会因此变得更加复杂,无法获得分布的解析形式。因此VAE利用变分推理构造可优化的qφ(z|x)用于近似表示编码器中真实后验概率pθ(z|x)。观测变量x对数似然可以写成:
logpθ(x)=DKL(qφ(z|x)||pθ(z|x))+LELBO(θ,φ;x) (10)
其中,DKL表示KL散度,用于衡量相同事件空间下两个概率分布的相似程度,其值恒为非负。因此观测变量x的极大对数似然估计问题等价于最大化变分下界LELBO(θ,φ;x),如式(11)所示。
logpθ(x)≥LELBO(θ,φ;x) (11)
公式(11)等号成立的条件是变分近似后验概率等于真实后验概率。LELBO(θ,φ;x)可以继续展开,如公式(12)所示。
公式(12)包含两项内容:第一项是观测变量x的重构误差,通过近似后验分布qφ(z|x)采样隐变量z,并计算对数似然logpθ(x|z),用于描述生成样本与真实样本之间的差异;第二项是隐变量的近似后验分布qφ(z|x)与先验分布pθ(z)之间的KL分散度,约束后验分布使其接近于先验分布,可以看作是隐变量z正则化系数。VAE采用SGVB训练算法,对参数Φ和θ优化求解,同时满足以下两个条件:第一,使训练数据和重构数据尽可能相等;第二,使z的后验分布qφ(z|x)逼近先验分布pθ(z)。
VAE通常假设z的后验分布qφ(z|x)服从高斯分布,先验分布pθ(z)服从标准正态分布,似然pθ(x|z)根据变量的特点选择多元高斯分布或者伯努利分布。直接采用蒙特卡洛采样进行模型的参数估计会产生很大的方差,为了降低方差,对隐变量采用重参数变换的方法,用一个可微的方程和一个随机变量表示,如公式(12)所示。
z=g(x,y,c,ε)withε~p(ε) (13)
当先验概率满足pθ(z)=N(0,I),qφ(z|x)=N(z;μ,σ2I)条件时,变分下界的表达式等价为如下公式(14):
在本申请实施例中,由于风电机组的运行状态模型是在工况变量C条件下,对特征指标X和Y的条件概率分布logpθ(x,y|c)进行监测。因此,本申请在上述标准VAE的结构基础上,引入条件变量改进原有网络结构,建立了条件变自编码器(Conditional VariationalAuto-Encoder,简称CVAE)模型用于预测变工况下的基准数据。
具体基于条件变分自编码器构建基准模型时,作为一种可能的实现方式,本申请实施例构建了如图5所示CVAE的网络结构。如图5所示,该模型包括编码模块10、解码模块20以及运行工况(C)的获取及传输模块30。其中,CVAE的目标是求解使条件对数似然logpθ(x,y|c)最大化时参数的值。在变工况条件下,先将式logpθ(x)扩展为条件对数似然logpθ(x,y|c),写作如下公式:
logpθ(x,y|c)=DKL(qφ(z|x,y,c)||pθ(z|x,y,c))+LELBO(θ,φ;x,y,c) (15)
然后,根据VAE的基本原理,将条件对数似然的变分下界LELBO(θ,φ;x,y,c)展开为以下表达式:
在本实施例中,假设隐变量的先验分布服从各向同性多元高斯,则先验概率不涉及参数,如以下公式所示:
p(z)=N(0,I) (17)
观测变量的条件似然pθ(x,y|z,c)服从多元高斯分布,如以下公式(18)所示:
pθ(x,y|z,c)=N(μθ(z,c),σθ(z,c)2I) (18)
其中,参数由编码器中的多层神经网络输出得到,σθ(z,c)假定是定值,μθ(z,c)=Wθ[z,c]+bθ,σθ(z,c)=const。
由于真实的后验概率pθ(z|x,y,c)的形式是具有斜对角方差的多元高斯模型,为了简化后验概率的估计,同样选用斜对角方差结构多元高斯分布表示编码器分布qφ(z|x,y,c),如以下公式所示。
qφ(z|x,y,c)=N(μφ(x,y,c),σφ(x,y,c)2I) (19)
重参数化后的变分近似分布,如以下公式所示:
z=μφ(x,y,c)+σφ(x,y,c)⊙εwithε~N(0,I) (20)
其中,参数可以同样可以由神经网络计算得到,计算方式如以下公式所示:
由此,本申请构建了基于条件变分自编码器的目标风电机组在变工况下的基准模型,然后,通过步骤S102中获取的各个工况下的基准样本对CVAE模型进行训练,训练完成后可以得到风电机组在变工况条件下的基准模型。
步骤104,通过训练完成的基准模型计算重构概率作为异常检测的特征指标,并获取目标风电机组的实时运行数据,根据重构概率以及实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据。
其中,重构概率是CVAE模型的损失函数中的重构误差项。需要说明的是,CVAE模型重构的是变量的概率分布而不是变量本身,重构的数据中包含了变量的更多信息,包括隐变量的后验分布和生成似然,对于CVAE基准模型而言,测试数据的重构概率越小,表明数据与基准工况的差异性则越大,因此,本申请选取重构概率作为异常检测的特征指标。
具体的,本申请先通过训练完成的基准模型计算重构概率作为异常检测的特征指标。作为一种可能的实现方式,计算重构概率时,先获取测试样本,通过条件变分自编码器的编码器获取每个隐变量的高斯分布中的第一参数和第二参数,并对每个隐变量采样预设数量个样本点,再通过条件变分自编码器的解码器计算每个隐变量对应的重构变量似然分布中的第三参数和第四参数,然后基于第三参数和第四参数,统计在隐变量条件下测试样本的对数似然的平均值。
具体而言,测试样本可以是从目标风电机组的历史运行数据中选取的计算重构概率的样本数据。向CVAE基准模型输入测试样本X后,通过CVAE的编码器得到隐变量的高斯分布中的第一参数μφ和第二参数σφ,并对隐变量Z采样L个点。然后,由解码器计算每个隐变量Z对应的重构变量似然分布的第三参数μθ和第四参数σθ,最后,统计在隐变量条件下测试样本对数生成似然的平均值得到重构概率,具体的计算方式可以由以下公式表示:
进一步的,在生成变工况下的基准模型并计算出重构概率后,获取待检测的目标风电机组的实时运行数据,比较当前数据与基准数据的差异,进行异常判别。
作为一种可能的实现方式,根据重构概率以及实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据,包括以下步骤,先通过核密度估计KDE统计训练样本的重构概率分布,将置信度等于预设数值时对应的置信区间的下限,作为异常检测的阈值。然后,根据异常检测的阈值判断实时运行数据的重构概率是否异常,在检测到重构概率异常的情况下,通过以下公式计算实时运行数据中每个参数的偏离度:
具体而言,采用核密度估计(kernel density estimation,简称KDE)统计用于训练样本的重构概率分布,将置信度等于95%时对应的置信区间下限作为异常检测的阈值,具体计算公式如以下所示:
其中,训练样本可以是从获取到实时运行数据中抽取出计算异常检测的阈值的样本数据。在风电机组中,风速、转速等参数间的相互耦合,局部参数的扰动会传递到系统内的其他参数上,并且在系统的控制调节作用下某些参数早期异常的微小偏离还会被拉至正常水平,影响参数异常的定位。
因此,本申请采用基于重构概率的异常检测能够提前发现机组局部系统单元的异常变化。并在此基础上,计算重构输出与原始输入参数间的差值向量,利用二者的相对偏差进一步定位参数的异常,参数偏离度的计算公式如以下所示:
在本实施例中,通过核密度估计KDE统计训练样本的重构概率分布,获得异常检测的阈值后,计算实时运行数据的重构概率,并将实时运行数据的重构概率与异常检测的阈值进行比较,一旦检测到实时运行数据重构概率异常,则确定目标风电机组当前处于异常状态。进一步的,通过上述公式(24)计算运行数据中每个运行参数,比如,风机扭矩等的偏离度,再通过比较系统内各参数的偏离度,进一步定位参数异常。举例而言,将各运行参数的偏离度与预设的偏离阈值进行比较,当某一运行参数的偏离度大于预设的偏离阈值时,则确定该运行参数异常。
由此,本申请通过重构概率作为异常检测的特征指标,由于重构概率不仅考虑了重构与原始输入间的差异性,也考虑了由于隐变量方差的存在对重构结果的影响,具有检测数据波动异常的潜力。并且,重构概率衡量的是当前整体状态与基准的偏离度,对于多参数耦合系统的异常检测更加敏感。因此,本申请基于条件变分自编码器构建变工况下的基准模型后,通过重构概率将实时运行数据与基准模型确定的当前场景的基准数据进行比较,可以获得准确的变工况下的异常检测结果,不但可以及时、准确的检测出风电机组的运行状态是否异常,还通过计算实际值与重构值之间的偏离度可以精准的确定产生了异常的具体参数。
综上所述,本申请实施例的风电机组的运行数据异常检测方法,先启动数据清洗流程,建立了稳态判别、工况划分和基准筛选模型,将风电机组历史数据中混有的无效异常数据、非稳态数据和少量的微小异常数据点剔除,清洗后的数据用于后续异常检测模型的训练,可以提高训练出的异常检测模型的检测异常数据的准确性。然后,针对风电机组状态信息的动态复杂性,以数据驱动方式解析数据中多元参数间的关联关系,采用变自编码器模型对变工况的数据进行重构,建立了多特征参数融合的异常检测模型,实现对风电机组在变工况条件下健康状况的实时动态评估。从而,该方法可以在工况发生变换和偏离设计工况的场景下建立精确的基准模型,有利于在变工况下及时准确的检测出异常参数,提高了对风电机组在变工况下进行运行状态评估的准确性,并可以精确定位到具体的异常参数,有利于工作人员获取到更加细致的异常信息,便于及时排除故障。
为了更加清楚地说明本申请实施例的风电机组的运行数据异常检测方法的流程,下面以一个具体的风电机组的运行数据异常检测的实施例进行详细说明。图6为本申请实施例提出的一种具体的风电机组的运行数据异常检测方法的流程示意图。如图6所示,该方法包括以下步骤:
步骤S601,判别并筛选出历史运行数据中的正常运行数据。
步骤S602,基于等间隔分类的工况划分方法进行工况划分。
步骤S603,筛选基准样本数据。
其中,步骤S601至步骤S603组成了历史数据清洗流程,针对历史数据中混有的无效、非稳态和少量异常数据点的问题,研究了稳态判别、工况划分和基准筛选模型进行了数据清洗,清洗后的数据用于后续异常检测模型的训练。
步骤S604,对风电机组变工况运行状态分析。
步骤S605,构建基于条件变自编码器的风电机组变工况基准模型。
步骤S606,基于重构概率进行异常检测。
其中,步骤S604至步骤S606组成了变工况异常检测流程,针对风电机组状态信息的动态复杂性,以数据驱动方式解析数据中多元参数间的关联关系,采用变自编码器模型对变工况的数据进行重构,建立了多特征参数融合的异常检测模型,实现对风电机组在变工况条件下健康状况的实时动态评估。
需要说明的是,在本实施例中,各步骤的具体实现方式可参照上述实施例的描述,具体实现构成相似,此处不再赘述。
为了实现上述实施例,本申请还提出了一种风电机组的运行数据异常检测系统,图7为本申请实施例提出的一种风电机组的运行数据异常检测系统的结构示意图,如图7所示,该系统包括获取模块100、筛选模块200、构建模块300和检测模块400。
其中,获取模块100,用于获取待检测的目标风电机组的历史运行数据,从历史运行数据中剔除不符合风电机组输出特性的异常数据以及非稳态数据。
筛选模块200,用于选取运行工况特征参数,通过等间隔分类对历史运行数据进行工况划分,并通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本。
构建模块300,用于对风电机组在变工况下的运行状态进行分析,基于条件变分自编码器构建目标风电机组在变工况下的基准模型,并通过基准样本对条件变分自编码器进行训练,获取训练完成的基准模型。
检测模块400,用于通过训练完成的基准模型计算重构概率作为异常检测的特征指标,并获取目标风电机组的实时运行数据,根据重构概率以及实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据。
可选地,在本申请的一个实施例中,获取模块100,具体用于:将目标风电机组的输出功率表示为包含功率的变化速率的表达式;计算相邻两个时刻输出功率的差值;通过时间窗口内样本统计量的均值对功率的变化速率进行估计;通过区间估计确定功率的变化速率的真实值位于的置信区间;根据置信区间内是否不包括零,判断目标风电机组在时间窗口内是否处于非稳态工况,若是,则将非稳态数据剔除。
可选地,在本申请的一个实施例中,选取的运行工况特征参数包括:风速、风向、扭矩、转速和环境温度,筛选模块200,具体用于:确定每个运行工况特征参数在自身变化范围内的最大值和最小值,并获取预设的每个运行工况特征参数的工况划分间隔;
通过以下公式进行等间隔工况划分:
Ci=(Si,Si+ΔS)∩(Di,Di+ΔD)∩(Mi,Mi+ΔM)∩(Ni,Ni+ΔN)∩(Ti,Ti+ΔT)∩(Pi,Pi+ΔP)
s.t.Si<<Smin,Si+ΔS>>Smax,Di<<Dmin,Di+ΔD>>Dmax,Mi<<Mmin,Mi+ΔM>>Mmax,Ni<<Nmin,Ni+ΔN>>Nmax,Ti<<Tmin,Ti+ΔT>>Tmax,Pi<<Pmin,Pi+ΔP>>Pmax
其中,S是风速,D是风向,M是扭矩,N是转速,T是环境温度,P是负荷;从划分后的全部工况中剔除无效工况,直至剩余有效工况的数目大于理论工况总数的预设比例。
可选地,在本申请的一个实施例中筛选模块200还用于:通过最大期望值算法估计高斯混合模型GMM的参数;通过赤池信息准则AIC确定高斯混合模型的子模型个数,以对目标风电机组的状态类别进行聚类;比较每个聚类簇下的数据样本,选择平均运行效率最高的目标数据组作为基准样本;通过高斯混合模型GMM将似然远小于平均似然的样本点剔除。
可选地,在本申请的一个实施例中,检测模块400具体用于:获取测试样本,通过条件变分自编码器的编码器获取每个隐变量的高斯分布中的第一参数和第二参数,并对每个隐变量采样预设数量个样本点;通过条件变分自编码器的解码器计算每个隐变量对应的重构变量似然分布中的第三参数和第四参数;基于第三参数和所述第四参数,统计在隐变量条件下测试样本的对数似然的平均值。
可选地,在本申请的一个实施例中,检测模块400还用于:通过核密度估计KDE统计训练样本的重构概率分布,将置信度等于预设数值时对应的置信区间的下限,作为异常检测的阈值;根据异常检测的阈值判断实时运行数据的重构概率是否异常,在检测到重构概率异常的情况下,通过以下公式计算实时运行数据中每个参数的偏离度:
需要说明的是,前述对风电机组的运行数据异常检测方法的实施例的解释说明也适用于该实施例的系统,此处不再赘述
综上所述,本申请实施例的风电机组的运行数据异常检测系统,先启动数据清洗流程,清洗后的数据用于后续异常检测模型的训练,可以提高训练出的异常检测模型的检测异常数据的准确性。然后,针对风电机组状态信息的动态复杂性,以数据驱动方式解析数据中多元参数间的关联关系,采用变自编码器模型对变工况的数据进行重构,建立了多特征参数融合的异常检测模型,实现对风电机组在变工况条件下健康状况的实时动态评估。从而,该系统可以在工况发生变换和偏离设计工况的场景下建立精确的基准模型,有利于在变工况下及时准确的检测出异常参数,提高了对风电机组在变工况下进行运行状态评估的准确性,并可以精确定位到具体的异常参数。
为了实现上述实施例,本申请还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例中任一所述的风电机组的运行数据异常检测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种风电机组的运行数据异常检测方法,其特征在于,包括以下步骤:
获取待检测的目标风电机组的历史运行数据,从所述历史运行数据中剔除不符合风电机组输出特性的异常数据以及非稳态数据;
选取运行工况特征参数,通过等间隔分类对所述历史运行数据进行工况划分,并通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本;
对风电机组在变工况下的运行状态进行分析,基于条件变分自编码器构建所述目标风电机组在变工况下的基准模型,并通过所述基准样本对所述条件变分自编码器进行训练,获取训练完成的基准模型;
通过所述训练完成的基准模型计算重构概率作为异常检测的特征指标,并获取所述目标风电机组的实时运行数据,根据所述重构概率以及所述实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据。
2.根据权利要求1所述的方法,其特征在于,所述从所述历史运行数据中剔除非稳态数据,包括:
将所述目标风电机组的输出功率表示为包含功率的变化速率的表达式;
计算相邻两个时刻输出功率的差值;
通过时间窗口内样本统计量的均值对所述功率的变化速率进行估计;
通过区间估计确定所述功率的变化速率的真实值位于的置信区间;
根据所述置信区间内是否不包括零,判断所述目标风电机组在所述时间窗口内是否处于非稳态工况,若是,则将非稳态数据剔除。
3.根据权利要求1或2所述的方法,其特征在于,所述选取的运行工况特征参数包括:风速、风向、扭矩、转速、环境温度和负荷,所述通过等间隔分类对所述历史运行数据进行工况划分,包括:
确定每个所述运行工况特征参数在自身变化范围内的最大值和最小值,并获取预设的每个所述运行工况特征参数的工况划分间隔;
通过以下公式进行等间隔工况划分:
Ci=(Si,Si+ΔS)∩(Di,Di+ΔD)∩(Mi,Mi+ΔM)∩(Ni,Ni+ΔN)∩(Ti,Ti+ΔT)∩(Pi,Pi+ΔP)
s.t.Si<<Smin,Si+ΔS>>Smax,Di<<Dmin,Di+ΔD>>Dmax,Mi<<Mmin,Mi+ΔM>>Mmax,Ni<<Nmin,Ni+ΔN>>Nmax,Ti<<Tmin,Ti+ΔT>>Tmax,Pi<<Pmin,Pi+ΔP>>Pmax
其中,S是风速,D是风向,M是扭矩,N是转速,T是环境温度,P是负荷;
从划分后的全部工况中剔除无效工况,直至剩余有效工况的数目大于理论工况总数的预设比例。
4.根据权利要求1所述的方法,其特征在于,所述通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,包括:
通过最大期望值算法估计所述高斯混合模型GMM的参数;
通过赤池信息准则AIC确定所述高斯混合模型的子模型个数,以对所述目标风电机组的状态类别进行聚类;
所述根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本,包括:
比较每个聚类簇下的数据样本,选择平均运行效率最高的目标数据组作为基准样本;
通过所述高斯混合模型GMM将似然远小于平均似然的样本点剔除。
5.根据权利要求1所述的方法,其特征在于,所述通过所述训练完成的基准模型计算重构概率,包括:
获取测试样本,通过所述条件变分自编码器的编码器获取每个隐变量的高斯分布中的第一参数和第二参数,并对每个隐变量采样预设数量个样本点;
通过所述条件变分自编码器的解码器计算每个隐变量对应的重构变量似然分布中的第三参数和第四参数;
基于所述第三参数和所述第四参数,统计在隐变量条件下所述测试样本的对数似然的平均值。
7.一种风电机组的运行数据异常检测系统,其特征在于,包括:
获取模块,用于获取待检测的目标风电机组的历史运行数据,从所述历史运行数据中剔除不符合风电机组输出特性的异常数据以及非稳态数据;
筛选模块,用于选取运行工况特征参数,通过等间隔分类对所述历史运行数据进行工况划分,并通过高斯混合模型GMM对每种工况下的数据样本根据样本相似性进行聚类,根据预设的筛选标准从每种工况下的全部聚类簇中筛选出基准样本;
构建模块,用于对风电机组在变工况下的运行状态进行分析,基于条件变分自编码器构建所述目标风电机组在变工况下的基准模型,并通过所述基准样本对所述条件变分自编码器进行训练,获取训练完成的基准模型;
检测模块,用于通过所述训练完成的基准模型计算重构概率作为异常检测的特征指标,并获取所述目标风电机组的实时运行数据,根据所述重构概率以及所述实时运行数据的实际值与重构值之间的偏离度定位出异常的运行数据。
8.根据权利要求7所述的系统,其特征在于,所述获取模块,具体用于:
将所述目标风电机组的输出功率表示为包含功率的变化速率的表达式;
计算相邻两个时刻输出功率的差值;
通过时间窗口内样本统计量的均值对所述功率的变化速率进行估计;
通过区间估计确定所述功率的变化速率的真实值位于的置信区间;
根据所述置信区间内是否不包括零,判断所述目标风电机组在所述时间窗口内是否处于非稳态工况,若是,则将非稳态数据剔除。
9.根据权利要求7或8所述的系统,其特征在于,所述选取的运行工况特征参数包括:风速、风向、扭矩、转速、环境温度和负荷,所述筛选模块,具体用于:
确定每个所述运行工况特征参数在自身变化范围内的最大值和最小值,并获取预设的每个所述运行工况特征参数的工况划分间隔;
通过以下公式进行等间隔工况划分:
Ci=(Si,Si+ΔS)∩(Di,Di+ΔD)∩(Mi,Mi+ΔM)∩(Ni,Ni+ΔN)∩(Ti,Ti+ΔT)∩(Pi,Pi+ΔP)
s.t.Si<<Smin,Si+ΔS>>Smax,Di<<Dmin,Di+ΔD>>Dmax,Mi<<Mmin,Mi+ΔM>>Mmax,Ni<<Nmin,Ni+ΔN>>Nmax,Ti<<Tmin,Ti+ΔT>>Tmax,Pi<<Pmin,Pi+ΔP>>Pmax
其中,S是风速,D是风向,M是扭矩,N是转速,T是环境温度,P是负荷;
从划分后的全部工况中剔除无效工况,直至剩余有效工况的数目大于理论工况总数的预设比例。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的风电机组的运行数据异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210261000.1A CN114623050A (zh) | 2022-03-16 | 2022-03-16 | 风电机组的运行数据异常检测方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210261000.1A CN114623050A (zh) | 2022-03-16 | 2022-03-16 | 风电机组的运行数据异常检测方法、系统及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114623050A true CN114623050A (zh) | 2022-06-14 |
Family
ID=81901202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210261000.1A Pending CN114623050A (zh) | 2022-03-16 | 2022-03-16 | 风电机组的运行数据异常检测方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114623050A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115640503A (zh) * | 2022-10-25 | 2023-01-24 | 北京华控智加科技有限公司 | 风电机组叶片异常检测方法和装置 |
CN116146515A (zh) * | 2022-11-15 | 2023-05-23 | 安徽智质工程技术有限公司 | 一种水泥厂离心风机设备异常检测方法 |
CN116447089A (zh) * | 2023-06-19 | 2023-07-18 | 华电电力科学研究院有限公司 | 一种风电机组的运行状态检测方法、装置及介质 |
CN116565861A (zh) * | 2023-07-10 | 2023-08-08 | 广东电网有限责任公司江门供电局 | 一种配电网可靠性评估方法、系统、设备和介质 |
CN117406161A (zh) * | 2023-12-11 | 2024-01-16 | 普华讯光(北京)科技有限公司 | 一种计量装置量值偏离度预警方法、系统、设备及介质 |
CN117540332A (zh) * | 2024-01-10 | 2024-02-09 | 北京名道恒通信息技术有限公司 | 多工况离群点检测模型确定方法及多工况离群点检测方法 |
CN117706360A (zh) * | 2024-02-02 | 2024-03-15 | 深圳市昱森机电有限公司 | 电机运行状态的监测方法、装置、设备及存储介质 |
CN117874663A (zh) * | 2024-01-17 | 2024-04-12 | 内蒙古工业大学 | 一种风力发电机异常诊断装置及其诊断方法 |
CN118242234A (zh) * | 2024-05-28 | 2024-06-25 | 陕西立拓科源科技有限公司 | 一种风力驱动机监测方法及系统 |
-
2022
- 2022-03-16 CN CN202210261000.1A patent/CN114623050A/zh active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115640503A (zh) * | 2022-10-25 | 2023-01-24 | 北京华控智加科技有限公司 | 风电机组叶片异常检测方法和装置 |
CN115640503B (zh) * | 2022-10-25 | 2023-08-11 | 北京华控智加科技有限公司 | 风电机组叶片异常检测方法和装置 |
CN116146515A (zh) * | 2022-11-15 | 2023-05-23 | 安徽智质工程技术有限公司 | 一种水泥厂离心风机设备异常检测方法 |
CN116447089B (zh) * | 2023-06-19 | 2023-08-25 | 华电电力科学研究院有限公司 | 一种风电机组的运行状态检测方法、装置及介质 |
CN116447089A (zh) * | 2023-06-19 | 2023-07-18 | 华电电力科学研究院有限公司 | 一种风电机组的运行状态检测方法、装置及介质 |
CN116565861B (zh) * | 2023-07-10 | 2023-10-03 | 广东电网有限责任公司江门供电局 | 一种配电网可靠性评估方法、系统、设备和介质 |
CN116565861A (zh) * | 2023-07-10 | 2023-08-08 | 广东电网有限责任公司江门供电局 | 一种配电网可靠性评估方法、系统、设备和介质 |
CN117406161A (zh) * | 2023-12-11 | 2024-01-16 | 普华讯光(北京)科技有限公司 | 一种计量装置量值偏离度预警方法、系统、设备及介质 |
CN117406161B (zh) * | 2023-12-11 | 2024-04-02 | 普华讯光(北京)科技有限公司 | 一种计量装置量值偏离度预警方法、系统、设备及介质 |
CN117540332A (zh) * | 2024-01-10 | 2024-02-09 | 北京名道恒通信息技术有限公司 | 多工况离群点检测模型确定方法及多工况离群点检测方法 |
CN117874663A (zh) * | 2024-01-17 | 2024-04-12 | 内蒙古工业大学 | 一种风力发电机异常诊断装置及其诊断方法 |
CN117706360A (zh) * | 2024-02-02 | 2024-03-15 | 深圳市昱森机电有限公司 | 电机运行状态的监测方法、装置、设备及存储介质 |
CN118242234A (zh) * | 2024-05-28 | 2024-06-25 | 陕西立拓科源科技有限公司 | 一种风力驱动机监测方法及系统 |
CN118242234B (zh) * | 2024-05-28 | 2024-07-19 | 陕西立拓科源科技有限公司 | 一种风力驱动机监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114623050A (zh) | 风电机组的运行数据异常检测方法、系统及介质 | |
CN110414155B (zh) | 一种带有单测点的风机部件温度异常检测和报警方法 | |
CN113255848B (zh) | 基于大数据学习的水轮机空化声信号辨识方法 | |
Zheng et al. | A review on non-model based diagnosis methodologies for PEM fuel cell stacks and systems | |
CN112036042B (zh) | 一种基于变分模态分解的动力设备异常检测方法及系统 | |
CN103675525B (zh) | 基于多svdd模型的dc‑dc变换器健康监测与故障预测方法 | |
CN116380445B (zh) | 基于振动波形的设备状态诊断方法及相关装置 | |
WO2023165006A1 (zh) | 基于健康状态指数的工业设备预测性维护方法、装置和电子设备 | |
CN103631145B (zh) | 基于监控指标切换的多工况过程监控方法和系统 | |
CN117074961A (zh) | 一种变分自编码器动力电池异常检测方法、系统、装置及存储介质 | |
CN111273125A (zh) | 基于rst-cnn的电力电缆沟道故障诊断方法 | |
CN114912640A (zh) | 基于深度学习的发电机组的异常模式检测方法及系统 | |
WO2023065580A1 (zh) | 风电机组齿轮箱的故障诊断方法及装置 | |
CN114118219A (zh) | 基于数据驱动的长期加电设备健康状态实时异常检测方法 | |
CN117273489A (zh) | 光伏状态评估方法及装置 | |
CN111695452A (zh) | 基于rbf神经网络的并联电抗器内部老化程度评估方法 | |
CN117371207A (zh) | 一种特高压换流阀状态评价方法、介质及系统 | |
CN117668684A (zh) | 基于大数据分析的电网电能数据异常检测方法 | |
CN117471346A (zh) | 用于确定退役电池模组剩余寿命和健康状态的方法及系统 | |
CN115081331A (zh) | 一种基于状态参数重构误差的风电机组运行状态异常检测方法 | |
CN114742363A (zh) | 风电机组的能效状态评价方法、系统及介质 | |
CN114116832A (zh) | 一种基于数据驱动的配电网异常识别方法 | |
CN112580254B (zh) | 一种基于多级决策融合的换流变多维度分析和预警方法 | |
CN116629843B (zh) | 智能化柴油发电机组的远程预警与维护决策支持系统 | |
CN116842464A (zh) | 一种电池系统soc估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |