CN108590982B - 一种风电机组限功率运行的异常数据处理方法 - Google Patents

一种风电机组限功率运行的异常数据处理方法 Download PDF

Info

Publication number
CN108590982B
CN108590982B CN201810250870.2A CN201810250870A CN108590982B CN 108590982 B CN108590982 B CN 108590982B CN 201810250870 A CN201810250870 A CN 201810250870A CN 108590982 B CN108590982 B CN 108590982B
Authority
CN
China
Prior art keywords
power
wind speed
probability
value
limited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810250870.2A
Other languages
English (en)
Other versions
CN108590982A (zh
Inventor
马远驰
刘永前
杨志凌
韩爽
李莉
阎洁
王一妹
邵振洲
张路娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201810250870.2A priority Critical patent/CN108590982B/zh
Publication of CN108590982A publication Critical patent/CN108590982A/zh
Application granted granted Critical
Publication of CN108590982B publication Critical patent/CN108590982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D17/00Monitoring or testing of wind motors, e.g. diagnostics
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2260/00Function
    • F05B2260/82Forecasts
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F05INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
    • F05BINDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
    • F05B2260/00Function
    • F05B2260/84Modelling or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Sustainable Development (AREA)
  • Sustainable Energy (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Wind Motors (AREA)

Abstract

本发明公开了属于风电场技术领域的一种风电机组限功率运行的异常数据处理方法。通过引入风电机组限电运行状态下的合理假设,将风电机组限功率运行下的数据处理问题转化为混合概率分布模型,应用K‑Means聚类算法初始化模型参数,然后根据期望值最大化(EM)算法,推导参数更新表达式,通过迭代的方式最大化对数似然函数,得到最优模型参数,以实现限功率运行状态下风电机组异常运行数据的进行处理;本发明可以找出限功率异常运行数据,区分不同限功率程度的运行数据。并剔除离群异常数据点,得到快速稳定的数据处理效果。

Description

一种风电机组限功率运行的异常数据处理方法
技术领域
本发明属于风电场技术领域,特别涉及一种风电机组限功率运行的异常数据处理方法。
背景技术
风能是可再生能源中发展最快且最具有开发价值的清洁能源之一,而风力发电是风能开发利用的主要形式。近年来我国风电产业发展迅速,风电场积累了大量的风电机组运行数据。风电场的历史运行数据尤其是风速和风电功率数据对风电场的运行管理和电力系统的运行调度都具有重要意义;风电机组运行数据是进行风电机组健康状态评估和风电功率预测不可或缺的数据,也是电力系统调度部门制定风电场调度计划的重要参考。
上述的几方面的应用对运行数据的质量都有较高的要求,然而,实际机组的运行数据质量较差,原始运行数据通常难以达到直接应用的要求。影响运行数据质量的因素有很多,比如传感器自身的误差,恶劣的运行环境导致仪器测量精度下降,数据存储和传输故障以及风电场弃风限电等。在应用中,为达到数据质量要求,必须要经过数据处理;数据处理一般包括四个部分:缺失数据处理、重复数据处理、异常数据处理以及不一致数据处理。对于风电机组运行状态评估以及风电功率预测等实际应用来说,异常数据的识别和处理是数据预处理的重要方面,而异常数据出现的最主要原因是风电场弃风限电,从而如何准确快速识别由限功率运行造成的数据异常是重要的研究方向。
现有的异常数据处理方式存在着实用性差、通用性不强、识别率较低、速度慢等问题,而且在筛选过程中难以避免人的主观因素影响,难以适用于运行数据量日益增加的风电场。基于以上问题,本发明提出了一种风电机组限功率运行数据清洗方法,在风电数据中掺杂了大量不同程度的限功率数据的情况下,可以准确快速的进行识别筛选,使风电数据达到较高的质量水平。
风电机组原始运行数据中通常掺杂有大量异常数据,这些异常数据由多种原因导致,而现存的数据清洗方法较难针对多种运行工况下产生的复杂运行数据进行有效的数据清洗。针对以上问题,本发明提出的一种风电机组限功率运行数据清洗方法,该方法把异常运行数据分为由限电导致的限功率数据和由其他原因产生的离群数据,可以解决如下技术问题:快速高效辨识运行数据中存在的限功率程度类别,区分正常运行数据和不同程度的限功率数据,并且剔除每一类数据中的离群数据,实现风电机组原始运行数据的数据处理工作,提高风电机组运行数据质量。
发明内容
本发明的目的是提出一种风电机组限功率运行的异常数据处理方法,其特征在于,该方法包括以下步骤:
步骤1:引入风电机组限功率程度和限功率出力假设,设随机变量x,y,z分别代表风电机组输出功率、机舱的风速以及限功率程度,其中,x是连续型随机变量,y,z是离散型随机变量。
假设机组的限功率程度z用有限的限功率状态来表示,并假设风电机组的限功率程度z取K个不同的值,分别对应机组正常运行状态和K-1种不同限电程度的限功率运行状态。
假设风电机组限功率出力等于理论功率输出与对应的限功率系数相乘;假设在某一限功率程度下,风电机组的限功率运行曲线表示为x=αkf(y),其中,f(y)为风电机组理论功率曲线函数,αk为第k个限功率状态对应的限功率系数,其取值范围αk∈[0,1],αk取值越小,则代表机组的限功率程度越大,αk取值越趋近于1,则表示机组状态越趋近于正常发电状态;
步骤2:建立混合概率分布模型,将风速y离散化,把风速分布范围均匀划分成J个风速区间,以各风速区间中值代表区间风速值;假设在风速和限功率程度给定的情况下,机组输出功率服从高斯分布,且分布均值等于限功率输出,即x|y=j,z=k~N(μjkjk),并且μjk=αkf(y(i)),μjk、σjk分别表示在给定风速区间j和限功率程度k的高斯分布均值和标准差;假设风速服从多项式分布,即y~Multinomial(ψ),其中风速概率分布参数向量ψ是多项式分布的分布参数,风速概率分布参数向量ψ第j个元素满足ψj≥0,
Figure GDA0002543363460000031
且p(y=j)=ψj;不同于风速和功率,机组限功率程度z无法直接观测,为隐含随机变量,假设限功率程度也服从多项式分布,即z~Multinomial(φ),其中向量φ的第k个元素满足φk≥0,
Figure GDA0002543363460000032
且p(z=k)=φk;此外,风速y和限功率程度z相互独立,因此p(y|z)=p(y);根据边缘概率分布p(z)和条件概率分布p(y|z)和p(x|y,z)计算联合概率分布p(x,y,z)=p(x|y,z)p(y|z)p(z),机组输出功率的概率分布模型可通过求联合概率分布的边缘概率得到,即:
Figure GDA0002543363460000033
式中,p(x)表示机组输出功率x的边缘概率分布,p(y=j)表示风速y的值落入第j个风速区间的概率;p(z=k)表示限功率程度取k时的概率值;p(y=j|z=k)表示在限功率程度取k的条件下风速落入第j个风速区间的条件概率;p=(x|y=j,z=k)表示在限功率程度为k、风速取值落入第j个风速区间的条件下,机组输出功率的条件概率;根据上述概率分布假设,若得到分布函数参数,则求出式(1)中各项的概率值;
步骤3:初始化混合概率模型参数;
步骤4:用EM算法寻找步骤3中建立的混合概率分布模型参数的最大似然估计;
步骤5:根据步骤4得到混合概率分布模型参数计算给定样本下的不同限功率程度下的后验概率,根据最大后验概率将运行数据划分到不同限功率程度对应的类别中;具体包括:
步骤51:计算p(z=k∣x=x(i),y=y(i)),即为样本点(x(i),y(i))属于限功率程度k的后验概率值,样本i的限功率程度
Figure GDA0002543363460000041
Figure GDA0002543363460000042
即风速和功率在不同限功率程度下的最大后验概率作为其所属的限功率程度类别;
步骤52:根据预先确定的概率决策阈值θ,剔除后验概率小于等于该决策阈值的离群异常数据点,保留剩余样本数据。经过数据清洗后的不同程度的限功率数据集合为:
Figure GDA0002543363460000043
实现不同限功率程度的运行数据的区分,并剔除离群数据。
所述步骤3包括如下步骤:
步骤31:采用线性插值方法,根据理论功率散点数据得出理论功率曲线函数x=f(y);
步骤32:随机初始化α=[α1,…,αK],ψ=[ψ1,…,ψK],φ=[φ1,…,φK],μjk
Figure GDA0002543363460000044
步骤33:采集机组观测样本集{(x(1),y(1)),…,(x(m),y(m))},其中,m为机组观测样本集的样本总数,x(i)表示机组出力样本,y(i)表示对应的风速样本;对每个样本i,计算(x(i),y(i))到理论限功率运行功率曲线的距离
Figure GDA0002543363460000051
Figure GDA0002543363460000052
找出样本到各条限功率运行曲线的距离最小的一条曲线对应的限功率程度作为样本(x(i),y(i))的限功率程度,记为
Figure GDA0002543363460000053
样本i距离对应限功率运行曲线的距离记为
Figure GDA0002543363460000054
步骤34:对同一限功率程度的样本集合{(x(i),y(i))∣c(i)=k},用最小二乘拟合限功率运行曲线x(i)=αkf(y(i)),并更新对应的限功率系数αk
步骤35:不断重复交替进行步骤33和步骤34的过程直到收敛;
步骤36:令K依次取2-8,重复步骤32到步骤35若干次,计算所有样本的平均损失值
Figure GDA0002543363460000055
取各次的损失的平均值,以该均值作为纵轴,K值作为横轴作肘形曲线,取平均损失函数值下降幅度最大的位置对应的K值作为最佳的聚类数;
步骤37:初始化参数ψ,φ,μ,σ:
Figure GDA0002543363460000056
Figure GDA0002543363460000057
Figure GDA0002543363460000058
Figure GDA0002543363460000059
其中指示函数I{c(i)=k,y(i)=j},若大括号内的表达式为真,则指示函数I{c(i)=k,y(i)=j}的取值为1,否则,指示函数I{c(i)=k,y(i)=j}的取值为0;
所述步骤4包括如下步骤:
步骤41:计算
Figure GDA0002543363460000061
Figure GDA0002543363460000062
其中,
Figure GDA0002543363460000063
表示给定机组出力为x(i)的条件下风速落入风速区间j,限功率程度取k的条件概率值;p(y(i)=j)表示样本i的风速处于风速区间j的概率;p(z(i)=k)表示样本i属于限功率程度k的概率;p(x(i)|y(i)=j,z(i)=k)表示在给定风速属于区间j,限功率程度属于k的条件下,功率取值为x(i)的条件概率值;
步骤42:
更新
Figure GDA0002543363460000064
更新
Figure GDA0002543363460000065
更新
Figure GDA0002543363460000066
更新μjk=αkf(y(i)=j) (11)
更新
Figure GDA0002543363460000067
其中,m为机组观测样本集的样本总数;
步骤43:不断重复交替进行步骤41和步骤42的过程直到收敛;m为机组观测样本集的样本总数。
本发明的有益效果是通过引入风电机组限电运行状态下的合理假设,将风电机组限功率运行下的数据处理问题转化为混合概率分布模型,应用K-Means聚类算法初始化模型参数,然后根据期望值最大化(EM)算法,推导参数更新表达式,通过迭代的方式最大化对数似然函数,得到最优模型参数,以实现限功率运行状态下风电机组异常运行数据的进行处理;因此本发明具有如下优点:
(1)该方法可以找出运行数据中含有几种不同程度的限功率运行状态。
(2)该方法可以剔除离群异常数据点,并能区分不同限功率程度的运行数据。
(3)应用K-Means算法初始化模型参数可以有效避免因随机初始化导致的收敛到不同的局部最优点的情况,可以得到快速稳定的数据处理效果。
附图说明
图1为风电机组限功率运行数据处理流程图。
图2为混合概率分布模型示意图。
图3为未经过处理的风速、功率散点示意图。
图4为肘部曲线。
图5为不同限功率程度下的数据处理结果示意图,其中(a)风速、功率散点图,(b)正常运行状态,(c)限功率程度1,(d)限功率程度2。
具体实施方式
本发明提出一种风电机组限功率运行的异常数据处理方法,下面结合附图和实施例对本发明作详细说明。
如图1所示为风电机组限功率运行的异常数据处理流程图。包括以下步骤:
步骤1:引入风电机组限功率程度和限功率出力假设,设随机变量x,y,z分别代表风电机组输出功率、机舱的风速以及限功率程度,其中,x是连续型随机变量,y,z是离散型随机变量;
假设机组的限功率程度z用有限的限功率状态来表示,并假设风电机组的限功率程度z取K个不同的值,分别对应机组正常运行状态和K-1种不同限电程度的限功率运行状态;
假设风电机组限功率出力等于理论功率输出与对应的限功率系数相乘;假设在某一限功率程度下,风电机组的限功率运行曲线表示为x=αkf(y),其中,f(y)为风电机组理论功率曲线函数,αk为第k个限功率状态对应的限功率系数,其取值范围αk∈[0,1],αk取值越小,则代表机组的限功率程度越大,αk取值越趋近于1,则表示机组状态越趋近于正常发电状态;
步骤2:建立混合概率分布模型,将风速y离散化,把风速分布范围均匀划分成J个风速区间,以各风速区间中值代表区间风速值;假设在风速和限功率程度给定的情况下,机组输出功率服从高斯分布,且分布均值等于限功率输出,即x|y=j,z=k~N(μjkjk),并且μjk=αkf(y(i)),μjk、σjk分别表示在给定风速区间j和限功率程度k的高斯分布均值和标准差;假设风速服从多项式分布,即y~Multinomial(ψ),其中风速概率分布参数向量ψ是多项式分布的分布参数,风速概率分布参数向量ψ第j个元素满足ψj≥0,
Figure GDA0002543363460000081
且p(y=j)=ψj;不同于风速和功率,机组限功率程度z无法直接观测,为隐含随机变量,假设限功率程度也服从多项式分布,即z~Multinomial(φ),其中向量φ的第k个元素满足φk≥0,
Figure GDA0002543363460000082
且p(z=k)=φk;此外,风速y和限功率程度z相互独立,因此p(y|z)=p(y);根据边缘概率分布p(z)和条件概率分布p(y|z)和p(x|y,z)计算联合概率分布p(x,y,z)=p(x|y,z)p(y|z)p(z),机组输出功率的概率分布模型可通过求联合概率分布的边缘概率得到,即:
Figure GDA0002543363460000083
式中,p(x)表示机组输出功率x的边缘概率分布,p(y=j)表示风速y的值落入第j个风速区间的概率;p(z=k)表示限功率程度取k时的概率值;p(y=j|z=k)表示在限功率程度取k的条件下风速落入第j个风速区间的条件概率;p=(x|y=j,z=k)表示在限功率程度为k、风速取值落入第j个风速区间的条件下,机组输出功率的条件概率;根据上述概率分布假设,若得到分布函数参数,则求出式(1)中各项的概率值;
步骤3:初始化混合概率模型参数,该模型包含的参数为:聚类数K;离散化风速区间数量J;理论功率曲线函数x=f(y);限功率系数α=[α1,…,αK],限功率程度分布参数φ=[φ1,…,φK],离散化风速概率分布参数ψ=[ψ1,…,ψK]和高斯分布的均值参数μjk和方差参数
Figure GDA0002543363460000091
首先给定聚类数K和离散化风速区间数量J;其余参数初始化包括以下步骤:
步骤31:采用线性插值方法,根据理论功率散点数据得出理论功率曲线函数x=f(y);
步骤32:随机初始化α=[α1,…,αK],ψ=[ψ1,…,ψK],φ=[φ1,…,φK],μjk
Figure GDA0002543363460000092
步骤33:采集机组观测样本集{(x(1),y(1)),…,(x(m),y(m))},其中,m为机组观测样本集的样本总数,x(i)表示机组出力样本,y(i)表示对应的风速样本;对每个样本i,计算(x(i),y(i))到理论限功率运行功率曲线的距离
Figure GDA0002543363460000093
Figure GDA0002543363460000094
找出样本到各条限功率运行曲线的距离最小的一条曲线对应的限功率程度作为样本(x(i),y(i))的限功率程度,记为
Figure GDA0002543363460000095
样本i距离对应限功率运行曲线的距离记为
Figure GDA0002543363460000096
步骤34:对同一限功率程度的样本集合{(x(i),y(i))∣c(i)=k},用最小二乘拟合限功率运行曲线x(i)=αkf(y(i)),并更新对应的限功率系数αk
步骤35:不断重复交替进行步骤33和步骤34的过程直到收敛。
步骤36:令K依次取2-8,重复步骤32到步骤35若干次,计算所有样本的平均损失值
Figure GDA0002543363460000101
取各次的损失的平均值,以该均值作为纵轴,K值作为横轴作肘形曲线,取平均损失函数值下降幅度最大的位置对应的K值作为最佳的聚类数;
步骤37:初始化参数ψ,φ,μ,σ,其中:
Figure GDA0002543363460000102
Figure GDA0002543363460000103
Figure GDA0002543363460000104
Figure GDA0002543363460000105
其中指示函数I{c(i)=k,y(i)=j},若大括号内的表达式为真,则指示函数I{c(i)=k,y(i)=j}的取值为1,否则,指示函数I{c(i)=k,y(i)=j}的取值为0;
步骤4:以步骤3中得到的参数作为初始值,用EM算法最大化混合概率分布模型的似然函数,得出概率分布参数;该步骤包括:
步骤41:计算
Figure GDA0002543363460000106
Figure GDA0002543363460000107
其中,
Figure GDA0002543363460000108
表示给定机组出力为x(i)的条件下风速落入风速区间j,限功率程度取K的条件概率值;p(y(i)=j)表示样本i的风速处于风速区间j的概率;p(z(i)=k)表示样本i属于限功率程度k的概率;p(x(i)|y(I)=j,z(i)=k)表示在给定风速属于区间j,限功率程度属于k的条件下,功率取值为x(i)的条件概率值;
步骤42:
更新
Figure GDA0002543363460000111
更新
Figure GDA0002543363460000112
更新
Figure GDA0002543363460000113
更新μjk=αkf(y(i)=j) (11)
更新
Figure GDA0002543363460000114
其中,m为机组观测样本集的样本总数;
步骤43:不断重复交替进行步骤41和步骤42的过程直到收敛;
该步骤的推导过程如下:
由于混合概率模型中含有无法观测的隐含随机变量z,直接求对数似然函数的最大值比较困难,根据EM算法,我们转而去求似然函数的下界(E-step),然后最大化这个下界(M-step),通过不断重复E-setp和M-step来优化模型参数。首先求似然函数的下界。根据Jenson不等式,可得到下面的不等式:
Figure GDA0002543363460000121
其中,l(α,φ,σ)为混合概率模型对数似然函数;Qi代表某个分布,不等式取等号的条件是
Figure GDA0002543363460000122
为常数,根据
Figure GDA0002543363460000123
可得:
Figure GDA0002543363460000124
步骤41中的
Figure GDA0002543363460000125
即为Qi(y(i)=j,z(i)=k);另L(α,φ,σ)等于式(13)不等号右边项,Qi(y(i),z(i))取式(14)所示,则对数似然函数的下界表示为:
Figure GDA0002543363460000126
得到对数似然函数的下界,我们求其对参数α,φ,σ的最大值;求L对αq的偏导:
Figure GDA0002543363460000127
另上式等于零可求出:
Figure GDA0002543363460000131
得到αq可以求得μpq
μpq=αqf(y(i)=p) (18)
求L对σpq的偏导:
Figure GDA0002543363460000132
另上式等于零得:
Figure GDA0002543363460000133
Figure GDA0002543363460000134
用拉格朗日乘数法,求
Figure GDA0002543363460000135
对φk和λ的偏导:
Figure GDA0002543363460000136
Figure GDA0002543363460000137
另上两式等于零,联立求解得:
Figure GDA0002543363460000138
同理可解得:
Figure GDA0002543363460000139
算法的收敛性的由EM算法保证,这里省略证明。但是,EM算法只能收敛到局部最优,因此受初值影响较大,步骤3中的初始化可以帮助算法收敛到较好局部最优点上。
实施例1
以中国西北地区某风电场2.5MW变桨距变速型风电机组的SCADA数据验证本发明。中国西北地区风电场弃风限电现象非常严重,适于研究限功率条件下的数据处理方法;包括以下步骤:
步骤1:确定概率决策阈值θ和风速区间数量J。在本实施例中,原始未经处理的含有大量限功率运行数据的风速、功率散点图如图3所示;这里,设置J=50,θ=0.8;
步骤2:根据理论功率曲线散点,通过线性插值方法确定理论功率曲线函数x=f(y);
步骤3:建立混合概率分布模型(如图2所示),并初始化参数;
步骤4:根据肘部曲线,确定最佳的聚类数K,在本实施例中,肘部曲线如图4所示,可以得到最佳的聚类数K为3,即可以得出,在这组运行数据中含有1种正常运行状态和2种不同程度的限功率运行状态;
步骤5:用EM算法通过迭代求解混合概率模型参数的最大似然估计;
步骤6:计算后验概率p(z(i)=k∣x(i),y(i)),取最大后验概率对应的类别
Figure GDA0002543363460000141
Figure GDA0002543363460000142
根据概率决策阈值θ,剔除离群异常数据点;如图5所示的经过数据处理后的不同程度的限功率数据,其中(a)风速、功率散点图,(b)正常运行状态,(c)限功率程度1,(d)限功率程度2。

Claims (2)

1.一种风电机组限功率运行的异常数据处理方法,其特征在于,该方法包括以下步骤:
步骤1:引入风电机组限功率程度和限功率出力假设,设随机变量x,y,z分别代表风电机组输出功率、机舱的风速以及限功率程度,其中,x是连续型随机变量,y,z是离散型随机变量;
假设机组的限功率程度z用有限的限功率状态来表示,并假设风电机组的限功率程度z取K个不同的值,分别对应机组正常运行状态和K-1种不同限电程度的限功率运行状态;
假设风电机组限功率出力等于理论功率输出与对应的限功率系数相乘;假设在某一限功率程度下,风电机组的限功率运行曲线表示为x=αkf(y),其中,f(y)为风电机组理论功率曲线函数,αk为第k个限功率状态对应的限功率系数,其取值范围αk∈[0,1],αk取值越小,则代表机组的限功率程度越大,αk取值越趋近于1,则表示机组状态越趋近于正常发电状态;
步骤2:建立混合概率分布模型,将风速y离散化,把风速分布范围均匀划分成J个风速区间,以各风速区间中值代表区间风速值;假设在风速和限功率程度给定的情况下,机组输出功率服从高斯分布,且分布均值等于限功率输出,即x|y=j,x=k~N(μjkjk),并且μjk=αkf(y(i)),μjk、σjk分别表示在给定风速区间j和限功率程度k的高斯分布均值和标准差;假设风速服从多项式分布,即y~Multinomial(ψ),其中风速概率分布参数向量ψ是多项式分布的分布参数,风速概率分布参数向量ψ第j个元素满足ψj≥0,
Figure FDA0002543363450000011
且p(y=j)=ψj;不同于风速和功率,机组限功率程度z无法直接观测,为隐含随机变量,假设限功率程度也服从多项式分布,即z~Multinomial(φ),其中向量φ的第k个元素满足φk≥0,
Figure FDA0002543363450000021
且p(z=k)=φk;此外,风速y和限功率程度z相互独立,因此p(y|z)=p(y);根据边缘概率分布p(z)和条件概率分布p(y|z)和p(x|y,z)计算联合概率分布p(x,y,z)=p(x|y,z)p(y|z)p(z),机组输出功率的概率分布模型可通过求联合概率分布的边缘概率得到,即:
Figure FDA0002543363450000022
式中,p(x)表示机组输出功率x的边缘概率分布,p(y=j)表示风速y的值落入第j个风速区间的概率;p(z=k)表示限功率程度取k时的概率值;p(y=j|z=k)表示在限功率程度取k的条件下风速落入第j个风速区间的条件概率;p=(x|y=j,z=k)表示在限功率程度为k、风速取值落入第j个风速区间的条件下,机组输出功率的条件概率;根据上述概率分布假设,若得到分布函数参数,则求出式(1)中各项的概率值;
步骤3:初始化混合概率模型参数;
步骤4:用EM算法寻找步骤3中建立的混合概率分布模型参数的最大似然估计;
步骤5:根据步骤4得到混合概率分布模型参数计算给定样本下的不同限功率程度下的后验概率,根据最大后验概率将运行数据划分到不同限功率程度对应的类别中;具体包括:
步骤51:计算p(z=k∣x=x(i),y=y(i))即为样本点(x(i),y(i))属于限功率程度k的后验概率值,样本i的限功率程度
Figure FDA0002543363450000023
即风速和功率在不同限功率程度下的最大后验概率作为其所属的限功率程度类别;
步骤52:根据预先确定的概率决策阈值θ,剔除后验概率小于等于该决策阈值的离群异常数据点,保留剩余样本数据;经过数据清洗后的不同程度的限功率数据集合为:
Figure FDA0002543363450000031
实现不同限功率程度的运行数据的区分,并剔除离群数据;
所述步骤3包括如下步骤:
步骤31:采用线性插值方法,根据理论功率散点数据得出理论功率曲线函数x=f(y);
步骤32:随机初始化α=[α1,…,αK],ψ=[ψ1,…,ψK],φ=[φ1,…,φK],μjk
Figure FDA0002543363450000032
步骤33:采集机组观测样本集{(x(1),y(1)),…,(x(m),y(m))},其中,m为机组观测样本集的样本总数,x(i)表示机组出力样本,y(i)表示对应的风速样本;对每个样本i,计算(x(i),y(i))到理论限功率运行功率曲线的距离
Figure FDA0002543363450000033
Figure FDA0002543363450000034
找出样本到各条限功率运行曲线的距离最小的一条曲线对应的限功率程度作为样本(x(i),y(i))的限功率程度,记为
Figure FDA0002543363450000035
样本i距离对应限功率运行曲线的距离记为
Figure FDA0002543363450000036
步骤34:对同一限功率程度的样本集合{(x(i),y(i))∣c(i)=k},用最小二乘拟合限功率运行曲线x(i)=αkf(y(i)),并更新对应的限功率系数αk
步骤35:不断重复交替进行步骤33和步骤34的过程直到收敛;
步骤36:令K依次取2-8,重复步骤32到步骤35若干次,计算所有样本的平均损失值
Figure FDA0002543363450000037
取各次的损失的平均值,以该均值作为纵轴,K值作为横轴作肘形曲线,取平均损失函数值下降幅度最大的位置对应的K值作为最佳的聚类数;
步骤37:初始化参数ψ,φ,μ,σ,其中:
Figure FDA0002543363450000041
Figure FDA0002543363450000042
Figure FDA0002543363450000043
Figure FDA0002543363450000044
其中指示函数I{c(i)=k,y(i)=j},若大括号内的表达式为真,则指示函数I{c(i)=k,y(i)=j}的取值为1,否则,指示函数I{c(i)=k,y(i)=j}的取值为0。
2.根据权利要求1所述风电机组限功率运行的异常数据处理方法,其特征在于,所述步骤4包括如下步骤:
步骤41:计算
Figure FDA0002543363450000045
Figure FDA0002543363450000046
其中,
Figure FDA0002543363450000047
表示给定机组出力为x(i)的条件下风速落入风速区间j,限功率程度取k的条件概率值;p(y(i)=j)表示样本i的风速处于风速区间j的概率;p(z(i)=k)表示样本i属于限功率程度k的概率;p(x(i)|y(i)=j,z(i)=k)表示在给定风速属于区间j,限功率程度属于k的条件下,功率取值为x(i)的条件概率值;
步骤42:
更新
Figure FDA0002543363450000048
更新
Figure FDA0002543363450000051
更新
Figure FDA0002543363450000052
更新μjk=αkf(y(i)=j) (11)
更新
Figure FDA0002543363450000053
其中,m为机组观测样本集的样本总数;
步骤43:不断重复交替进行步骤41和步骤42的过程直到收敛。
CN201810250870.2A 2018-03-26 2018-03-26 一种风电机组限功率运行的异常数据处理方法 Active CN108590982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810250870.2A CN108590982B (zh) 2018-03-26 2018-03-26 一种风电机组限功率运行的异常数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810250870.2A CN108590982B (zh) 2018-03-26 2018-03-26 一种风电机组限功率运行的异常数据处理方法

Publications (2)

Publication Number Publication Date
CN108590982A CN108590982A (zh) 2018-09-28
CN108590982B true CN108590982B (zh) 2020-08-11

Family

ID=63623626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810250870.2A Active CN108590982B (zh) 2018-03-26 2018-03-26 一种风电机组限功率运行的异常数据处理方法

Country Status (1)

Country Link
CN (1) CN108590982B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109669935A (zh) * 2018-12-13 2019-04-23 平安医疗健康管理股份有限公司 检查数据筛选方法、装置、设备及存储介质
CN109727446B (zh) * 2019-01-15 2021-03-05 华北电力大学(保定) 一种用电数据异常值的识别与处理方法
CN110134919B (zh) * 2019-04-30 2020-12-15 华北电力大学 风电机组异常数据清洗方法
CN110224391B (zh) * 2019-05-10 2022-06-24 广西电网有限责任公司电力科学研究院 一种混合概率-区间最优潮流的求解方法
CN111145109B (zh) * 2019-12-09 2023-03-31 深圳先进技术研究院 基于图像的风力发电功率曲线异常数据识别与清洗方法
CN113007019B (zh) * 2019-12-19 2022-10-18 新疆金风科技股份有限公司 控制器、控制系统以及风力发电机组
CN111563543B (zh) * 2020-04-26 2023-07-04 国网冀北电力有限公司电力科学研究院 一种风电机组的风速-发电功率数据的清洗方法及装置
CN113847195B (zh) * 2020-06-28 2023-06-02 北京金风科创风电设备有限公司 风力发电机组及其避转速控制方法、装置
CN112213584B (zh) * 2020-09-29 2024-04-09 阳光智维科技股份有限公司 一种逆变器限功率运行诊断方法、装置及监控设备
CN112267972B (zh) * 2020-10-22 2023-05-05 华能国际电力股份有限公司 一种风电机组功率曲线异常智能判定方法
CN113339207B (zh) * 2021-06-29 2023-05-26 浙江理工大学 一种风电机组主传动系统的运行工况划分方法及系统
CN116123041A (zh) * 2023-02-16 2023-05-16 中国长江三峡集团有限公司 一种风力发电机限功率过程识别方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103291544B (zh) * 2013-06-21 2016-01-13 华北电力大学 数字化风电机组功率曲线绘制方法
JP2016084714A (ja) * 2014-10-23 2016-05-19 Ntn株式会社 風力発電装置の異常監視装置
CN105134484A (zh) * 2015-07-28 2015-12-09 国家电网公司 风电功率异常数据点的识别方法
CN105528735B (zh) * 2015-12-03 2019-05-31 甘肃省电力公司风电技术中心 基于量测风速与空间相关性的异常数据点的校正方法

Also Published As

Publication number Publication date
CN108590982A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108590982B (zh) 一种风电机组限功率运行的异常数据处理方法
CN111275288B (zh) 基于XGBoost的多维数据异常检测方法与装置
Zheng et al. Raw wind data preprocessing: a data-mining approach
CN106529719B (zh) 基于粒子群优化算法风速融合的风电功率预测的方法
CN105467975B (zh) 一种设备故障诊断方法
CN106447098B (zh) 一种光伏超短期功率预测方法及装置
CN112800682B (zh) 一种反馈寻优的风机叶片故障监测方法
CN106548270B (zh) 一种光伏电站功率异常数据辨识方法及装置
CN110717610B (zh) 一种基于数据挖掘的风电功率预测方法
CN104573876A (zh) 基于时序长记忆模型的风电场短期风速预测方法
CN109902339A (zh) 一种基于iaga-svm的滚动轴承故障诊断方法
CN116911806B (zh) 基于互联网+的电力企业能源信息管理系统
CN110007660B (zh) 一种火电厂汽轮机组瞬态等效热应力在线软测量方法
CN106640547B (zh) 监测风电机组状态的方法及系统
CN109933040B (zh) 基于层次密度峰值聚类和最相似模态的故障监测方法
CN116910556A (zh) 电厂设备异常检测方法、训练方法、装置、设备和介质
CN110795841B (zh) 一种间歇性能源出力不确定性的数学建模方法
CN117633688A (zh) 一种基于岭回归-k均值聚类-LOF-LSTM融合算法的大规模电力数据异常检测方法
CN114548295A (zh) 基于多尺度领域自适应网络的轴承故障分类系统及方法
Zhang et al. An improved association rule mining-based method for discovering abnormal operation patterns of HVAC systems
Yao et al. Power curve modeling for wind turbine using hybrid-driven outlier detection method
CN113449920A (zh) 一种风电功率预测方法、系统及计算机可读介质
CN113048012A (zh) 基于混合高斯模型的风电机组偏航角度识别方法和装置
CN117151488A (zh) 一种寒潮大风天气样本扩充方法、系统、存储介质及设备
Haiyan et al. Fuzzy soft relation and its application in decision making

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant