CN107067100A

CN107067100A - 风电功率异常数据辨识方法及辨识装置

Info

Publication number: CN107067100A
Application number: CN201710055628.5A
Authority: CN
Inventors: 崔正湃; 乔颖; 王靖然; 吴晓刚; 王若阳; 徐海翔; 鲁宗相; 孙荣富
Original assignee: Tsinghua University; State Grid Corp of China SGCC; State Grid Jibei Electric Power Co Ltd
Current assignee: Tsinghua University; State Grid Corp of China SGCC; State Grid Jibei Electric Power Co Ltd
Priority date: 2017-01-25
Filing date: 2017-01-25
Publication date: 2017-08-18
Anticipated expiration: 2037-01-25
Also published as: CN107067100B

Abstract

本发明涉及一种风电功率异常数据辨识方法，其中，所述方法包括：根据异常数据的来源和时间序列的不规则变化，将异常数据进行分类，得到异常数据分类结果；根据异常数据的分类结果，获取异常数据判断标准；根据异常数据判断标准，对同时段风电功率序列和风速序列分别进行概率变点分析，辨识时间序列中的不规则突变；根据风电功率序列和风速序列建立混合回归模型，根据各回归变量重要性排序的变化，获得风电功率序列中的模型变点。本发明还涉及一种风电功率异常数据辨识装置。本发明提供的风电功率异常数据辨识方法和装置能够对风电功率异常数据进行准确辨识。

Description

风电功率异常数据辨识方法及辨识装置

技术领域

本发明涉及一种风电功率异常数据辨识方法及辨识装置，尤其涉及一种基于变点分析的风电功率异常数据辨识方法及辨识装置，属于电力系统预测与控制技术领域。

背景技术

风电大规模并网背景下，其具有的波动性和随机性给传统电力系统的安全稳定运行带来巨大挑战，风电功率预测技术是帮助解决这一问题的重要手段。目前用于生产实践的功率预测系统大多采用数值天气预报(NWP)和统计学相结合的方法，不仅用到未来的天气预报情况，还用到了历史实际运行数据。历史样本是统计学方法的研究对象，其质量好坏对风电功率预测统计学方法建模效果影响很大。原始数据预处理可以为串行模式下充分发挥样本统计特性对预测精度的提升作用提供可靠的数据基础，也是风电功率预测系统的必备环节。

以往的研究当中常用控制图方法来辨识风电功率数据中的异常值，然而，基于控制图原理的风电功率异常数据辨识方法中，大部分分散点，不论是错误数据还是不规则数据，都被辨识为异常点去除，无法适用于精细化功率预测，使得风电功率的预测的准确度不够高。

发明内容

综上所述，确有必要提出一种能够准确对风电功率异常数据进行辨识的方法及装置。

一种风电功率异常数据辨识方法，其中，所述方法包括：

根据异常数据的来源和风电功率序列的不规则变化，将异常数据进行分类，得到异常数据分类结果；

根据异常数据的分类结果，建立基于风速序列的异常数据判断标准；

根据预设的异常数据判断标准，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列以及风速时间序列中的不规则突变，根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型；

根据风电功率序列和风速序列建立混合回归模型，根据混合回归模型中各回归变量重要性排序的变化，获得风电功率序列中的模型变点，并根据模型变点识别剩余风电功率异常数据的类型。

在其中一个实施例中，异常数据包括错误数据和不规则数据；错误数据包括在数据量测、传输和保存等环节中由于干扰导致的失真数据；不规则数据包括正常记录存储的数据，但由于极端天气过程引起的第一类不规则数据或人工控制干预而表现异常的数据第二类不规则数据。

在其中一个实施例中，根据风电功率的不规则变化与风速序列的不规则变化对应关系，异常数据包括三种类型：

类型一：若不规则变化变化是由于风资源/风电功率的非平稳、非线性特征导致，则风电功率序列中的异常突变对应于相同或相近时刻风速序列中的突变，为第一类不规则数据；

类型二：若风电功率序列中的异常突变与相同或相近时刻风速序列中的突变不对应，则风电功率序列中的异常突变属于错误数据；以及

类型三：人工控制干预导致的风电功率序列异常数据，为第二类不规则数据。

在其中一个实施例中，基于风速序列的异常数据判断标准包括：

若风电功率序列和风速序列中同时存在的不规则突变则属于第一类不规则数据；

若只在风电功率序列中存在的不规则突变则属于错误数据；

若风速序列不变而风电功率序列中存在的预定时长的不规则变化，为第二类不规则数据。

在其中一个实施例中，所述根据风电功率序列和风速序列建立混合回归模型，根据各回归变量重要性排序的变化，获得风电功率序列中的模型变点的步骤包括：

以风电功率序列的一阶差分结果作为因变量数组，风速序列一阶差分作为自变量数组，建立混合回归模型；

根据各回归变量重要性排序的变化，分析辨识风电功率序列中的模型变点。

在其中一个实施例中，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点包括：

当获得一个概率变点后，将原风电功率序列根据该概率变点位置拆分为前后两个子序列；

分别对每个子序列进行辨识，直到没有新的概率变点被发现，获得风电功率序列中所有的概率变点。

在其中一个实施例中，进一步包括：

利用特殊影响因子对异常数据进行分析，根据正态分布均值的假设检验，获得异常数据的产生与特殊影响因子之间的相关关系。

一种风电功率异常数据辨识装置，其中，所述装置包括：

异常数据分类模块，用于根据异常数据的来源和风电功率序列的不规则变化，将异常数据进行分类，得到异常数据分类结果；

标准建立模块，用于根据异常数据的分类结果，建立基于风速序列的异常数据判断标准；

第一异常数据分析模块，用于根据异常数据判断标准，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列以及风速序列中的不规则突变，根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型；

第二异常数据分析模块，用于根据风电功率序列和风速序列建立混合回归模型，根据混合回归模型中各回归变量重要性排序的变化，获得风电功率序列中的模型变点，并根据模型变点识别剩余风电功率异常数据的类型。

在其中一个实施例中，所述第二异常数据分析模块包括：

回归模型获取单元，用于以风电功率序列的一阶差分结果作为因变量数组，风速序列一阶差分作为自变量数组，建立混合回归模型；

模型变点获取单元，根据各回归变量重要性排序的变化，分析辨识风电功率序列中的模型变点。

在其中一个实施例中，所述第一异常数据分析模块还用于：

在其中一个实施例中，所述装置还包括：

相关关系建立模块，用于利用特殊影响因子对异常数据进行分析，根据正态分布均值的假设检验，获得异常数据的来源与特殊影响因子之间的相关关系。

上述实施例根据异常数据分析判断原则对其成因进行分类，并结合了概率变点和模型变点的时序关系，符合风资源/风电序列的时序相依特性，能够对风电功率异常数据进行准确辨识。

附图说明

图1为一个实施例提供的风电功率异常数据辨识方法的流程框图；

图2为风电功率异常数据辨识方法中多变点分析流程的示意图；

图3为滚动建模子样本形成过程的示意图；

图4为其中一个实施例中概率变点分析的示意图；

图5为另一个实施例中概率变点分析的示意图；

图6为实施例提供的风电功率异常数据辨识方法中采用的样本曲线的示意图；

图7为不同延迟步长变量的排序情况，其中n₀＝16，n＝96，p＝4。

图8为一个实施例中电功率异常数据辨识方法与传统方法的异常点辨识效果对比；

图9为一个实施例提供的风电功率异常数据辨识装置的结构框图。

具体实施方式

下面根据说明书附图并结合具体实施例对本发明的技术方案进一步详细表述。

本发明提供的基于变点分析的风电功率异常数据辨识方法，用于为系统后续预测建模提供可靠的数据基础。本发明提供的风电功率异常数据辨识方法，通过将待分析的时间序列看作某非线性系统的输出，根据不同类型异常数据的产生机理制定分析判断原则，从概率、模型、特殊影响因子三个角度开展异常数据辨识和分析。

请参阅图1，本发明实施例提供的风电功率异常数据的辨识方法，主要包括以下步骤：

S10，根据异常数据的来源和风电功率序列的不规则变化，将异常数据进行分类，得到异常数据分类结果；

S20，获取异常数据的分类结果与风速序列的对应关系，建立基于风速序列的异常数据判断标准；

S30，根据异常数据判断标准，对位于同时段风电功率序列和风速序列分别进行概率变点分析，风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列以及风速序列中的不规则突变，根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别异常数据的类型；

S40，根据风电功率序列和风速序列建立混合回归模型，根据各回归变量重要性排序的变化，获得风电功率序列中的模型变点，并根据模型变点识别异常数据的类型。

在其中一个实施例中，在步骤S10中，可以根据异常数据的产生机理将异常数据进行分类。

其中，根据异常数据的产生机理可将异常数据分为错误数据和不规则数据两类；错误数据指在数据量测、传输和保存等环节中由于干扰导致的失真数据，不规则数据则是指正常记录存储的数据，但由于极端天气过程引起的第一类不规则数据或人工控制干预等原因而表现异常引起的第二类不规则数据。

进一步，风电功率异常数据的表现都可以归纳为时间序列的不规则变化，即根据风电功率的不规则变化与风速序列的不规则变化对应关系，异常数据可包括三种类型：

类型一：若不规则变化变化是由于风资源/风电功率的非平稳、非线性特征导致，则风电功率序列中的异常突变对应于相同或相近时刻风速序列中的突变，为第一类不规则数据。

类型二：若风电功率序列中的异常突变与相同或相近时刻风速序列中的突变不对应，则风电功率序列中的异常突变属于错误数据。

虽然风速序列中不会有所反应，但这类功率控制措施下功率序列的变化，受技术和安全等条件限制，相对于错误数据的即时产生，一般是一个较为缓变的过程，且一旦发生，会持续一段时间，即对应于第二类不规则数据，风速序列不变而风电功率序列中存在的预定时长的不规则变化。

在步骤S20中，获取异常数据的分类结果与风速序列的对应关系，建立异常数据基本判断标准如下：

对风电功率和风速序列中的不规则变化进行识别；

若风电功率和风速中同时存在的不规则突变则属于不规则数据；

若只在风电功率中存在的不规则突变则属于错误数据；

可以理解，变点问题的分析方法很多，根据不同类型风电功率异常数据的产生机理，可通过概率变点和模型变点对类型一、类型二以及类型三进行辨识。具体的，可选取概率变点作为类型一、类型二中不规则突变的辨识方法，选择模型变点作为类型三中较缓慢不规则变化的辨识方法，并利用特殊影响因子变点分析异常数据产生的遥相关性。

作为其中一个实施例，在步骤S30中，基于概率变点的不规则数据辨识，对同时段风电功率序列和风速序列分别进行概率变点分析，获得风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列中的不规则突变。

具体的，可根据累积概率分析变点问题，基于原假设下的渐近分布对其进行检验。考虑一类简单情况，假设时间序列中只有一个变点，事件的发生概率开始保持在p₁，时刻m_c下发生概率突然变化为p₂，则m_c即为变点发生时间。为了估计m_c，不同时刻事件累计发生次数C_n计算如下：

式中{z_i},i＝1,...,n,是表示每个时刻下事件是否发生的时间序列，z_i＝1表示事件在i时刻发生，z_i＝0表示没有发生。统计量T_n为：

式中C_n/n是截止到时刻n的事件发生频次，C_N/N是总事件发生频次。T_n的期望值为：

一开始，|E(T_n)|的值随着n的增加而增大，在n＝m_c-1时到达最大值，然后|E(T_n)|开始减小。因此，变点判断流程可以总结为；

S31：计算统计量T_n的绝对值|T_n|,n＝1,2,...,N

S32：找到变点发生时间m*，使|T_m*|＝max(|T_n|),n＝1,2,...,N

S33：将作为变点发生的时刻。

假设p₁＝p₂下，统计量Nn₁ ^-1n₂ ^-1|T_m*|的渐近分布与斯米尔诺夫检验(CMNPHOBtesting)统计量相同，其中n₁＝C_N，n₂＝N-C_N。因此，如果有：

式中l_α是n₁、α限制下的斯米尔诺夫检验临界值，则对于给定置信度水平α下，原假设p₁＝p₂不成立，变点存在，且其估计可信度可由检验置信水平保证。

具体的，作为其中一个实施例，请参阅图2，当检验得到一个概率变点后，将原风电功率序列根据变点位置拆分为前后两个子序列，分别对每个子序列重复上述辨识过程，直到没有新的概率变点被发现，获得所有的概率变点。另外，可以根据相邻两点间的跃变是否超过一定比例将时间序列转化为0-1序列。然后将上述方法用于检验风电功率、风速序列中是否存在突变点。

在步骤S40中，可以风电功率序列的一阶差分结果作为因变量数组，风速序列一阶差分作为自变量数组，建立混合回归模型，根据各回归变量重要性序列的变化，来分析辨识风电功率序列中的模型变点，该模型变点用于识别经过概率变点分析之后剩余的风电功率异常数据，且风电功率异常数据的第二类不规则数据。

作为其中一个实施例，可采用疏系数混合回归模型来建立输入、输出变量之间的关系：

y_t＝α₀+α₁y_t-1+α₂y_t-2+...+α_py_t-p

+β_1,1x_1,t-1+β_1,2x_1,t-2+...+β_1,px_1,t-p+...

+β_m,1x_m,t-1+β_m,2x_m,t-2+...+β_m,px_m,t-p+ε_t (5)

式中{y_t},t＝1,2,...,N是因变量序列，{x_i,t},i＝1,...,m,t＝1,2,...,N，是m种相关影响变量序列，α₁,...,α_p是因变量延迟变量系数，β_1,1,...,β_1,p,...,β_m,p是相关影响变量延迟变量系数，p是最大延迟步长，ε_t是白噪声序列。式(5)中回归模型既包含了对因变量自回归特性的考虑，也包含了对其影响变量混合回归特性的考虑。

下面简要介绍模型估计过程，将式(5)整理为一般回归模型因变量和自变量形式：

y_t＝α₁'x_t,1'+α₂'x_t,2'+...+α_s'x_t,s'+ε_t (6)

式中s＝mp+1。进一步写成：

Y＝Xα+ε (7)

式中Y＝[y₁,y₂,...,y_N]^T，α＝[α₁',α₂',...,α_s']^T，ε＝[ε₁,...,ε_N]^T，求解的正规方程为：

X^TXα＝X^TY (8)

对式(8)进行中心化和标准化，得到：

Tα'＝Y' (9)

式中T的第i行、第j列的元素是t_i,j，i,j＝1,2,...,s，Y'＝[y₁',y₂',...,y_s']^T。对T加边，得到其中y₀＝1。

采用逐步回归的方法，对T进行s阶削去变换。在每一阶，比较不同变量削去后的残差变化量y_i ²/t_i,i，若某变量对应的残差变化量是最小值，则说明该变量对因变量的贡献最小，应将其削去。对T矩阵全部阶数的削去变换完成后，按照BIC准则(BayesianInformation Criterion，贝叶斯信息准则)，比较各阶削去后的BIC值，得到定阶模型。对于本发明的研究，更重要的是，根据各阶变换削去情况，也同时得到了回归变量的重要性排序。

采用对总样本滚动建模的方式来考察样本中的变点问题。请一并参阅图3，n₀是滚动时间间隔，n为子样本大小，p为最大延迟步长。变点分析步骤如下：

第一步：设定n₀，n，p的大小；

第二步：利用每份子样本建立疏系数混合回归模型，同时根据残差变化量对回归变量的重要性进行排序；

第三步：以不同子样本对应模型回归变量重要性排序的变化表征回归模型统计特性的变化。若从第l期样本建模开始，变量排序发生变化，则可估计变点发生的时段为(l-2)n₀+n～(l-1)n₀+n。

进一步，可利用特殊影响因子对异常数据进行分析，从较长期统计角度，根据正态分布均值的假设检验，获得异常数据的产生与特殊影响因子之间的遥相关关系。

受风资源/风电时空波动特性影响，风电功率的变化会受到某些影响因子遥相关关系的影响。一些情况下，风电功率序列中异常数据的产生原因是特殊天气过程，例如雨、雪、霾等，作为特殊影响因子。从较长期统计角度，根据正态分布均值的假设检验，来分析异常数据的产生与特殊影响因子之间的关系。

将{y_t},t＝1,...,N作为待分析的对象，是一定时间段Δt内的异常数据量组成的时间序列。选取可能导致{y_t}发生变化的特殊影响因子，将其发生的时段作为特殊时段，标记为t₁,t₂,...,t_n,t_n≤N。按照和特殊时段相隔不同时间从{y_t}中抽取子样本l＝0,±1,±2,...,±L，L为影响因子最大考察时间间隔。对于每一份子样本计算其均值

式中如果则n_l为有效样本数量。统计量U计算如下：

式中μ为{y_t}的均值，σ为其标准差。原假设为即{y_t}不受特殊因子影响，与μ没有显著性区别。但是，如果|U|超过了一定置信度水平下的临界值，则表明与μ存在显著性区别。这种情况下，说明距离特殊因子发生l·Δt时间会对异常数据的发生有影响。

实施例一

下面结合具体的实际数据，进一步说明本发明应用于风电功率异常数据辨识的效果。算例中使用的数据来源于我国北方某并网大型风电场，风电功率数据和测风塔数据从SCADA系统中采集，覆盖时间窗口为1年。具体步骤如下：(1)基于概率变点的不规则突变数据辨识

对同时段风电功率序列和风速序列分别进行概率变点分析，辨识序列中的不规则突变，进一步比较二者分析结果，来帮助判断造成功率序列中不规则突变的原因。请一并参阅图4及图5，分别给出了两种典型分析结果。在图4中，功率序列的分析结果|T_n|在i＝32达到最大值，风速序列的分析结果在i＝31达到最大值，且对应的式(4)计算结果分别为2.040和2.271，均大于斯米尔诺夫检验临界值l_0.01＝1.628，因而判定为变点存在。功率序列变点的发生时刻与风速变点十分相近，根据本发明中所述分析判断原则，该功率变点属于类型一：由天气变化导致的功率突变，为不规则数据。对照功率和风速曲线图相应时刻的变化也可以验证该辨识结果。而图5中，功率序列|T_n|在i＝29达到最大值，且统计量计算结果为2.045，大于l_0.01＝1.628，但该功率变点对应时段附近(i±2)不存在风速变点，因此判断时刻的功率样本属于类型二：错误数据。该结果同样可以在功率和风速曲线图上得到验证。

(2)基于模型变点的异常数据分析

以风电功率序列的一阶差分结果作为{y_t}，风速序列一阶差分作为{x_1,t}，根据式(5)建立混合回归模型，根据各回归变量重要性排序的变化，来分析辨识风电功率序列中的模型变点。以图6和图7所示算例说明模型辨识效果。对于图6中截取的风速、风电功率序列，图7按照不同类型的回归变量(风速/功率)，给出了每次滚动建模得到的变量重要性排序前两位变化情况，其中延迟步长的时间间隔是15分钟，横坐标第(l-1)n₀+1～(l-1)n₀+n₀序列点对应的是第l期子样本建模排序。可以看出，从第16、17期建模开始，风速变量的排序发生了明显变化，则推知功率序列中模型变点对应的位置在321～352点。在这之前，变量排序基本符合风速/风电功率在较短延迟步长下的自相关性，即y_t-1，x_1,t-1分别是功率、风速重要性排序第一的回归变量。变点发生后，y_t-1保持第一的排序，但x_1,t-1排序变得较为不规律，且这种情况在其后多期建模中持续。本算例中，对比图7中的序列波动情况，该模型变点代表特殊功率控制时段的开始，为异常数据类型三所述的情况，属于不规则数据。

(3)特殊天气因子影响分析

选取沙尘和降雪作为特殊天气因子来研究其与异常数据发生之间的关联性。所用的异常数据包括先前剔除的明显错误数据，以及变点分析所得的异常数据。式(12)中的统计量U计算结果如表1所示。对于沙尘天气因子，在取式(11)中延迟量l为0和1时，统计量U大于正态分布限值1.64(置信度水平0.1)，说明沙尘的发生与当天发生及后1日的异常数据产生之间具有显著的关联性。对于降雪影响因子，从统计量U的计算结果看，降雪和异常数据产生的关联性可以从发生当天开始一直到发生后2日。

表1异常数据发生与天气因子之间的关系(间隔时段Δt＝1day)

(4)不同异常数据辨识方法获得的风速-功率散点图比较

为了进一步论证基于变点分析的异常数据辨识方法的优势，将其与传统的基于控制图原理的异常数据辨识方法进行比较，图8给出了使用两种方法前后的风速-功率散点图对比。比较数据窗口为2个月。变点分析结果的图例中，“控制”对应类型三的异常数据，“突变”对应类型一的异常数据，“错误”对应类型二的异常数据。

可以看出，受样本分散性较高的影响，基于控制图原理的三倍标准差法的异常数据筛选结果不太理想，特别是高风速区段，由于限电较多，控制图方法基本无法对其进行辨识。

进一步，本发明实施例进一步提供一种风电功率异常数据辨识装置，所述装置包括：

异常数据分类模块110，用于根据异常数据的来源和风电功率序列的不规则变化，将异常数据进行分类，得到异常数据分类结果；

标准建立模块120，用于获取异常数据的分类结果与风速序列的对应关系，建立基于风速序列的异常数据判断标准；

第一异常数据分析模块130，用于根据异常数据判断标准，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列以及风速序列中的不规则突变，根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别异常数据的类型；

第二异常数据分析模块140，用于根据风电功率序列和风速序列建立混合回归模型，根据各回归变量重要性排序的变化，获得风电功率序列中的模型变点，并根据模型变点识别异常数据的类型。

在其中一个实施例中，所述第一异常数据分析模块还用于：

在其中一个实施例中，所述第二异常数据分析模块还包括：

模型变点获取单元，根据各回归变量重要性排序的变化，分析辨识风电功率序列中的模型变点。在其中一个实施例中，所述风电功率异常数据辨识装置还包括：

本发明实施例提供的异常数据辨识方法及装置，具有以下特点：(1)不仅可以辨识异常数据，还可以对其成因进行分类；(2)不论是概率变点方法还是模型变点方法，都考虑了样本点间的时序关系，而不是完全将其作为孤立点看待，因此从图8中可以看出不仅离散分布的异常点可以被辨识，位于样本集中区域的异常点也可以被辨识。(3)特殊影响因子的变点分析，可以帮助判断特殊天气现象与异常数据发生之间的关联性，这为不同类型数据间的遥相关分析提供了一种有效方法，也有助于利用极端天气的预报结果，对异常数据的多发进行预判、预警。(4)由于变点分析方法对数据分布没有特定假设，因此并不局限于风电功率异常数据辨识，也可用于风电功率预测复合数据源中其它类型的数据，如风速、风向、气温等，从而提高了风电概率预测的准确性。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种风电功率异常数据辨识方法，其特征在于，所述方法包括：

获取异常数据的分类结果与风速序列的对应关系，建立基于风速序列的异常数据判断标准；

根据异常数据判断标准，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列以及风速序列中的不规则突变，根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型；

2.根据权利要求1所述的风电功率异常数据辨识方法，其特征在于，根据风电功率的不规则变化与风速序列的不规则变化对应关系，异常数据包括三种类型：

类型一：若不规则变化变化是由于风资源/风电功率的非平稳、非线性特征导致，则风电功率序列中的异常突变对应于相同或相近时刻风速序列中的突变，为第一类不规则数据，该第一类不规则数据为正常记录存储但由于极端天气过程引起的异常数据；

类型二：若风电功率序列中的异常突变与相同或相近时刻风速序列中的突变不对应，则风电功率序列中的异常突变属于错误数据，该错误数据为在数据量测、传输和保存等环节中由于干扰导致的失真数据；以及

类型三：人工控制干预导致的风电功率序列异常数据，为第二类不规则数据，该第二类不规则数据为正常记录存储但由于人工控制干预而表现异常的数据。

3.根据权利要求2所述的风电功率异常数据辨识方法，其特征在于，基于风速序列的异常数据判断标准包括：

若只在风电功率序列中存在的不规则突变则属于错误数据；

4.根据权利要求1所述的风电功率异常数据辨识方法，其特征在于，所述根据风电功率序列和风速序列建立混合回归模型，根据各回归变量重要性排序的变化，获得风电功率序列中的模型变点的步骤包括：

5.根据权利要求1所述的风电功率异常数据辨识方法，其特征在于，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点包括：

6.根据权利要求1所述的风电功率异常数据辨识方法，其特征在于，进一步包括：

利用特殊影响因子对异常数据进行分析，根据正态分布均值的假设检验，获得异常数据的来源与特殊影响因子之间的相关关系。

7.一种风电功率异常数据辨识装置，其特征在于，所述装置包括：

第一异常数据分析模块，用于根据预设的异常数据判断标准，对位于同时段的风电功率序列和风速序列分别进行概率变点分析，得到风电功率序列和风速序列中的概率变点，通过概率变点辨识风电功率序列以及风速时间序列中的不规则突变，根据该风速序列的不规则突变与风电功率序列中不规则突变的对应关系识别风电功率异常数据的类型；

8.如权利要求7所述的装置，其特征在于，所述第二异常数据分析模块包括：

9.如权利要求7所述的装置，其特征在于，所述第一异常数据分析模块还用于：

10.如权利要求7所述的装置，其特征在于，所述装置还包括：